4324
Авторский контент Рвачева Никиты (@rvnikita): о чем думаю, мечтаю, что читаю.
🛡🛡🛡 OpenAI запускает Codex Security - набор инструментов для автоматического поиска уязвимостей в коде.
GPT-5.3-Codex стала первой моделью, которую OpenAI классифицировала как "High capability" для задач кибербезопасности. Это первая модель, которую целенаправленно обучали находить уязвимости в софте. При тестировании на внешних репозиториях она нашла около 800 критических и более 10 500 высокоприоритетных проблем.
Главный продукт линейки - агент Aardvark. Он автономно анализирует репозиторий, строит threat model проекта, сканирует каждый коммит на уязвимости и пытается эксплуатировать найденные баги в изолированной среде. Если уязвимость подтверждается - генерирует патч через Codex. За время бета-тестирования Aardvark нашел уязвимости, которым присвоили 10 CVE-идентификаторов. Теперь OpenAI расширяет бету и предлагает бесплатное сканирование для популярных open-source проектов, включая Next.js.
Отдельная история - Trusted Access for Cyber. Это программа контролируемого доступа к кибер-возможностям модели. Запросы с повышенным риском автоматически перенаправляются на менее способную GPT-5.2. Для легитимных исследователей безопасности есть отдельная заявка на полный доступ. Плюс OpenAI выделяет $10M в API-кредитах на защиту open-source и критической инфраструктуры.
Интересный кейс: в декабре 2025 инженер из Privy (компания Stripe) за одну неделю с помощью GPT-5.1-Codex-Max нашел несколько ранее неизвестных уязвимостей в React Server Components, которые были ответственно раскрыты команде React.
https://openai.com/index/codex-security-now-in-research-preview/
#openai #codex #cybersecurity #ai #aardvark
—————————
Мысли Рвачева
—————————
🎢 Claude Code управляет виртуальным бизнесом в RollerCoaster Tycoon
Ребята из Ramp Labs сделали демо, где Claude Code управляет парком развлечений - нанимает механиков, строит аттракционы, анализирует финансы и даже генерирует CFO-отчеты. Все через командную строку.
Технически это работает так: они написали CLI-инструмент rctctl (по образцу kubectl) для OpenRCT2, и Claude получает информацию о парке в виде ASCII-сетки и JSON-данных. Никакой графики - только текст.
Что интересно: Claude отлично справляется с анализом данных, настройкой цен и размещением простых объектов. Но пространственное мышление пока слабое - с прокладкой дорожек и постройкой американских горок проблемы.
Почему RollerCoaster Tycoon? Потому что игра - это "Монтессори-набор B2B SaaS интерфейсов". Управление персоналом, удовлетворенность клиентов, финансовые циклы - все как в реальном бизнесе.
Главный вывод: агенты лучше всего работают не как замена человеческого интеллекта, а как "автоматизация усердия" - рутинный мониторинг и оптимизация, пока люди занимаются стратегией.
🧪 Demo: https://labs.ramp.com/rct
📝 Paper: https://ramplabs.substack.com/p/ai-plays-rollercoaster-tycoon
#ai #claude #agents #coding
—————————
Мысли Рвачева
—————————
claude --dangerously-skip-permissions
#friday #fun
—————————
Мысли Рвачева
—————————
График из отчета: успешность Claude vs время задачи
Читать полностью…
🔧 Anthropic починили большую проблему в Claude Code.
Контекст - это "рабочая память" Claude. Она ограничена. Раньше при подключении внешних инструментов (GitHub, Jira, базы данных) их описания и данные сразу загружались в эту память - и занимали огромную часть. Типичный набор инструментов съедал 50-100 тысяч токенов еще до начала разговора. А в процессе работы данные от инструментов накапливались еще больше. Claude быстро упирался в лимиты, а в куче загруженной информации терялся и работал хуже.
Теперь сделали по-умному: инструменты загружаются только когда реально нужны. Claude ищет подходящий инструмент по ключевым словам и подгружает только его. Результат - минус 85% потребления памяти, а точность работы выросла с 49% до 74% на сложных задачах.
Проще говоря: раньше Claude таскал с собой огромный чемодан инструментов "на всякий случай". Теперь берет только то, что нужно для конкретной задачи.
🔗 Source: https://analyticsindiamag.com/ai-news-updates/claude-code-finally-fixes-the-huge-issue-with-mcps/
#claude #anthropic #ai
—————————
Мысли Рвачева
—————————
💸 Инвестиционная стратегия для пользователей AI
Каждый раз когда упираюсь в лимит Claude Code — иду и докупаю акций компаний связанных с вычислениями.
Логика простая: если я готов платить за эти инструменты и упираюсь в потолок — значит спрос реальный. А где спрос — там и рост.
Своеобразный "put your money where your mouth is" подход к инвестициям.
#ai #investing #anthropic #claude
—————————
Мысли Рвачева
—————————
⚡️ Claude Code добавил удобную фичу для работы с permissions
Boris Cherny из Anthropic поделился новым улучшением Claude Code: теперь при запросе разрешения (permission prompt) можно нажать Tab и добавить дополнительные инструкции перед тем как принять или отклонить.
Мелочь, но приятная - особенно когда хочешь уточнить контекст для модели, но не хочешь прерывать флоу.
По словам Бориса, команда перепробовала около дюжины вариантов UX за последние недели, прежде чем остановились на этом.
🔗 Source: https://x.com/bcherny/status/2011332893772308867
#claudecode #anthropic #ai #ux
—————————
Мысли Рвачева
—————————
🚨 VSCode и вирусы в тестовых заданиях
Разработчики, которые ищут работу - будьте осторожны при открытии "репозиториев с тестовыми заданиями" в VSCode. Внутри могут быть вирусы, которые крадут всю крипту с компьютера.
Движок тот же, что и у сентябрьской эпидемии Shai-Hulud, которая заразила тогда сотни JavaScript-библиотек. Нажимаешь "Да, я доверяю автору этого репозитория" - и тю-тю. Прямо как раньше вирусы на Windows.
Говорят, северокорейские хакеры.
🔗 Source: https://opensourcemalware.com/blog/contagious-interview-vscode
#security #vscode #malware
—————————
Мысли Рвачева
—————————
⚡️⚡️⚡️ Anthropic запустили Cowork - Claude Code для обычных людей
После запуска Claude Code команда заметила: люди использовали его не только для кода. Планировали отпуска, создавали презентации, чистили почту, восстанавливали фотографии с жестких дисков, мониторили рост растений и даже управляли духовками.
Сегодня Anthropic представили Cowork - Claude Code для не-технических задач. Продукт сырой, как и сам Claude Code при запуске, но в этом суть research preview.
Встроенная VM для изоляции, автоматизация браузера, интеграция с data connectors, система уточнений когда AI не уверен. Как говорит Boris Cherny: "базовый Claude Agent - лучший агент, а Opus 4.5 - лучшая модель".
Доступно для Claude Max в macOS приложении.
🔗 https://claude.com/blog/cowork-research-preview
#anthropic #claude #cowork #ai
—————————
Мысли Рвачева
—————————
🧠 MIT и Harvard опубликовали работу о "Коузианской сингулярности" - точке, когда AI-агенты изменят саму идею компании.
В 1937 году экономист Рональд Коуз задал вопрос: зачем вообще нужны компании? Почему бы не покупать все на рынке? Его ответ: потому что поиск, переговоры и контроль стоят дорого. Проще нанять людей и делать все внутри.
Теперь представьте AI-агента, который за секунды находит лучших поставщиков, договаривается о цене и следит за качеством. Без зарплат, без офиса, без менеджеров. Вдруг держать большую компанию становится не нужно?
Исследователи описывают три волны изменений. Первая: у каждого будет личный агент для покупок и сделок. Вторая: компании создадут своих агентов - одни будут работать везде, другие только внутри одной экосистемы. Третья: появится новая инфраструктура - способы проверить агента, автоматические договоры, новые правила торговли.
Это не значит, что компании исчезнут. Они останутся там, где нужны люди - для создания брендов, инноваций, культуры. Но рутинные операции и координация перейдут к агентам.
Это уже началось. OpenAI выпустила Operator - агента для работы в браузере. Anthropic делает агентов для управления компьютером. Стартапы строят рынки, где агенты торгуются между собой. Через 5-10 лет бизнес может работать совсем иначе.
📝 Paper: https://www.nber.org/books-and-chapters/economics-transformative-ai/coasean-singularity-demand-supply-and-market-design-ai-agents
#ai #economics #agents #research
—————————
Мысли Рвачева
—————————
Если кто-то пользуется Alfred, я обернул скрипт переключения между аккаунтами Claude Code в воркфлоу, чтобы делать это в один клик. Удобно иметь не один профиль за $100 или $200, а 2-3 за $20 и просто переключаться между ними.
Link: https://github.com/rvnikita/claude-account-switcher-alfred
P.S. Не стесняйтесь делиться с друзьями и расшаривать на свои каналы.
—————————
Мысли Рвачева
—————————
В прошлом у меня был классный "проект" - совместное прохождение курсов. Работало это так: каждый независимо смотрел в течение недели блок из курса, а потом мы созванивались в одно время и обсуждали.
Самым главным для меня открытием стало, насколько по-разному люди воспринимают, казалось бы, одинаковую информацию. Как производная от этого, обсуждения (даже просто послушать) сильно расширяли горизонт понимания, не говоря уже о том, что повторение и обсуждение значительно улучшают качество усвоения.
К чему я все это? Одна из целей этого года - восстановить клуб. Уверен, кому-то из вас это будет интересно. Давайте начнем с того, что в комментариях накидаем курсы, которые вы очень хотите пройти, считаете лучшими из того, что видели и т.д.
Составлю свой список (правда, это мы уже все прошли):
1. Michael Sandel - Harvard - Justice - просто лучший! прошел дважды
2. Robert Sapolsky - Human Behavioral Biology
3. Y Combinator - Startup School
P.S. Это все 100% на некоммерческой основе.
#education #michael_sandel #philosophy #robert_sapolsky #biology #ycombinator
—————————
Мысли Рвачева
—————————
Мне кажется или OpenAI постепенно начинает проигрывать рынок Anthropic?
Повсюду слышу про Claude Code, а про OpenAI Codex только в твиттах Sam Altman и Co про то какой он крутой и невероятный?
Или это я в бабле?
—————————
Мысли Рвачева
—————————
📬 Google превращает Gmail в ассистента
Google объявила, что Gmail переходит в эпоху Gemini. Почта становится не просто ящиком, а персональным помощником.
Главные обновления:
- AI Overviews - краткие сводки длинных переписок и ответы на вопросы к inbox на естественном языке
- Help Me Write и новые Suggested Replies - помощь в написании писем с учетом контекста и стиля
- AI Inbox - автоматическая приоритизация важных писем, задач и напоминаний
Часть функций доступна бесплатно, продвинутые возможности - для подписчиков Google AI Pro и Ultra. Все работает на Gemini 3. Запуск начинается в США, сначала на английском.
Source: https://blog.google/products-and-platforms/products/gmail/gmail-is-entering-the-gemini-era/
#google #gmail #ai #gemini
—————————
Мысли Рвачева
—————————
Лучше способ начать любой проект - создать SPEC.md, описать подробно задачу, а потом заставить Claude Code задать тебе 40+ для уточнения. Польза в обе стороны: CC больше понимает от тебя что ты хочешь, ты сам лучше понимаешь детали того, что тебе нужно.
#ai #agi #claude_code #coding #agent
—————————
Мысли Рвачева
—————————
🤖 Notion добавляет автономных агентов
Notion выпустил версию 3.3 с Custom Agents - и это важный сигнал куда движется индустрия.
Что умеют агенты Notion:
- Работают автономно 24/7, без ручных промптов
- Читают Slack, почту, календарь, Figma, Linear, HubSpot
- Триажат задачи и роутят их нужным людям
- Отвечают на повторяющиеся вопросы в Slack
- Пишут daily standups и статус-репорты по расписанию
- Онбордят сотрудников, ведут IT-поддержку, обрабатывают фидбэк
Агенты вылезают за пределы IDE во все рабочие инструменты. Через год-два это станет стандартом для любого бизнес-софта.
Курс как строить агентов: https://academy.notion.com/custom-agents/435915/scorm/8iven7mv17k3
#ai #notion #productivity #agents
—————————
Мысли Рвачева
—————————
📚 Недооцененная фича ChatGPT - Study Mode
Есть режим "Study and learn", который не дает готовый ответ, а ведет тебя к нему через наводящие вопросы. Сократовский метод в действии.
Что делает: задает вопросы, чтобы понять твой уровень, разбивает сложное на простые шаги, периодически тестирует понимание, объясняет почему ответ верный или нет. Можно загрузить свои материалы (PDF, картинки) и попросить потестировать тебя потом.
Как жаль, что этого не было, когда я учился в универе. Всем родителям школьников и студентам - must use.
P.S. Сам решил вспомнить как решаются дифференциальные уравнения - прям кайфанул.
🔗 Source: https://openai.com/index/chatgpt-study-mode/
#openai #chatgpt #ai #education
—————————
Мысли Рвачева
—————————
📊 Anthropic выпустили 4-й Economic Index. 2 млн разговоров с Claude.
Чем сложнее задача - тем больше выигрыш. Школьные задачи ускоряются в 9 раз, колледж - в 12.
Claude справляется с задачами на 19 часов. Успешность - 66%.
География: богатые страны - работа, бедные - образование. AI как социальный лифт.
Покрытие задач за год: 36% → 49%. Больше затронуты операторы ввода данных и радиологи.
Продуктивность: +1-1.2% в год - уровень США 90-х.
🔗 https://anthropic.com/research/economic-index-primitives
#anthropic #ai #research
—————————
Мысли Рвачева
—————————
📊 Anthropic выпустили 4-й Economic Index - исследование реального влияния AI на работу. Проанализировали 2 миллиона разговоров с Claude. Каждый выпуск - кладезь инсайтов.
Несколько находок:
Чем сложнее задача - тем больше выигрыш от AI. Задачи уровня школы ускоряются в 9 раз, а уровня колледжа - уже в 12 раз. Парадоксально, но AI больше помогает там, где нужна высокая квалификация.
Claude справляется с задачами, которые у человека заняли бы до 19 часов. При этом успешность на сложных задачах - 66%. Не идеально, но достаточно чтобы серьезно влиять на продуктивность.
Интересно про географию: в богатых странах Claude используют для работы, в бедных - для образования. AI как социальный лифт в действии.
За год покрытие рабочих задач выросло с 36% до 49%. Больше всего затронуты операторы ввода данных и радиологи. Меньше всего - учителя и разработчики (ирония - те, кто создают AI, пока меньше всего им заменяемы).
Оценка влияния на продуктивность: +1-1.2 процентных пункта в год. Для сравнения - это уровень роста производительности труда в США конца 90-х, золотая эпоха tech-бума.
🔗 Source: https://www.anthropic.com/research/economic-index-primitives
#anthropic #ai #research #economics
—————————
Мысли Рвачева
—————————
🖥 Масштаб того, что сейчас происходит с искусственным интеллектом, как минимум сравним с появлением компьютера.
Представьте: раньше 100% людей работали не за компьютером. Если смотреть совсем далеко - почти 100% людей были заняты выращиванием пищи. Сейчас количество людей, задействованных в том, чтобы накормить человечество - меньше процента. И продолжает снижаться.
То же самое, кажется, будет происходить с работой за компьютером. Количество людей, задействованных в создании чего-то через компьютер, очень скоро может стать 1%. Есть предсказания - и мне они уже не кажутся наивными - что все, что производит человек за компьютером, будет на 100% автоматизировано.
Сильное ощущение, что это произойдет значительно раньше, чем автоматизация оффлайн-профессий. Хотя через какое-то время и до них доберутся.
#ai #agi #future #automation
—————————
Мысли Рвачева
—————————
🧠 Google представил "Personal Intelligence" - Gemini теперь знает о вас все
Google анонсировал новую функцию Personal Intelligence для Gemini. Теперь AI-ассистент может с вашего разрешения подключаться к Gmail, Google Photos, истории поиска и YouTube, чтобы давать персонализированные ответы.
Ключевое отличие от прошлых интеграций - Gemini теперь может "рассуждать" по всем вашим данным сразу и проактивно предлагать инсайты, а не просто искать по запросу.
Функция пока в бета и доступна подписчикам AI Pro и AI Ultra в США. По умолчанию выключена - Google подчеркивает, что пользователь сам решает, когда ее включить.
Это именно то преимущество Google перед OpenAI и Anthropic - экосистема приложений, которыми пользуются миллиарды людей каждый день.
🔗 Source: https://support.google.com/gemini/answer/16836988
#google #gemini #ai #personalassistant
—————————
Мысли Рвачева
—————————
💰 Как инвестировать в Anthropic, если она еще не публичная
Меня часто спрашивают про то, как я инвестирую в Anthropic. К сожалению (или к счастью) Anthropic еще не публичная компания (хотя ей и OpenAI прогнозируют IPO в этом году), поэтому единственный прямой вариант - это выкупать доли у инвесторов, что сложно, дорого, да и в целом по ощущениям большинство хочет держать их до IPO.
Есть обходной путь - инвестировать в фонды, которые инвестировали в Anthropic. Удобный из тех, кто мне известен - Fundrise (https://fundrise.com/r?i=3n2q7z) По реферальной ссылке вам еще и $25 дадут.
P.S. Не является финансовой рекомендацией.
P.P.S. Я лично в этом году ставку делаю на:
1) Anthropic
2) Google
3) Публичные компании которые делают "лопаты" для производителей "лопат" - NVIDIA, а также про ресурсы для поддержки этого всего (инфраструктура, энергия и т.п.)
#anthropic #investing #ai #startups
—————————
Мысли Рвачева
—————————
Boris Cherny is the new Andrej Karpathy
#boris_cherny #andrej_karpathy
—————————
Мысли Рвачева
—————————
⚡️⚡️⚡️ Anthropic запустили Cowork - Claude Code для обычных людей
После запуска Claude Code команда заметила интересную тенденцию: люди использовали его не только для кода. Планировали отпуска, создавали презентации, чистили почту, отменяли подписки, восстанавливали свадебные фотографии с жестких дисков, мониторили рост растений и даже управляли духовками. Паттерн был очевиден - людям нужна агентность Claude для всей их работы, а не только для программирования.
Сегодня Anthropic представили Cowork - первый шаг к тому, чтобы сделать Claude Code доступным для не-технических задач. Продукт сырой и ранний, как и сам Claude Code при запуске, но в этом и есть смысл research preview.
Что особенного: встроенная VM для изоляции, поддержка автоматизации браузера из коробки, интеграция со всеми data connectors из claude.ai, система уточнения когда AI не уверен. Как говорит Boris Cherny из Anthropic: "причина в том, что базовый Claude Agent - лучший агент, а Opus 4.5 - лучшая модель".
Доступно сейчас для подписчиков Claude Max в macOS приложении - кнопка "Cowork" в сайдбаре.
🔗 Блог: https://claude.com/blog/cowork-research-preview
📥 Скачать: https://claude.com/download
▶️ Demo: https://www.youtube.com/watch?v=UAmKyyZ-b9E
#anthropic #claude #cowork #ai #automation
—————————
Мысли Рвачева
—————————
🧠 MIT и Harvard опубликовали работу о "Коузианской сингулярности" - точке, когда AI-агенты изменят саму идею компании.
В 1937 году экономист Рональд Коуз задал вопрос: зачем вообще нужны компании? Почему бы не покупать все на рынке? Его ответ: потому что поиск, переговоры и контроль стоят дорого. Проще нанять людей и делать все внутри.
Теперь представьте AI-агента, который за секунды находит лучших поставщиков, договаривается о цене и следит за качеством. Без зарплат, без офиса, без менеджеров. Вдруг держать большую компанию становится не нужно?
Исследователи описывают три волны изменений. Первая: у каждого будет личный агент для покупок и сделок. Вторая: компании создадут своих агентов - одни будут работать везде, другие только внутри одной экосистемы. Третья: появится новая инфраструктура - способы проверить агента, автоматические договоры, новые правила торговли.
Это не значит, что компании исчезнут. Они останутся там, где нужны люди - для создания брендов, инноваций, культуры. Но рутинные операции и координация перейдут к агентам.
Это уже началось. OpenAI выпустила Operator - агента для работы в браузере. Anthropic делает агентов для управления компьютером. Стартапы строят рынки, где агенты торгуются между собой. Через 5-10 лет бизнес может работать совсем иначе.
📝 Paper: https://www.nber.org/books-and-chapters/economics-transformative-ai/coasean-singularity-demand-supply-and-market-design-ai-agents
#ai #economics #agents #research
[—————————
Мысли Рвачева
—————————](/channel/\+OvImEUmA7W5mYTRi)
Google Gemini постепенно но уверенно отжимает долю у OpeAI ChatGPT.
Вижу это как в аналитике, так и в настроениях спецов с которыми общаюсь.
#google #gemini
Source: https://www.similarweb.com/corp/wp-content/uploads/2026/01/attachment-Global-AI-Tracker-6.pdf
#openai #chatgpt
—————————
Мысли Рвачева
—————————
#robotics #amazon
—————————
Мысли Рвачева
—————————
Ключевым ограничением сейчас являются энергия и дата центры. Произодство чипов опережает постройку датацентров и подкючение их к электрической цепи.
Интервью с Jeremie Eliahou Ontiveros и Ajey Pandey из SemiAnalysis.
Source: - https://stratechery.com/2026/an-interview-with-jeremie-eliahou-ontiveros-and-ajey-pandey-about-building-power-for-ai
Jeremie Eliahou Ontiveros: https://x.com/JeremieEO
Ajey Pandey: https://x.com/GridGodAjey
#ai #agi
—————————
Мысли Рвачева
—————————
The Bash tools is the most powerful agent tool.
#agi #ai #agent
—————————
Мысли Рвачева
—————————