rvnikita_blog | Unsorted

Telegram-канал rvnikita_blog - Мысли Рвачева

4324

Авторский контент Рвачева Никиты (@rvnikita): о чем думаю, мечтаю, что читаю.

Subscribe to a channel

Мысли Рвачева

🛡🛡🛡 OpenAI запускает Codex Security - набор инструментов для автоматического поиска уязвимостей в коде.

GPT-5.3-Codex стала первой моделью, которую OpenAI классифицировала как "High capability" для задач кибербезопасности. Это первая модель, которую целенаправленно обучали находить уязвимости в софте. При тестировании на внешних репозиториях она нашла около 800 критических и более 10 500 высокоприоритетных проблем.

Главный продукт линейки - агент Aardvark. Он автономно анализирует репозиторий, строит threat model проекта, сканирует каждый коммит на уязвимости и пытается эксплуатировать найденные баги в изолированной среде. Если уязвимость подтверждается - генерирует патч через Codex. За время бета-тестирования Aardvark нашел уязвимости, которым присвоили 10 CVE-идентификаторов. Теперь OpenAI расширяет бету и предлагает бесплатное сканирование для популярных open-source проектов, включая Next.js.

Отдельная история - Trusted Access for Cyber. Это программа контролируемого доступа к кибер-возможностям модели. Запросы с повышенным риском автоматически перенаправляются на менее способную GPT-5.2. Для легитимных исследователей безопасности есть отдельная заявка на полный доступ. Плюс OpenAI выделяет $10M в API-кредитах на защиту open-source и критической инфраструктуры.

Интересный кейс: в декабре 2025 инженер из Privy (компания Stripe) за одну неделю с помощью GPT-5.1-Codex-Max нашел несколько ранее неизвестных уязвимостей в React Server Components, которые были ответственно раскрыты команде React.

https://openai.com/index/codex-security-now-in-research-preview/

#openai #codex #cybersecurity #ai #aardvark

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

🎢 Claude Code управляет виртуальным бизнесом в RollerCoaster Tycoon

Ребята из Ramp Labs сделали демо, где Claude Code управляет парком развлечений - нанимает механиков, строит аттракционы, анализирует финансы и даже генерирует CFO-отчеты. Все через командную строку.

Технически это работает так: они написали CLI-инструмент rctctl (по образцу kubectl) для OpenRCT2, и Claude получает информацию о парке в виде ASCII-сетки и JSON-данных. Никакой графики - только текст.

Что интересно: Claude отлично справляется с анализом данных, настройкой цен и размещением простых объектов. Но пространственное мышление пока слабое - с прокладкой дорожек и постройкой американских горок проблемы.

Почему RollerCoaster Tycoon? Потому что игра - это "Монтессори-набор B2B SaaS интерфейсов". Управление персоналом, удовлетворенность клиентов, финансовые циклы - все как в реальном бизнесе.

Главный вывод: агенты лучше всего работают не как замена человеческого интеллекта, а как "автоматизация усердия" - рутинный мониторинг и оптимизация, пока люди занимаются стратегией.

🧪 Demo: https://labs.ramp.com/rct
📝 Paper: https://ramplabs.substack.com/p/ai-plays-rollercoaster-tycoon

#ai #claude #agents #coding

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

claude --dangerously-skip-permissions

#friday #fun

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

График из отчета: успешность Claude vs время задачи

Читать полностью…

Мысли Рвачева

🔧 Anthropic починили большую проблему в Claude Code.

Контекст - это "рабочая память" Claude. Она ограничена. Раньше при подключении внешних инструментов (GitHub, Jira, базы данных) их описания и данные сразу загружались в эту память - и занимали огромную часть. Типичный набор инструментов съедал 50-100 тысяч токенов еще до начала разговора. А в процессе работы данные от инструментов накапливались еще больше. Claude быстро упирался в лимиты, а в куче загруженной информации терялся и работал хуже.

Теперь сделали по-умному: инструменты загружаются только когда реально нужны. Claude ищет подходящий инструмент по ключевым словам и подгружает только его. Результат - минус 85% потребления памяти, а точность работы выросла с 49% до 74% на сложных задачах.

Проще говоря: раньше Claude таскал с собой огромный чемодан инструментов "на всякий случай". Теперь берет только то, что нужно для конкретной задачи.

🔗 Source: https://analyticsindiamag.com/ai-news-updates/claude-code-finally-fixes-the-huge-issue-with-mcps/

#claude #anthropic #ai

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

💸 Инвестиционная стратегия для пользователей AI

Каждый раз когда упираюсь в лимит Claude Code — иду и докупаю акций компаний связанных с вычислениями.

Логика простая: если я готов платить за эти инструменты и упираюсь в потолок — значит спрос реальный. А где спрос — там и рост.

Своеобразный "put your money where your mouth is" подход к инвестициям.

#ai #investing #anthropic #claude

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

⚡️ Claude Code добавил удобную фичу для работы с permissions

Boris Cherny из Anthropic поделился новым улучшением Claude Code: теперь при запросе разрешения (permission prompt) можно нажать Tab и добавить дополнительные инструкции перед тем как принять или отклонить.

Мелочь, но приятная - особенно когда хочешь уточнить контекст для модели, но не хочешь прерывать флоу.

По словам Бориса, команда перепробовала около дюжины вариантов UX за последние недели, прежде чем остановились на этом.

🔗 Source: https://x.com/bcherny/status/2011332893772308867

#claudecode #anthropic #ai #ux

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

🚨 VSCode и вирусы в тестовых заданиях

Разработчики, которые ищут работу - будьте осторожны при открытии "репозиториев с тестовыми заданиями" в VSCode. Внутри могут быть вирусы, которые крадут всю крипту с компьютера.

Движок тот же, что и у сентябрьской эпидемии Shai-Hulud, которая заразила тогда сотни JavaScript-библиотек. Нажимаешь "Да, я доверяю автору этого репозитория" - и тю-тю. Прямо как раньше вирусы на Windows.

Говорят, северокорейские хакеры.

🔗 Source: https://opensourcemalware.com/blog/contagious-interview-vscode

#security #vscode #malware

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

⚡️⚡️⚡️ Anthropic запустили Cowork - Claude Code для обычных людей

После запуска Claude Code команда заметила: люди использовали его не только для кода. Планировали отпуска, создавали презентации, чистили почту, восстанавливали фотографии с жестких дисков, мониторили рост растений и даже управляли духовками.

Сегодня Anthropic представили Cowork - Claude Code для не-технических задач. Продукт сырой, как и сам Claude Code при запуске, но в этом суть research preview.

Встроенная VM для изоляции, автоматизация браузера, интеграция с data connectors, система уточнений когда AI не уверен. Как говорит Boris Cherny: "базовый Claude Agent - лучший агент, а Opus 4.5 - лучшая модель".

Доступно для Claude Max в macOS приложении.

🔗 https://claude.com/blog/cowork-research-preview

#anthropic #claude #cowork #ai

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

🧠 MIT и Harvard опубликовали работу о "Коузианской сингулярности" - точке, когда AI-агенты изменят саму идею компании.

В 1937 году экономист Рональд Коуз задал вопрос: зачем вообще нужны компании? Почему бы не покупать все на рынке? Его ответ: потому что поиск, переговоры и контроль стоят дорого. Проще нанять людей и делать все внутри.

Теперь представьте AI-агента, который за секунды находит лучших поставщиков, договаривается о цене и следит за качеством. Без зарплат, без офиса, без менеджеров. Вдруг держать большую компанию становится не нужно?

Исследователи описывают три волны изменений. Первая: у каждого будет личный агент для покупок и сделок. Вторая: компании создадут своих агентов - одни будут работать везде, другие только внутри одной экосистемы. Третья: появится новая инфраструктура - способы проверить агента, автоматические договоры, новые правила торговли.

Это не значит, что компании исчезнут. Они останутся там, где нужны люди - для создания брендов, инноваций, культуры. Но рутинные операции и координация перейдут к агентам.

Это уже началось. OpenAI выпустила Operator - агента для работы в браузере. Anthropic делает агентов для управления компьютером. Стартапы строят рынки, где агенты торгуются между собой. Через 5-10 лет бизнес может работать совсем иначе.

📝 Paper: https://www.nber.org/books-and-chapters/economics-transformative-ai/coasean-singularity-demand-supply-and-market-design-ai-agents

#ai #economics #agents #research

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

Если кто-то пользуется Alfred, я обернул скрипт переключения между аккаунтами Claude Code в воркфлоу, чтобы делать это в один клик. Удобно иметь не один профиль за $100 или $200, а 2-3 за $20 и просто переключаться между ними.

Link: https://github.com/rvnikita/claude-account-switcher-alfred

P.S. Не стесняйтесь делиться с друзьями и расшаривать на свои каналы.

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

В прошлом у меня был классный "проект" - совместное прохождение курсов. Работало это так: каждый независимо смотрел в течение недели блок из курса, а потом мы созванивались в одно время и обсуждали.

Самым главным для меня открытием стало, насколько по-разному люди воспринимают, казалось бы, одинаковую информацию. Как производная от этого, обсуждения (даже просто послушать) сильно расширяли горизонт понимания, не говоря уже о том, что повторение и обсуждение значительно улучшают качество усвоения.

К чему я все это? Одна из целей этого года - восстановить клуб. Уверен, кому-то из вас это будет интересно. Давайте начнем с того, что в комментариях накидаем курсы, которые вы очень хотите пройти, считаете лучшими из того, что видели и т.д.

Составлю свой список (правда, это мы уже все прошли):

1. Michael Sandel - Harvard - Justice - просто лучший! прошел дважды
2. Robert Sapolsky - Human Behavioral Biology
3. Y Combinator - Startup School

P.S. Это все 100% на некоммерческой основе.

#education #michael_sandel #philosophy #robert_sapolsky #biology #ycombinator

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

Мне кажется или OpenAI постепенно начинает проигрывать рынок Anthropic?
Повсюду слышу про Claude Code, а про OpenAI Codex только в твиттах Sam Altman и Co про то какой он крутой и невероятный?

Или это я в бабле?

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

📬 Google превращает Gmail в ассистента

Google объявила, что Gmail переходит в эпоху Gemini. Почта становится не просто ящиком, а персональным помощником.

Главные обновления:
- AI Overviews - краткие сводки длинных переписок и ответы на вопросы к inbox на естественном языке
- Help Me Write и новые Suggested Replies - помощь в написании писем с учетом контекста и стиля
- AI Inbox - автоматическая приоритизация важных писем, задач и напоминаний

Часть функций доступна бесплатно, продвинутые возможности - для подписчиков Google AI Pro и Ultra. Все работает на Gemini 3. Запуск начинается в США, сначала на английском.

Source: https://blog.google/products-and-platforms/products/gmail/gmail-is-entering-the-gemini-era/

#google #gmail #ai #gemini

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

Лучше способ начать любой проект - создать SPEC.md, описать подробно задачу, а потом заставить Claude Code задать тебе 40+ для уточнения. Польза в обе стороны: CC больше понимает от тебя что ты хочешь, ты сам лучше понимаешь детали того, что тебе нужно.

#ai #agi #claude_code #coding #agent

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

🤖 Notion добавляет автономных агентов

Notion выпустил версию 3.3 с Custom Agents - и это важный сигнал куда движется индустрия.

Что умеют агенты Notion:
- Работают автономно 24/7, без ручных промптов
- Читают Slack, почту, календарь, Figma, Linear, HubSpot
- Триажат задачи и роутят их нужным людям
- Отвечают на повторяющиеся вопросы в Slack
- Пишут daily standups и статус-репорты по расписанию
- Онбордят сотрудников, ведут IT-поддержку, обрабатывают фидбэк

Агенты вылезают за пределы IDE во все рабочие инструменты. Через год-два это станет стандартом для любого бизнес-софта.

Курс как строить агентов: https://academy.notion.com/custom-agents/435915/scorm/8iven7mv17k3

#ai #notion #productivity #agents

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

📚 Недооцененная фича ChatGPT - Study Mode

Есть режим "Study and learn", который не дает готовый ответ, а ведет тебя к нему через наводящие вопросы. Сократовский метод в действии.

Что делает: задает вопросы, чтобы понять твой уровень, разбивает сложное на простые шаги, периодически тестирует понимание, объясняет почему ответ верный или нет. Можно загрузить свои материалы (PDF, картинки) и попросить потестировать тебя потом.

Как жаль, что этого не было, когда я учился в универе. Всем родителям школьников и студентам - must use.

P.S. Сам решил вспомнить как решаются дифференциальные уравнения - прям кайфанул.

🔗 Source: https://openai.com/index/chatgpt-study-mode/

#openai #chatgpt #ai #education

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

📊 Anthropic выпустили 4-й Economic Index. 2 млн разговоров с Claude.

Чем сложнее задача - тем больше выигрыш. Школьные задачи ускоряются в 9 раз, колледж - в 12.

Claude справляется с задачами на 19 часов. Успешность - 66%.

География: богатые страны - работа, бедные - образование. AI как социальный лифт.

Покрытие задач за год: 36% → 49%. Больше затронуты операторы ввода данных и радиологи.

Продуктивность: +1-1.2% в год - уровень США 90-х.

🔗 https://anthropic.com/research/economic-index-primitives

#anthropic #ai #research

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

📊 Anthropic выпустили 4-й Economic Index - исследование реального влияния AI на работу. Проанализировали 2 миллиона разговоров с Claude. Каждый выпуск - кладезь инсайтов.

Несколько находок:

Чем сложнее задача - тем больше выигрыш от AI. Задачи уровня школы ускоряются в 9 раз, а уровня колледжа - уже в 12 раз. Парадоксально, но AI больше помогает там, где нужна высокая квалификация.

Claude справляется с задачами, которые у человека заняли бы до 19 часов. При этом успешность на сложных задачах - 66%. Не идеально, но достаточно чтобы серьезно влиять на продуктивность.

Интересно про географию: в богатых странах Claude используют для работы, в бедных - для образования. AI как социальный лифт в действии.

За год покрытие рабочих задач выросло с 36% до 49%. Больше всего затронуты операторы ввода данных и радиологи. Меньше всего - учителя и разработчики (ирония - те, кто создают AI, пока меньше всего им заменяемы).

Оценка влияния на продуктивность: +1-1.2 процентных пункта в год. Для сравнения - это уровень роста производительности труда в США конца 90-х, золотая эпоха tech-бума.

🔗 Source: https://www.anthropic.com/research/economic-index-primitives

#anthropic #ai #research #economics

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

🖥 Масштаб того, что сейчас происходит с искусственным интеллектом, как минимум сравним с появлением компьютера.

Представьте: раньше 100% людей работали не за компьютером. Если смотреть совсем далеко - почти 100% людей были заняты выращиванием пищи. Сейчас количество людей, задействованных в том, чтобы накормить человечество - меньше процента. И продолжает снижаться.

То же самое, кажется, будет происходить с работой за компьютером. Количество людей, задействованных в создании чего-то через компьютер, очень скоро может стать 1%. Есть предсказания - и мне они уже не кажутся наивными - что все, что производит человек за компьютером, будет на 100% автоматизировано.

Сильное ощущение, что это произойдет значительно раньше, чем автоматизация оффлайн-профессий. Хотя через какое-то время и до них доберутся.

#ai #agi #future #automation

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

🧠 Google представил "Personal Intelligence" - Gemini теперь знает о вас все

Google анонсировал новую функцию Personal Intelligence для Gemini. Теперь AI-ассистент может с вашего разрешения подключаться к Gmail, Google Photos, истории поиска и YouTube, чтобы давать персонализированные ответы.

Ключевое отличие от прошлых интеграций - Gemini теперь может "рассуждать" по всем вашим данным сразу и проактивно предлагать инсайты, а не просто искать по запросу.

Функция пока в бета и доступна подписчикам AI Pro и AI Ultra в США. По умолчанию выключена - Google подчеркивает, что пользователь сам решает, когда ее включить.

Это именно то преимущество Google перед OpenAI и Anthropic - экосистема приложений, которыми пользуются миллиарды людей каждый день.

🔗 Source: https://support.google.com/gemini/answer/16836988

#google #gemini #ai #personalassistant

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

💰 Как инвестировать в Anthropic, если она еще не публичная

Меня часто спрашивают про то, как я инвестирую в Anthropic. К сожалению (или к счастью) Anthropic еще не публичная компания (хотя ей и OpenAI прогнозируют IPO в этом году), поэтому единственный прямой вариант - это выкупать доли у инвесторов, что сложно, дорого, да и в целом по ощущениям большинство хочет держать их до IPO.

Есть обходной путь - инвестировать в фонды, которые инвестировали в Anthropic. Удобный из тех, кто мне известен - Fundrise (https://fundrise.com/r?i=3n2q7z) По реферальной ссылке вам еще и $25 дадут.

P.S. Не является финансовой рекомендацией.

P.P.S. Я лично в этом году ставку делаю на:
1) Anthropic
2) Google
3) Публичные компании которые делают "лопаты" для производителей "лопат" - NVIDIA, а также про ресурсы для поддержки этого всего (инфраструктура, энергия и т.п.)

#anthropic #investing #ai #startups

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

Boris Cherny is the new Andrej Karpathy

#boris_cherny #andrej_karpathy

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

⚡️⚡️⚡️ Anthropic запустили Cowork - Claude Code для обычных людей

После запуска Claude Code команда заметила интересную тенденцию: люди использовали его не только для кода. Планировали отпуска, создавали презентации, чистили почту, отменяли подписки, восстанавливали свадебные фотографии с жестких дисков, мониторили рост растений и даже управляли духовками. Паттерн был очевиден - людям нужна агентность Claude для всей их работы, а не только для программирования.

Сегодня Anthropic представили Cowork - первый шаг к тому, чтобы сделать Claude Code доступным для не-технических задач. Продукт сырой и ранний, как и сам Claude Code при запуске, но в этом и есть смысл research preview.

Что особенного: встроенная VM для изоляции, поддержка автоматизации браузера из коробки, интеграция со всеми data connectors из claude.ai, система уточнения когда AI не уверен. Как говорит Boris Cherny из Anthropic: "причина в том, что базовый Claude Agent - лучший агент, а Opus 4.5 - лучшая модель".

Доступно сейчас для подписчиков Claude Max в macOS приложении - кнопка "Cowork" в сайдбаре.

🔗 Блог: https://claude.com/blog/cowork-research-preview
📥 Скачать: https://claude.com/download
▶️ Demo: https://www.youtube.com/watch?v=UAmKyyZ-b9E

#anthropic #claude #cowork #ai #automation

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

🧠 MIT и Harvard опубликовали работу о "Коузианской сингулярности" - точке, когда AI-агенты изменят саму идею компании.

В 1937 году экономист Рональд Коуз задал вопрос: зачем вообще нужны компании? Почему бы не покупать все на рынке? Его ответ: потому что поиск, переговоры и контроль стоят дорого. Проще нанять людей и делать все внутри.

Теперь представьте AI-агента, который за секунды находит лучших поставщиков, договаривается о цене и следит за качеством. Без зарплат, без офиса, без менеджеров. Вдруг держать большую компанию становится не нужно?

Исследователи описывают три волны изменений. Первая: у каждого будет личный агент для покупок и сделок. Вторая: компании создадут своих агентов - одни будут работать везде, другие только внутри одной экосистемы. Третья: появится новая инфраструктура - способы проверить агента, автоматические договоры, новые правила торговли.

Это не значит, что компании исчезнут. Они останутся там, где нужны люди - для создания брендов, инноваций, культуры. Но рутинные операции и координация перейдут к агентам.

Это уже началось. OpenAI выпустила Operator - агента для работы в браузере. Anthropic делает агентов для управления компьютером. Стартапы строят рынки, где агенты торгуются между собой. Через 5-10 лет бизнес может работать совсем иначе.

📝 Paper: https://www.nber.org/books-and-chapters/economics-transformative-ai/coasean-singularity-demand-supply-and-market-design-ai-agents

#ai #economics #agents #research

[—————————
Мысли Рвачева
—————————](/channel/\+OvImEUmA7W5mYTRi)

Читать полностью…

Мысли Рвачева

Google Gemini постепенно но уверенно отжимает долю у OpeAI ChatGPT.

Вижу это как в аналитике, так и в настроениях спецов с которыми общаюсь.

#google #gemini

Source: https://www.similarweb.com/corp/wp-content/uploads/2026/01/attachment-Global-AI-Tracker-6.pdf

#openai #chatgpt

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

#robotics #amazon

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

#friday #fun

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

Ключевым ограничением сейчас являются энергия и дата центры. Произодство чипов опережает постройку датацентров и подкючение их к электрической цепи.

Интервью с Jeremie Eliahou Ontiveros и Ajey Pandey из SemiAnalysis.

Source: - https://stratechery.com/2026/an-interview-with-jeremie-eliahou-ontiveros-and-ajey-pandey-about-building-power-for-ai
Jeremie Eliahou Ontiveros: https://x.com/JeremieEO
Ajey Pandey: https://x.com/GridGodAjey

#ai #agi

—————————
Мысли Рвачева
—————————

Читать полностью…

Мысли Рвачева

The Bash tools is the most powerful agent tool.

#agi #ai #agent

—————————
Мысли Рвачева
—————————

Читать полностью…
Subscribe to a channel