Авторский контент Рвачева Никиты (@rvnikita): о чем думаю, мечтаю, что читаю.
🤖 OpenAI выпустила подробное руководство по созданию AI-агентов
OpenAI опубликовала "Practical Guide to Building Agents" — 32-страничный документ, который систематизирует опыт построения AI-агентов для реальных задач. Это не манифест и не исследование, а подробная методичка: где агенты реально полезны, как их проектировать и как не напороться на хаос.
Агент — это не просто обёртка вокруг LLM. Это автономная система, которая сама принимает решения, вызывает нужные инструменты, держится в рамках инструкций и может справляться с многошаговыми задачами. OpenAI предлагает начинать с одиночных агентов (single-agent loops), а уже потом двигаться к более сложным мультиагентным архитектурам.
Гайд особенно полезен тем, кто устал от демо-проектов и хочет построить систему, которая реально работает в продакшене. С фокусом на guardrails, human-in-the-loop и безопасность при выполнении критичных задач.
🔗 Source: https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf
#openai #ai #agent #coding
—————————
Мысли Рвачева
—————————
Очень крутой курс от MIT который я сейчас прохожу называется "The Missing Semester of Your CS Education". Основная идея - что этот курс не про AI и не про языки программирования, а про инструменты, которые для них используются. В первую очередь программистами, но не только. Среди инструментов: shell (терминал), git, vim и др. Научившись оптимально ими пользоваться можно ускорить свою работу как минимум на порядок. Ну и название конечно классное "the missing semester". Как человек замороченный на оптимизацию я, конечно, многое уже знаю, но тем не менее в каждой лекции нахожу что-то новое и применяю.
Список лекций
Course overview + the shell
Shell Tools and Scripting
Editors (Vim)
Data Wrangling
Command-line Environment
Version Control (Git)
Debugging and Profiling
Metaprogramming
Security and Cryptography
Potpourri
Q&A
Рекомендую!
Сайт: https://missing.csail.mit.edu/
Лекции: https://www.youtube.com/watch?v=sz_dsktIjt4&list=PLyzOVJj3bHQuloKGG59rS43e29ro7I57J
#lecture #education #coding #shell #vim #regexp #mit
—————————
Мысли Рвачева
—————————
🔥 OpenAI презентует модели o3 и o4-mini
https://www.youtube.com/live/sq8GBPUb3rk?si=wZz5NRLGRaE4BMk-
#openai #ai #chatgpt
—————————
Мысли Рвачева
—————————
ChatGPT 4.1 vs 4.5 на тесте в написании кода эмулирующего простую физику
Не забываем, что 4.1 в 30 раз дешевле чем 4.5
#ai #agi #chatgpt #coding
—————————
Мысли Рвачева
—————————
Google встроил AI прямо в Google Sheets — на уровне формул.
Больше не нужно вспоминать, как писать VLOOKUP или придумывать хитрые конструкции для сложных задач.
Теперь достаточно написать промпт в =AI() — и модель сама поймёт, что в ячейках, и вернёт нужный результат.
Примеры, что можно делать прямо в таблице в комметариях.
#google #spreadsheet #ai
—————————
Мысли Рвачева
—————————
🔥 Большое обновление ChatGPT: с сегодняшнего дня ChatGPT имеет доступ ко всей истории переписки (включая другие чаты), а значит ответы будут еще более точные и персонализированные.
#ai #agi #chatgpt #openai #memory
—————————
Мысли Рвачева
—————————
#lifehack 15: всегда проси скидку
Интересный факт, но в постсоветском пространстве просить скидку кажется чем-то стыдным, в то время как в американской культуре это абсолютная норма. То есть в постсоветском пространстве за просьбу можно потерять пару поинтов в репутации, в США точно нет, в худшем случае - откажут.
Переодически вспоминаю об этом и снова и снова применяют, как результат:
1) За последнюю неделю сэкнономил в двух местах на ощутимых чеках (подписка на https://www.firecrawl.dev и полугодовой абонемент для детей в арт школу )
2) Потренировался получать отказы - это тоже полезно.
Слышал истории, что люди тренируют скилл до того, что получают скидос в старбаксе 🤪
В общем: всегда проси скидку
#lifehack #money
—————————
Мысли Рвачева
—————————
#lifehack 14: в ChatGPT можно принудительно выключить Canvas.
Если вас, как и меня, бесит Canvas, оказывается его можно выключить для всех новых чатов в Customize ChatGPT.
Причны почему он меня бесит:
1) Обычно я работают одновременно с несколькими файлами, в Canvas же будет изменен в итоге только один
2) Самое каварное - иногда если ChatGPT не справляется с задачей по написанию кода я переключаю с 4o (которая сильно быстрее и достаточна в 95% случаев) на o3 (которая медленная но сильно лучше в логике и написании кода). Так вот если где-то наверху у вас включился канвас автоматически - вы можете забыть про o3, она не включится.
#lifehack #coding #ai #agi #chatgpt
—————————
Мысли Рвачева
—————————
#lifehack 13:
Вместо того, чтобы проводить встречи "за обедом" или "за ужином" - договоритесь о встрече-прогулки. У этого варианта только одни плюсы: полезно для здоровья, повышает настроение, необычный формат который увеличит шансы запомниться/договориться.
#productivity #lifehack #networking #health
—————————
Мысли Рвачева
—————————
Оказывается не все знают, что в ChatGPT можно перерисовывать не все изображение, а только часть явно выделив ее с помощью инструмента.
P.S. инструмент появляется на первой итерации сгенерированного изображения, поэтому если вам нужно что-то изменить на своей фотке - жалейте ее и напишите «нарисуй изображение, ничего не меняй), а уже дальше работайте «кистью».
#ai #chatgpt #image
—————————
Мысли Рвачева
—————————
ChatGPT это новый гугл. Трафик из чата постепенно, но неуклонно растет.
#chatgpt #openai #google #ai
—————————
Мысли Рвачева
—————————
🧮 Anthropic обновила Economic Index: как AI влияет на профессии
Я уже писал про первый отчёт Anthropic об экономическом влиянии AI — теперь вышел второй. Отчет стриотся на анонимной статистике использования LLM от Anthropic
Главное: после запуска Claude 3.7 Sonnet увеличилось использование AI в программировании, образовании и науке. Особенно часто включают режим extended thinking для сложных технических задач — лидируют computer science researchers, разработчики и дизайнеры игр.
Интересно, что несмотря на общий рост, в ряде областей — наоборот, снижение доли использования. Например, часть рутинных задач остаётся на прежнем уровне автоматизации или даже сокращается.
Также в отчёте — редкий для отрасли разбор: как AI распределяется между задачами, где он больше помогает (augmentation) и где полностью берёт работу на себя (automation). Оказалось, что в среднем AI чаще выступает как ассистент (57%), но для переводчиков и разработчиков уже ближе к 50/50.
Anthropic продолжает выкладывать сырые данные и детали методологии для независимых исследований — за это им респект.
Подробнее: https://www.anthropic.com/news/anthropic-economic-index-insights-from-claude-3-7-sonnet
#anthropic #ai #economics #automation #chatgpt
—————————
Мысли Рвачева
—————————
ChatGPT когда в очередной раз просят картинку в стиле Studio Ghibli
#friday #fun
—————————
Мысли Рвачева
—————————
Что если бы Interstellar делали в Studio Ghibli.
Сразу предвосхищая вопрос:
1. В ChatGPT 4o Images делаются картинки
2. В morphic.com делается анимация
#ai #agi #chatgpt #video
—————————
Мысли Рвачева
—————————
ChatGPT o3 и o4 mini отлично справляются с тестом на написание кода эмулирующего простую физику
#ai #agi #chatgpt #coding
—————————
Мысли Рвачева
—————————
📺 #lifehack 16: заведи два YouTube-аккаунта — это реально изменит твою продуктивность
Один — для полезного контента: лекции, интервью, туториалы, хорошие подкасты.
Второй — для отдыха и бессмысленного скроллинга: клипы, мемы, хайлайты, реакты.
Каждый раз, когда заходишь в YouTube, приходится принять маленькое, но важное решение:
я сейчас хочу думать или отключиться?
Алгоритмы подстраиваются мгновенно. Один клик на дурацкое видео в чате — и весь фид начинает скатываться. А переключение между аккаунтами помогает сохранить чистоту ленты и осознанность в потреблении.
Это правило можно применить и к другим платформам — от TikTok до Instagram. Главное — сделать границу между “я развиваюсь” и “я прокрастинирую” видимой.
#lifehack #productivity #dopamine #attention #digital_hygiene
—————————
Мысли Рвачева
—————————
🔥 OpenAI презентует ChatGPT 4.1
Link: https://openai.com/index/gpt-4-1/
Video: https://www.youtube.com/watch?v=kA-P9ood-cE
P.S. Зачем называть модель 4.1 если она круче чем 4.5 не понятно.
P.P.S. Доступна только через API
#openai #chatgpt #ai #agi
—————————
Мысли Рвачева
—————————
Появилось четкое ощущение, что OpenAI теперь знает про меня больше, чем Google и все остальные.
Напишите в ChatGPT "Write everything you know about me" и тоже немного прифегеете.
#privacy #chatgpt #ai #agi
—————————
Мысли Рвачева
—————————
Первый 🐺 за 12 000 лет: как Colossal "вернула" dire wolf
Стартап Colossal заявил о де-вымирании — на свет появились три "щенка" dire wolf: Ромул, Рем и Халиси. Это результат масштабного редактирования ДНК с помощью CRISPR — учёные взяли древние образцы (до 72 000 лет) и внедрили фрагменты генома в клетки серого волка.
На выходе — не оригинальный вид, а гибрид: функциональный аналог, созданный из современного волка с частями ДНК dire wolf. Такой подход вызвал споры. Критики напоминают: dire wolves — это не просто крупные волки, а отдельная эволюционная линия, не совместимая с современными суррогатами. Даже с идеальной ДНК это не была бы "ресинтезация вида".
Тем не менее, достижение значительное: более 20 точечных изменений в 14 генах, восстановление признаков — от шерсти до размеров тела. Colossal называет это "functionally equivalent species" — биологическая реконструкция без претензии на полную идентичность.
Главный вопрос теперь не в науке, а в намерениях. Это Jurassic Park или шаг к спасению исчезающих видов?
📝 Source: https://colossal.com/direwolf
#genetics #crispr
—————————
Мысли Рвачева
—————————
Мысль: если стартовать с нуля цивилизацию (либо хорошую симуляцию цивилизации) как быстро в ней появятся деньги? Не смотря на то, что деньги весьма логичный инструмент и столько про него написано, все равно каждый раз когда задумываюсь о его существовании и огромном количестве инструментов построенных сверху определяющих жизнь каждого человека - прихожу в невероятный восторг.
Казалось бы, у какие-то цифры упали на 15%, а влияние, обсуждения и т.д. невероятные.
#thought #money
—————————
Мысли Рвачева
—————————
Сможешь отличить 🤖 от 👨🦰?
Ребята из UC San Diego запустили интересную исследовательскую игру — одновременно общаешься с человеком и AI и пытаешься понять, кто есть кто. Это и есть классический тест Тьюринга.
Удивительно, но ChatGPT (GPT-4.5) смог пройти этот тест. В формате, где он играл роль интровертного подростка, знающего интернет-культуру, его приняли за человека в 73% случаев — чаще, чем настоящего человека! Это первый раз, когда AI выиграл у человека в такой трёхсторонней версии теста.
Правила простые: у вас есть 5 минут на общение с двумя собеседниками, после чего нужно решить, кто из них человек. Спойлер — это не так просто, как кажется.
📝 Paper: https://arxiv.org/abs/2503.23674
🎮 Play: https://turingtest.live/
Кстати, в детстве мне казалось, что как только AI пройдет тест Тьюринга — это будет конец света. Ну что ж, момент настал, но пока вроде живём.
#openai #ai #agi #turingtest
—————————
Мысли Рвачева
—————————
Ставим ставки когда в телеграмме появятся не пресозданные, а автогенерируемые стикеры?
#telegram #genai
—————————
Мысли Рвачева
—————————
Засилье картинок в стиле Ghibli только доказывает, что в будущем выиграют те, кто придумывает что-то своё, а не копирует чужое в тысячный раз.
#thought #ai #agi #singularity
—————————
Мысли Рвачева
—————————
В общем нужно признать, что до AGI еще далеко
“нужно нарисовать семь красных линий. Все они должны быть строго перпендикулярны, и кроме того, некоторые нужно нарисовать зеленым цветом, а еще некоторые — прозрачным.”
#friday #fun
—————————
Мысли Рвачева
—————————
🤖 CodeAct: новая эпоха AI-агентов после ReAct
AI-агенты — это программы, способные не просто выдавать ответы, но и самостоятельно принимать решения, выполнять задачи и взаимодействовать с окружающей средой. Долгое время AI умели хорошо «думать вслух» (chain-of-thought), постепенно рассуждая над задачей, но ограничивались только знаниями, которые уже были у них внутри. Другие подходы позволяли агентам активно действовать (например, искать что-то в интернете), но без глубокого планирования и понимания задачи в целом.
С появлением подхода ReAct (Reasoning + Acting) произошла важная революция. ReAct позволил AI-агенту делать две вещи одновременно: рассуждать и сразу же совершать действия во внешней среде.
Пример работы ReAct:
Представьте, вы спросили агента: «Какие интересные места посетить в Париже?» Агент сначала рассуждает: «Мне нужно найти актуальную информацию». Затем он совершает действие — ищет в интернете список достопримечательностей. Получив результат поиска, агент снова рассуждает: «Вот несколько мест, теперь выберу самые популярные», и выдаёт вам окончательный ответ. Если полученной информации недостаточно, агент снова выполняет действия и рассуждения, пока не достигнет нужного результата.
Однако когда задачи становятся длинными или особенно сложными, у ReAct могут возникнуть трудности: агент начинает теряться, повторять неудачные шаги или забывать общий план действий.
Именно для таких ситуаций был создан новый подход — CodeAct.
CodeAct использует более мощную идею: каждый следующий шаг AI-агента определяется не просто размышлениями, а с помощью генерации программного кода. Агент буквально пишет код, который выполняется, чтобы понять, что делать дальше.
Пример работы CodeAct:
Представьте, агенту нужно подсчитать сумму чисел от 1 до 100. Вместо того чтобы мысленно выполнять действия шаг за шагом, агент пишет код:sum(range(1, 101))
Затем агент запускает этот код, мгновенно получая результат.
CodeAct позволяет агенту «писать инструкции самому себе», которые затем исполняются. Это значительно повышает точность и позволяет выполнять сложные и многоэтапные задачи, например, планировать поездку (бронировать отели и авиабилеты, резервировать рестораны и встречи) или совершать покупки на разных сайтах одновременно.
Оба подхода (ReAct и CodeAct) работают по принципу цикла: агент думает, действует, оценивает результат и повторяет эти шаги, пока задача не будет выполнена. Но ключевое отличие CodeAct в том, что здесь агент не просто думает, а напрямую генерирует код для каждого действия, что намного расширяет его возможности и точность.
CodeAct — важный шаг вперёд, потому что позволяет агентам справляться с более сложными сценариями, чем это было возможно раньше. Это похоже на разницу между человеком, который решает задачу в уме, и человеком, который записывает промежуточные шаги на бумаге. Второй подход гораздо надёжнее и эффективнее, особенно если задача непростая.
Поэтому важно следить за развитием таких подходов, как CodeAct — они могут значительно расширить возможности AI в будущем.
#ai #coding #openai #multiagent #agent
—————————
Мысли Рвачева
—————————
Техническая, но важная (в первую очередь с точки зрения стандартизации индустрии) новость: OpenAI поддержит MCP.
https://x.com/sama/status/1904957253456941061
P.S. Для тех, кто не понимает о чем речь - писал об MCP тут.
#ai #agi #openai #mcp
—————————
Мысли Рвачева
—————————