3490
Предприниматель и продакт в AI. Обучаю и внедряю. ex-CPO в канадском стартапе Tiggy. ex-Founder в эдтех-стартапе. В закрепе канала больше информации. Для связи: @vladkooklev
впервые выкладываю исходники своего ai-тренера и анонс закрытого клуба
на прошлой неделе вышел подкаст со мной на канале сообщества димы мацкевича. обсудили чем аи-тренер лучше настоящего, почему агент работает лучше чатжпт. там же я по шагам рассказал про процесс создания такого агента.
я занимаюсь с ним уже полтора месяца и это лучший спортивный опыт в жизни. мы вместе пережили смену трех спортазлов, две травмы вне зала и адаптиацию программы под них. прогресс идет каждую неделю и мне сложно представить систему, которая подходила бы мне больше.
но даже с моими наводками из видео — процесс создания агента достаточно запарный. мне почти каждый день пишут и спрашивают исходники. хорошая новость — сегодня я их впервые выкладываю в свой закрытый клуб, как и еще два полезных артефакта. по исходникам агента можно развернуть за 5 минут и сразу начать пользоваться.
каждый день я строю agentcy — компанию, где нет сотрудинков и есть только агенты. в процессе у меня копится масса аи-артефактов, которые помогают запускать продукты и фичи быстро, с опорой на данные, и интересно рассказывать про это в контенте. их я и буду публиковать в закрытом клубе.
на сайте можно посмотреть список дропов на следющие недели. про этот канал я конечно не забуду, но самые ценные артефакты я откладывал для клуба. для первых 50 подписчиков early bird цена. увидимся в клубе
я изучил больше 100 отчётов по уязвимостям openclaw и исправил их все разом. запускаю инструмент
лекс фридман вчера написал то же, что мы обсуждаем последние недели на аи-встречах: безопасность -- главный блокер распространения агентов. чем больше данных и контроля ты даёшь агенту -- тем больше он помогает и тем больше может навредить.
первая крайность: дать агенту root-доступ к серверу, файлам, секретам. вся защита -- системный промпт с просьбой «будь осторожен». промпт не защищает ни от чего, и когда прилетает простейшая промпт-инъекция, то просто ей следует
другая крайность в том, чтобы целиком обрубить доступы агенту, аппрувить каждое действие вручную. но это убивает весь кайф от использования, ощущение автономии и системы, которая дорабатывает сама себя.
проблема в том, что нет удобного инструмента для точечного контроля. не «можно всё» или «нельзя ничего», а гранулярно: этот агент читает эти файлы, но не делает rm -rf. ходит в сеть, но только на эти домены. либо вообще - дать полный доступ, но только на 30 минут.
хорошая новость -- я сделал такой инструмент. назвал его radius. радиус -- это то, сколько свободы мы даём агенту в моменте. ужимаем или расширяем.
нужны всего 3 команды, чтобы запустить его над openclaw (и другими оркестраторами). я уже раскатил его на свою агентскую систему. внутри всё, о чём я писал в гайде. я также провел исследование по более чем 100 отчётам об уязвимостях и заложил все их фиксы в систему. всё это работает строго, через код, с чёткими правилами и рамками. с ним не получится договориться через свой или чужой промпт
website - github
вам могут забанить аккаунт claude если вы пользуетесь openclaw (у меня есть решение)
об этом рассказал создатель openclaw на подкасте у лекса фридмана. его друг купил подписку за 200$ / мес, подключил openclaw → через несколько дней — бан. я тоже с таким недавно столкнулся: у макса из одного из сообществ, где я состою, заблокировали учётку похожим образом
почему банят: подписку claude можно использовать только для работы руками, без автоматизаций. anthropic субсидирует токены в подписке — даёт больше, чем если бы вы платили по api. openclaw работает даже когда пользователь спит, жжёт субсидированные токены, и экономика ломается. антропик начинает бороться с этим и закручивать гайки
как банят: anthropic смотрит на паттерны запросов. openclaw шлёт heartbeat каждые 30 минут, крутит крон-задачи по расписанию, дёргает модель ночью, когда человек спит. идеально ровный тайминг, который хорошо детектят антифрод-модели, и блокируют учётку
в то же время, ко мне постоянно приходят друзья с похожим запросом: «мне нужен умный агент в телеграме». не звезда смерти с сотней фич. просто агент, который работает и решает задачи автономно и по инструкциям
я собрал для этого свой оркестратор: claude code как движок, telegram как интерфейс. без хартбитов, без кронов, без подозрительных паттернов автоматизации, которые нарушают tos. несколько человек на него уже целиком перешли
сегодня я выкладываю его в опенсорс и делюсь с вами. по традиции попрошу ставить звездочки и кидать пулл-реквесты — https://github.com/bluzir/claude-telegram
я перестал учиться год назад. это был самый продуктивный год в жизни
всю осознанную жизнь учусь — самостоятельно, по книгам, курсы, подкасты, консультации. но за последний год я вообще перестал учиться старыми способами
мой паттерн теперь другой: дип-рисёрч темы → вытаскиваю лучшие практики → моментально применяю в работе → обучаюсь об практику. мне сложно представить задачу, на которую не найду применимых ответов этим способом. начинал с дип-рисёрча от чатжпт. сейчас у меня своя система, которая разбирает тему с разных сторон, в том числе критикует выводы
но агенты двигают планку ещё выше. зачем мне вообще читать рисёрч и вникать в тему? рисёрч должен превращаться в агента. это должен быть модуль внутри системы, заземлённый на реальные данные. пускай он и принимает решения
хочу строить продукт, который нужен пользователю? подключаю ajbtd-агента из данных курса. хочу разобраться в виральных хуках? запускаю рисёрч → упаковываю в агента → агент генерирует хуки за меня
стоимость репликации таких агентов будет нулевой. нажимаешь кнопку и он у тебя. это и убьет большую часть курсов и онлайн-образования
тут можно парировать: чёрная коробка, не знаешь что внутри. но это не так. все инструкции для агента открыты и видны. и они легко докручиваются через фидбэк-луп самим же агентом. не нравится хук → объясняю → даю больше примеров → скармливаю больше рисёрч-данных → получаю более совершенный пайплайн
здесь интересно поисследовать — куда пойдет онлайн-образование. я вижу выход в человеческом взаимодействии, сообществах, их я и хочу строить в этом году
почему я не использую openclaw и вам тоже не стоит
немного статистики: за последние 7 дней в main ветку прилетало в среднем 90 коммитов в сутки. в пиковый день прилетело 67к строк кода
это огромный успех с точки зрения воплощения человеческих идей и прогресса. но максимально неустойчиво с точки зрения системы, которой вы хотите доверить свою жизнь
задайте себе вопрос. я знаю, какие изменения туда прилетают? какие прилетят за следующую неделю? какая цель, насколько все контрибьюторы alligned этой цели? нужны ли вам все эти фичи? как туда добавить свои изменения и aligned ли они с остальной системой?
это нормально, что сейчас нет ответов ни у вас, ни у openclaw, это все болячки молодого проекта и молодой системы, часть из них обезательно исправят
но я выбираю для себя другой подход - я уже несколько месяцев разрабатываю свою систему оркестрации агентов. в моменте openclaw оказался сильно впереди, но я вместе этого взял их репо и забрал оттуда все лучшие механики и архитектуры. сделал их частью своей системы, при этом оставил за собой контроль. а сегодня я повесил ежедневную задачу смотреть апдейты в их репо за сутки и присылать мне саммари, чтобы забирать лучшее регулярно
мы живем в мире, где стоимость репликации стремится к нулю. самая выгодная стратегия в этом мире - не быть инноватором и тем, кто ищет вкладывается в поиск решений. а быстро находить и адоптить чужие лучшие практики в свою систему над которой имеешь контроль
а так конечно openclaw это прекрасная стартовая точка, и нормально с нее начинать при всех мерах предосторожности
😊 Неделя запусков — курс и конференцию по вайбкодингу
Настало время анонсов! Уже завтра вечером проводим конференцию по вайбкодингу от Vibecon, выступят четыре практикующих спикера:
— Сева Устинов покажет, как навайбкодил себе в Cursor личную CRM и телеграм-бота к ней;
— Алексей Писаревский расскажет, как сделал свой апп в Replit, который выдерживает боевой трафик и боевые нагрузки. А также покажет, как в одиночку собрал в Cursor, Supabase и Preset целую BI систему с дашбордами, для которой раньше нужны были разработчики и аналитики;
— Кирилл Гурбанов покажет своего финансового агента, который рассчитывает зарплаты и дашборды. А также как они работают с вайбкодингом в команде;
— Мари Афонина расскажет и покажет, как завайбкодила платформу для своего курса, которой пользуется уже больше 1000 человек;
Бесплатно, за подписки на спикеров. Зарегистироваться можно через бота. Тема очень горячая, собрали уже 600 регистраций.
—————
А в четверг стартует второй поток нашего с Лешей курса по вайбкодингу для не-разработчиков. Вы могли уже заметить, что это единственная тема, про которую пишу посты, и все мое внимание правда направлено туда.
Я писал и буду продолжать писать, что на мой взгляд команды должны состоять наполовину из вайбкодеров, а на другую половину из AI-разработчиков. Этот курс для первой половины команды: продакты, дизайнеры, маркетологи, CEO, методисты, финансисты. Для всех вас я вижу массу кейсов, чтобы улучшать работу при помощи AI и вайбкодинга. Мы упаковали наше видение и опыт в курс, провели тестовый первый поток, учли его ошибки, пересобрали. И вот получился этот новый запуск.
Когда я запускал в 2017 свой первый курс по Python, то ставил себе цель, чтобы каждый участник выходил с первой недели с телеграм-ботом. Время идет, цели становятся глобальнее, а достигаются быстрее — уже после первого воркшопа участники получат навайбкоженный продукт, задеплоенный на сервер.
Программа, расписание, инструменты — все доступно на сайте.
🤯 Мои инсайты из года внедрения AI в разработку (ч.1)
У меня главный фокус последнего года — это обучение команд разработки и внедрение AI в их процессы. Я поработал с разными компаниями — стартапами и корпорациями; и с разными ролями — СEO, СТО, продакт-менеджеры и разработчики. И мне есть, что рассказать.
Для начала разделим эту историю на два понятных стрима:
1. Для команд разработки я помогаю выстраивать системный процесс, rules-management, spec-driven development, итд. Главная задача — выстроить процесс так, чтобы AI стабильно доставлял код, а метрики росли по всей воронке доставки, без просадок по качеству или стабильности релизов. Это направление я называю AI-driven development.
2. Для нетехнических професионалов (продакты, маркетологи, СЕО компаний и многие другие) набор навыков и инструментов отличается. Это тот самый вайбкодинг — навык быстро проверять гипотезы, автоматиировать рутину, все те ситуации, где раньше для реализации идеи нужно было искать для себя технического партнера или обращаться к команде разработки, а теперь можно сделать все самому. С этим мы работаем в Vibecon.
И вот мой главный инсайт на текущий момент: вы либо вайбкодите свой продукт без команды разработки; либо у вас есть команда разработки, но она безоговорочно использует AI на всех этапах разработки и ускорена за счет этого.
Я так часто слышал аргументы против применения AI в разработке и в 99% это упирается в skill issue. Галлюцинирует модель? Научитесь прокидывать контекст и писать спеку перед тем, как нести агенту. Спефичиные подходы к разработке в команде? Распишите рулы для AI-агента и раскатите на всю компаню. Так можно долго продолжать.
Я тратил месяцы своей карьеры на фичи или продукты, которые сейчас создаю за 1-2 вечера. Впервые в жизни я чувствую, что могу реализовать любую свою идею, и мне для этого не нужен дизайнер или разработчик.
И это невероятное чувство 😊
😎 Ну как вы там без меня? Справлятесь?
Сорри, что долго не писал, работал...
Вчера вот выступал для рабочей группы по генеративному AI от R-Founders с классной темой про агентов. Получил хороший отклик и сразу захотелось написать пост.
Но на самом деле у меня набралось уже пару десятков таким тем и нет сил больше молчать. Пока дефолтные аи-каналы кормят новостями про новые модели и бенчмарки, расскажу вам про реальный опыт использования и улучшение метрик.
Но давайте договоримся: вы накидываете 100 реакций на этот пост, а с меня за следующий месяц посты по темам:
1. Увольняйте своих разработчиков, если они не используют Cursor
2. Стоит ли разрабатывать сейчас своего AI-агента? (Спойлер: нет)
3. Каким должен быть профессионал в эпоху AI-агентов
4. Системное внедрение Cursor в разработку (даже с кучей существующей кодбазы)
5. Вайб-кодинг — главный скилл продакта (стартапера?) в 2025
6. Как AI-сотрудники мне помогают строить агенство
7. Биохакинг в эру AI. Как я использую 50+ метрик организма для принятия решений.
Если какая-то из тем интереснее других, то пишите в комменты 👉👈
🏗 AI в 2024 — это кубики Лего
Дисклеймер: этот пост я впервые написал год назад, но сейчас он мне кажется еще более актуальным, делюсь снова без редактуры.
Технологии развиваются сегодня быстрее, чем когда-либо. Если раньше AI был конкурентным преимуществом, то сейчас это такой же базовый уровень, как удобный интерфейс. Ниже я расскажу, почему я разделяю классический ML и AI, который доступен сейчас.
ML устарел: раньше для решения любых AI-задач требовались ML-инженеры и долгие месяцы на эксперименты. Теперь же часто достаточно запроса в API. Эндрю Ынг— один из главных людей в ML-индустрии. Теперь он делает курсы по промптингу и рассказывает про это так: «Даже мне, опытному ML-щику, раньше нужны были 2 недели, чтобы решить задачу классификации. Теперь же достаточно написать промпт.».
Почему конструктор: по интернету разбросаны разные кубики и главная задача — их умело собрать. Именно про это я говорил в посте про AI-инженеров. Технологии распознования и синтеза голоса, качественные промпты, генерация изображений, ноукод-тулы для создания цепочек запросов в LLM — все это кубики.
Как я применяю это: в феврале я применил стратегию «кубиков» и запустил расширение для продаж в LinkedIn за два часа. Дальше я интегрировал эту же технологию в процесс привлечения аутстафинг-агенства. Так мы смогли рассылать в 3 раза больше сообщений кандидатам. Я применил этот подход на >10 проектов и везде «AI как сервис» выигрывал у «классического ML» по скорости итераций и проверки гипотез.
🤩 Прямо сейчас происходят огромные инвестиции в индустрию. Только вчера GPT научился видеть и говорить, а в следующем году уже может научиться генерировать видео. Мы неминуемо идем к миру, где технологии стоят дешево и доступны всем.
@prod1337
🫡 Не стоит переживать из-за недостатков ИИ, действуйте
У меня есть стандартный слайд, который использую во всех выступлениях — «что мешает людям начать использовать ИИ?». Первыми всегда идут «галлюцинации» и «я попробовал, получилось не очень, для моей задачи не работает». На этом отваливаются и разработчики, и предприниматели и продакты. Казалось бы, ИИ и правда галюцинирует, правда ошибается — что тут не так? Но мне больше нравится другой подход.
Когда я подступаюсь к задаче, то смотрю на нее так «нет галлюцинаций и проблем, а есть недостаточная проработка промпта и пайплайна». За 30+ проектов агентства и за кучу консультаций я пока не встретил ни одного кейса, где ИИ не давал бы достаточное качество при правильном подходе. Их чаще всего два: декомпозиция задачи до набора простых задач, чтобы ИИ точно справился + промпт-инжиниринг.
Так смотреть даже просто выгоднее: я заранее себя не ограничиваю никакими установками. Это особенно важно, когда технология новая, постоянно меняется, любая установка быстро становится неактуальной. Я могу поверить на слово автору телеграм-канала, а могу пойти попробовать сам на своей задаче, получить реальный опыт.
Другая сторона, что применение подходов может занять действительно много времени. То есть ИИ решит задачу с достаточным уровнем качества, но какой ценой. Вполне нормальное решение — не идти в разработку пайплайна, а посадить студента, который будет делать эту работу руками. Но научиться принимать такое решение эффективно мы можем тоже только через прокачку насмотренности, что снова нас возвращает к моей призме восприятия — делать, а не переживать.
❓ А какую задачу вы хотите решить следующей при помощи AI?
@prod1337
🤑 Как я сэкономил 50 часов за месяц во время JBTD-исследования (показываю AI-пайплайн)
За последние полтора я плотно занялся улучшением своих продуктов. В рамках этого я провел 40+ JBTD-интервью про AI в работе. Сами звонки занимают ~50 минут, при этом еще больше часа уходило на расшифровку записи — работа при этом не самая приятная. В этот раз я решил подойти из AI-first подхода и построил пайплайн, который сэкономил мне все эти часы.
Что умеет текущая система:
- Автоматически приходит на звонки из календаря и собирает транскрипт;
- Транскрипт складывается на страницу звонка в базе знаний;
- Генерируется общее AI-саммари на странице звонка, выделяется список задач;
- В шаблон интервью подставляются ответы респондента;
- Генерируются JBTD-сценарии из заполненного шаблона интервью и инструкций;
Как я это реализовал:
- Для AI-транскрипта и саммари я использую AI-агента от Tana, но подойдет любой аналогичный сервис — обычно я рекомендую mymeet;
- Для базы знаний, база транскриптов звонков я тоже использую Tana — она легко интегрируется с календарем и списком контактов — для меня работает идеально. Могу зайти в сущность человека и найти все наши звонки, быстро наверстать контекст;
- Для заполнения шаблона и финальной обработки я использую Sonnet 3.5. По моему опыту он лучше справляется с длинными текстами, а еще мне нравится их XML-like промптинг.
Какие слабые места:
- AI все еще плохо справляется с выделением смыслов во время генерации JBTD-сценариев. Это сложная и креативная задача — мало, кто из людей умеет это делать правильно, так что не удивительно;
- Всю логику работы с Claude я пока что делаю вручную, хотя у Tana есть API и я могу легко к нему подключиться;
Какие следующие шаги:
- Склеить Tana и Claude, автоматизировать весь процесс;
- Упаковать внедрение AI-first-meetings в услугу и начать внедрять в процессы компаний. Если интересно уже сейчас, то пишите;
На выходе AI мне позволил автоматизировать всю рутину, оставила для меня только самые и креативные задачи. К такому мы сейчас стремимся во всех рабочих сферах.
@prod1337
👨💻 Как научить команду разработки применять AI
С таким вопросом ко мне часто приходят компании. Для одних это просто желание конкретного менеджера ускорить доставку фичей, а у кого-то это KPI на уровне всей компании по количеству AI-сгенерированного кода.
Раньше я мог помогать компаниям только через консультации, а теперь могу поделиться ссылкой на мое мартовское выступление. Я пробежался там по основным слоям внедрения AI в процесс разработки: от базового промптинга до мульти-агентских систем.
На видео неожиданно уже набролось 7.5к просмотров за несколько дней, но чувствую, что тема зайдет для намного большего количества людей. Даже если вам не актуально, то рекомендую закинуть в ваш чат с разработчиками, это лучший способ «начать внедрять AI в процессы» и начать доставлять фичи быстрее.
https://www.youtube.com/watch?v=JAWhQ4FpL8c
Снова большой перерыв без постов, буду исправляться. Насыпьте реакций ❤️, если интересно, над каким AI-продуктом я работал последние месяцы.
Всем привет, апдейты от меня 😎
Как оказалось, сложно вести канал, когда у тебя каждую неделю выступления. За последние два месяца прочитал 8 лекций для компаний, выступал на конфах — все про AI конечно. На это наложился мой перфекционизм и то, что я каждый раз обновлял материал. Знаю, что в канале много людей с выступлений, привет ребята!
К счастью (для читатателей канала) выступления заканчиваются, а еще из них набралась масса материала, постепенно начну ее упаковывать в посты:
1. Почему 2024 — идеально время, чтобы начать делать контент (при помощи AI конечно)
2. AI-сотрудники, как нанять первого к себе в компанию
3. Реальные способы внедрить AI в процесс разработки (помимо копайлота)
4. Как я внедрил в жизнь AI-фитнес-тренера и доверился его решениям
Поставьте реакций, если ждете посты 🫡
📺 Как устроены изнутри языковые модели
Я постоянно пишу про сложные технические темы. Я осознанно не вдаваюсь в детали, но зато посты получаются более насыщенными моими инсайтами. В то же время, я с большим уважением отношусь к людям, которые могут простыми словами объяснять, как устроены сложные вещи.
Именно такой контент регулярно выпускает Andrey Karpathy — один из главных людей в OpenAI и в прошлом директор AI-направления в Tesla. Несколько дней назад у него вышло видео «Intro to Large Language Models». Там он за час рассказывает из каких основных компонентов состоят системы, как ChatGPT. Если слышали термины «инференс», «файн-тюнинг», «галлюцинации модели», но не понимаете их до конца, то рекомендую к просмотру. Видео набрало за эти дни уже пол миллиона просмотров.
Если пока нет времени, чтобы посмотреть видео целиком, то Леша из канала «Ночной Писаревский» сделал хорошую выжимку на 5 минут на VC. Этого хватит, чтобы получить первичную картину и начать лучше ориентироваться в теме.
👀 AI теперь видит и сделает за вас рутинные задачи
Раньше для автоматизации действий в браузере этого требовалось цепляться к html-элементам, четко задавать последовательность шагов, из-за этого существовал порог входа. Теперь у GPT появилась способность видеть и открылось новое пространство решать эту задачу. Разберемся, какие новые подходы уже доступны на рынке автоматизаций.
Adept: еще до ChatGPT хайпа показали свою модель для превращения запроса пользователя в действия. Недавно открыла бету в свой первый продукт Experiments и закрыли раунд на $350mln. Важно, они пока не заявляли про поддержку «видения» в своих продуктах, но это явно вписывается в их стратегию построить AGI.
Induced AI: у этих ребят только $2.3 mln. инвестиций, но зато инвестировал Сэм Альтман. Они также предлагают продукт для автоматизации рутинных задач. Для этого планируют использовать смешанный подход: облачное решение, интеграции с сервисами по API, но в тоже время хотят использовать виртуальый браузер, в котором понадобится возможность «видеть». Для этого сейчас нанимают эксперта в Chromium.
VimGPT: опен-сорсная демка и единственный продукт из подборки, который можно по настоящему попробовать. Проект позволяет управлять виртуальным браузером через команды «найди в гугле все ai+sales продукты и прочитай их контент». GPT получает скриншот страницы, анализирует его и составляет очередность действий. Демка очень сырая, но дает понимание текущих возможностей.
😎 Официально GPT Vision используется только в последнем проекте, но я все равно вынес это в заголовок. «Видение» в перспективе станет ключевой технологий на рынке автоматизаций. На наших глазах появиласть возможность автоматизировать любые действия на сайтах без привязок к API или html-элементам. AI-работникам из предыдущего поста понадобится такой же визуальный инпут, чтобы эффективно решать задачи реального мира. Уже придумали какие задачи будете автоматизировать в первую очередь?
@prod1337
в этот четверг расскажу подробнее про свой дип-рисерч
получил классный отклик на опенсорс релиз моего дип-рисерча: больше 100 тысяч просмотров во всех соцсетях, 65 звездочек на гитхабе, много новых подписчиков. спасибо!
решил подробнее рассказать про кейсы, где я его использую каждый день и почему в них он перформит сильно лучше чатжпт. мой контент, маркетинг, запуски продуктов и агентов — там везде я пользуюсь им.
расскажу про это на зимней конференции про вайбкодинг. там будут и другие классные спикеры, которые поделятся кейсами про оркестрация ии-агентов; cоздание личных помощников в Cursor + Claude Code; агентный инжиниринг вместо вайбкодинга.
конференция бесплатная, но для участия понадобится подписаться на спикеров. четверг, 26 февраля, 17:00 (МСК)
регистрация по ссылке
а завтра будет еще один интересный анонс
мне надоело читать про уязвимости ai-агентов каждый день. сделал гайд — закрываем 7 дыр разом
на прошлой неделе аудит нашел 341 вредоносный скилл на clawhub. в это же время 135 тысяч серверов с агентами торчали наружу. андрей карпати и другие аи-специалисты начали бить тревогу. это действительно критичные вопросы, но у этих проблем есть решение
я выделил 7 основных дыр в безопасности и подготовил инструкцию для вас и вашего агента:
0. скилл-инъекции: скилл — инструкция, которая попадает напрямую в агента. там нет границы между «прочитать docs» и «отправить ключи хакеру» → не ставьте скиллы из маркетплейса вслепую. читайте текст скилла, а не его описание. также добавьте в claude. md правило проверять скиллы перед установкой
1. сервер торчит наружу: по дефолту openclaw работает на localhost. но агент может сам открыть порты во время установки → проверь ufw status. закрой всё кроме SSH и того что реально нужно
2. ключи в открытом виде .env, .aws/credentials, ssh-ключи — это всё текстовые файлы. агент с доступом к файлам = агент с доступом ко всему → вынеси секреты в vault или отдельный .env вне рабочей директории. никогда не давай агенту доступ к ~/.ssh
3. утечка данных: агент может закодировать данные в base64 и отправить куда угодно незаметно. встроенной защиты нет → output dlp: regex + entropy-анализ на каждый ответ. ловит ключи, токены, приватные данные до отправки
4. промпт-инъекция через внешний контент: агент читает веб-страницу — в ней встроена незаметная вредоносная инструкция. атакующему не нужен доступ к вашей сети, чтобы запустить в ней действия → модели стали устойчивее к таким аткам, но не полагайся на это. заведи белый список источников, аппрувь новые сайты вручную
5. сжигание токенов: реальный кейс: $500 за одну сессию. агент крутит бесконечные циклы — ты платишь → жёсткий лимит в админке провайдера. $5-10 на старте. логируй расход, подводи итог каждый день
6. tos-бан: google и antropic банят за использование подписки через оркестратор. аккаунт сгорает без предупреждения → используй api, не подписку для автоматических задач. либо используйте решения без крона и хартбита. также можно завести отдельную учётку для агента, которую не страшно потерять
бонус: дима мацкевич выложил security-пакет (sandbox, dlp, secret scanner). отправь своему агенту — пусть он реализует
мне надоело платить 200$/мес за gpt pro и я построил своего агента для deep research (делюсь с вами кодом)
gpt pro даёт мощную глубину — модель реально копает тему заходами по 30 минут. но ты не контролируешь сам рисёрч: откуда она берёт данные, как фильтрует источники, почему решила что этот сайт достоверный. она постоянно тащит SEO-мусор и AI-слоп, но на это трудно повлиять
стандартная история — это репорты, где он пишет про «самые актуальные модели — sonnet 3.5 и gpt-4o», хотя к тому моменту модели сменились раз 5. в современном мире это непозволительно. я собрал вместо этого свой дип рисерч над claude code
мой пайплайн — 5 шагов:
— декомпозиция темы на ~8 аспектов через разные призмы (who, what, so what, avoid)
— параллельный рисёрч каждого аспекта агентами
— синтез находок
— red team — а что если всё это буллшит? проверка предположений с обратной стороны
— упаковка финальный отчёт
оркестрацией шагов занимается мой фреймворк — claude-pipe. плюс у меня есть мой личный slop-checker skill, который фильтрует источники по критериям.
каждый шаг — отдельный агент со своими инструкциями. не один промпт на всё, а конвейер где каждый этап проверяет предыдущий. одно исследование обходится в ~$1 через exa. значительно шире и глубже, чем gpt pro за $200/мес.
выложил на гитхаб, просто дайте ссылку на него своему claude code / openclaw: github.com/bluzir/claude-pipe/tree/master/examples/research-pipeline
настоящий рисёрч — это система которую ты контролируешь. знаешь откуда данные, можешь поменять критерии, перезапустить один кусок не переделывая всё. я убежден, что в 2026 такая должна быть у каждого. с вас звездочки на гитхабе!
может ли аи-тренер заменить настоящего? я проверил
последние лет 5 я пробую построить внешнюю систему для управления здоровьем
я слушал подкасты хубермана, аттиа, смотрел курсы беловешкина, писал конспекты в обсидиане со связями и графами, вытаскивал протоколы, строил правила, привычки вокруг них. из тулов были: гугл шиты, телеграм боты, фэтсикрет, приложения для трекинга тренировок. итог был всегда один — ты забиваешь. это неудобно, слишком много разных систем, чтобы это было просто на автомате.
но главная проблема - в тех системах нет протокола «что-то пошло не по плану и нам нужно перестроиться». вносить изменения руками слишком запарно и на это нужен ресурс, которого в той ситуации может не быть. живой тренер тоже эту проблему не решает, а только создает новые — они просто не шарят на нужном мне уровне
и вот, я наконец решил все фундаментальные проблемы. через аи-агента. система работает:
0. заземление: система построена на науке - я выкачал те самые сотни подкастов и переложил их на протоколы и инструкции. если данных протокола недосточно и система не уверена, то всегда может сходить в wiki и найти, что в подкастах про это говорили
1. стратегия: на входе в систему я ставлю цель и декомпозирую ее на реалистичные еженедельные действия и ожидаемые результаты. цели могут быть разными: в моем случа это сократить процент жира, vo2max + не хочется терять мышцы
2. данные: синхронизация с вупом + трекаю питание и тренировку. могу прислать фото блюда, могу войсом наговорить какие упражнения я только что сделал
3. адаптивность: неприятные ощущения во время упражнения? пропустил тренировку? переехал, а в новом зале нет нужного тренажера? просто говоришь тренеру об этом - он перестраивает тактику на пути к цели. но самое прикольное, что два раза в неделю тренер сам делаает рекап системы через данные, дает рекомендации
4. долголетие: это финальный и стратегический слой, который я спроектировал и отчасти реализовал, но пока не использую. это биомаркеры, строится на концепции centenarian decathlon от питера аттиа. возможно расскажу про нее отдельно
я пользуюсь системой уже две недели и это лучший экспириенс в плане здоровья, который у меня был в жизни. тренировки не пропускаю, четко понимаю что и зачем, могу уточнить в любой момент. уверен в том что это science-based, не трачу энергию на сомнения или дополнительный рисерч
интересна вам эта тема? в какую их частей углубиться?
последние 2 месяца я каждый день разрабатываю и использую агентов, и вот что я понял
openclawd — это конечно круто и прорывная штука с точки зрения адопшена агентов. я даже выступал на днях и рассказал в чем именно там прорыв
но также правда в том, что все его главные возможности — доступны в голом claude code последние ~ 9 месяцев, и мир за это время не рухнул. claude code можно запустить на сервере, дать автономность, прикрутить крон, длинные сессии и телеграм интерфейс, и получить тот же самый moltbow / openclaw. ребята просто сделали это удобнее из коробки + получили виральность
при этом лично мне ближе голый claude code - нахожусь ниже уровнем, имею больше контроля за инструкциями, данными, понимаю почему что-то идет не так
именно так я собрал для себя за эти месяцы личный совет директоров (агентов), которые мне каждый день помогают принимать решения
здоровье - про стратегию питания и спорта, а также данные из вупа, базриуется на протоколах хубермана и питера аттиа
исследовать - каждый день автоматически рисерчит для меня тренды и рынки. есть и много других ролей - они на скрине
а вчера выкатил через hive - закидываю вопрос в общий чатик с агентами, и даю им возможность обсудить с разных сторон
следующие дни я буду подробнее рассказывать, как строю агентов и делиться опытом. а в конце зашэрю свои основные архитектурные наработки на гитхабе - с вас только реакции
🤯 Мои инсайты из года внедрения AI в разработку (ч.2)
Для меня это во многом личная история. Я начинал карьеру, как разработчик и до 2020 писал код фуллтайм и мне это нравилось, но тянуло в продуктовую сторону. Дальше был переход в продакт-менеджеры. Я продолжил любить код, но времени на него не осталось, а со времнем и сам навык постепенно теряться. Каждый заход «накодить» что-то после перерыва становился все более тяжелым.
Я все еще мог накидать архитектуру, соединить с продуктовым видением, отгрузить в виде спеки, но дальше его реализовать могли только разработчики. Так было до начала 2024, когда я плотно подсел на Cursor. Там еще не было агента, но уже можно было писать код в 2-3 раза быстрее промтами.
А дальше наступила agentic-code революция, апдейты моделей от claude с 3.5 до 4. Я все также могу накидать спеку и соединить с продуктовым видением, только код за меня пишет теперь агент вместо разработчика. Продумываешь, подгатавливаешь документ, декомпозируешь, отгружаешь агенту и забываешь. Время от идеи до реализации сократилось до часов. А я оказался наконец на своем месте: работаю с кодом каждый день, реализую идеи, не теряя при этом фокуса на продукте и продажах.
Забавный факт, таким образом получается работать паралельно над несколькими продуктами за счет того, что уровень абстракции поднимается ниже и не нужно думать о деталях реализации конкретного места в коде. В этом я вижу наибольший потенциал для трансформации IT-команд, но напишу про это отдельно.
Нет более заезженной фразы, чем «будущее уже здесь, просто оно неравномерно распределено», но именно разработка это то место, где это сильнее всего заметно.
🕺 Да уж, ну я и наобещал вам тут
Снова много, что есть рассказать, работал...
Так получилось, что часть из обещанных постов я уже написал, но сделал это в другом канале — про вайбкодинг — активно ведем его вместе с Лешей Писаревским.
Например:
1. Мой реальный кейс вайбкодинга своего продукта
2. Вайбкодим AI-продукт бесплатно (nano banana / gemini под капотом)
3. Взламываем сайты вайбкодеров
А еще посты про N8N, Atlas, вайб-дизайн и все вот это.
Ближайший месяц в контенте фокусируюсь на AI в разработке (с оглядкой на список из предыдущего поста), дальше перейду к агентам.
Писать буду в оба канала, так что подписывайтесь, чтобы не пропустить 😘
Если еще интересны какие-то темы, то пишите в комменты
🤑 One Person One Billion Dollar Company
Летом я рассказывал, как провел исследование. Там я в том числе спрашивал профессионалов, что их мотивирует обучаться в сфере AI. Многие ссылались на концепцию «one person one billion dollar company» от Сэма Альтмана. К тому моменту я уже слышал про нее, но решил разобраться еще глубже.
В начале года в интервью Сэм упомянул, что в своем микро-комьюнити tech-CEO они считают, что в ближайший год мы увидим компанию из одного человека + AI-агентов, которая будет оценена в 1 миллиард $.
Посмотрим объективно: текущее состояние агентов пока далеко от того, чтобы они взяли на себя большую часть функций внутри компании. Сэм явно делает ставку на тренд. Он понимает, что текущее качество агнетов раскладывается на понятные рычаги: cтоимость и скорость инференса, качество ризонинга, количество инструментов, которые облегчают разработку. С момента интервью мы уже увидели две новые модели — 4o и 4o1. Сэм явно также знает, какие модели нас ждут впереди. В будущем явно маячит точка, где это становится правдой.
Хотя Сэм и прав про агентов, но само их появление в нашей жизни не станет одним лишь фактором успеха. Если у всех будут такие агенты, то ценность созданных продуктов быстро обесценится. Все будет также упираться в скорость, дистрибуцию, знание рынка и пользователя. Это нас возвращает к одному из моих последних постов. Важно быть первым.
💪 Я лично верю, что агенты позволят многим людям собрать продукты вокруг своей экспертной ниши, проявиться и раскрыть потенциал. Разбираешься в нутрициологии, фитнесе, IFS или том как проводить публичные выступления — сделай цифровую версию себя. Productize Yourself.
Уже знаете какой продукт вы бы запустили, если бы вам со всем помогала команда AI-агентов?
⏰ У вас есть только одна попытка в эпоху AI
Сегодня необычный пост с отсылкой к мультфильму «Суперсемейка» и злодею оттуда. В какой-то момент он произносит фразу «если все супергерои, то никто не супергерой». Немного переделаю ее с учетом нашей специфики — «если у всех есть доступ к универсальным AI-агентам, то ни у кого нет конкурентного преимущества за счет этого».
Каждый день сложные вещи становятся доступнее: код, иллюстрации, дизайн, знания, операции классификации и саммаризации. В моменте может быть сложно оценить влияние этого на экономику, но легко нарисовать график на котором одна линия будет идти вниз — «стоимость разработки продукта», а другая расти — «количество продуктов на рынке». В какой-то момент продуктов станет так много, что привлечь людей туда станет практически невозможно.
С одной стороны это значит, что важно фокусироваться не на том, что агенты сейчас не могут, а быть первым, кто сможет вытаскивать из них ценность с учетом ограничений. Не забывать при этом и про дистрибуцию — где я возьму первые 10-100-1000 пользователей?
С другой стороны — это значит, что нужны будут новые навыки — менеджерские. Если агент может делать всё, то знания и навыки уже не так важны. Важно будет то, как вы распределяете ресурсы и находите точки, которые дают 10-100х результата. Такой навык можно заработать только практикой.
🫡️️️️️️ Полчуается, что если вы планируете успеть заработать деньги на AI, то начинать нужно сегодня: собирать вокруг себя аудиторию, разбираться в технологиях, экспериментировать с агентами. Еще никогда не было так дешево воплотить свою идею в жизнь. Если вам нужен был сигнал, то пускай это будет он.
@prod1337
💫 Как я стал AI-консультантом
C начала года я провел в 10 раз больше консультаций, чем за всю жизнь до этого. Повлияли на это два фактора: рост подписчиков и взлет AI-хайпа.
👋 На скриншоте Артем, он директор по продукту. Мы созваниваемся уже полгода каждую неделю. На звонках мы генерируем и валидируем вместе AI-гипотезы, ищем дешевые способы внедрения в продукт, обсуждаем и подбираем лучшие на рынке AI-инструменты.
С каждого такого звонка я выхожу счастливым и полным энергии. При этом, я все время относился к консалтингу как к чему-то стыдному: на канале ни одного упоминания, все запросы на консультацию пришли самостоятельно. На это повлиял базовый нарратив окружения — «нужно делать и развивать продукты, а не продавать свое время по часам» и что-нибудь рядом обязательно про leverage и Навала Равиканта.
Вчера я снова круто провел консультацию — на этот раз для одной из крупнейших консалтинговых фирм. На этом моменте даже мой внутренний критик решил отойти в сторону — из этого родился пост с простым достаточно смыслом. Если вам нужна консультация по AI, то напишите мне:
👇 Ниже список запросов, с которыми ко мне обращаются чаще всего:
- Архитектура AI/LLM-продуктов;
- Мы хотим внендрить куда-нибудь, не знаем куда;
- Я пропустил весь AI-хайп, помоги наверстать;
- Продуктовая стратегия для AI-продукта;
- (и также масса других запросов);
📆 Начать можно со звонка-знакомства, его можно забукать по ссылке. Если пока не уверены или есть вопросы, то просто напишите.
🤖 Я создал AI-агента, который помогает готовиться к звонкам
Каждую неделю я провожу не меньше 10 зум-звонков с незнакомыми людьми. Обычно это запросы на консультации или люди с аутрича. Я по своему опыту знаю насколько сильно портит впечателение неподготовленность собеседника. Даже 5 минут подготовки дают преимущество, но даже они не всегда есть.
В один из моментов, я спешно гуглил собеседника перед встречей и осознал, что делаю всегда примерно одни и те же шаги. Так я решил разработать своего AI-агента, который собирает репорты для меня. Ниже расскажу, что он умеет.
Агент подключен к почте: за час до каждого звонка мне в телеграм приходит продвинутый отчет о собеседнике. Агент проходится по 8 источникам данных, ходит по сайту компании, гуглит (запросы для поиска агент составляет самостоятельно) и ищет нужную информацию на сайте компании.
Агент подстраивается: в настройках я указываю мои текущие цели, а агент адаптирует отчет под них. Он также подстраиватеся и под собеседника: легко разделяет инвесторов и фаундеров. Например, для инвесторов больше фокуса будет на последние сделки, а для фаундеров на общий бэкграунд: первый ли это опыт запуска компании, какие позиции занимал в найме. Агент также анализирует, что человек писал в соцсетях в последнее время.
С агентом можно общаться: если в изначальном репорте информации недостаточно, то ее всегда можно уточнить. В этот момент агент может продолжить сбор информации. Обычно я прошу сгенерировать список айсбрейкеров, чтобы начать с них диалог или больше деталей про компанию.
🚀 Дальше больше: планирую интегрировать агента с моим хранилищем расшифровок звонков, чтобы при подготовке к звонку учитывать контекст прошлой встречи. Рынок автоматического рисерча кажется интересным: можно дальше уходить в поиск интервью или подкастов с этим человеком, конкретных цитат, которые можно использовать, уходить на много уровней вглубину.
Хотели бы себе такого агента? Ставьте 🦄, если да
🏋️♀️ Как я внедрил в жизнь AI-фитнес-тренера и доверился его решениям
Уже больше месяца я использую фитнес-браслет Whoop с AI-тренером внутри. У меня набралось достаточно информации, и я решил упаковать ее в пост, где про все расскажу.
Что такое Whoop: это условно бесплатный фитнес-браслет по подписке. Его носит главный биохакер мира — Брайан Джонсон и масса других знаменитостей. При покупке платишь только за доставку, а дальше оплачиваешь подписку — от $20 в месяц. Главная фишка самого браслета — он собирает информацию о пульсе каждую секунду, за счет этого достигается высокая точность при анализе активности и сна. При этом браслет работает 4-5 дней от одного заряда. Это стало возможно за счет того, что сам браслет только собирает пульс и будит вибрацией по утрам, все остальное находится внутри приложения.
Что может приложение: сама бизнес-модель подталкивает компанию вкладываться в развитие приложения. Интерфейс приложения строится вокруг аналитики по трем основных метрикам: strain, sleep, recovery. Приложение следит не только за тем, чтобы вы жили активно, но и за качеством восстановления и сна. Например, часы предложат вам сделать расслабленный день после дня со сложной тренировкой. Подход Apple Watch, где вам нужно закрывать кольца каждый день, несмотря ни на что, после этого кажется примитивным и устаревшим. Мой главный фокус сейчас на том, чтобы вывести метрику сна на регулярные 90%+, и понимаю, что без данных это было бы кратно сложнее. Еще одна фишка — дневник: вы каждый день проходитесь по чеклисту и отмечаете сделали ли что-то из списка (кофе, алкоголь, холодный душ), а через время приложение находит корреляции между этими действими и вашим восстановлением.
Для чего там AI: также в приложение встроен персональнрый AI-тренер. Он дает рекомендации по питанию, активности, восстановлению из ваших данных и цели. На скриншоте например я спросил, какие активности мне стоит сегодня сделать. Внутри тренер работает на связке GPT+RAG по базе знаний + по моим персональным данным. Один из немногих крутых примеров AI-копайлота вне профессиональных задач, пользуюсь почти каждый день.
😎 Пока писал пост, то понял что у меня мыслей еще как миниму на один пост про бизнес-модель и продуктовый подход Whoop: как они привлекают и удерживают пользователей, как создают ощущение причастности к комьюнити — расскажу про это отдельно. По моей рекомендации браслет заказали уже несколько человек, так что тут тоже оставлю рефералку на бесплатный первый месяц. За месяц можно понять нравится ли браслет. Если нет, то просто не оплачивать дальше подписку.
👨💻 Лучшие AI-инструменты для разработчика в 2024
На прошлой неделе я провел первый тренинг «AI для разработчиков». При подготовке я поговорил с десятками разработчиков, проанализировал отчеты от Gitlab и Jetbrains. В результате я узнал какие AI-инструменты и промпты разработчики используют для повышения продуктивности. В этом посте я решил поделиться инсайтами про самые интересные инструменты для разработчиков и разбил их на категории.
1. Github Copilot — универсальный инструмент: больше 50% кода на Github уже написано с его применением. Большинство разработчиков при этом до сих пор им не пользуются. Команда Copilot сначала закрыла сценарии отдельных разработчиков (авто-дополнение, тесты, документация), а теперь развивает продукт на уровне команд и все компании (анализ PR, разворачивание в контуре). JetBrains недавно показали свой аналог Copilot для тех, кто сидит на их стеке. Стоимость — от $10 в месяц.
2. Cursor.sh — потенциальный дизрапшен: в отличии от Copilot они выбрали другой путь — AI-first. Команда Cursor форкнула VSCode и перестроили его интерфейс, чтобы промпты стали главным способом взаимодействия с кодом. В Cursor вы пишете промпт прямо там же, где раньше писали в редакторе код. Также отмечу фичу, которая позволяет прокинуть ссылки на актуальную документацию библиотек, и тогда они будут использованы при генерации. Также как и Copilot — используют модели от OpenAI. Есть небольшое количество запросов в месяц, чтобы протестить бесплатно.
3. Phind — альтернатива для GPT: они начали еще до ChatGPT-хайпа, как поисковик для разработчиков и попали с ним в YC. Долгое время они использовали GPT внутри, но в процессе собрали даныне и обучили свою модель. Теперь Phind отвечает на вопросы разработчиком и генерирует код. Phind доступен в вебе и ставится, как расширение для редакторов кода (в том числе Cursor). Phind доступен бесплатно.
4. CodeMuse — самый интересный стартап: свежий проект из следующего батча YC. Эта команда сфокусировалась на том, чтобы применить к локальному репозиторию open source LLM и эмбединги, и строить вокруг этого фичи. Уже сейчас доступен поиск человеческим языком над проектом — «find function that checks permissions» и автоматическая документация для всего проекта. В начале следующего года они планируют добавить ассистента и генерацию кода. CodeMuse также доступен бесплатно в виде расширения.
🫡 Уже сейчас такие инструменты создают разрыв между разработчиками в разы, а в следующем году разрыв станет критическим. Сейчас лучшее время, чтобы начать их применять — начните с этого списка.
🤔 Я больше не доверяю GPT. Куда переезжать?
За последние дни многие люди вокруг задумались, что необходима альтернатива для GPT. Десятки тысяч бизнесов смотрели, как сотрудники уходят из OpenAI и были готовы ко всему. Я провел начало недели за рисерчем доступных решений и решил упаковать результат в пост. Существует два вида решений: 1) сервисы с API над языковыми моделями; 2) поднятие моделей у себя. Сегодня расскажу про первую категорию.
Claude: самая близкая к GPT-4 модель по бенчмаркам, недавно увеличили контекстное окно до 200 тысяч токенов (не совсем эффективных), и добавили function calling как в GPT. В первую очередь я бы начал эксперименты с нее. Из минусов: немного отличается API, промптинг, и также модель напрямую доступна не во всех регионах (зато доступна через Amazon).
Perplexity: в мае я рассказывал про их продукт, как замену Гугла. С тех пор они также запустили API для доступа к их собственной языковой модели, а также Llama2 и Mistral . В анонсе высочайшую скорость инференса среди конкурентов. API работает в формате OpenAI — это значит что переключаться легко. Мне нравится темп их команды и обязательно буду за ними следить. В комментариях поделюсь способом получить бесплатный доступ к Perplexity PRO на 2 месяца — он как раз дает доступ к API и оно пока бесплатное.
Decart: вариант для тех, кто любит потестить сырые стартапы. Они также предлагают API для доступа к моделям — от $0.1 за миллион токенов Llama2 7B. Это самая дешевая цена за инференс, которую я нашел во время рисерча и скорость ответа также порадовала, так что решил про них тоже рассказать. От стартапа есть ощущение, что он в любой момент отвалится, но зато быстро отвечают в твиттере.
Также потестил: Replicate — медленно и по ощущениям, и по бенчамаркам; Anyscale — сложный онбординг, непрозрачная ценовая модель; LiteLLM — библиотека, чтобы приводить разные форматы API к формату OpenAI, чтобы делать бесшовное переключение, показалось удобной.
😲️️️️️️ Когда я начинал рисерч, то не ожидал, что уже есть столько удобных решений на рынке, чтобы эксперементировать с ними. Конечно, они все уступают GPT по качеству, но это не значит, что с ними не нужно учиться работать уже сейчас. Последняя неделя очень ярко показала, как опасен платформенный риски. Нам нужна диверсификация.
🤖 AI-сотрудники — когда мы уже сможем их нанимать?
Возможно, вы уже слышали новый AI-нарратив — «вашим следующим работником станет AI». Мне нравится концепция: нанимаешь на джуниорскую роль AI-агента, встраиваешь его в процесс и он выполняет свою четкую роль. Но насколько это работает уже сейчас? Я пообщался с 10 компаниями, которые строят AI-сотрудников и узнал на какой сейчас стадии развития они находятся. Ниже поделюсь своими наблюдениями.
Конструктор vs. коробочный агент: есть два подхода к созданию AI-сотрудников. 1) Создать конструктор, в котором уже будут собирать сотрудники под задачу. 2) Создавать уже готовых AI-агентов и давать их компаниям на внедрение. У обоих подходов есть свои плюсы и минусы, пока рано делать выводы.
Решают узкие задачи: компании сейчас сфокусированы на решении узких задач внутри профессий, которые дадут максимум пользы компаниям. Обычно это рутины: переписки, рисерчи, подготовка документов, продажи. Идет нормальный продуктовый процесс, когда сценарии последовательно закрываются и затем проверяются в реальном мире.
AI-агенты уже работают: здесь нужно смотреть на это взвешено: на данный момент ничего пугающего, их уровень пока сложно называть джуниорским. С другой стороны, я бы также не делал никаких выводов о «бесполезности». Следующие итерации будут появляться быстро, и через полгода мы увидим уже продвинутые версии.
😎 Вот здесь можно почитать мои апрельские предсказания про AI-агентов, там я целиком предсказал их текущее развитие. За это время мы в Agentcy научились собирать state-of-the-art ИИ-сотрудников для компаний и начали их внедрять. В связи с этим, могу написать новый список предсказаний — поставьте реакций, если интересно.