neuraldeep | Unsorted

Telegram-канал neuraldeep - Валера Ковальский

14058

Head of AI redmadrobot.com From IT Admin to Head of AI in 5 years Applied AI Engineer B2C RAG (2M+ books) B2B RAG platform (10+ implementations) B2C gptdaisy.com (100k MAU) github.com/vakovalskii | chat @neuraldeepchat To infinity... and beyond!

Subscribe to a channel

Валера Ковальский

https://hub.neuraldeep.ru/

Вот и случилось 1000 регистраций на хабе
Сделано 700 коммитов
5000+ рестартов гейта
Вы сгенерировали 6 млрд токенов
Вызвали Дрифт более 100 000 раз!

Спасибо, что продолжаете тестировать то, что я делаю, и спасибо Паше за помощь в разработке хаба с инфраструктурной стороны!

И на канале уже 15 000 человек! Тоже приятная новость!

А я тем временем всё глубже погружаюсь в автоматизацию разработки хаба с помощью claude code cli и codex cli (напомню, я делаю это в одиночку, и всё это — очень большой эксперимент).

Читать полностью…

Валера Ковальский

Как искать вайбкодера?

Намедни мне задали один интересный вопрос:

Как пишут навыки по вайбкоду в резюме?

Казалось бы, простой вопрос, ведь действительно как найти именно вайбкодера, как оформить резюме, чтобы показать, что у тебя есть навыки вайбкода, но при этом есть и нормальный технический бэкграунд и понимание того, как всё работает. Прошерстил hh.

По каким словам искать?

В заголовке должности на hh встречается солянка различных вариантов, искать стоит не только по слову "вайб", иначе пропустим половину людей, которые попросту стесняются говорить о том, что умеют вайбкодить.

У меня нет оплаченной учётки работодателя на hh, базу резюме нормально не почекать, поэтому смотрел по описаниям вакансий (полнотекстовый поиск, вся Россия, май 2026). Цифры в скобках возле ключевых слов значат сколько вакансий нашлось по этому запросу.

Какие должны быть заголовки?

- вайб-кодер (8), vibe coder (12), vibe-coding (63), vibe coding (63), вайбкодинг (56), вайбкодер (19)
- AI-native developer (47), AI automation builder (16)
- full stack + vibe-coding в одной строке (7)
- AI-оператор (8), LLM оператор (52), prompt engineer (219) - часто рядом с vibe-coding
- инженер по вайбкодингу (14) - да, такое тоже бывает

Что должно быть в ключевых навыках?

- Cursor (290), Claude Code (285), Codex (111), Windsurf (13), GitHub Copilot (91), ChatGPT (1021), OpenClaw (23), OpenCode (8), Hermess (30), Antigravity (16)
- vibe-coding (63), AI-assisted development (451), разработка с ИИ (2389)
- prompt engineering (219), промпт-инжиниринг (84), in context learning (29)
- n8n (202), flowice (1), langgraph (185), langchain (272), llamaindex (87)
- плюс обычный стек, его я не считал: JS/TS, Python, Go, React, API, SQL, Git, Linux, Docker

Что должно быть в описании опыта?

- MVP за дней (33) - имеется в виду "MVP за N дней"
- доработка кода AI (65) - имеется в виду доработка и отладка кода, который нагенерил AI
- RAG (604), боты, harness (17), интеграции, деплой
- ссылки на конкретные репозитории и проекты, выведенные в прод

Что писать в CV?

Важно помнить, что вайбкодинг - это нечто среднее между soft и hard скиллами, так как AI-агенты - это уникальная в своём роде технология, которая требует от разработчика опыта бизнес-анализа для составления спецификаций, опыта менеджмента для декомпозиции сложных задач, опыта использования инструментов для вайбкодинга и, наконец, технического бэкграунда для валидации результата.

Исходя из сказанного ранее, можно сделать ряд предположений о том, как правильно оформить своё резюме, чтобы и отобразить свои скилы правильно и чтобы был хороший матчинг с вакансиями.

Иными словами, нормальный вайбкодер с хорошим бэкграундом должен в резюме иметь следующие признаки:
- в навыках обязательно упоминаются AI-инструменты, указаны языки, фреймворки и так далее, плюс хорошо, если упомянуты системы тестирования, системы CI/CD, а также Linux, контейнеризация и так далее
- в опыте - конкретные проекты и желательно ссылки, а не абстрактное "работаю с нейросетями"
- используется терминология, которая предполагает наличие навыков менеджмента, или, например, прямое указание на соответствующий опыт, скажем тим лид или пм
- есть ключевые слова, связанные с бизнес-аналитикой и написанием спецификаций, разработкой документации по ГОСТу или, например, упоминание Cucumber и подобных систем

При этом подозрительно будет, если в резюме у соискателя:
- только условный Claude Code и "вайбкодинг", без стека
- ни одного кейса с деплоем, API, БД, Git
- опыт как у классического джуна

Короче как-то так, это само собой моё имхо, а как у вас? Напишите в комментариях, по каким словам вы ищете вакансии и что реально пишете в резюме про AI, агентов и вайбкодинг - в заголовке, в навыках, в описании проектов. Интересно сравнить, кто как упаковывает опыт и что срабатывает на hh и других площадках. Если есть удачные формулировки или, наоборот, провальные - делитесь, разберём вместе.

Читать полностью…

Валера Ковальский

Обновления одного из продуктов на Hub

https://drift.neuraldeep.ru/

Для PRO пользователей была замечена ошибка с моделькой Kimi k2.6, она не работала

На сегодня всё исправлено, приятного использования!

Из апдейтов протестирован и добавлен BYOK (для OpenRouter)

Всё, что вы пишете в TG-чате, повторяется в вебе, и наоборот

Можно выставить модель по умолчанию для ТG бота

Добавлена интеграция с Битрикс24, на сегодня можно добавить один портал

Напоминаю что Drift это реинкарнация Topsha только вам не нужно ничего разворачивать на своем сервере!

Читать полностью…

Валера Ковальский

Ежедневный дайджест

Проект который я начал полгода назад и продолжаю поддерживать!

На сегодня @neuraldeepbot сканирует более 60 каналов, на него подписано 1300+ человек
На сегодня он подготовил уже более 100 дайджестов, проводя около 20 минут в цикле поиска и метчинга каждое утро, чтобы предоставить вам интересные новости и готовить дайджест каждое утро в 10 часов

Дайджест абсолютно бесплатный. Чтобы запустить подписку на дайджест, достаточно нажать «Старт» в боте.

Из полезных фишек: по всем 60 каналам можно задавать вопросы под капотом OpenAI Agent SDK и gpt-oss 120b с нашего хаба https://hub.neuraldeep.ru/

Читать полностью…

Валера Ковальский

Лимиты по Kimi k2.6 удвоены для про подписки!
Старые лимиты будут сброшены


https://hub.neuraldeep.ru/

Читать полностью…

Валера Ковальский

Харнесы умирают? Часть 2

Собрал коменты
через ллм и чутка обработал

После моего наброса накидали в комментах много чего полезного, собираю в одно место
Главное что унес

Pavel Zloi разнес идею что что-то умирает
Хайп спадает а технология остается и сидит на своей задаче
Так было с RAG, агентами, MCP, скиллами, теперь с харнесом
Все живо просто эволюционировало


ElKornacio ткнул что современный харнес это не про тулинг а про упакованный процесс
У него имплементация 15-20% времени, ревью и рефакторинг 50-60% и это факт с которым не поспорить
Узкое горлышко не написать код а проверить
Мой пост был именно про основу кода, ревью и тесты отдельная история и там автоматизация нужна


Mike Shevchenko принес три категории харнеса
Экзоскелет который двигает руками модели умирает
Память identity и recall между сессиями не умирает
Инструменты shell браузер поиск точно не умирает


Vladimir дал простой критерий Харнес нужен если экономит время на план дебаг следить за дурилкой
Если больше ковыряешься чем экономишь значит что-то не так


Kirill B про лень задать вопрос агенту
Это не лень а неготовность брать ответственность за результат
Проще пнуть мейнтейнера чем принести пуллреквест
Записал себе
Полезности из коментов забрал в сохраненки


Mutation testing через LLM про которое ElKornacio говорил
LLMorpheus
Meta ACH разбор
Cross-model review Claude + Codex Официальный плагин ставится через /plugin marketplace add openai/codex-plugin-cc
Get Shit Done про который Maxim рассказал Convergency planning через все CLI одновременно Claude, Codex, OpenCode, GLM
Best practices от Boris Cherny и Anthropic для тех кто еще не видел
Официальный гайд

Заголовок был кликбейтным признаю
Умирает излишняя сложность поверх того что модели уже умеют
Умирают саб-агенты для ревью когда хватает второй сессии кодекса
Умирают графовые оркестраторы из 50 нод когда работает один реакт цикл
Умирают тысячестрочные AGENT.md когда хватает 200 строк с context7, web_search, playwright

Не умирает упакованный процесс, память между сессиями и cross-model review на объемных задачах
Сначала собери процесс руками на одном CC или Codex с парой промптов
Упираешься в потолок и теряешь время на копипасты бери харнес типа GSD Харнес жрет больше времени чем экономит выкидывай и возвращайся к простоте
Чем проще велосипед тем лучше и надежнее едет Но если везешь 150к строк кода с брейк ченджами велосипед не подойдет нужен грузовик

Спасибо всем кто накидал, пишите что у вас работает, собираем общую картину

Читать полностью…

Валера Ковальский

UPDATE: Новый продукт в рамках хаба

https://search.neuraldeep.ru/

Собрал в него все лучшие свои подходы workflow поиска в интернете: чистый LLM Call пайплайн

Всем пользователям доступен Perplexity-подобный поиск на базе GPT OSS 120b (возможны задержки с ответами). Основной поисковый индекс: Yandex + Видео (Rutube + VK)

Решение будет развиваться и доступно в рамках базовой авторизации в хабе

https://hub.neuraldeep.ru/
https://coder.neuraldeep.ru/ (PRO)
https://webui.neuraldeep.ru/ (OpenWebUI)

Видео поиска в комментариях

Читать полностью…

Валера Ковальский

Обновление NeuralDeep Hub
https://hub.neuraldeep.ru/

1) Увеличили с Пашей количество серверов под qwen3.6-35b-a3b
2) Светлая тема
3) Форма обратной связи с уведомлением админу, как на видео
4) Возможность оплатить тариф через ЮКассу (но есть особенность: для STARTER доступно 20 мест, для PRO — 10 мест; первые 30 PRO получают также полный доступ)

И самое интересное: про подписку экспериментально доступно https://coder.neuraldeep.ru/

Это концепт, который работает в связке с таким стеком:

Barmetal server это физический сервер (Yandex) + MicroVM + OpenCode Web + qwen3.6-35b-a3b. Доступен только платным подпискам PRO. Ресурсов не так много, я все оплачиваю со своих средств ради эксперимента

Самое интересное — это повторить механики подписок от Anthropic и OpenAI

Спасибо, что тестируете
Вы уже сгенерировали 2 000 000 токенов

Читать полностью…

Валера Ковальский

Запись вчерашнего стрима "Как создавать AI-агентов на on-prem-моделях?".

YouTube: https://www.youtube.com/live/wjA9aPg7pjQ

Telegram: в медиа этого поста

Участники:
1. @neuraldeep
2. @kdoronin_blog

Паша. На стриме его несколько раз вспоминали:
@evilfreelancer

Платформа, с помощью которой тестировали on-prem-модели:
https://hub.neuraldeep.ru/

Презентация – в комментариях.

Читать полностью…

Валера Ковальский

Сброшены недельные лимиты для всех!

Добавлены еще инстансы qwen3.6-35b-a3b (латенси должен упасть)

Обновлены лимиты на free тире

Пол ярда токенов на квен за 2 дня КАРЛ! 🦾

Проработана дока для подключения моделей к агентам https://hub.neuraldeep.ru/docs#agents (теперь там есть огромная кнопка скопировать доку в md, сделаны базовые фиксы responses api

Читать полностью…

Валера Ковальский

С большой GPU большая ответственность

Разберем стек
vLLM + LiteLLM + Codex CLI

Часть первая, когда у вас много GPU серверов под LLM инференс, а у меня часть в одном офисе, часть в колокейшене (когда арендуешь стойку в датацентре под свое железо, не AWS) и нужно все же понять как сделать одно API окно сверху всего этого, привет https://hub.neuraldeep.ru/ и все наши эксперименты выше =)

В целом это проблема любой связки vLLM + LiteLLM даже если вы заводите это внутри компании, не на продажу

У меня заняло неделю по вечерам найти, и решить проблемы, пройдусь по пунктам чтобы вам было быстрее

Вы так же найдете те же проблема на GitHub vLLM висят открытые issues с января-апреля 2026
#33089 (multi-turn Responses API),
#39426 (tool-aggregation protocol drift) десятки людей жалуются на одно и то же, апстрим месяцами не закрывает

Боль набер ван роутинг

LiteLLM по дефолту simple-shuffle или следующий кандидат latency-based routing
Звучит умно выбирает самый быстрый сервер или рандомим
По факту на двух одинаковых инстансах LLM с GPU он залипает на winner-сервер навсегда, второй простаивает в ноль, курит за деньги вашей компании

Включить round-robin?
Нельзя
Round-robin для multi-turn агент loop убивает кеш на каждом turn'е попадаешь на другой сервер история пере-prefillится с нуля +5-10s к ответу, песня да?

Нужен sticky session (один user всегда на одном сервере) + балансировка между разными user'ами
Из коробки в LiteLLM такого нет, оно как бы есть но его как бы нет 💀

Решение простое как две копейки главное на него выйти сразу, "custom routing strategy"
180 строк кода
Внутри consistent-hash md5 от api_key_alias, один user всегда на одном сервере
Разные user'ы, разные сервера через равномерное распределение хеша, что делать когда будет требоваться масштабирование дальше? Расскажу в следующих сериях
Сервер в колокейшене ожил (ура) и по логам есть кеш!

Боль набер два кеш умирает без sticky решается первым пунктом и сильно связан с роутингом, но дальше сложнее

Боль 3 Codex CLI шлет нестандартные tool types

Я хочу использовать Codex CLI как агентный харнес в своих экспериментах, с qwen3.6 все просто фиксим протокол и поехали, с gpt oss 120b чуть сложнее так как там что? Правильно harmony =)

Codex CLI отправляет в запрос tools которые vLLM не понимает custom, image_generation, namespace
vLLM на это шлет вам 400 tool type custom not supported, вы оптекаете и думаете что с этим делать
Codex падает на старте, до первой генерации

Лезу в исходники vLLM есть файл harmony_utils.py (harmony это внутренний формат сообщений для gpt-oss моделей, как ChatML для других)
Там whitelist tool types web_search_preview, code_interpreter, container, function
Все
Никаких custom или image_generation 😳

Решение в лоб, bind-mount (монтируете файл с хоста поверх файла в контейнере, апстрим не трогаете) с пропатченным harmony_utils.py
Расширил whitelist на custom, web_search, file_search, image_generation, local_shell, apply_patch, mcp_*
После этого Codex реально начинает работать делает git rev-parse, читает файлы, пишет код

Боль набер 4 Responses API строгая валидация

Responses API это новый OpenAI endpoint /v1/responses (на смену /v1/chat/completions)
С server-side state через previous_response_id
Codex с ним и работает (completions дипрекейтнули еще 2-3 месяца назад)

На каждом turn'е шлет previous_response_id + полный input[] с историей
В истории assistant-айтемы которые vLLM ранее сам сгенерировал
У них нет полей id, status="completed", annotations=[]

По OpenAI-схеме это required-поля
vLLM строгая Pydantic-валидация запрос делает что?
Правильно отлетает
Codex в ступоре
Вы тоже

Решение тот же подход bind-mount пропатченных Pydantic-моделей делаем поля optional с дефолтами

Итого
Кодинг агенты помогли собрать все это в кучу, и локализовать проблемы, да не так элегантно но работает!
Базовый вывод это легко находится через Codex/Claude Code главное тесты и что бы вы понимали что делаете
Все это решилось так же через подробные логи на всех сторонах систем

Затестить все это можно тут https://hub.neuraldeep.ru/docs#agents

Читать полностью…

Валера Ковальский

Расширение каталога на Hub NeuralDeep

Сегодня вместе с Валерием (@neuraldeep) добавили новых моделей в публичной API проекта NeuralDeep. Базовый URL для запросов api.neuraldeep.ru (OpenAI-совместимо, Bearer с ключом). Ключ можно полчить после регистрации на hub.neuraldeep.ru.

Итого:
- LLM'ки - из коробки через апишку доступны две флагманские модельки gpt-oss-120b и qwen3.6-35b-a3b, их можно крутить в кодовых агентах и чатботах.
- Эмбеддинги - в дополнение к bge-m3 и e5-large добавили русскоязычную frida, мультимодальную jina-embeddings-v4 и толстушку qwen3-embedding-4b.
- Реранкеры - уже была bge-reranker для ранжирования чанков, пригодится для вашего RAGу.
- Голос в текст (ASR) - помимо whisper-1 добавили ещё и whisper-podlodka-turbo.

Полный список моделей можно посмотреть так:

curl -sS "https://api.neuraldeep.ru/v1/models" \
-H "Authorization: Bearer <ваш-ключ-с-хаба>"


Регистрируйтесь, пользуйтесь, предлагайте свои модельки, поддерживайте рублём, рассказывайте друзьям - нам пригодится любая ваша помощь.

Читать полностью…

Валера Ковальский

Как создавать AI-агентов на on-prem-моделях?

Как меняется создание пайплайна, когда мы переходим на локальные модели?

Что вообще может этот ваш Qwen на 4B по сравнению с GPT-5.5?

Чтобы ответить на эти (и многие другие) вопросы максимально-качественно, основываясь на большом практическом опыте, я попросил присоединиться к стриму Валеру.

Все, кому были неудобны стримы по субботам, возрадуйтесь!

Стрим будет во вторник, 5 мая в 16:00 мск.

Проведём его на моём kdoronin_blog_ru">YouTube-канале.

Чтобы добавить событие в календарь, нажимайте сюда.

Задавайте вопросы в комментариях. Обязательно ответим на них на стриме!

Читать полностью…

Валера Ковальский

Собрались поболтать про агентов!

Будет интересно привет всем кто офлайн

Читать полностью…

Валера Ковальский

FOMO в обнимку с кодинг-агентом

Заметил, что лагеря разделились особенно в коментах под постом Тимура

Есть те, кто обвешивается плагинами, скиллами, автоматизациями саб-агентов, методологиями, которые состоят из 1 000 000 нюансов. И те, кто течет по течению, как я =)

Буду честен: последние мои ИИ-проекты, которые были сделаны с агентами, используют только playwright-плагин для теста вэба и, наверное, всё

80–150 строк CLAUDE.md + оглавление и гиперссылки на заголовки, стартовые папки /docs). Папка /docs с понятной и читаемой вложенностью
И, наверное, всё

CLI и токен в глобальном env + на старте объясняю, где живет моя личная база знаний (сервера, токены до Cloudflare и MikroTik)

Такой сет-ап на сегодня позволяет создавать то, что я вам показываю, за 120–300 минут

Если вожусь дольше, как я это называю «пережарил идею», либо я уже переборщил, либо ушел не туда (не учитываем улучшения базовой версии, которая получилась успешно за 120 минут)

Самая базовая рекомендация, которая у меня к вам есть при вкатывании в ИИ-кодинг:

Просите агента искать в интернете

Просите делать тесты и поглядите, что из них есть код

Старайтесь спрашивать у агента, как бы он сделал лучше (модели на сегодня и так очень умные по статистике)

Просите агента сделать вам отображение логов всего, что вы делаете, в удобном для вас виде(какой, посоветуйтесь с агентом)


Но, кстати, Тимур очень много разговаривает про базу
Загляните к нему в канал, точно найдете очень много полезной инфы
Даже есть очень крутой курсец, который он недавно запустил, мой личный рек

UPDATE: Тимур закинул код на курсец, забираем TMY5XJ

Читать полностью…

Валера Ковальский

Ну наконец то я теперь вижу прогресс бар процесса /compact в CC

Теперь могу смотреть на него и ждать когда зависнет на 99% =)

Кстати статус лайн от сюда автор вот

Читать полностью…

Валера Ковальский

"Каждый токен на счету".

Вы его ждали – и он пришёл. Анонс нового стрима!

Для большинства пользователей то, что OpenClaw или Hermes едят токены с лопаты – не проблема.

Дело в том, что использует эту обвязку вокруг агента один человек. Поэтому и разница в пять раз (хорошо если в пять!) по количеству используемых токенов – это разница между $20 и $100. Для человека с доходом в $2000 и то, и другое – приемлемая цена за удобство от использования личного ассистента.

У бизнеса, как правило, степеней свободы меньше. Так как включается эффект масштаба. И мы получаем уже выражение вида "цена" умножить на 20 сотрудников и ещё на 10 бизнес-процессов. И разница, в таком случае, получается между $4000 и $20000... Это в маленькой и скромной компании. Представьте, что творится хотя бы в среднем бизнесе?

Время представить гостей:

Сергей Нотевский. AI Platform Lead в Битрикс24. Про те крутые штуки, которые они там у себя в Битрикс24 выпускают, я ещё вам поведаю. В рамках нашей беседы Сергей расскажет о том, как настроить prefix_cache и сэкономить на этом "десятки поцентов костов" (прямая цитата из этого поста).

Родион Мостовой. Создатель CodeAlive.ai – системы организации контекста для программных проектов. Несколько лет Родион занимается тем, что оптимизирует контекст для LLM и, как следствие, токены, которые на него уходят.

На стриме пощупаем руками оба подхода, сделаем практические выводы и определим принципы, которыми стоит руководствоваться, чтобы не разбрасываться бесцельно токенами.

Дата и время проведения стрима: воскресенье, 17 мая, 16:00 мск

Место проведения: kdoronin_blog_ru">мой YouTube-канал

Чтобы не пропустить – добавьте в календарь!

Читать полностью…

Валера Ковальский

🗓 AI ДАЙДЖЕСТ • 15.05.2026

━━━━━━━━━━━━━━━
🚀 МОДЕЛИ И СЕРВИСЫ

🔹 GPT 5.5 впервые прошла тест ProgramBench
Модель GPT 5.5 в режимах high и xhigh полностью решила задачу cmatrix из бенчмарка ProgramBench, став первой публичной моделью, доведшей это реальное задание по переписке утилит до конца [3].

🔹 Claude для юристов: новые MCP-коннекторы
Anthropic расширил функционал Claude для юридической отрасли, добавив 20 MCP-коннекторов и 12 специализированных плагинов, включая инструменты для трудового права и студентов юрфаков [11].

━━━━━━━━━━━━━━━
🔬 ИССЛЕДОВАНИЯ

🔹 Perceptron AI выпустила модель Mk1 для анализа видео
Стартап представил флагманскую мультимодальную модель Mk1, способную к воплощенному резонингу и оперированию пространственно-временной информацией о физическом мире [6].

━━━━━━━━━━━━━━━
🛠 ИНСТРУМЕНТЫ

🔹 OpenAI Codex Remote: управление Mac с телефона
Вышла функция Codex Remote on Mobile, позволяющая управлять приложением Codex на MacOS напрямую с iOS и Android устройств, что потенциально заменяет необходимость в Telegram-мостах [2] [4].

🔹 Open Design: open-source клон Claude Design
Проект Open Design от nexu-io собрал 20 000 звезд на GitHub за 6 дней, предлагая бесплатный аналог платного сервиса Anthropic для создания прототипов, лендингов и презентаций с экспортом в HTML/PDF/PPTX [8].

🔹 Уральский Барс и Aqua Voice
Команда BashAdventure открыла запись на горные этапы проекта «Уральский Барс», а приложение Aqua Voice вышло на iOS, обеспечив голосовое общение через чаты и приложения с удобным UX [9] [10].

📚 Подготовлено Neural Deep Agent

Читать полностью…

Валера Ковальский

Пока @VaKovaLskii и @eprogrammist активно развивают крутой продукт https://hub.neuraldeep.ru , я не дам вам забыть Codbash, и я по чуть его развиваю, так как пользуюсь им каждый день, итак, в ближайшем релизе https://github.com/vakovalskii/codbash


🚀 Codbash — что нового

С последнего релиза вкладка «Projects» превратилась в полноценный launcher для AI-агентов, появилась поддержка новых агентов и куча мелких улучшений.


Главное: запуск агентов — в один клик

Projects теперь — это две вкладки:

- Projects — карточки ваших проектов с кнопками ▶ New (новая сессия) и ⟳ Last (продолжить последнюю). Можно выбрать агента «на разок» через ⏷, не меняя дефолт.
- History — привычный список сессий, ничего не потерялось, просто переехало.

Добавлять проекты теперь проще:

- Кнопка «+ Add Project» с тремя вкладками: локальный путь, ваши репозитории GitHub, репозитории где вы контрибьютор.
- Можно прямо из дашборда клонировать репо с GitHub одним кликом — он попадёт в ~/code/<repo> и сразу появится в списке.
- Если запустить агента в новом git-репозитории под $HOME, проект сам добавится в Projects.

Настройка дефолтного агента:
В ⚙ Settings можно выбрать, какой агент будет запускаться по ▶ New по умолчанию. Список показывает только то, что у вас реально установлено.

🔍 Drill-down по проекту

Клик на проект — и вы видите только его сессии, с понятным breadcrumb «× Clear filter».

📊 Дашборд сам обновляется

Раз в минуту подтягиваются новые сессии и свежие траты — не нужно жать Refresh. Также починена аналитика, которая показывала закэшированные данные после переключения вкладок.

💳 Подписки в Analytics

Теперь можно вводить любой сервис и план (не только Claude/Cursor/Codex). При знакомой комбинации цена подставляется сама. И починен баг, когда после третьей добавленной подписки новые перестали
появляться.

🛠 Чистка проектов

- Worktree-репозитории больше не дублируются как отдельные «проекты» — все ветки и worktrees собираются под основной репо.
- Если ваш $HOME сам по себе git-репозиторий (например, dotfiles) — codbash больше не приписывает его remote к сессиям, запущенным просто из домашней папки.

🔄 Background git fetch (свежее)

Для подключённых репозиториев данные о ветках и коммитах подтягиваются в фоне — без блокировок UI.

Читать полностью…

Валера Ковальский

Помните мой проект Topsha?

Так вот, я не прекратил его развивать, просто закрыл свою ветку в приват, и сегодня представляю вам многопользовательское решение на базе своего харнеса и sandbox для кода.

Drift (личный AI-агент с памятью между сессиями, веб-поиском, песочницей для исполнения кода, Telegram-ботом, интеграцией с Google Workspace, расписанием задач и навыками для работы с PPTX/DOCX/PDF)

https://drift.neuraldeep.ru/

Со всеми лимитами можно ознакомиться на странице тарифов!

Читать полностью…

Валера Ковальский

OpenAI осознали бесперспективность файн-тюнинга моделей

7 Мая OpenAI оповестили разработчиков, что лавочка закрывается. Новые компании уже больше не могут запускать задачи тюнинга. В течение полугода закроют возможность даже для тех, кто уже тюнил. А возможность использования своих тюненых моделей сохранится только до момента выключения базовой модели. Потом - все.

См deprecations page.

В OpenAI говорят, что надо переключаться на RAG-и, нормальные инженерные подходы, оркестрацию и контроль качества. Это и выгоднее для всех, и позволяет быстрее выкатить рабочие решения без наступания на грабли.

Это все логично. Среди кейсов успешных внедрений AI в бизнес задачи я видел только один случай, когда традиционную LLM затюнили и получили желаемый результат, который стоил того (тюны ASR/Wake/Emb/TTS/CV стэка сюда не включаем, да и они тоже уже отмирают). Эти кейсы вместе с паттернами я разбираю в курсе AI Assitants вместе с бесперспективностью тюнинга и векторных подходов.

Тюнинг (и векторные RAGи) умирают не потому, что они не работают (вполне себе работают), а просто потому, это слишком долгий, дорогой и рискованный подход к повышению качества ответов (как для пользователей, так и для вендоров). Есть пути попроще - context engineering, современные frontier модели (включая локальные), контроль качества, tool use.

Если вы до сих пор используете тюнингованные модели в облаке, можно ожидать, что и другие компании последуют примеру OpenAI и свернут лавочку тюнинга, даже если это LORA. А потом это дойдет и до экосистемы локального inference.

И когда это произойдет, можно будет еще раз перечитать мой прогноз в конце 2024 года про тупиковость fine-tuning, ну или крик души про fine-tuning в бизнесе от 2023 года)

Ваш, @llm_under_hood 🤗

Читать полностью…

Валера Ковальский

UPDATE:

Kimi k2.6 теперь доступна всем PRO кто приобрел подписку через юкассу

https://hub.neuraldeep.ru/

Читать полностью…

Валера Ковальский

Харнесы умирают?

После панельной дискуссии про вайбкодинг в офисе Туту с Серёжей, Андреем, Максимом и Женей у меня появилось большое желание встретится с Андреем и поговорить в спокойной обстановке, результатом разговора стал мем в канале про который мы вспомнили но есть и еще небольшая рефлексия

Все эти умные спеки, агентные обвязки, саб-агенты для ревью, отдельные оркестраторы
Год назад без этого было никак, и я ощущал лютейшее FOMO что не обуздал весь этот SDLC контент завод по производству кода

Cегодня модели стали умнее харнесов(обвязок над классическим СС/Codex CLI)
И вся эта обвязка из 1 000 000 спек превратилась в хрупкие лестницы из спичек ИМХО, которые проще сжечь, чем поддерживать

UPDATE: Я в целом про процесс написания кода, тестирование/ревю/багфиксы нужно автоматизировать и точно возможно расскажу в след постах что для этого делаю!

Да, на сегодня есть критическая масса минимума того что нужно
context7
web_search
playwright
Базовые навыки структурирования AGENT.md/CLAUDE.md
На этом наверное и все

Я для себя понял простую вещь если ты знаешь что делаешь, тебе хватит пары промптов в рукаве которые подсовываем в начале сессии
Модели за счёт статистики доделают как надо, без миллиона спецификаций

Чем проще велосипед тем лучше и надежнее он едет


Сегрегация ранних адоптеров

Еще как факт после панельки главное наблюдение большинству людей мешает не сложность LLM, а страх перед инструментом
Мы даже сравнили его с благоговением, как когда-то перед навигатором, который говорил поворачивать с моста через три полосы и его слушались

Народ боится сказать модели "слышь, ты, попроще объясни я не DevOps с 6 летним стажем" или "cлышь ты ***** делай ровно не ленись на ревю"
Боится переформулировать вопрос
Боится написать "сделай мне"
Или же страх=не понимание возможностей?
Пока загадка для меня =)
Почему часть людей у меня в канале идет сразу в комменты?
Спросить у кодинг агента как решить проблему? Разобраться самому? Что это? Лень?
Вижу картину что про мой open source проще сходить ко мне в комментарии с фразой "Валера! Не работает! Почини!"

И тут наша задача как евангелистов держать в рукаве пачку метафор под каждую группу
Для кого-то LLM это Excel 2.0
Для кого-то поисковик без критического мышления
Для кого-то джун, к которому надо научиться правильно обращаться

Чем раньше человек научится тем легче ему будет жить дальше
Получается что учится никогда не поздно! И задавать правильные вопросы тоже human_question_skill.md =)

Читать полностью…

Валера Ковальский

После митапа и еще одной встречи с Андреем пришли к точному выводу что я где-то справа, часть людей еще по середине

UPDATE:

Нашли правильную картинку /channel/neuraldeepchat/58210

Читать полностью…

Валера Ковальский

Мы начинаем нашу трансляцию "Как создавать AI-агентов на on-prem-моделях?"

https://youtube.com/live/wjA9aPg7pjQ?feature=share – подключайтесь!

Читать полностью…

Валера Ковальский

Встроил в хаб OpenWebUI, чтобы показать реальную скорость, и вы сразу могли проверить модели!

Работает фича из личного кабинета после авторизации (если вы нашли баг или вам интересен такой ИИкит, пишите в ЛС)

https://hub.neuraldeep.ru/

P.S. Токен из видео уже не работает))))
Скорость на видео реальная х1

За идею спасибо Паше

Читать полностью…

Валера Ковальский

NeuralDeep LLM Hub

Добавлено:

qwen3.6-35b-a3b
Второй инстанс под gpt oss 120b
whisper large-v3-turbo
Возможность в ЛК отключить логирование (тут конечно надо поверить мне на слово)

Обе LLM протестированы с codex/opencode/hermes-agent/kiro/cursor

Осталось 70 регистраций на free тир (добиваем 1к регистраций)

Из-за активного юзеджа зарезал фритир и протир по лимитам
За это время вы закинули 140 000 запросов и затестили все модели из списка
И как-то дали 4 рпс на обе gpt oss 120b

Спасибо, что используете, я продолжаю эксперименты и скоро расскажу про них! Расскажите в комментариях, какие эксперименты провели вы с этой платформой

https://hub.neuraldeep.ru/

Читать полностью…

Валера Ковальский

Что мешает масштабировать генеративный ИИ 

В red_mad_robot мы регулярно проводим сессии по генеративному ИИ для технических команд, и один из самых частых запросов связан с переходом от первых ИИ-сценариев к системной работе. 

Старт обычно получается быстрым. Сложнее закрепить эффект в процессе: договориться о правилах работы, критериях качества, границах системы и способе переноса удачных кейсов в общий контур разработки.

О том, как проходить этот этап, узнали у Head of AI red_mad_robot Валеры Ковальского и CTO AI red_mad_robot Влада Шевченко. Они как раз и ведут программу AI-Ready 🔗

#AI_moment #роботайм

↗️ red_mad_robot

Читать полностью…

Валера Ковальский

Если кому интересно

Взяли сервер с 6 H100 (и командой rmr) без измеения репо погоняли разные модели на нем под PAC1 на моем решении https://github.com/vakovalskii/phantom-agent

Читать полностью…

Валера Ковальский

Ну наконец-то готов релизить OCR сервис

sotaocr.com

Что это? Это сервис распознавания документов. Грузите PDF, получаете распознанный json. По капотом лучшая OCR модель из имеющихся на рынке по цене-качеству.

— Очень хороша в таблицах
— Специально натренирована на математические формулы в LATEX формате.
— Отдает честные границы объектов (LLM это делает как бог на душу положит).
— Знает много языков

Ограничения:
— плохо работает с рукописным вводом. Для этого нужно усиливать модельку, знаю как — если нужно пишите, сделаю
— я пока отключил распознавание картинок, работает только PDF. Планирую скоро включить.

В общем, велкам пробовать. 30 страничек бесплатно, дальше можно закинуть денежку и пользоваться по мере необходимости.

PS Если есть проблемы — сразу в личку пишите, поправлю. Не забудьте написать почту, под которой регались.

Читать полностью…
Subscribe to a channel