neuraldeep | Unsorted

Telegram-канал neuraldeep - Валера Ковальский

14058

Head of AI redmadrobot.com From IT Admin to Head of AI in 5 years Applied AI Engineer B2C RAG (2M+ books) B2B RAG platform (10+ implementations) B2C gptdaisy.com (100k MAU) github.com/vakovalskii | chat @neuraldeepchat To infinity... and beyond!

Subscribe to a channel

Валера Ковальский

Песочница для AI куличиков

Нынче в популярных сообществах РФ все чаще обсуждают песочницы для агентов

Все пилят свои Cowork.
Все пилят свои OpenClow в облаке.
И все хотят при случае иметь мульти-тенант.

Но мало кто задумывается, сколько стоит такой мульти-тенант на проде и в эксплуатации и что же такое реально ИЗОЛЯЦИЯ а не просто умные слова

Залил подробный разбор этой статьи что мне прислали еще в начале года дабы освежить память https://www.luiscardoso.dev/blog/sandboxes-for-ai когда я наткнулся на очень толковый разбор темы, которую большинство понимает неправильно «A field guide to sandboxes for AI» (Luis Cardoso)
Ссылка в конце.
Читается ровно как то, что мы прошли руками, когда сажали Coder внутрь NeuralDeep-хаба(временно депрекейтнул из за стоимости инфры
Там я кратко описал, как его фреймворк ложится на наш реальный прод — и заодно зачем нам bare metal в.....Подробнее читать тут на моем сайте

А вы начем строите изолированные среды? Просто докер? Или все же VM по типу Firecracker MicroVM?

Читать полностью…

Валера Ковальский

⚡️ Как оценивать агентский harness

Одной LLM недостаточно, чтобы понять качество AI-агента. На итоговый результат влияет агентский harness — как он управляет инструментами, памятью, сообщениями, восстановлением после ошибок.

Чтобы разобраться в этой теме, мы провели ряд экспериментов. И выкатили в open source Harness Bench — открытый фреймворк для сравнения связок «модель + harness».

А в новой мощной статье на Хабре рассказали про архитектуру фреймворка, адаптацию классических бенчмарков под системы агентов, поделились инженерными находками и результатами сравнений разных связок.

↗️ Читайте статью
↗️ Тестируйте бенч

Автор и статьи, и бенчмарка, Андрей Иванов — NLP-инженер в R&D red_mad_robot.

Читать полностью…

Валера Ковальский

На следующей неделе я решил провести стрим «Как настроить рабочее место разработчика с использованием кодинговых агентов».

Рассмотрим мою версию настройки на MacBook для разработки с учетом реалий РФ:

Без впн!

Буфер обмена;
Claude Code CLI;
Статус лайн
Codex CLI;
HTTPS-прокси;
Хуки уведомлений смс/тг/вк;
CI/CD;
жизненный цикл от идеи до развертывания в облаке.

Специально для этого я возьму чистый ноутбук.

Также мы настроим возможность продолжения разработки с мобильного телефона без VPN и полный удаленный доступ к вашим сессиям as is.

Memory bank (моя версия)
Флоу разработки (тут будет тайный гость)

Площадку еще выбираю скорее всего букайте вторник

Читать полностью…

Валера Ковальский

Раз конфа в спб, то доехать точно стоит

Я тут ловите где-то до 16 часов

Читать полностью…

Валера Ковальский

Все больше прорабатываю личный кабинет, где-то могут быть ошибки в расчетах, но мне самому все больше нравится neuraldeep.ru

Читать полностью…

Валера Ковальский

Для Kimi k2.6 сброшены лимиты для всех PRO подписчиков на neuraldeep.ru

На следующей неделе ожидаем появление GLM-5.2, DeepSeek v4 flash через pay as you go формат (часть трафика будет направлена на партнеров в РФ, часть на АПИ официальных поставщиков) следите за новостями


neuraldeep.ru/news

Читать полностью…

Валера Ковальский

Перевайбкодь за 20 дней или умри

Данный сервис создавался людьми без LLM-агентов на протяжении 2 лет

Мне понадобилось 20 дней, чтобы переделать на свои рельсы вайбкода всю https://gptdaisy.com/chat/auth/ в рамках эксперимента AI PDLC на базе Opus 4.8

Встроил свой дрифт(ReAct агент) внутрь системы
Переработал функционал агентов
Изменил работу с тулами
Улучшил поиск в интернете
Агент умеет редактировать фото за несколько ходов
Память
Артефакты
Добавил новые модели
Выкинул RAG =)

Снизил нагрузку на бэкенд на 80%

Поднял MAU до 1000+ человек

Просто решил поделиться тем, чем ещё занят последнее время. Сервис нацелен на простой юз и простых пользователей

Будут предложения, вопросы или баги — приходите в комментарии
До лендинга руки ещё не дотянулись =(
Буду дальше рассказывать про этот сервис, про метрики, почему взялся и что будет дальше!

Читать полностью…

Валера Ковальский

Так ну если на мои решения снимают уже рилсы, и сами, без приглашения, значит мы точно что-то правильное делаем с вами! 🔥


https://www.instagram.com/reel/DZfcqCBoaMA/?igsh=MWx3ajIzY3FmbDF1Nw==

А мы с вами не забываем база скиллов живет тут

https://neuraldeep.ru/skills

Читать полностью…

Валера Ковальский

Опубликовал на Хабр небольшой обзор "У вайбкода два пути: Code-подписка и API" на тему стоимости подписок на разные кодовые агенты и тарифов агрегаторов моделей.

Всеми агентами и агрегаторами мне доводилось пользоваться, так что что циферки не просто агентом нашёл, но выстарадал, тут всё честно.

#МесяцАгентности

Читать полностью…

Валера Ковальский

Diffusiongemma на хабе!

https://neuraldeep.ru/#models

~130-150 tok/s single request! (на одной 4090 48гб)

Читать полностью…

Валера Ковальский

Блин я вспомнил эту имбу

Если она что-то похожее будет творить просто топ!

Кто-то проходил за добряка?

Читать полностью…

Валера Ковальский

Оркестрация себя это только начало пути?

Да-да, я, как и вы, учусь, и сегодня я наконец пришел к осознанию того что не знаю как расширять свою способность кодить с ИИ на команду клонов Валеры

Осознание это нечеткое, точно его еще не удалось описать, в md файл точно не влезет
ИИ тут тоже не помощник все его рекомендации как клеше из утренней газеты

Но я точно знаю, что мы с вами все в одной лодке, просто русло не такое широкое, и не все успевают пройти вверх по течению

Кто-то в совершенстве освоил делегирование с ИИ
Кто-то в совершенстве освоил автоматизацию, что SaaS соберет за 120 минут
Кто-то может рассказать так про ИИ что тебе станет понятно как последние 20 лет все развивалось за 60 минут

Но у всего этого есть планка, предел, что-то, что мешает двигаться дальше, и когда вы придете к этому ощущению, оно заставит вас искать пути как от него избавиться

Я его еще не достиг, но уже сегодня думаю, как все эти знания масштабировать
И тут должна на помощь прийти системность и порядок, воспроизводимость и четкость

Каждый приходит к этому по-своему через свою призму понимания методологии и правильности бытия!

Так что я хочу сказать еще одним куском этого опуса, что сегодня мы все находимся в вечной стадии обучения.
ИИ точно ускорил и расширил границы наших возможностей сегодня

Но не забывайте, что у вас должно быть время на отдых и другие мирские занятия

DevOps с вами!

Читать полностью…

Валера Ковальский

Питер готовьте календари, я еду на Conversations

Если думали, куда ворваться этим летом ради крутых ИИ докладов и нормального нетворка, то вам точно сюда.

Буду 25 и 26 июня просто в качестве слушателя. Хочу походить по кулуарам послушать коллег и поболтать.

Точно загляну послушать Сергея Нотевского из Битрикс24 ❤️ про локальные модели и онпрем
Вы же знаете, как я люблю свои железки

И, конечно,послушаю Стаса Округа из R77 про боль перехода от прототипа за пару недель до реального прода.
Это прям жиза – hub показал нам, как сложно строить такие решения особенно в одного!

На конфе соберется весь крупняк: от VK до Касперского и X5.

А 25 июня будет крутое афтерпати, где я точно задержусь

Выбил для вас промокод на скидку: CVS26sKaV

Забирайте билеты по ссылке ниже и увидимся на площадке
Кто пойдет – пишите в комменты, пересечемся ☕️

Регистрация и подробности

Читать полностью…

Валера Ковальский

Самое простое и самое рабочее?

README-first база знаний: markdown + git, и всё». Это и есть «самое простое»

Уже второй месяц экспериментирую с очень простым подходом создания и управления базой знаний по коду, при разработке с AI ассистентами

На картинке как на сегодня выглядит граф документации для https://hub.neuraldeep.ru/
Точка входа CLAUDE.md/AGENT.md
/docs
README
/service
README(всегда как индекс страницы)


Для управления знаниями я брал концепцию Gotham от Palantir (использует технику онтологий, средствами которых разнородные данные из множества источников оснащаются смысловой информацией и унифицируются для совместного анализа. Онтологии в продуктах Palantir могут быть одного из трёх типов:

сущности — cубъекты или объекты реального мира
события — действия над сущностями, происходящие в определённый момент времени и в определённой точке пространства
)
документы — подтверждения сведений о реальном мире, сведённые в унифицированный формат (используется HTML)

Только я применил разметку md как это сейчас везде заведено!

Для себя сделал skill + plagin который имеет CLI для поиска и построения индекса

Но что действительно может быть вам интересно что я так развиваю и делаю продукт дальше, по этому считаю свой подход экспериментально наблюдаемым так как вы можете не просто видеть в "теории" как такое может работать, а как именно такое работает с хабом

Кстати таким образом я веду не только кодовые базы но и личную, так же недавно перевел все решения что разрабатываю с ИИ агентами по моим внутренним тестам и ощущениям этого хватает более чем!

Но эксперимент продолжается посомтрим куда меня это все приведет =)

РЕПО: https://github.com/vakovalskii/gitmark-memory-bank

Claude Code install

/plugin marketplace add vakovalskii/gitmark-memory-bank

/plugin install gitmark@gitmark-marketplace

Читать полностью…

Валера Ковальский

AI полезен на все 25% жирности

Установил в офисе и дома кондиционеры MDV=Midea
Заранее выяснил, чтобы они работали с Алисой и имели приложение для телефона
Узнал, что для этого в них устанавливается Wi-Fi-модуль под панелью в виде wifi usb свистка
Привезли и установили

Скачал приложение, подключил к Алисе, настроил автоматизации и забыл

Вчера вспомнил, потому что Алиса сказала, что соединения нет
В приложении оба кондиционера были не в сети
Проверил через роутер, оба есть в списке DHCP и оба даже пытаются что-то получить по пакетам из «Пятёрочки» =)


Но результат тишина
Не помогли ни перезагрузка, ни питание, даже новая настройка не сработала
Нашел что их серваки стали блокать, решил проверить можно ли локально перебрать протокол

В итоге скормил Клоду все спецификации, и шерстил он китайские форумы но все нашел!
И через 30 минут получил приложение, работающее за NAT, которое умеет управлять и опрашивать сразу два кондиционера в разных точках моего города.

Кстати, пока прокидывал другой кондей из офиса по статик NAT, ещё дал Клоду временный доступ к MikroTik, и там мы тоже прибрались знатно (я это откладывал, наверное, года два)

Stay tuned!


РЕПО: https://github.com/vakovalskii/midea-local-web

Читать полностью…

Валера Ковальский

По техническим причинам стрим перенесем на следующую неделю во вторник 18 часов!

Не теряйтесь ❤️

Работоспособность neuraldeep.ru восстановлена

Читать полностью…

Валера Ковальский

Завтра, 30.06.2026

Запишем новый стрим по самой базе (по версии Валеры Ковальского)
Изучим то, что именно все перепрыгивают когда открывают GUI для вайбкодинга
Опустимся в самые недра терминалов и сборки ядра Linux (шучу).

Приходите, будет интересно.
Также на стрим позвал 2 секретных участника =)

Ссылка будет в канале в 18 часов так что не пропустите (врубайте уведомления)

Запись будет нарезками появляться на разных площадка, не скоро (я ленивый)!

Читать полностью…

Валера Ковальский

Токены нужны всем.
Подписка не решает всех проблем.
Агенты врут.
Люди врут.
Агенты ленятся.
Люди тоже ленятся.

Нам запретят AGI (ну или уже).
Мы с вами живем в пузыре.
В одиночку можно сделать сервис за месяц на 350 000 строк кода, ни одной не прочитать и запустить это в прод. Безопасно ли это? Не знаю

Дешевые токены не всегда безопасны.
Супер дешевые токены точно безопасны =)

Люди строят велосипеды.
Агенты помогают строить убедительные велосипеды.
Иногда велосипеды слишком сложны.
Велосипед не всегда должен ехать.
Иногда велосипед превращается в самолет и тут же плавает по воде.

Почти всю рутину можно делегировать агенту, нужно ли?

Мы стали меньше общаться с людьми?

Кодируйте братья

Читать полностью…

Валера Ковальский

TTS на хабе

Это значит, что цикл замкнулся, и теперь можно построить end2end-агента от STT/RAG/LLM/TTS.

Экспериментируйте, изучайте, разрабатывайте!

Документация: https://neuraldeep.ru/docs#tts

Еще новости GLM-5.2/DeepSeek V4 Pro, теперь доступны по модели pay as you go!

Читать полностью…

Валера Ковальский

ИИ-агенты заходят в бронирование: рассказали Forbes, что это значит для рынка

«Туту» открыл поиск и бронирование поездок через ИИ-агентов. Для сервисов это ранний тест нового канала дистрибуции: пользователь формулирует намерение в диалоге с помощником, а платформа получает шанс подключиться к нему до перехода в привычный интерфейс.

Если ИИ-агент станет точкой входа в выбор поездки, сервисам важно быть доступными для него технически и коммерчески. В моменте трафик из таких сценариев, скорее всего, будет небольшим, но для бизнеса это работа на будущую позицию в цепочке принятия решения: кто окажется ближе к моменту пользовательского намерения, тот и получит преимущество в агентной коммерции.

Илья Филиппов, CEO red_mad_robot AI


При этом есть техническая сторона: сам поиск через агента уже знаком рынку, поэтому важна глубина MCP.

Browser use у агентов существует около полутора лет: сильные модели уже умеют открывать сайты, обходить защиты через прокси, делать скриншоты и доставать релевантную информацию. Поэтому поиск сам по себе рынок не удивит. Главный вопрос — позволяет ли MCP дойти до оформления заказа.

Сейчас агент может довести пользователя до собранного заказа, но финальную оплату человек подтверждает сам — это агентный поиск и сборка корзины, но ещё не сквозная покупка. Настоящим переломом станет момент, когда MCP позволит закрывать и оплату.

Валера Ковальский, руководитель ИИ-направления red_mad_robot


↗️ red_mad_robot

Читать полностью…

Валера Ковальский

DCD: Domain–Collection–Document ↗️

Выпустили статью на arXiv, в которой представили DCD Design — архитектурный подход к организации пространства знаний и обработке запросов в RAG-системах.

DCD организует знания в виде явной иерархии и ограничивает область поиска ещё до извлечения документов.

В статье:
• объясняем, как устроен DCD;
• сравниваем его с Naive RAG, Contextual RAG и RAPTOR;
• показываем результаты экспериментов на собственном бенчмарке;
• открываем код и датасет.

Если хочется разобраться на русском — уже вышел материал на Хабре. А все детали экспериментов, метрики и оценки — в статье↗️на arXiv.

Читать полностью…

Валера Ковальский

Ищу человека, который возьмёт на себя почтовую платформу на 100 млн ящиков

Рынок почты в РФ переформатируется на глазах
Старая модель «жить на чужой бесплатной почте» закончилась

На этом фоне нужна экспертиза на почтовый сервис национального масштаба, до 100 000 000 ящиков, полностью в российском контуре

Ищу не «инженера Postfix», а технического лидера направления того, кто возьмёт архитектуру/стратегию и результат на себя + соберёт команду под себя

Тебе сюда, если ты:
• строил или эксплуатировал почту/мессенджинг на десятках млн пользователей (Яндекс / VK / Mail.ru / крупный телеком / хостинг / RuPost);
• держишь весь стек: распределённое хранилище и очереди, доставляемость на уровне IP-пулов, антиспам/антифрод;
• понимаешь комплаенс на масштабе — 152-ФЗ, ОРИ, СОРМ (на 100 млн это фундамент, а не опция);
• умеешь вести команду и отвечать за направление, а не только за конфиги.

Формат обсуждаем — лид/Head, фуллтайм или партнёрство в проекте. Условия под уровень.

Особенно ценно услышать тех, кто уже ловил грабли hyperscale-почты, которых нет в документации

👉 Отклик боту @kovalski_hairing_bot: пришли PDF (CV/опыт) и в подписи пару строк о себе. Одна заявка с человека, анализ будет в ручном режиме без ИИ =)

Читать полностью…

Валера Ковальский

что бан fable 5 как прецедент значит для нас, фаундеров без гражданства сша, которые используют frontier модели

— фронтир-модель теперь это отзываемый сервис, а не софт который ты купил. одно письмо от правительства и она исчезает из твоего стека за ночь. если продукт жестко завязан на одну топ-модель это single point of failure. Недавний релиз higgsfiled с Fable 4 вот сейчас поплыл

— большинство из нас сегодня в порядке. вырубили только fable 5 и mythos 5, все остальные клоды работают. opus 4.8 закрывает процентов 95 продуктовых задач. если ты строил именно на fable 5 (контент-пайплайны, агенты, длинные таски) - оно лежит прямо сейчас. меняй модель сегодня и относись к этому как к bus factor только для моделей

— настоящий долгий риск для нас, фаундеров без сша паспортов: режим верификации, где твой паспорт решает, дадут ли тебе лучшие модели. это не сегодняшняя история, а та за которой надо следить

— гражданство твоих юзеров может стать твоей проблемой, а не только твое собственное. ограничение по гражданству (а не по гео) значит что фильтровать придется и конечных пользователей

— топ-доступ и так шел со звездочками. fable и mythos 5 запустили с обязательным 30-дневным хранением всего трафика, даже для тех у кого был zero-retention контракт. бан - это вторая звездочка. больше мощности = больше комплаенса, и его будет только больше

"будущее уже наступило, просто оно распределено неравномерно"

@neural_prosecco

Читать полностью…

Валера Ковальский

STT-сервис для Long Record записей

Speechcore перешел под управление NeuralDeep!
Интеграции стали нативнее.
Использование удобнее!

https://speechcore.neuraldeep.ru/

Читать полностью…

Валера Ковальский

⚡️ Открываем бенчмарк для детекции PII в русском тексте

Мы тут много рассказывали про работу guardrails. А теперь выкатываем в открытый доступ бенчмарк для детекции персональных данных на русском языке. На нём можно сравнивать NER-модели, PII-детекторы и системы анонимизации.

Внутри датасета 21 тип персональных данных:
• ФИО: имя, фамилия, отчество;
• адресная иерархия: страна, регион, город, район, улица, дом;
• контакты: email, телефон, URL, IP;
• документы: паспорт, СНИЛС, ИНН, ОМС, банковская карта, водительское удостоверение, военный билет, свидетельство о рождении.

Датасет состоит из синтетических данных, а также реальных примеров из продакшен-логов, где персональные данные заменены на синтетику. Внутри сгенерированные данные в формате документов + сложные пограничные кейсы и опечатки.

Все данные представлены в формате BIO. Разметка и валидация выполнялись частично вручную, частично с помощью LLM. В карточке датасета описали таксономию сущностей и протокол оценки, а ещё добавили результаты популярных открытых моделей для удобного сравнения. 😊

Прогоняйте свои анонимайзеры, PII-детекторы и NER-модели, ломайте бенчмарк и делитесь результатами в комментариях.

↗️ Hugging Face

Автор этого поста, как и многих других про NER и PII, Женя Андриевская — NLP-инженер в R&D red_mad_robot


#Безопасность

Читать полностью…

Валера Ковальский

О, тоже подъехало


Пойду делать AGI

/channel/neuraldeepchat/63651

Читать полностью…

Валера Ковальский

Вайбдрайвинг голосом, а почему нет?

Настроил на руле Сири так что бы вызвать клаву голосовую на телефон

Читать полностью…

Валера Ковальский

IMAGE API в рамках текущих тарифов, включая FREE!

https://neuraldeep.ru/docs#images

Все тарифы:
1) FLUX image · генерация (/v1/images · промпт RU→EN авто)
2) Upscale ×4 image · апскейл RealESRGAN (еще будут замены)
3) Background-remove image · удаление фона (ISNet/RMBG)
4) Enhance image · улучшение (FLUX)
5) Avatar image · аватар из фото

Читать полностью…

Валера Ковальский

Как накачать агентов к лету:

Читать полностью…

Валера Ковальский

Голосуем за модели!

В нашем полку прибыло видеопамяти

Какую модель вы хотели бы увидеть на хабе?

Heretic не предлагать 😈

Предложения жду в комментариях.

Читать полностью…
Subscribe to a channel