Меня зовут Андрей Кузнецов Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML Tg: @kuznetsoff87 Linkedin: https://tinyurl.com/y96nmmdd
В 01:15 с четверга на пятницу на телеканале НТВ выйдет в эфир передача «Мы и наука. Наука и мы» — «Через 10 лет искусственный интеллект обретёт эмоции» с моим участием.
Увидимся на экране! Позже по ссылке можно будет найти запись, а здесь — увидеть программу в прямом эфире.
Встретился на днях с руководителем направления отдела исследований и разработки в области искусственного интеллекта ПИК, Артуром Ишмаевым.
Мы обсудили возможные форматы сотрудничества и инициативы с использованием технологий генеративного проектирования, обменялись мыслями и практическим опытом!
✔️Буду рассказывать вам о совместных проектах!
🔥 Интернет-королева возвращается: 340 страниц об AI, которые взорвали Кремниевую долину
Легендарный аналитик Мэри Микер, автор культовых отчетов о трендах интернета, спустя 6 лет выпустила новый масштабный доклад — на этот раз об искусственном интеллекте. 340 страниц данных, прогнозов и провокационных выводов.
Главный вывод: ИИ-революция уже необратима, и мы находимся в точке "сингулярности".
📌 Основные тезисы:
- AI-революция необратима: В отчете 51 раз встречается слово "беспрецедентный"
- Китайские модели дешевле в 500 раз (ERNIE 4.5 Turbo vs GPT-4.5)
- Индия — неожиданный лидер по числу пользователей ChatGPT (13.5% от мирового трафика)
💸 Пузырь OpenAI?
Микер прямо называет оценку компании ($300B) "сильно завышенной":
→ Выручка OpenAI: $9.2B/год
→ Оценка/Выручка = 33x (у Perplexity — 75x!)
🔧 Технические детали
• Стоимость инференса упала на 99.7% за 2 года
• Энергопотребление Blackwell GPU в 105 000 раз ниже аналогов 2014 года
• DeepSeek-R1 почти догнал OpenAI (93% vs 95% в MATH Level 5)
🌐 Главный тренд будущего
Следующие 1 миллиард пользователей пропустят этап приложений и сразу перейдут к AI-ассистентам через голосовые интерфейсы — особенно в регионах с низким интернет-покрытием.
🔮Вывод: "Нынешние лидеры ИИ могут повторить судьбу AltaVista. Единственное, что точно известно — мы в начале нового суперцикла технологий."
Полный отчет: BOND Capital AI Report 2025
Краткий обзор в китайской статье
#КитайскийИИ #КитайAI #ИИтренды #OpenAI #TechАналитика
Уже привычно: крупная трансляция на @okkosport — сайт лежит намертво, а там уже 1:0. Спасибо🤝
Читать полностью…🔥Супер интересный доклад про ризонинг от @Ivan_Oseledets
Читать полностью…Сегодня коллеги из Сбера зарелизили технологию инструктивного редактирования — Malvina⚡️
Наша лаборатория FusionBrain принимала активное участие в проекте. Мы сосредоточились на исследованиях и разработке новых архитектурных решений для базовой модели. Цель — повысить эффективность модели и улучшить качество итогового редактирования🔝
Результаты в комментариях, а подробнее читайте тут
🔥 Внимание, AI-энтузиасты! 🔥
Ребята из нашей лаборатории FusionBrain запускают несколько топовых исследовательских проектов в рамках конкурса научных проектов МГУ! Если мечтаешь вкатиться в AI Research, прокачать свои навыки и поработать над крутыми задачами — это твой шанс!
📢 Темы исследований:
- Text-to-Image/Video Diffusion Models
- Large Language Models (LLM)
- Vision-Language Models (VLM)
- 3D perception/reconstruction
👩💻 Кто может участвовать?
Студенты и выпускники технических вузов, готовые погрузиться в мир передовых технологий и внести свой вклад в развитие науки.
📌 Как принять участие?
1. Заходи на сайт: ссылка
2. Выбирай проект, который тебе по душе
3. Заполняй анкету с сайта
4. Отправляй заявку на почту: a.mezentseva@intellect-foundation.ru
📅 Дедлайн: до 23:59 (МСК) 26 мая 2025 года.
Не упускай возможность — вливайся в мир AI, работай с крутыми задачами и прокачивайся вместе с нами! 🔥
⚡️Вчера ByteDance выпустил новую супер модель Bagel, которая базируется да трансформере декодере и решает широкий спектр задач понимания и генерации мультимодальных данных (картинки, видео). Модель умеет как понимать разные модальности, так и генерировать их и вносить изменения (например, редактировать картинку по текстовой инструкции)
Архитектурно это MoE архитектура с двумя типами экспертов: Understanding и Generation. В опен сурс выложена 7B модель.
Модель обучена на нескольких триллионах токенов (отдельная часть исследования посвящена росту качества от увеличения числа токенов на обучении для визуальных генеративных задач), которые включают очень разнообразные задачи: от описания изображений до видеороликов, сопровождаемых траекториями движения. Также проработан механизм подробной фильтрации данных (UI removal, контроль разрешения и др.). Это позволяет насытить модель большим разнообразием потенциальных задач, обученных на чистых данных. Что интересно, у модели прокачаны и способности к рассуждениям (thinking mode inside💪).
Статья
Hugging Face
P.S. Обязательно изучаем и дружим с Cursor😉
Вместе с коллегами из TRASSIR успешно завершили первый этап исследования возможностей мультимодальных моделей в задачах видеоаналитики📷
Основная цель проекта — создание системы, способной эффективно выявлять случаи краж товаров в торговых точках с минимизацией ошибок. Мы использовали мультимодальные модели, работающие в zero-shot-режиме, чтобы снизить количество ложных тревог и повысить точность выявления подозрительных ситуаций без специального дообучения модели.
Улучшения:
⚫️Механизмы рассуждения, позволяющие лучше распознавать сложные действия (например, "взятие+возврат" товара)
⚫️Детализация эпизодов интереса для более точного анализа коротких событий
⚫️Поддержка потокового видео с учётом длинного временного контекста
➡️Будущие проекты предусматривают использование мультимодальных моделей для оценки соблюдения стандартов общепита: анализ аудио на предмет соблюдения речевых скриптов персоналом, контроль за соблюдением санитарных норм, детекцию нарушений, связанных с условиями допродаж и чистотой помещений.
Эта неделя насыщена деловыми поездками, делюсь с вами.
📌Первый пункт назначения был вчера — международная конференция IEEE USBEREIT 2025 в Екатеринбурге. Целью конференции являлось объединение исследователей и практиков из различных областей науки, включая радиоэлектронику, информационные технологии, биомедицинскую инженерию и другие.
Я выступал с докладом по генеративному проектированию в области строительства и промышленного производства. Это направление активно развивается в рамках деятельности лаборатории FusionBrain и вызывает интерес как у научного сообщества, так и у представителей бизнеса. После доклада присоединился в качестве эксперта к круглому столу про применение и развитие современных технологий ИИ в образовании.
📌Следующая остановка — Казань!
Приглашаю вас на мое выступление на Data Fest в Сбере 30 мая ✨
Будем говорить про генеративное проектирование в архитектуре, новые горизонты возможностей для творчества и инженерии 🤖
Подключайтесь к онлайн-трансляции в сообществе Сбера в VK или приходите на мероприятие, если вы в Москве!
Чтобы прийти очно, необходимо зарегистрироваться ➡️ вот тут
Поздравляю всех с великим праздником — С Днём Победы⭐️
Вечная память всем героям, которые отдали жизнь ради счастья и спокойствия будущих поколений! Мы будем нести историю из поколения в поколение🙏
Желаю всем мира и добра!🕊️
Коллеги из Сбера ищут человека, который будет организовывать и проводить хакатоны по искусственному интеллекту в онлайн и оффлайн форматах 👋
Кандидат будет управлять всеми этапами подготовки мероприятия — от разработки концепции и привлечения участников до контроля качества исполнения и анализа результатов.
Что предстоит:
☑️Разработка концепций и реализация хакатонов
☑️Подбор и координация команд разработчиков
☑️Юридическое сопровождение и подготовка документов
☑️Запуск рекламы
☑️Организация церемоний награждения, анализ обратной связи
Что ждут от кандидата:
☑️Опыт проектной деятельности и организации мероприятий
☑️Понимание правовых норм и опыт работы с документацией
☑️Коммуникабельность и умение вести переговоры
☑️Хорошее знание инструментов и методов управления проектами (Agile/Scrum)
☑️Английский язык для общения и понимания технических материалов
☑️Желательны базовые знания AI и ML
Присылайте резюме @vladalogunova и приходите делать крутые проекты в Сбере вместе 😼
Коллеги из Сбера опубликовали на Хабре кейс: «Как мы научили GigaChat слышать».
Из главного, для повышения качества распознавания перешли на end-to-end архитектуру вместо связки ASR + LLM. И если раньше голосовой запрос шёл через распознавание речи и преобразование в текст, то сейчас GigaChat Audio сразу распознаёт речь. В side-by-side сравнении на 1200 диалогах набрал 0,68 против 0,32 у прежней схемы. Вместе с этим увеличилась и длительность контекста до 170 минут аудио в одном запросе.
Новый GigaChat Audio достиг уровня GPT-4o. Субъективная оценка диалоговых возможностей на русском языке состояла из семи критериев: общее впечатление, красота, грамотность, следование system, контекстность, полезность и фактология.
Протестировать слух нейросети уже можно в веб-версии giga.chat и в боте @gigachat_bot.
Обращаюсь ко всем потенциальным участникам школы👨🎓👩🎓
Если вы:
📍испытываете экзистенциальные муки выбора (подаваться или нет)
📍сложности с выполнением задания (так делать или иначе)
📍любые другие сомнения относительно летней школы
Вы можете задать свой вопрос прямо внизу в комментариях и получить на него ответ👇👇👇
И помните, «не бывает глупых вопросов — бывают глупые ответы» (не в этом случае, надеюсь)😅
Почти Last call 🚀
Мы на финальной стадии набора в шестой батч Sber500 — и особенно ждем AI-first и DeepTech-команды.
В первом квартале 2025 года на AI-стартапы пришлось более половины всех венчурных инвестиций в мире. Спрогнозируем итоги второго квартала сами?
Приходите в акселератор, если:
▪️ ищете доступ к инвесторам и корпорациям
▪️ хотите масштабироваться с помощью международных экспертов
▪️ готовы заявить о себе на широкую аудиторию и стать частью сообщества сильных основателей
Подавайте заявку в Sber500 до 9 июня по ссылке.
Программа на английском. Участие бесплатное 🔥
@sberstartup
Нашу статью приняли на Slavic Natural Language Processing Workshop на А* конференции ACL!
Скоро выложим на архив.
Первый выпуск второго сезона подкаста "Фичи Катятся"!
Дима Бугайченко — CDS B2C в Сбере. Мы познакомились в Минске, где выступали на митапе по рекомендательным системам. Мне понравился его доклад, а после, на афтерпати, несколько часов обсуждали машинное обучение и мультиагентные системы. Тогда я подумал: “Блин, я бы с ним поработал”. И вот, спустя почти два года — мы коллеги. Именно видосом с Димой я открываю второй сезон подкаста “Фичи Катятся”.
В этом видео мы обсудим:
- Как понять искусственный интеллект через призму натурального: ключевые принципы и их значение для разработчиков.
- Эволюция ИИ: от древних автоматов до генеративных моделей и трансформеров.
- Мультиагентные системы: как они работают, где применяются (логистика, умные дома, марсианские роверы) и почему 2025 год астрологи объявили годом агентов.
- Рекомендательные системы: их роль в продуктах, вызовы приватности и пузыри мнений.
- Теория игр и эмерджентность: как мультиагентные системы балансируют интересы бизнеса и пользователей.
- Будущее развитие применения ИИ: как технологии изменят бизнес, организации и нашу повседневную жизнь.
- Будущее ИИ и сильный искусственный интеллект (AGI): что ждет IT, продукты и общество, и как разработчикам к этому подготовиться.
Этот выпуск для тех, кто хочет глубже понять, как мы оказались в глобальной AI трансформации, какие изменения нас ждут в айти, бизнесе, продуктах, обществе, и как разработчикам, тимлидам и CTO использовать эти технологии для создания продуктов будущего.
https://youtu.be/QKt2BlKUwpk
ВК, Rutube, Spotify, Apple Podcasts, Яндекс.Музыка
Лайк, шер! Ты знаешь, с кем поделиться этим выпуском!
Делюсь своей победой 🌟
Я стал лауреатом Премии Посла Китая. Премия учреждена РосСНИО и Посольством Китая по инициативе Чрезвычайного и Полномочного Посла КНР Чжан Ханьхуэя и ежегодно поддерживает выдающихся российских специалистов.
Вместе с остальными лауреатами я поеду в КНР посетить научно-исследовательские учреждения для обмена опытом с китайскими коллегами.
Благодарен за такую возможность, это большая честь для меня!
⚡️⚡️⚡️В 11:00 стартует Data Fest 2025 в сердце Сбера на Кутузовском 💚
Подробная программа: по ссылке
Подключиться в онлайн:
Ссылка на Main Stage
Ссылка на AI Disrupt Stage
Ссылка на ODS VK Видео стрим
Приходите, подключайтесь! 🦜
Data Fest в Сбере 🏦 🦜
30 мая Data Fest 2025 придёт в гости в штаб-квартиру на Кутузовском проспекте.
🧠 Открывает главную сцену Иван Оселедец @Ivan_Oseledets с докладом "Большие языковые модели в эпоху ризонинга"
🎨 Следом выступит Александр Капитанов @rndcv_team с релизом state-of-the-art модели инструктивного редактирования изображений MALVINA, над которой активно трудилась команда @layercv
😎 Также будет представлен доклад Федора Минькина @gigadev_channel о разработке больших языковых моделей в Сбере
🛠 Андрей Кузнецов @complete_ai выступит с интересной темой про генеративное проектирование в строительстве и промышленности
🧑💻 Дмитрий Бабаев @dl_l_lb представит подробный доклад о том, как команда обучает GigaCode
🤖 Сергей Марков @oulenspiegel_channel открывает сцену с визионерским докладом про ИИ в эпоху больших языковых моделей
🧠 Александр Абрамов @dealerAI расскажет про глобальную память в LLM на примере GigaChat
📝 Никита Мартынов и Даниил Астафуров, инженеры MERA покажут, как оценивать генеративные способности LLM для русского языка
🖥 Виктория Вольф @rndcv_team поделится лайфхаками обработки и фильтрации больших объемов мультимодальных данных.
И это еще не все, в программе представлено более 20 крутых докладов!
🖥 Зарегистрироваться и узнать подробности можно на сайте
Хочу познакомить вас со своим другом, Артёмом Арюткиным, руководителем продуктового офиса, который делает платформу для разработчиков в Яндексе.
На своём канале Артём рассказывает о построении масштабируемых сервисов, обеспечивающих надёжность работы для миллионов пользователей, о современных методиках управления продуктом и принципах эффективной коммуникации:
🔹 как решать проблемы
🔹 какие вопросы задавать нанимающему менеджеру
🔹 как гарантированно выгореть (лучше не надо!)
🔹 нужно ли продакту уметь в техничку
Подписывайтесь и исследуйте мир редких зверей — technical product manager’ов 😎
МТС приглашает разработчиков на масштабную ИТ-конференцию True Tech Day 6 июня. Участие бесплатно
Ключевая тема конференции в этом году — искусственный интеллект. Тебя ждут доклады ученых, выступления зарубежных спикеров по AI и экспертов крупных ИТ-компаний.
В программе:
— 4 трека и больше 40 докладов.
— Выступления зарубежных спикеров с индексом Хирша более 50.
— Концентрация практических кейсов: как создаются большие ML-проекты.
— Доклады по архитектуре, бэкенд-разработке и построению ИТ-платформ.
— AI-интерактивы и технологические квесты.
— Пространство для нетворкинга,
…а еще after-party со звездным лайн-апом.
Когда: 6 июня
Где: Москва, МТС Live Холл и онлайн
Участие бесплатно. Регистрация по ссылке.
📌Второй пункт — Казань!
Вместе с Университетом Иннополис мы запустили новую лабораторию мультимодального генеративного ИИ!
Сегодня, на XVI Международном экономическом форуме «Россия — Исламский мир: KazanForum», состоялось подписание соглашения заместителем директора по развитию цифровых проектов российского ИТ-вуза Алексеем Павловым и генеральным директором Института AIRI Иваном Оселедцем.
Мне выпала честь возглавить новую лабораторию. Вместе с Директором Института ИИ Университета Иннополис Рамилем Кулеевым будем заниматься сведением ресерч инициатив лаборатории и продуктовых запросов от бизнеса с прицелом на повышение качества, а также поиском новых решений с помощью мультимодальных моделей. Задачи новой лаборатории связаны с треками лаборатории FusionBrain, AIRI, что усилит научные проекты и повысит эффективность команд.
Начало положено✔️
Если вы студент, аспирант, постдок Иннополиса с опытом работы с языковыми, мультимодальными моделями, увлечены темой генеративного ИИ, присылайте мне @kuznetsoff87 своё резюме!
Стал доступен первый российский AI-сервис для создания 3D-моделей — Kandinsky 3D 🚀
За считанные минуты сервис генерирует детализированные 3D-объекты по текстовым описаниям или входным изображениям. На выбор несколько поддерживаемых форматов: STL, OBJ, FBX, GLB и USDZ.
Kandinsky 3D также поможет оптимизировать процессы генеративного проектирования и промышленного дизайна. Нейросеть создаёт полигональные модели, совместимые с профессиональными системами автоматизированного проектирования (САПР).
Протестировать модель можно здесь, подключить API здесь.
⚡️Sakana AI продолжает свой путь в развитии bio inspired архитектур нейронных сетей. Свежий утренний релиз нового типа моделей - Continuous Thought Machine
Ключевой особенностью новой архитектуры - механизм синхронизации нейронов, где каждый нейрон - это набор весов или мини-нейронка со своей памятью состояний. Как результат - говорят о росте способности к рассуждениям или reasoning, что сейчас является очень важным направлением развития фундаментальных моделей.
Детально тут👇
Paper: https://pub.sakana.ai/ctm/
GitHub: https://github.com/SakanaAI/continuous-thought-machines
@complete_ai
2025 год. Международная конференция NAACL 2025. Место проведения — Альбукерке, США. Представление работы, когда никому из авторов не дали визу🤪
Пояснение: это некоторая виртуальная площадка как в онлайн стратегии, где ты ходишь между постерами и можешь к любому подойти, рассмотреть его и собственно поговорить с презентующим о его исследовании или просто посмотреть постер.
Так и живём😉
Мы с командой делали сервис по реставрации и колоризации фотографий для Бессмертного полка💪
Поэтому, если у вас есть фото ваших героев, то можете внести их вместе с краткой информацией до 6 мая на сайте👇
https://2025.polkrf.ru/
Фото дедушки получилось очень красивым!
Ванильный RAG не работает. Как исправить?
RAG — один из самых популярных подходов для интеграции LLM в реальные продукты. Но несмотря на популярность его внедрение часто сопровождается проблемами: система выдает недостоверные ответы, делает поверхностные выводы или вообще молчит. Причины разнообразны: эмбеддинг теряет суть запросов, поиск пропускает важные документы, генератор не справляется с обработкой контекста.
В эту среду DeepSchool проведёт открытую лекцию, на которой коллеги разберут, как в этой системе навести порядок✔️
На лекции вы узнаете:
🟢почему ванильная схема "ретривер + генератор" почти никогда не даёт нужного качества
🟢с чего начинать улучшения: эмбеддер, поиск, реранкер, генератор, данные или что-то ещё
🟢какие задачи приходится решать, чтобы RAG действительно работал
🟢как из разрозненных компонент собрать надежный RAG-продукт
На лекции также будет представлен курс LLM Pro, где вы сможете научиться создавать эффективные AI-решения. Всем участникам лекции — скидка на обучение!
📎Регистрируйтесь по ссылке и подключайтесь 30 апреля в 18:00!
До закрытия приёма заявок на школу по искусственному интеллекту «Лето с AIRI» в ТГУ — всего 4 дня!
Все лекции и семинары прошлого года доступны в VK Видео — загляните, чтобы почувствовать атмосферу Школы и вдохновиться на участие.
Подавайте заявки по ссылке до 29 апреля 23:59📌