complete_ai | Неотсортированное

Telegram-канал complete_ai - Complete AI

6842

Меня зовут Андрей Кузнецов Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML Tg: @kuznetsoff87 Linkedin: https://tinyurl.com/y96nmmdd

Подписаться на канал

Complete AI

Приглашаю принять участие в IT_ONE Cup. ML Challenge

Соберите крутого AI-ассистента для дизайнеров, системных и бизнес-аналитиков! Призовой фонд — 1,5 миллиона рублей, каждый участник сможет забрать классный мерч и получить приглашение в магистратуру ИТМО.

Окончание регистрации совсем близко — успейте зарегистрироваться до 13 апреля!

Почему стоит участвовать?
✔️ Нужен всего лишь прототип, а не готовый продукт
✔️ Попробуете свои силы в машинном обучении, обработке текста и компьютерном зрении
✔️ Узнаете, какие методы реально работают
✔️ Базовых знаний и желания экспериментировать хватит — модели с нуля учить не придётся

Что вас ждёт на IT_ONE Cup. ML Challenge?
✔️ Поработаете с современными технологиями: LLM, NLP, RAG, MCP
✔️ Создадите AI-инструмент, который упростит работу других специалистов
✔️ Сможете попасть в магистратуру ИТМО на факультет Программной инженерии и компьютерной техники. Число приглашений не ограничено – шанс будет у каждого

Какие треки есть?
1️⃣ Динамические контекстные подсказки для системного аналитика
2️⃣ AI-генератор дизайн-макетов по описанию требований
3️⃣ Система визуализации BPMN-диаграмм

Пройдите регистрацию и получите главный приз!

Читать полностью…

Complete AI

Я участвую в Программном комитете AiConf X 2025 — конференции по Data Science от Онтико, организаторов HighLoad++ и TeamLeadConf 🌟

Сейчас мы ищем сильных спикеров и доклады по темам:
🟡RecSys, поиск, таблицы
🟡Генеративный AI: генерация и распознавание текстов, музыки, изображение, видео, рerception
🟡ML Edge — оптимизация обучения и инференса, дистилляция, квантизация, hardware и т.д.
🟡Automotive, роботы
🟡Обработка данных и бенчмарки

Акцент конференции на практические форматы: мастер-классы, воркшопы, круглые столы и т.д.

Даже если ваша тема отличается от перечисленных, присылайте заявки 🙂

10 апреля в 17:00 приглашаем на бесплатную онлайн-встречу с программным коммитетом, где обсудим темы конференции, идеи и ответим на вопросы. Встреча неформальная, нужно пройти регистрацию!

Жду ваши доклады!

Читать полностью…

Complete AI

Прошло уже больше 6 лет с последнего open source релиза LLM от Open AI (это была модель GPT-2 в феврале 2019), и вот Альтман говорит, что в ближайшее время планируется релиз новой открытой модели🙈 Верим?

https://techcrunch.com/2025/03/31/openai-plans-to-release-a-new-open-language-model-in-the-coming-months/

Читать полностью…

Complete AI

⚡️Всегда испытываю искреннюю радость за успехи ребят, с которыми удалось работать! Андрей пришел стажером ко мне в лабораторию в 2024 году по предложению @Ivan_Oseledets, занимался исследованиями мультимодальных архитектур, параллельно обучаясь и набираясь опыта, достигая успехов в исследованиях в AIRI и не только. А сегодня я горжусь его успехами и рад, что имею возможность работать с такими талантливыми ребятами🙏

Читать полностью…

Complete AI

M-Attack: как обмануть GPT-4.5 и Gemini

Все привыкли, что атаковать современные мультимодальные модели (типа GPT-4o, Claude, Gemini и т.п.) крайне сложно — особенно, если это black-box модели, где нет доступа к градиентам и архитектуре. Стандартные подходы атак типа "выдать одну картинку за другую" часто генерируют какие-то невнятные шумы, которые либо игнорируются моделью, либо приводят к абстрактным ответам типа "размытое изображение".

Но оказалось, что проблема была не в самих моделях, а в подходе к генерации возмущений. В свежей статье предложили очень простой, но мощный подход — M-Attack:
1. Берём исходную и целевую картинки.
2. На каждом шаге рандомно crop'аем кусок исходного изображения (50-100% площади) и затем ресайзим обратно до исходного размера.
3. Заставляем эмбеддинги этого кусочка максимально приблизиться к эмбеддингам целевого изображения оптимизируясь в white-box режиме по ансамблю открытых визуальных моделей (например, CLIP, ViT и тп).

И всё! После нескольких итераций в центральной области картинки "проявляется" целевая семантика, при этом возмущения выглядят крайне незаметно и аккуратно (в отличие от других подходов).

Авторы добились совершенно впечатляющих результатов: успех атаки (ASR) превышает 90% (!) для GPT-4.5, GPT-4o и даже для o1 и Gemini. Код и датасет из 100 атакованных картинок выложили в открытый доступ.

Статья, GitHub, dataset

Читать полностью…

Complete AI

🎉Всех женщин и девушек, читающих этот канал, сердечно поздравляю с Международным женским днём!

Прекрасно понимаю, что среди читателей представительницы совершенно разных профессий: учёные, преподаватели, студенты, менеджеры, маркетологи, дизайнеры и многие другие. И в каждом деле, в каждой профессии, в доме и в семье вы приносите душевность, нежность, вдохновение и заряжаете окружающих вас мужчин огромным зарядом энергии, оптимизма и стремления совершать открытия💐 Спасибо вам за то, что вы есть каждый день! Мы вам очень-очень благодарны за это💐❤️

Читать полностью…

Complete AI

Kandinsky в платёжных терминалах по всей стране готовится поздравлять всех женщин и девушек 💐

Читать полностью…

Complete AI

Приглашаю вас на AI Agents x Web3 BuildCon — митап для фаундеров и разработчиков, которые работают над запуском AI-продуктов в Web3.

Мероприятие состоится 4 марта при поддержке моих коллег из ComUnity Sber и MSK FRENS! На митапе будут разобраны реальные кейсы от тех, кто уже строит продукты с использованием децентрализованного ИИ. Если вы ИИ-разработчик, владелец бизнеса, который хочет внедрить ИИ в свои процессы, заинтересованный в технологиях ИИ пользователь, то митап для вас 🙂

Ключевые вопросы:
🟡Как билдить AI-агентов?
🟡Где искать инфраструктуру и полезные контакты?
🟡Что реально работает в Web3 и AI?

В программе спикеры: Sber AI, Лаборатория блокчейн Сбера, Fluence, AIRI, TETRIX, VARA, ComBox, Quarm и другие.

🔜 Бесплатный билет
🔜 ТГ-чат с навигацией @mskfrens

Адрес митапа: Кутузовский пр-кт 32к1, 2-ой этаж, конференц-зал.

Как добраться: Яндекс Карты | Google Карты

Для участия обязательно необходима регистрация и подтверждение регистрации, для прохода на площадку необходим паспорт. Не забудьте!

Читать полностью…

Complete AI

Как ML-инженеру пробиться из мидлов в сеньоры?

Вы умеете делать fit() и predict(), но что-то не даёт покоя — застряли на уровне мидла и нет понимания, как пробиться в сеньоры.

Сеньор — это не просто человек, который знает больше библиотек или пишет код быстрее. Это специалист, который видит картину целиком, способен самостоятельно взять на себя задачу или выбрать направление в развитии проекта и довести его до успешного завершения.

Прокачайте свои навыки и получите level up своей карьеры на курсе Hard ML от karpov courses. Авторы курса — Валерий Бабушкин, из British Petroleum и другие топовые специалисты из Яндекса, X5 Retail Group и других крупных компаний.

Вы получите максимально глубокое погружение в задачи, с которыми сталкивается современный бизнес. К концу каждого модуля у вас будет собственный ML-сервис, решающий сложную и важную задачу.

Курс охватывает абсолютно все этапы работы ML-инженера. Вы научитесь самостоятельно собирать и размечать данные, строить пайплайны их поставки, деплоить приложения, настраивать мониторинги и оценивать эффективность алгоритмов.

Присоединяйтесь к курсу со скидкой 5% по промокоду COMPLETE до 31.03.2025: https://clc.to/e2oXRg

Читать полностью…

Complete AI

🔜 Как формируются ценности искусственного интеллекта?

LLM обучаются на данных, созданных людьми, но действительно ли они наследуют наши убеждения? Как культура разметчиков данных и разработчиков влияет на то, какие решения принимает искусственный интеллект? 

25 февраля эксперты Школы управления СКОЛКОВО разберут эти вопросы на открытой встрече. В рамках дискуссии Александр Диденко (руководитель Лаборатории искусственного интеллекта СКОЛКОВО), Николай Верховский (академический директор Digital Shift), Яна Чаруйская (исполнительный директор Управления экспериментальных систем машинного обучения, Сбер) и Валерий Шульгинов (ведущий научный сотрудник Центра междисциплинарных исследований МФТИ, НИУ ВШЭ) обсудят: 

🔘действительно ли LLM отражают ценности своих создателей
🔘как культурные различия формируют характер искусственного интеллекта 
🔘во что «верят» современные AI-модели — ChatGPT, YandexGPT, GigaChat и другие
🔘как это влияет на экономику, корпоративные стратегии и управление командами

⭐️Регистрируйтесь и приходите уже завтра, 25 февраля в 17:00, кампус СКОЛКОВО.

Читать полностью…

Complete AI

У нас тут кстати случилось чудесное событие после одного телефонного звоночка на прошлой неделе)

Разблокировали гитхаб лаборатории — https://github.com/FusionBrainLab 🎉

Все звёзды на месте🔥🔥🔥

Читать полностью…

Complete AI

Когда чувства компилируются без ошибок

Мы сделали валентинки для тех, кто видит красоту в коде, звёздное небо в репозиториях и всегда выбирает оптимальный путь — и в науке, и в жизни. Отправляйте их коллегам, друзьям и просто дорогим людям.

Пусть ваши градиенты сходятся, модели не переобучаются, а сердце остаётся в стабильной конвергенции!

Читать полностью…

Complete AI

Приглашаю вас на научно-фантастические дебаты сотрудников AIRI в баре Ровесник. Обсудим правдивы ли тезисы из научно-популярных фильмов

Я буду спорить с Костей Соболевым, руководителем группы "Генеративный ИИ для видео" лаборатории FusionBrain, о наличии у искусственного интеллекта эмоций. Может ли он что-то чувствовать или это всё-таки бездушная машина🙂

К какой точке зрения склоняюсь я, вы узнаете уже завтра в 19:00. Не забудьте зарегистрироваться!

Читать полностью…

Complete AI

Как известно, в лаборатории FusionBrain есть несколько научных групп. Одна из них занимается механистической интерпретируемостью (Architectural insights) и руководит ею Антон Разжигаев (автор канала AbstractDL). На днях он выпустил отличную статью на Хабре про нашумевшую модель DeepSeek-R1, где подробно изложил все тонкости процесса обучения.

Несмотря на то, что называется она "DeepSeek-R1 для чайников", внутри много технических деталей (мы вчера уже пошутили, что это какие-то очень навороченные чайники с кучей сенсоров и умных программ). Не пугайтесь, вы в них не утоните😉

Рекомендую всем почувствовать себя каким-то "чайником" и получить ответы на вопросы, которые могли еще остаться без ответа) Желаю приятного чтения! Приходите с вопросами, будем рады помочь разобраться💪

👉Хабр

Читать полностью…

Complete AI

Секретная новость от создателя DeepSeek — в основе модели код, написанный советскими учеными в 1985 году💪

Инфа сотка

Читать полностью…

Complete AI

⚡️⚡️⚡️И вот снова приближается Лето с AIRI, где моя лаборатория будет представлена в трёх треках:

📍Мультимодальные модели для видео
📍Генеративные модели для параметрических данных
📍World Models (совместно с @causality_links)

Мы подготовим очень крутой материал на базе проводимых исследований, в том числе с описанием ряда прикладных продуктовых кейсов, где нам удалось апробировать полученные результаты. Поделимся процессом поиска эффективных решений и результатом выбора наилучших из них.

Летняя школа пройдёт с 30.06 по 10.07 на базе Томского государственного университета. Участникам, прошедшим отбор, понадобится самостоятельно покрыть только транспортные расходы.

Если ты бакалавр 2-4 курса, магистр, аспирант или молодой учёный, то…
👉 Регистрируйся по ссылке до 29 апреля включительно
👉 Пиши крутую заявку на участие в отборе
👉 Приезжай и получай возможность интенсивно прокачаться за лето, найти новых единомышленников и может быть даже подготовить свою первую статью на топ конференцию

❓Вопросы можно оставлять под постом

Делитесь, распространяйте
/channel/airi_research_institute/825

Читать полностью…

Complete AI

Как удаление знаков препинания и артиклей в запросе снижает точность языковых моделей до 20%⤵️

Исследователи AIRI обнаружили, что знаки препинания и артикли играют более важную роль в обработке информации языковыми моделями, чем кажется на первый взгляд. Это удалось узнать с помощью метода, который позволяет определить, какие именно данные сохраняются в связке с конкретными токенами.

В серии экспериментов исследователи использовали тексты, из которых заранее убрали элементы, кажущиеся незначительными для логики повествования: знаки препинания, артикли и стоп-слова. Для этого систему обучили анализировать последовательность токенов и восстанавливать текст. Оказалось, что больше всего информации о контексте содержится именно в стоп-словах. Затем поставили перед несколькими популярными языковыми моделями задачу — решить, какие элементы текста, с точки зрения человека, можно удалить. Проверка подтвердила, что, если убрать из формулировки технического задания такие «незначительные» символы, качество работы модели падает.

📎Код для анализа работы языковых моделей доступен по ссылке.

Читать полностью…

Complete AI

Приглашаю вас на онлайн-эфир моих друзей из South HUB на тему локализации IT-сервисов на международные рынки ✏️

В эфире они разберут вопросы, с которыми может столкнуться CEO, CTO и CPO при локализации и масштабирования бизнеса в других регионах на примере реальных компаний. Локализация требует комплексного подхода, включающего не только решение технических вопросов, но и работу с культурными различиями и местными игроками, иначе покорение новых рынков обернётся серьёзной проблемой.

Эфир будет полезен как для общего развития, так и специалистам, планирующим международные проекты или уже работающим с зарубежными продуктами.

Модерировать встречу будет Энтони Минковский, автор проекта First Steps GoGlobal — еще не вышедшей в свет книги, в которой он обещает раскрыть подробности 48 стартапов, успешно вышедших на международные рынки, и Максим Политов CMO South Hub. Отвечать на вопросы будут CTO Flowwow — Дмитрий Шестернин, CEO Достависта — Дмитрий Зубков.

🔜 Когда? 1 апреля, 19:00 (МСК)
🔜 Где? Прямой эфир в Telegram-канале South HUB

Читать полностью…

Complete AI

⚡️Наша новая статья про прунинг визуальных энкодеров в мультимодальных моделях «When Less is Enough: Adaptive Token Reduction for Efficient Image Representation» снова борется за звание Paper of the day на Hugging Face

Особенность исследования в том, что от 30 до 50% визуальных фичей можно исключить из контекста мультимодальной модели при незначительном проседании в качестве на бенчах. Очень интересный результат, который мы продолжаем проверять на различных задачах - несёт пользу для экономии длины контекста мультимодальных моделей

Немного не хватает до первого места) Будем очень рады и благодарны вашим апвоутам 🔝

https://huggingface.co/papers/2503.16660

Читать полностью…

Complete AI

На прошлой неделе вышло моё небольшое интервью для @snobru на тему технологической гонки в ИИ в мире. Обсуждали глобальные вызовы, подходы к развитию ИИ в США, Европе и Азии.

Подробнее можно посмотреть по ссылке

Читать полностью…

Complete AI

На связи #AIRI_Seminars, рассказываем про следующий семинар, который пройдет 12 марта

Руководитель группы компьютерного зрения MTS AI представит доклад на тему «Обучение штраф разреженности с помощью неявного дифференцирования для робастной оценки и регуляризации изображений». Оппонентом выступит кандидат технических наук, директор лаборатории FusionBrain AIRI Андрей Кузнецов.

Семинар пройдет на английском языке. Подробное описание и регистрация на офлайн-формат с пиццей и нетворкингом по ссылке.

Трансляции: VK Видео и YouTube📌

Читать полностью…

Complete AI

🙋‍♀️ Всем привет! В предыдущем посте мы уже рассказывали, как наш датасет EasyPortrait помог коллегам при создании модели GHOST 2.0.

⚡️ А на прошлой неделе наша команда приезжала в Португалию на конференцию VISIGRAPP '25, где представляла статью EasyPortrait — Face Parsing and Portrait Segmentation Dataset.

🚀 Конференция прошла 26-28 февраля в городе Порту, и за 3 дня на ней было представлено больше 200 статей. На конференции мы услышали обратную связь от сообщества, пообщались с коллегами из других стран, а также послушали множество докладов других участников.

📖 ArXiv: https://arxiv.org/abs/2304.13509
👩‍💻 GitHub: https://github.com/hukenovs/easyportrait
🔑 kaggle: https://www.kaggle.com/datasets/kapitanov/easyportrait

#news

Читать полностью…

Complete AI

⚡️⚡️⚡️Первая open-source модель переноса головы на фото — GHOST 2.0

Сегодня мы выпустили первую модель для переноса головы на фото с открытым кодом — GHOST 2.0. Модель продолжает наследие семейства моделей переноса лиц на фото и видео (GHOST).

Архитектура GHOST 2.0 модели включает две составляющих:
🟢 Aligner для реконструкции положения головы и трансфера выражения лица с головы-источника
🟢 Blender позволяет "встроить" голову в целевую картинку с сохранение свойств окружения (чтобы освещение и контраст совпадали, а также дорисовались области-лакуны, которые возникли при переносе)

Самое интересное, что в open source таких моделей по сути нет и самый ближайший аналог — это модель HeSer 2022 года, которую по метрикам удалось обойти. Также мы проделали большой объём работы, исследуя механизмы блендинга и аугментации данных при обучении, чтобы постараться учесть сложные кейсы, когда голова-источник отличается от области встраивания по форме, положению, причёске и т.д. Подробно про эти эксперименты можно почитать в детальном тех репорте.

Внизу по ссылочке можно поиграть с демкой, почитать Хабр и собственно развернуть у себя код, чтобы изучить "нутро" модели. В ближайшее время обновим TG бот, и я отдельно оповещу об этом)

⚡️По сложившейся традиции все наши статьи стараемся номинировать на Paper of the day на Hugging Face — буду очень рад вашим Upvote голосам👇
https://huggingface.co/papers/2502.18417

Полезные ссылки:
👉 ArXiv: https://arxiv.org/abs/2502.18417
👉 Хабр: https://habr.com/ru/companies/sberbank/articles/884780/
👉 Project page: https://ai-forever.github.io/ghost-2.0/

@complete_ai

Читать полностью…

Complete AI

⚡️+1 Accept на CVPR-2025

Детали о принятой статье расскажу чуть позже😉

Читать полностью…

Complete AI

⚡⚡⚡Прекрасная новость!
Наша статья про open source фреймворк LLM-Microscope и методы оценки языковых моделей на предмет измерения контекстуальности токенов, нелинейности, logit lens и прочего снова борется за первое место на Hugging Face за звание Paper of the day🏆

Поддержите upvote'ами🙏
Мы пока на втором месте, но верю, что можем на первом оказаться)
Cтатья принята на большую международную конференцию Core A — NAACL 2025

Отдать голос за статью можно тут👇
https://huggingface.co/papers/2502.15007

Читать полностью…

Complete AI

Что не так с LLM?

🔵Модели игнорируют команды
🔵Даже лучшие LLM фантазируют
🔵RAG не работает с первого раза
🔵API дороже, чем кажется
🔵Инференс без оптимизации — дорогое удовольствие

На лекции 20 февраля в 18:00 на лекции DeepSchool спикеры разберут эти и другие проблемы LLM, и покажут, как их решать на примере реальной задачи ✔️

Спикеры:
🙂 Илья Димов — Senior NLP-инженер
🙂 Тимур Фатыхов — основатель DeepSchool, ex Lead CV Engineer, KoronaPay

Регистрируйтесь на лекцию и получите список полезных инструментов и библиотек для работы с LLM, а также скидки на обучение.

Поделитесь в комментариях мнением: какая главная проблема LLM сегодня?

Читать полностью…

Complete AI

Дорогие читатели, друзья, коллеги, поздравляю всех с Днём российской науки🔬

Желаю выдающихся открытий, передовых результатов, никогда не сдаваться в процессе исследований и побольше мечтать! Наука - это не только про формулы и законы, но и про удачу, чутьё и целеустремлённость! «Per aspera ad astra» (Через тернии к звёздам) (это всё, что я знаю на латыни — мама в детстве как-то сказала, я запомнил и регулярно вспоминаю это выражение)

У науки нет границ и пусть так остаётся всегда!

Читать полностью…

Complete AI

Вот, как работают современные алгоритмы на примере Ведра:

1) Samsung Galaxy S22+
2) iPhone 15 Pro Max
3) iPhone 13 mini
4) iPhone 16 Pro

Ссылка на ведро:
https://market.yandex.ru/cc/VX3y9Pk

Читать полностью…

Complete AI

На самом деле, это конечно же фейковая новость, которая довольно быстро распространилась за последние дни и дошла даже до федеральных телеканалов.

Какой можно сделать вывод: какой бы источник информации вы не читали/смотрели/слушали, всегда надо сохранять место здоровой критике и уделить 1-2 минуты факт-чекингу или проверке достоверности сообщения. Как правило, большинство таких «громких» или кликбейтных заголовков раскручивается на раз-два🧐

Будьте бдительны и проверяйте всё, что читаете)

Читать полностью…

Complete AI

ICT.Moscow собрал 80 крутых инструментов для разработчиков ИИ 🔥

Все они в открытом доступе и подходят для решения абсолютно разных задач. В подборку вошли библиотеки, фреймворки, датасеты, архитектуры и многое другое.

В подборке также есть решение от нашей лаборатории — фреймворк LLM Microscope для визуализации и анализа характеристик языковых моделей. Он позволяет исследовать свойства трансформерных архитектур. Статья о LLM Microscope была недавно принята на международную конференцию NAACL 2025.

Полную версию подборки ICT.Moscow можно посмотреть тут 🔜 ссылка

Также есть удобная инфографика для быстрого поиска нужных решений в PDF.

Читать полностью…
Подписаться на канал