Меня зовут Андрей Кузнецов Руковожу лабораторией FusionBrain в AIRI, один из создателей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML Tg: @kuznetsoff87
🔜 Как формируются ценности искусственного интеллекта?
LLM обучаются на данных, созданных людьми, но действительно ли они наследуют наши убеждения? Как культура разметчиков данных и разработчиков влияет на то, какие решения принимает искусственный интеллект?
25 февраля эксперты Школы управления СКОЛКОВО разберут эти вопросы на открытой встрече. В рамках дискуссии Александр Диденко (руководитель Лаборатории искусственного интеллекта СКОЛКОВО), Николай Верховский (академический директор Digital Shift), Яна Чаруйская (исполнительный директор Управления экспериментальных систем машинного обучения, Сбер) и Валерий Шульгинов (ведущий научный сотрудник Центра междисциплинарных исследований МФТИ, НИУ ВШЭ) обсудят:
🔘действительно ли LLM отражают ценности своих создателей
🔘как культурные различия формируют характер искусственного интеллекта
🔘во что «верят» современные AI-модели — ChatGPT, YandexGPT, GigaChat и другие
🔘как это влияет на экономику, корпоративные стратегии и управление командами
⭐️Регистрируйтесь и приходите уже завтра, 25 февраля в 17:00, кампус СКОЛКОВО.
У нас тут кстати случилось чудесное событие после одного телефонного звоночка на прошлой неделе)
Разблокировали гитхаб лаборатории — https://github.com/FusionBrainLab 🎉
Все звёзды на месте🔥🔥🔥
Когда чувства компилируются без ошибок❤
Мы сделали валентинки для тех, кто видит красоту в коде, звёздное небо в репозиториях и всегда выбирает оптимальный путь — и в науке, и в жизни. Отправляйте их коллегам, друзьям и просто дорогим людям.
Пусть ваши градиенты сходятся, модели не переобучаются, а сердце остаётся в стабильной конвергенции!
Приглашаю вас на научно-фантастические дебаты сотрудников AIRI в баре Ровесник. Обсудим правдивы ли тезисы из научно-популярных фильмов❓
Я буду спорить с Костей Соболевым, руководителем группы "Генеративный ИИ для видео" лаборатории FusionBrain, о наличии у искусственного интеллекта эмоций. Может ли он что-то чувствовать или это всё-таки бездушная машина🙂
К какой точке зрения склоняюсь я, вы узнаете уже завтра в 19:00. Не забудьте зарегистрироваться!
Как известно, в лаборатории FusionBrain есть несколько научных групп. Одна из них занимается механистической интерпретируемостью (Architectural insights) и руководит ею Антон Разжигаев (автор канала AbstractDL). На днях он выпустил отличную статью на Хабре про нашумевшую модель DeepSeek-R1, где подробно изложил все тонкости процесса обучения.
Несмотря на то, что называется она "DeepSeek-R1 для чайников", внутри много технических деталей (мы вчера уже пошутили, что это какие-то очень навороченные чайники с кучей сенсоров и умных программ). Не пугайтесь, вы в них не утоните😉
Рекомендую всем почувствовать себя каким-то "чайником" и получить ответы на вопросы, которые могли еще остаться без ответа) Желаю приятного чтения! Приходите с вопросами, будем рады помочь разобраться💪
👉Хабр
Секретная новость от создателя DeepSeek — в основе модели код, написанный советскими учеными в 1985 году💪
Инфа сотка
Китайцы перед своим Новым годом, конечно, обеспечили всех пищей для размышлений на пару недель празднества💪
А меж тем Janus Pro 1B (any-to-any новую мультимодальную модель) уже раскатали в режиме локального использования в браузере на WebGPU
Почитать тред на Reddit тут
Попробовать тут
Подготовил мини-колонку про ИИ-агентов для нового новостного проекта @anti_agi от команды канала @antidigital, который читают многие decisionmakers IT-отрасли. Ребята создали форк, посвященный исключительно искусственному интеллекту, а так как они на медиарынке уже 20 с лишним лет – стараются отличить важное от сиюминутного. Радует, что научная составляющая ИИ-повестки интересует все больше людей.
Читать полностью…Мои коллеги из SberDevices приоткрыли завесу тайны и представляют Malvina — функциональное расширение GigaChat для редактирования изображений через текстовый промпт. Только промпт! Больше никаких масок, точек и танцев с бубнами😃
Проект пока в закрытой альфе, но на конференции AIJ был представлен демо-стенд и выступал с рассказом Сергей Марков. Архитектура использует сильные стороны LLM-ассистентов и генеративных моделей, фокусируясь на гибкости и качестве данных. Сейчас за генерацию изображения отвечает диффузионка, но коллеги ищут и авторегрессионные решения.
Мальвина умеет работать и со сгенерированными, и с реальными изображениями.
Ждите релиз в GigaChat! Подробнее о технологии на ➡️ канале команды компьютерного зрения Layer в SberDevices.
Дорогие подписчики!
Поздравляю вас с наступающим Новым годом ⭐️
Хочу от всей души пожелать вам благополучия, добра, спокойствия и тихого счастья. Пусть все ваши задуманные планы осуществляются всегда и не зависят от даты на календаре 🍪
Отдельно хочу пожелать процветания российской науке! Благодаря сильным людям, вам, она тоже становится сильнее на мировой арене.
Спасибо вам за активность, за комментарии. Буду радовать вас интересным контентом и новыми релизами команды!
С Новым годом 😱
🔥 Сколтех открыл приём заявок на конкурсный отбор в магистратуру!
Отличная новость: теперь можно проходить весь процесс как на английском, так и на русском языках. Учиться и сдавать экзамены на неродном языке бывает сложно, поэтому Сколтех облегчает задачу и даёт возможность выбирать:
🟢Английский язык — всё идёт по привычному сценарию, но плюс к этому вы получаете дополнительные баллы за участие
🟢Русский язык — проходите все этапы отбора на русском, а потом приезжаете в Сколтех на месяц раньше, чтобы подтянуть английский на программе English Bootcamp. Главное условие — ваш уровень языка должен быть не ниже B1, что проверится на финальном этапе
🙂 Решайте сами: хотите получить бонусные баллы и спокойно провести лето или же сначала пройти отбор на своём языке, а затем отправиться на интенсив по английскому? Всё зависит от вас!
Не упустите шанс — начните свой путь в Сколтех уже сегодня!
Можно ли научить модель text-to-video физике?
Решили с коллегами из AI Talent Hub, что будет здорово разобрать статью из поста ранее.
25 декабря в 18:30 разберёмся, можно ли на большом объёме синтетических данных научить модели text-to-video пониманию физики мира? В частных случаях — да, но чтобы построить "модель мира", придется подружиться с дифференцируемыми законами физики.
📕 Статья: How Far is Video Generation from World Model?
Не забудьте про ➡️ регистрацию
Приходите, жду вас!
Новое интервью: Андрей Кузнецов, директор лаборатории FusionBrain в AIRI, один из создателей Kandinsky, кандидат технических наук. Смотрите на YouTube и на VK (76 минут). Помимо разговора об ИИ, обсудили самое главное: куда пойти молодому исследователю и как попасть в команду AIRI. Подписывайтесь на канал Андрея (@complete_ai) и на канал AIRI (@airi_research_institute). #наши
Читать полностью…Фанаты Вайбера, добро пожаловать в телеграм😅
Да здравствуют гифки со стразами и букетами красных роз🙈
Сейчас на AIJ выступает мой коллега — Александр Панов, рассказывает об актуальных задачах в робототехнике
Самый крутой кейс для фундаментальных моделей — применение в реальных задачах реальной жизни. У меня в лаборатории есть отдельная команда, занимающаяся развитием мультимодальных моделей для планирования и манипуляции в робототехнике — FusionBrain.Robotics. С командой Александра мы тесно сотрудничаем в исследовательских задачах по поиску новых архитектур и решений для развития технологий роботов общего назначения.
⚡⚡⚡Прекрасная новость!
Наша статья про open source фреймворк LLM-Microscope и методы оценки языковых моделей на предмет измерения контекстуальности токенов, нелинейности, logit lens и прочего снова борется за первое место на Hugging Face за звание Paper of the day🏆
Поддержите upvote'ами🙏
Мы пока на втором месте, но верю, что можем на первом оказаться)
Cтатья принята на большую международную конференцию Core A — NAACL 2025
Отдать голос за статью можно тут👇
https://huggingface.co/papers/2502.15007
Что не так с LLM?
🔵Модели игнорируют команды
🔵Даже лучшие LLM фантазируют
🔵RAG не работает с первого раза
🔵API дороже, чем кажется
🔵Инференс без оптимизации — дорогое удовольствие
На лекции 20 февраля в 18:00 на лекции DeepSchool спикеры разберут эти и другие проблемы LLM, и покажут, как их решать на примере реальной задачи ✔️
Спикеры:
🙂 Илья Димов — Senior NLP-инженер
🙂 Тимур Фатыхов — основатель DeepSchool, ex Lead CV Engineer, KoronaPay
Регистрируйтесь на лекцию и получите список полезных инструментов и библиотек для работы с LLM, а также скидки на обучение.
Поделитесь в комментариях мнением: какая главная проблема LLM сегодня?
Дорогие читатели, друзья, коллеги, поздравляю всех с Днём российской науки🔬
Желаю выдающихся открытий, передовых результатов, никогда не сдаваться в процессе исследований и побольше мечтать! Наука - это не только про формулы и законы, но и про удачу, чутьё и целеустремлённость! «Per aspera ad astra» (Через тернии к звёздам) (это всё, что я знаю на латыни — мама в детстве как-то сказала, я запомнил и регулярно вспоминаю это выражение)
У науки нет границ и пусть так остаётся всегда!
Вот, как работают современные алгоритмы на примере Ведра:
1) Samsung Galaxy S22+
2) iPhone 15 Pro Max
3) iPhone 13 mini
4) iPhone 16 Pro
Ссылка на ведро:
https://market.yandex.ru/cc/VX3y9Pk
На самом деле, это конечно же фейковая новость, которая довольно быстро распространилась за последние дни и дошла даже до федеральных телеканалов.
Какой можно сделать вывод: какой бы источник информации вы не читали/смотрели/слушали, всегда надо сохранять место здоровой критике и уделить 1-2 минуты факт-чекингу или проверке достоверности сообщения. Как правило, большинство таких «громких» или кликбейтных заголовков раскручивается на раз-два🧐
Будьте бдительны и проверяйте всё, что читаете)
ICT.Moscow собрал 80 крутых инструментов для разработчиков ИИ 🔥
Все они в открытом доступе и подходят для решения абсолютно разных задач. В подборку вошли библиотеки, фреймворки, датасеты, архитектуры и многое другое.
В подборке также есть решение от нашей лаборатории — фреймворк LLM Microscope для визуализации и анализа характеристик языковых моделей. Он позволяет исследовать свойства трансформерных архитектур. Статья о LLM Microscope была недавно принята на международную конференцию NAACL 2025.
Полную версию подборки ICT.Moscow можно посмотреть тут 🔜 ссылка
Также есть удобная инфографика для быстрого поиска нужных решений в PDF.
А вот скажите, есть ли среди вас кто-то, кто рубит в low-level-ML? Руками под CUDA писать, оптимизировать потоки данных, кэши, вот это всё? Если да, то черкните мне в личку (@oulenspiegel), возможно у меня для вас будет прямо хорошее предложение
Читать полностью…ChatGPT меня загазлайтила
Как вы уже видели, у OpenAI появилась возможность отложенных задач. Я решил проверить лимиты дозволенного и попросил ChatGPT уйти играть в шахматы с самим собой, делая только случайные ходы, и не возвращаться с ответом, пока не доиграет. Ну, она и ушла играть в шахматы на... ДВА ДНЯ! При этом я регулярно спрашивал, как там дела, и получал ответ: «Партия ещё идёт». Терпение у меня лопнуло. Я стал в каждом сообщении спрашивать, сколько сейчас фигур осталось в игре, и, о чудо, с каждым моим вопросом их становилось чуть-чуть меньше. За одну минуту игра закончилась. Я получил набор ходов и отрисовал их в артефактах Claude (см. видео).
Какая мораль? Ассистент прокрастинировал два дня и ничего не делал, пока я не заставил показывать промежуточный результат. "Джун" level of AGI has been achieved internally.
Ссылка на диалог
Математические этюды @EtudesRu рассчитали особенность числа 2025🎉
Подробнее тут
С Новым годом🎄
Интерактивная сегментация, то есть автоматическое определение границ объектов на изображении, нужна и в медицине, и в индустрии развлечений. Для корректной оценки метода интерактивной сегментации разработчикам нужно собирать информацию о взаимодействии реальных людей с ним в процессе разметки изображений.
Исследователи AIRI объединили несколько классических датасетов для оценки этих методов и собрали для них в общей сложности 475 000 пользовательских кликов и тапов через специальный веб-интерфейс. Датасет получил название RClicks и был использован, чтобы протестировать популярные сегодня методы интерактивной сегментации. Статья с результатами этой работы была представлена на NeurIPS 2024.
📎Инженер–исследователь группы «ИИ для роботов» лаборатории FusionBrain AIRI Антон Антонов поделился подробностями исследования на Хабре.
⚡️⚡️⚡️Несколько часов назад Qwen анонсировали QvQ-72B-Preview — первую open source мультимодальную модель с ризонингом (умеет итеративно «размышлять/рассуждать» и двигаться в сторону правильного ответа)
Сами авторы говорят, что модель в стадии preview и может «тупить», но так или иначе метрики очень крутые. Ключевые проблемы:
📍Модель может миксовать языки при ответах
📍Модель может зацикливаться в рассуждениях, не приближаясь к правильному выводу
📍Требуется дополнительный уровень безопасности и “любимого” alignment
📍В ходе рассуждений модель может утратить внимание на входную картинку и начать галлюцинировать
Ещё детали и примеры в блоге👇
https://qwenlm.github.io/blog/qvq-72b-preview/
P.S. Так или иначе — we made a new step to AGI💪
@complete_ai
Международный научный комитет собирает предложения по задачам для IOAI 2025 (международная олимпиада школьников по искусственному интеллекту)
Приглашаю вас, подписчики, составить техническое задание для учеников старших классов. Задание должно быть оригинальным, не слишком лёгким (без универсальных методов решения) и быстрым! В процессе работы ученики должны приобрести новые, полезные навыки. Ваша задача — вдохновить молодое поколение учиться 🙂
Лучших авторов пригласят на олимпиаду в Китай в 2025 году!
📌 Дедлайн: 31 января 2025.
Больше информации от организаторов ➡️ тут
Ваша задача может стать частью истории и мотивировать будущих AI-исследователей!
А теперь подробнее о новинках от команды GigaTeam. Помимо выхода в Open Source GigaChat Lite, разработчики также поделились моделями GigaEmbeddings и GigaAMv2.
Решил выделить ключевые моменты:
🔹 GigaChat Lite — первая по-настоящему российская open-source модель. Это не просто локализованное решение: в отличие от «натюненных» моделей из других стран. Она надежна, стабильна и не зависит от внешних ограничений. Компактная и при этом невероятно эффективная, GigaChat Lite обеспечивает тот самый баланс между производительностью и затратами по времени. Иными словами — одно из лучших решений для тех, кто ценит скорость и точность.
🔹 GigaEmbeddings — модель эмбеддингов для RAG, классификации и других задач. По производительности она заметно превосходит аналоги, такие как E5. На тестах RAG демонстрирует прирост до 15% в абсолютном качестве.
🔹 GigaAMv2 — новая версия модели распознавания речи, признанная лучшей в России. Эта технология представляет собой революцию в работе с аудиоданными, обеспечивая высочайшую точность. Кроме того, поддерживается дообучение и использование современных видеокарт, что значительно ускоряет обработку запросов.
Потрогать каждую из них можно по ссылке. 😉
@complete_ai
Конференция AI Journey 2024 завершилась😁
Записи докладов исследователей AIRI уже можно посмотреть по ссылке.
До встречи в следующем году! #AIRIзация
Один из мастодонтов искусственного интеллекта, Александр Николаевич Горбань, сейчас выступает на AIJ
Рекомендую послушать классика💪