complete_ai | Неотсортированное

Telegram-канал complete_ai - Complete AI

6842

Меня зовут Андрей Кузнецов Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML Tg: @kuznetsoff87 Linkedin: https://tinyurl.com/y96nmmdd

Подписаться на канал

Complete AI

⚡️6⃣🅾🅾4⃣
Благодарю всех подписчиков за доверие🙏

Читать полностью…

Complete AI

Уже завтра состоится финальная ИИшница этого года, где исследователи расскажут про свои статьи на NeurIPS 2024 🍳

На онлайн-митапе будут два моих сотрудника:

⚫️Инженер-исследователь Robotics Антон Антонов с RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation — методом интерактивной сегментации для реалистичной оценки скорости и робастности аннотирования. Метод основан на оригинальной модели кликабельности, которая генерирует реалистичные клики аннотаторов. Исследование показало, что не существует одновременно оптимального метода с точки зрения скорости и робастности разметки.

⚫️Младший научный сотрудник Controllable Generative AI Максим Николаев с HairFastGAN: Realistic and Robust Hair Transfer with a Fast Encoder-Based Approach — методе для редактирования причёсок на фотографиях. Метод основан на использовании пространства StyleGAN и набора предобученных энкодеров, что обеспечивает высокую скорость работы. HairFastGAN превосходит аналоги как по качеству переноса причёсок, так и по скорости исполнения, включая самые сложные случаи.

Подробнее об ИИшнице ➡️ тут.

Читать полностью…

Complete AI

Исследователи из лаборатории «Сильный ИИ в медицине» и лаборатории FusionBrain AIRI вошли в топ-5 соревнования MIDRC XAI Challenge 🔥

Этот конкурс был направлен на решение одной из ключевых задач в области анализа медицинских изображений: создание интерпретируемых и надежных моделей искусственного интеллекта. Задачей участников была разработка и обучение модели классификации фронтальных рентгенограмм грудной клетки на наличие затемнений в лёгких, связанных с любым типом пневмонии.

По итогам команда представила 3 варианта решения задачи и вышла в топ-5 лучших наряду с учёными из Университета Джона Хопкинса, Университета Берна, команды Женского госпиталя в Бирмингеме, а также исследователями из Стенфорда и Университета Тюбингена.

📎Подробнее об участии в конкурсе команда рассказала в свежей статье на нашем Хабре.

Читать полностью…

Complete AI

За миром технологий можно наблюдать через конкретных инфлюенсеров и фаундеров, как и в любой сфере 😑

У вас может быть сто тысяч подписок “новости AI обо всём и всех”, но из них лучше оставить 2-3 годных. Информация часто дублируется, плюс, если вы джун, то не будете понимать насколько та или иная модель “прорывная” под капотом, какое влияние она окажет на рынок, а также, что происходит в конкретных областях ИИ (от роботехники до маркетинга). Полезно сохранить несколько лидеров мнений, которые будут держать в курсе новых решений, расскажут об ошибках, предложат новые гипотезы.

Например, по тематике “ИИ в бизнесе” рекомендую забрать папку с 11 фаундерами👇
🔗 Папка

Возможно, вы уже с кем-то знакомы!

📝 Поделитесь в комментариях: за кем следите вы из наших или зарубежных фаундеров и учёных в сфере технологий?

Читать полностью…

Complete AI

Новый шаг для индустрии игр или способ синтеза данных для обучения больших моделей?

Что думаете?

Читать полностью…

Complete AI

⚡️Reducio! Microsoft в соавторстве с Гарри Поттером на днях выпустил статью про свой новый image-conditioned VAE для видео

За счёт кодирования латентов движения удалось побить по сжатию обычный 2D VAE в 64 раза без потери качества (TxHxW: 1x8x8 -> 4x32x32)

Основной блок энкодера - это пространственно-временной 3D-VAE. Ключевая идея Reducio в том, что кадр из середины кодируемой видео последовательности (T/2, где T - длина видео) используется на этапе декодера при пирамидальной развёртке видеолатента через слой cross-attention. Проще говоря, средний кадр «помогает» восстановлению видео из сжатого пространства признаков (content image prior).
Кстати, похожий эффект с дополнительным image prior помог нам выбить лучшее качество при разработке Kandinsky 2.1.

Скорость работы Reducio очень высокая в разрешении 1024x1024 — 16 кадров генерируются 15.5 секунд на A100. При этом на обучение генеративной модели DiT по заявлениям потрачено всего 3.2k A100 часов!

По качеству даже побили свеженький Cosmos-VAE от Nvidia недельной давности🔥

Статья
Код
Веса

Читать полностью…

Complete AI

Натальная карта появления AGI от лидеров мнений💪

Читать полностью…

Complete AI

❗Напоминаю про конкурс за лучший диалог в GigaChat Max 👆
Конкурс

Кидайте скриншоты диалогов из @gigachat_bot, голосуйте и завтра будем выбирать лучший по количеству 👍

Читать полностью…

Complete AI

⚡️Компания Sony не так часто выходит с какими-то громкими релизами. Но вот анонсировали 2 модели на NeurIPS 2024: GenWarp и PaGoDA

Первая про синтез 3D сцен по одной картинке (судя по качеству интересно проверить для задач робототехники и 3D моделирования)

Вторая про генерацию картинок в высоком разрешении на базе low-res предобученной модели (вычислительно эффективно — максимум 32 карты A100, рост разрешения с 32x32 до 512x512 почти без потери качества)

Детали тут👇
Ссылка

Читать полностью…

Complete AI

Генеративный искусственный интеллект должен быть применим к реальным задачам реального бизнеса. Места такого применения ИИ для бизнеса сейчас формируются зачастую на стороне крупных клиентов 👍 Как раз такими проектами занимается Андрей Богомолов, сооснователь GenAI Lab, и рассказывает про них на канале лаборатории. Ребята не собирают лучшие промпты для контент-плана, но зато объясняют методы оценки точности RAG и нюансы разворачивания open-source LLM в контуре.

Контент будет полезен разработчикам, продактам и всем, кто планирует или уже внедряет генеративный ИИ в свои процессы 🤔 Как раз завтра на вебинаре в 19:00 команда расскажет, как сделали ИИ-аватара на базе GPT в формате бота в ВК.

Подписывайтесь и приходите на вебинар!

Читать полностью…

Complete AI

Хочу пригласить вас на мероприятие Soft Weekend 23 ноября 🥂 организованное моим хорошим другом Андреем Смирновым из X5 Tech. Вся конференция посвящена софт-скиллам, чтобы как можно больше айтишников умели в коммуникации с коллегами и, конечно, с собой!

На конференции будут практические знания о личной эффективности, переговорах, работе с командой и личном бренде айтишника. 14+ спикеров, 8+ полезных часов и много знакомств.

Темы мероприятия:
😎 Харды на максимуме — что дальше?
🤬 Как перестать со всеми ругаться и начать договариваться?
🗺 Карты гипотез в управлении изменениями
И другие!

Приходите перезагрузиться, отрефлексировать этот год и наметить стратегию на следующий.

Приобрести билет со скидкой можно по моему промокоду COMPLETEAI

Читать полностью…

Complete AI

Как вам темы международного совещания по ИИ 1977 года в Ленинграде? Большая часть является актуальной в современных статьях по мультимодальным и генеративным моделям😅

По ссылке скан приглашения профессора Стэнфорда на мероприятие

Читать полностью…

Complete AI

Лекции «Лето с AIRI 2024» — в плейлисте в VK Видео 🔥

Выложили записи лекций и семинаров летней школы по искусственному интеллекту «Лето с AIRI» с ведущими исследователями научных организаций и технологических компаний.

📎Сохраняйте ссылку на плейлист

Читать полностью…

Complete AI

Как пандемия позитивно складывается на некоторых отраслях: с 2020 года 2й альбом уже🤘

11й альбом с приходом нового барабанщика прямо отличным получился!

Читать полностью…

Complete AI

Все мы немного физики💪

Читать полностью…

Complete AI

Сегодня закончили трехдневную научную отчетную сессию AIRI, на которой исследователи, от младших научных сотрудников до директоров лабораторий, поделились итогами работы за этот год и планами на следующий. За 3 дня мы прослушали 45 докладов и обсудили 159 постеров.

Всем участникам — большое спасибо за интересные выступления, активные обсуждения и вовлеченность! Вместе мы делаем науку сильнее.

Читать полностью…

Complete AI

☝️Метрики и детали в большом техническом отчете

В части картинок и видео список моделей в сравнении не очень большой (если для картинок ещё показали автоматические метрики TIFA и ImageReward, то для видео только HumanEval с Gen 3 Alpha и Luma 1.6)

Хочешь быть SoTA — начни с выбора удобной метрики😅

Читать полностью…

Complete AI

Помните, на прошлой неделе я говорил об анонсе новой модели от Amazon?

Релиз состоялся вчера в рамках конференции Amazon re Invent, где показали аж целое семейство фундаментальных моделей Nova:

📍Micro — маленькая языковая модель, быстрая и дешевая (контекст 128к токенов)
📍Lite, Pro — мультимодальные модели для понимания текста, изображений и видео (контекст 300к токенов)
📍Premier — мультимодальная модель с упором на способность к рассуждениям (только анонс, релиз в 2025 году)
📍Canvas — SoTA модель генерации изображений по тексту
📍Reel — SoTA модель генерации видео по тексту и стартовому кадру

В новости добавили примеров работы моделей ( даже есть сгенерированное видео рекламы пасты ). Деталей в целом пока немного, но я обязательно расскажу как только они появятся.

Доступ к моделям можно получить через фреймворк Amazon Bedrock, который посредством API является единой точкой входа в большой список существующих больших моделей (не только от Amazon).

⚡️Также анонсировали выпуск в середине 2025 года мультимодальной модели формата «any-to-any», которая сможет как понимать текст, картинки, аудио и видео, так и генерировать эти типы данных. Неужели 2025й будет новым витком популярности end-to-end декодеров?🤔

🔥По ссылке ещё больше сгенерированных с помощью Reel видео

UPD:
сравнение с другими моделями в комментариях👇

@complete_ai

Читать полностью…

Complete AI

⚡️Похоже на следующей неделе нас ждёт анонс новой модели от бигтех компании🧐

Amazon готовится показать на следующей неделе на ежегодной конференции свою мультимодальную LLM с упором на понимание видео (например, найти нужный момент на видео по описанию) — Olympus.

Пишут, что там якобы 2T параметров (кстати, размер они анонсировали больше года назад, а как будет сегодня — узнаем)! Как когда-то WuDao 2.0 был лидером гонки параметров (говорили про 1.75Т)

Т - триллион😊

Читать полностью…

Complete AI

⚡️Вот и релиз новой языковой модели OLMo2 от Allen Institute подоспел

Просто взгляните на метрики💪
https://allenai.org/blog/olmo2

@complete_ai

Читать полностью…

Complete AI

Выступал сегодня на фесте «Формула будущего» в Иннополисе. Разгоняли со студентами тему карьеры в науке: с чего начать, как выглядит карьерный трек, как построена работа у меня в лабе в AIRI, какие направления занимают пальму «популярности» сейчас в исследованиях, а также о симбиозе науки и бизнеса в современных реалиях.

Интересный опыт для меня — отличается от привычных tech talk выступлений на конференциях. Тем не менее получилось довольно интересно, искали ответы на непростые вопросы (и это не про цену контрактов) — тимлид экспертизой оказалось тоже приятно делиться💪

Встретились и пообщались на фесте с Егором Бугаенко (автор канала @yegor256news) и Валей Малых (автор канала @valuableai) — они тоже выступали с докладами, обсудил с ними карьерные пути студентов в исследованиях и разработке, кадровый голод в некоторых направлениях и ещё много всего. Кажется, вопросов хватит не на один подкаст😉

Читать полностью…

Complete AI

⚡️Nvidia выкатила веса и демку text2image модели Sana

Демо
Код
Статья

Читать полностью…

Complete AI

AIRI и МТУСИ анонсировали хакатон SafeSpeak 2024, посвящённый борьбе с голосовыми дипфейками, и нацеленный на решение актуальных проблем безопасной голосовой аутентификации, а также защиту биометрических систем от атак.

Зарегистрироваться можно уже сейчас по ссылке. Регистрация будет открыта до 26 ноября, старт самого хакатона — 22 ноября.

Читать полностью…

Complete AI

⚡️GigaChat стал гигачадовее 😎

Теперь он лучше понимает запросы, быстрее отвечает, запоминает длинные диалоги, распознаёт изображения, а ещё стал прокаченнее в науках.

Так как моя команда принимает участие в разработке модели, мне интересно, чтобы вы потестили GigaChat Max и поделились своими диалогами в комментариях!

🏆
Конкурс
Самый оригинальный, интересный и получивший наибольшее количество 👍 диалог получит
SberBoom Mini 🔥

Делитесь конкурсом, пробуйте самые разные промпты и в пятницу 22 ноября в 23:59 я подведу итоги и выберу победителя 💪

Кидайте тесты-скриншоты в комментарии (должно быть видно, что это диалог именно с GigaChat)👇

Читать полностью…

Complete AI

На днях вышла интересная работа про учёт физики в генеративных text-to-video моделях и вообще возможности называть такие модели «моделями мира». Авторы показывают, что на исключительно на большом объёме наблюдений выучить закономерность модели не могут. Проверяют на законе сохранении энергии, законе инерции и 2м законе Ньютона в задачах на плоскости. Занимательные эксперименты и даже есть код для воспроизведения)

В целом, вопрос достаточно дискуссионный, и я планирую сделать мини обзор подходов к этой задаче в ближайшее время, потому что синтез видео в задачах аугментации или «расширения обзора» полезно и нужно в ряде направлений, особенно в робототехнике и беспилотном автотехе.

Читать полностью…

Complete AI

Приглашаю всех на второй Большой Семинар AIRI, который пройдет в нашем офисе в Сити. Спикером будет доктор юридических наук и профессор Александр Яковенко.

→ Подробности и регистрация: /channel/airi_research_institute/667

Читать полностью…

Complete AI

Круто, когда есть под рукой база знаний на случай непредвиденных рабочих ступоров 😔 Рассказываю вам про канал моих коллег из DeepSchool, который понадобится вам в повседневной ML-работе.

Ребята делают обзоры последних технологических статей, рассказывают, как решать различные DL-задачи, напоминают теорию, проводят видео мастер-классы и лекции с внешними специалистами индустрии. ТГ ведёт команда практикующих инженеров и исследователей, они шарят 💪

Канал можно использовать как шпаргалку в рабочих вопросах, поэтому подпишитесь, он вам пригодится 💯

Читать полностью…

Complete AI

Хочу поделиться IT-папкой с подборкой классных тг-каналов про технологии. Внутри вы найдёте каналы с релизами, аналитикой, инструментами и, конечно, мемами — всё необходимое, чтобы ориентироваться в современном мире.

Сохраните, чтобы быть в курсе всех новостей. Мой канал там тоже есть 👌

Читать полностью…

Complete AI

Всем привет!

Наверняка среди моих подписчиков есть те, кто интересуется робототехникой и применением ИИ для решения задач планирования и манипуляции. Хочу отдельно подсветить, что у нас сейчас в активной фазе соревнование AIJ Contest, где есть задача Embodied AI.

Там как раз есть 2 задачи в рамках трека. Подключайтесь, чтобы побороться за призовые места💪

-> Ссылка на описание соревнования👇
https://dsworks.ru/champ/aij2024-embodied-ai

-> Чтобы быстрее влететь в сореву, есть вебинар, который мы записывали пару недель назад
https://vk.com/video-22522055_456244521

Читать полностью…

Complete AI

Помимо ECCV’24 прошлая неделя запомнилась ещё двумя крайне знаменательными событиями:

✅ Один из ключевых исследователей в лаборатории FusionBrain, защитил PhD в Сколтехе. Руководителями работы выступили Александр Панченко и ваш покорный слуга

✅ У нас успешно приняли статью «Kandinsky 3: text-to-image synthesis for multifunctional generative framework» на демо трек Core A* конфы EMNLP’24, которая пройдет в середине ноября в Майями🎉

Читать полностью…
Подписаться на канал