Меня зовут Андрей Кузнецов Руковожу лабораторией FusionBrain в AIRI, один из создателей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML Tg: @kuznetsoff87
105!
Спасибо всем🙏
Это абсолютный рекорд наших публикаций среди комьюнити🔥
🏦На конференции действительно много активностей и конференция по масштабу можно считать одной из крупнейших в России. Среди привычных и уже знакомых «покатушек на великах», настольных игр мне понравился больше остальных новый стенд Сбера
В этом году команда HR бренда сделала интересный ход: вместо привычного мерча в виде маек, настолок и прочей символики ребята устроили благотворительный марафон — за выполнение заданий в ходе активностей на стенде участники будут зарабатывать виртуальные рубли
После конференции Сбер конвертирует виртуальные деньги в реальные, дополнит сумму и закупит на неё технику в Новосибирский лицей
🔥На мой взгляд, это реально крутой кейс, как можно сменить парадигму привычных подходов к привлечению новых сотрудников в сторону пользы для человека и общества
Your Transformer is Secretly Linear
Спешу познакомить вас с новой публикацией лаборатории FusionBrain про линейность большинства слоёв языковых моделей декодеров (принята на конференцию ACL 2024 - Main Track, Core A*). Наше исследование позволяет проанализировать внутренние представления языковых моделей, а также без потери качества избавиться от 10-15% слоёв.
Еще мы придумали новый механизм регуляризации, чтобы снизить пресловутую линейность и, тем самым, получить небольшой буст в качестве.
Ниже ссылочки на статью на архиве и код на гитхабе нашей прошлой статьи про анизотропию и внутреннюю размерность эмбеддингов (представляли на EACL 2024).
Статья уже на Hugging Face Daily Papers и уверенно занимает первое место, но мы будем очень рады вашим upvote голосам ⬆️
https://huggingface.co/papers/2405.12250
📕arXiv
👨💻GitHub
📖Хабр
@complete_ai
🎉Пришла радостная новость!
Статья на Хабре про Kandinsky 2.1 (линк) вошла в шортлист лучших статей 2023 года в номинации AI&ML. Среди 1022 заявок было выбрано около 300 работ. К 27 мая определятся сильнейшие!
С другими отобранными статьями можно ознакомиться тут
⛓️💥Часть 4 (самая хардкорная): Я случайно взломал Gemini 1.5 Pro от Google или к каким ужасным последствиям может привести гонка ИИ. (18+)
Я понял, что у Gemini 1.5 никаких барьеров просто нет и решил проверить те темы, которые должны быть абсолютно точно под запретом.
Но... посмотрите сами... У меня нет слов если честно. ☹️☹️☹️
А если про GPT-4o, то мой feedback такой:
- синтез речи впечатляет
- трансляция эмоций, стиля в голосе - эмпатия не за горами
- вопросы в пользователю и четкое следование инструкциям - поможет с уточнением задачи в случае неуверенности в ответах, снизятся галлюцинации
- генерация и компиляция кода очень быстрая 👍
- в части понимания картинок и видео примеры были достаточно примитивные, полноценное видео для их решения не требовалось
Ну и конечно, наконец Open AI может словом «Open» в названии пользоваться полноценно - GPT-4o теперь будет доступна всем бесплатно
Кто захочет послушать презентацию апдейтов, ссылку оставляю:
https://www.youtube.com/live/DQacCB9tDaw
Запускаем Большой Семинар AIRI — пространство для знакомства исследователей из разных областей и всех, кто интересуется наукой 💡
21 мая в 17:30 российский химик, академик РАН, заведующий лабораторией Института органической химии им. Н. Д. Зелинского РАН Валентин Анаников выступит с докладом «Искусственный интеллект в химии».
Модератор Большого Семинара AIRI — доктор физико-математических наук, профессор РАН, CEO Института AIRI, профессор Сколтеха Иван Оселедец.
Приглашаем вас разделить с нами запуск проекта, послушать лекцию и поучаствовать в дискуссии.
📌Регистрируйтесь по ссылке и делитесь постом с друзьями и коллегами!
📣 В прямом эфире подглядываем, как CTO проходят собеседования в крупные компании
👉 Mock interview — не новый в мире, но всё более популярный в России формат. Его суть в том, чтобы помочь соискателю подготовиться к настоящему испытанию на серьёзную должность.
На открытом собеседовании CTO с CEO вы узнаете, чего хотят СЕО от СТО, что на самом деле интересует бизнес, что важно CEO крупных компаний, какие вопросы он задаёт и на что делать ставки, чтобы занять позицию. У вас будет возможность получить много полезного в режиме онлайн, переложив этот тест на свой опыт и карьерные амбиции.
Встречаемся во вторник, 23 апреля, 19:00
В роли интервьюера — Дмитрий Григорьев, CEO Циан
В роли модератора — Екатерина Загумённова, Head of Executive Search Avito P&T
В роли кандидата — Дмитрий Кривицкий
👉 Теперь побольше о нашем «претенденте» на роль CTO
Дима Кривицкий — опытный технический директор, в разработке 20 лет, в управлении кросс-функциональными командами 10: реклама, финтех, IoT, облака. Software engineering manager в Google Cloud, СТО в Atol, Managing Director, Digital transformation в VTB — это некоторые из строчек его CV. С ним вы можете ознакомиться и целиком, открыв файл.
Увидимся в эфире канала 23 апреля в 19:00 по Москве. 🙌
#эфир
⚡️Вот и тех репорт по языковой модели Phi-3 пожаловал
На известном MMLU 7B версия уверенно обходит и Llama 3, и Gemma, и Mistral. Ждём доученной версии, разрывающей GPT-4😉
https://arxiv.org/abs/2404.14219
Сегодня выступаю и модерирую секцию про мультимодальный и генеративный ИИ на конференции по анализу данных и технологиям DataFusion (начало в 15.50 мск). Поговорим про современное состояние исследований в этих областях и интересные решения и технологии, которые нас ждут в недалёком будущем.
Мероприятие проходит оффлайн в Кластере Ломоносов на Раменском бульваре д.1, а также будет онлайн трансляция ( зарегистрироваться можно тут ).
🚀Мы с Kandinsky поздравляем всех с Днём Космонавтики!
Достигайте самых амбициозных высот!
За арты спасибо @kutsgelya
@complete_ai
⚡️Сегодня выпустили обновление нашей мультимодальной модели OmniFusion 1.1
Модель умеет понимать изображения, описывать сцены и отвечать на вопросы по картинкам. В основе open-source модели лежит языковая модель Mistral-7B.
В остальном было проделано большое число экспериментов,в числе которых:
- сравнили различные визуальные энкодеры
- научились смешивать несколько энкодеров для усиления визуального контекста
- проверили влияние механики нарезки картинки на фрагменты с последующим их энкодингом
В итоге побили 7B аналогичные решения на ряде бенчмарков, побили также 13B модели на некоторых бенчах. Исследования продолжаются, чтобы выбить однозначную SoTA на всех задачах и приблизиться к GPT4-Vision.
Сегодня выпустили technical report на arXiv, который попал в Daily Papers на Hugging Face и уже занимает там сейчас первое место🏆
📍Project page
📍Статья на Хабре
📍GitHub
Буду крайне признателен, если поддержите лайками, звёздами и upvote по ссылкам выше - всей команде будет супер приятно🙏
@complete_ai
Отметили 3 года Института!
Сегодня все сердца поста — команде AIRI ❤️
Как устроено пространство, в котором думают языковые модели?
Наша статья про анизотропию и внутреннюю размерность активаций трансформеров вышла в печать на EACL! В честь этого я подготовил небольшой хабр с её разбором.
Статья, хабр
🕯️Друзья, вчера случилась большая трагедия!
Нападение террористов на Крокус привело к большому числу жертв и пострадавших.
Сбер не остался в стороне и вместе с Российским красным крестом запустил благотворительный фонд. Прошу не оставаться в стороне, помощь каждого из вас безмерно важна🙏
➡️По ссылке сразу перейдёте в Сбербанк Онлайн и сможете внести пожертвование.
Берегите себя🙏
Статья по линейности эмбеддингов и новую механику регуляризации почти пробила 100 upvote на Hugging Face Daily Papers🔥
Линк
Всем привет!
Сегодня и завтра я на конференции CodeFest в Новосибирске, завтра поделюсь со слушателями в треке AI про способы расширения возможностей LLM в сторону понимания других типов данных, типа картинок, видео и др.
Конфа очень бодрая, организаторы молодцы, собрали крутых спикеров со всей России! Конечно, джетлаг с Мск в +4 часа не супер комфортно, но есть ребята, кто прилетел из -5))
Много стендов, активностей от разных компаний, подробнее расскажу про самые интересные сегодня и завтра👨💻
Всем привет!
Мы сейчас готовим статью по персонализированной генерации на международную конференцию NeurIPS 2024, и нам нужно провести human evaluation нашего метода. Так как дедлайн завтра, мы решили не заморачиваться и постараться быстро собрать нужный фидбэк в гуглдоке🤗
🙏Хочу попросить вас принять участие в исследовании и пройти небольшой опрос (до 14.00 мск 22.05). Он достаточно простой, нужно будет смотреть на картинки и выбирать у какого метода лучше получилось. В статье обязательно укажем, что помощь комьюнити бесценна🔥
Сам опрос большой, в нём 100 вопросов, но можно отвечать на часть вопросов. Если ответите хотя бы 10-20 вопросов, уже будет отлично🔥🔥🔥
Заранее благодарим за вклад в научный прогресс🙏
Ссылка на форму для сбора данных прилагается:
https://forms.gle/9geNyi45U1YeUpyMA
С большой верой в вас, априорной благодарностью и безмерным уважением🤗
За репост отдельные кармические плюсы🤝
Всем привет!
Я к вам с объявлением и приглашением на новую прикладную конференцию Ai Conf 26-27 сентября, которую мы собираем с коллегами из топ исследовательских и DS коллективов России.
На конференции хотим сделать обзор всего, что волнует исследователей в различных направлениях науки о данных — компьютерное зрение, синтез речи, языковые модели, мультимодальные решения и др.
Мы соберем максимум актуальной и супер свежей информации, чтобы побывав на конференции, каждый участник актуализировал свои знания, получил новые идеи для развития, узнал что-то новое.
Приглашаю всех заинтересованных принять участие в качестве спикеров и участников. Наш программный комитет обязательно выберет самые крутые темы🏆
Буду благодарен за репосты🤝
Регистрация на конференцию: https://cfp.aiconf.ru/
Больше деталей ещё в статье Олега Бунина на Хабре:
https://habr.com/ru/companies/oleg-bunin/articles/814539/
Крайне интересный лик обнаружил подписчик канала)
Удивительно, как такие вещи во время всеобщего помешательства на AI Alignment
/channel/agilabs
А пока все судорожно восхищаются апдейтами GPT-4o (кстати o - это Omni, значит наша модель OmniFusion в тренде:)), сегодня TII выпустили новую версию мультимодальной модели Falcon 2 (новость)
- Falcon 2 open source, мультиязычная мультимодальная LLM
- Falcon 2 11B превосходит Llama 3 8B и выбивает по качеству значения на уровне с моделью Google Gemma 7B
- В настоящее время авторы исследуют возможность еще большего улучшения качества с помощью Mixture of Experts
@complete_ai
Не прошло и дня, как MS выложили веса Phi-3 Mini.
Дали доступ к инструктивным версиям с контекстом 4k и 128k токенов, а также onnx и gguf адаптации модели
Мы забрали пощупать модель в возникающий уже зоопарк реализаций OmniFusion — расскажу по итогу, что получится
Дизайнеры vs AI. The winner is…
В этом году наш институт AIRI решил поддержать IV Конкурс-биеннале предметного дизайна «Придумано и сделано в России» впервые появилась номинация «AI‑технологии».
В рамках конкурса я буду выступать в роли куратора номинации «AI-технологии в дизайне», а мой коллега Денис @dendimitrov - членом экспертного жюри.
Эксперты оценят как дизайнеры «общаются»с генеративными моделями и насколько точно им удается воплотить задуманное. Это интересный опыт как для дизайнеров, креаторов, так и для экспертов, ведь надо быть непредвзятым между человеком и ИИ😉
Знаю, что среди моих подписчиков много промпт-инженеров, дизайнеров и представителей других творческих профессий - этот ивент для вас🖼️
🍿 Все подробности на официальном сайте конкурса. Подать заявку можно до 12 августа 2024 года. Участвуйте и побеждайте!
🔥LLaMa 3 - дождались: Новая SOTA в open-source!
Сегодня день больших релизов от Meta, в которых и я и моя команда принимала прямое участие.
Зарелизили в опенсорс LLaMa-3 8B и 70B:
🔳LLaMa-3 8B – лучшая в своем классе модель, и сопоставима с LLaMa-2 70B, хоть и в 10 раз меньше.
🔳LLaMa-3 70B – тоже самая мощная в режиме 70 млрд параметров, достигает 82 на MMLU бенчмарке (показывает уровень общих знаний в разных областях). Для сравнения, недавняя Mixtral 8x22B с 141B параметров достигает только MMLU 77.8. Ну, и ждем результатов на арене.
C новыми моделями можно початиться на meta.ai
Блог
Подробности
Скачать веса модели
@ai_newz
Международный онлайн саммит про разработку в сфере ИИ
Лучшие практики для разработчиков, ресерчеров, дата сайентистов, техлидов и фаундеров – от ведущих мировых экспертов из индустрии ИИ.
Выступят спикеры из:
— Microsoft (команда PromptFlow)
— D-ID
— Aisera
— Spectrm
— Lightricks
— Wrike
и других компаний-лидеров, которые прямо сейчас создают будущее искусственного интеллекта.
На саммите обсудят темы:
— How to build scalable GenAI Apps using prompts
— Data-driven approaches to personalizing AI Agents
— Crafting AI agents with a natural user interface
— Building robust & scalable AI-powered chatbots;
— The reality of being an AI Founder in 2024
— How Later Stage Companies Adopted AI
— Creating your own corporate-secured "ChatGPT" with almost zero specific knowledge
— Fine-tuning strategies for adapting pre-trained AI Agents to specific use cases,
и многое другое!
Конференция пройдет в ОНЛАЙН формате 16➖17 апреля на английском языке 🌎
Участникам будут доступны презентации, материалы воркшопов и записи, а также доступ в нетворкинг-чат.
Скидка 1️⃣0️⃣ % по промо-коду — FicQbaR
Регистрация через VPN
#реклама
Всем привет! Сегодня знакомим вас с первыми спикерами секции «Нейронные сети, искусственный интеллект»
⠀
1) Андрей Кузнецов (AIRI) «Как научить фундаментальные модели читать, видеть, слышать и анализировать всё одновременно»
⠀
Моделью, которая умеет общаться текстом, сейчас уже никого не удивишь. Андрей расскажет, из чего собрать модель, которая в дополнение к этому умеет смотреть картинки и слушать речь. Очередной шаг на пути к General AI!
⠀
2) Алексей Воропаев (SberAutoTech) «Архитектура беспилотного транспорта нового поколения»
⠀
Доклад позволит узнать, как NeRF нейросети позволяют организовать End2End обучение и тестирование современного беспилотного транспорта.
⠀
3) Евгений Кокуйкин (Raft) «Новые атаки на LLM и методы защиты для прикладных приложений»
⠀
Чем больше LLM проникает в нашу жизнь, тем острее встают вопросы безопасности. Вариативность атак меняется не просто быстро, а очень быстро. Из доклада вы получите полное представление о текущем состоянии атак на LLM и научитесь идентифицировать потенциальные уязвимости в своих приложениях.
⠀
Присоединяйтесь к нам 24 и 25 июня на Saint HighLoad++ 2024 🙌
⠀
✅Ознакомиться со всеми принятыми докладами и купить билет можно на сайте
Сегодня день рождения Kandinsky (самая популярная его версия вышла 4 апреля 2023 года, и с этого началась настоящая история линейки Kandinsky)🎉🎉🎉
И в этот день мы выпустили обновление модели Kandinsky 3.1, в котором:
📍добавили существенное увеличение скорости генерации за счёт дистилляции модели
📍затащили обратно режимы смешивания и вариации изображений вкупе с ControlNet
📍добавили возможность повышения разрешения генераций до 4K
Подробнее можно почитать на Хабре, ну а для всех мы покажем обновление на всех платформах чуть позже. Пишите вопросы в комментариях, буду рад ответить😉
С Днём Рождения, Kandinsky! С праздником всю нашу команду и всех почитателей творчества Generative AI🥂
🍰Ссылка на Хабр
@complete_ai
Сегодня вышла моя первая статья на Хабр про использование процессов в python!
⚙️Как работает multiprocessing в Python под капотом🔧
Многим разработчикам на python, в том числе DS/ML/DE специалистам, нужно ускорять обработку данных или распараллеливать CPU-bound вычисления. Потоки для этой задачи не подходят, так как в питоне есть GIL, поэтому часто используют процессы. Но чтобы мастерски овладеть каким-то инструментом, необходимо понимать как он устроен. Поэтому я подробно разобрал детали реализации пакета multiprocessing.
В статье вы узнаете:
- Как создаются процессы в ОС
- Как устроен внутри пакет multiprocessing
- Как работает пул процессов
P.S. Если получится дать обратную связь или поставить upvote на хабре - буду рад))
P.P.S. Перезалил пост, чтобы были доступны комментарии
Моё знакомство с South HUB началось в 2022 году, когда коллеги из Сбера предложили выступить на новой конференции для CTO и рассказать о генеративном ИИ. Без особых раздумий я согласился, потому что очень хотелось нести в мир то, чем занимается команда, какие исследования мы проводим и в чём видим прикладное значение этого направления. Именно тогда я считаю, что начал открывать перед Kandinsky двери и знакомить всех с нашей технологией синтез изображений по тексту.
Второй опыт участия в конференции был в 2023 году, где я с коллегой проводил воркшоп по тому, как понять и где найти место для генеративного ИИ в своей сфере работы. Интересный опыт, который позволил понять, что хочет бизнес, в какие направления смотрят коллеги и где генеративные мультимедийные данные могут однозначно быть полезными и усилить креатив в компаниях. На тот момент, кстати говоря, у нас уже было пару успешных коллабораций с Кофеманией, генерацией юбилейной монеты к году дракона, а за плечами было изрядное количество пиар проектов для решения задач визуалзиации в разных отраслях.
Почему же я так тепло отношусь к этой линейке конференций? Это действительно крутое место для знакомства со смежными отраслями в IT, огромный потенциал для нетворкинга, мегакрутые знакомства и в целом автоматическое попадание в топ комьюнити инженерно-технического мира в РФ. С 2022 года благодаря знакомствам на South HUB я тесно сотрудничаю с ребятами из Skillbox, Yandex, Geekbrains и др. компаний, мы устраиваем митапы, записываем подкасты, делимся идеями в части построения и развития RnD процессов - за всё это я благодарен организаторам этоу крутой тусовки.
А ещё там бомбические локации для проведения конфы на Красной Поляне, мероприятия для развития духа и тела (спорт турнир по стритболу - это пушка). В общем, что хочу сказать - желаю всем испытывать такие тёплые воспоминания со всех мероприятий, где принимаете участие, а если считаете, что в вашем личном рейтинге пьедестал уже занят каким-то ивентов, съездите на South HUB и первое место ему обеспечено)