Открыта регистрация на Летнюю школу машинного обучения Сколтеха.
SMILES-2024 — 12-дневный интенсивный курс для молодых специалистов, посвящённый современным статистическим методам машинного обучения. Темы этого года: большие языковые модели, мультимодальные подходы, мультиагентные системы, генеративные подходы, методы самообучения.
К участию приглашаются бакалавры, магистры и аспиранты вузов России, активно вовлечённые в сферу машинного обучения и планирующие связать свою карьеру с ИИ.
Школа пройдёт с 1 по 13 августа на исторической площадке Царского села (г. Пушкин) и онлайн. Участие бесплатное, но на основе конкурсного отбора. Подробности и подача заявки — здесь.
⚡️ Layer-Condensed KV Cache
Многослойный кэш-память KV для эффективного инференса больших языковых моделей.
Обеспечивает в 26 раз более высокую пропускную способность (throughput) по сравнению со стандартными трансформерами и помогает увеличить производительность больших языковых моделей.
pip install xformers --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt
У команды AI-центра Тинькофф есть канал «Желтый AI». Там ребята делятся своими исследованиями, обсуждают тренды в индустрии, зовут на свои митапы и делятся выпусками подкаста «Желтый Club Talks» (про индустрию и исследования. Кастомные мемы и инсайды из поездок на топовые конференции типа NeurIPS точно заслуживают отдельной строчки!
Подписывайтесь💛
erid:2Vtzqw29DT8
Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673
🌟 Verba — open-source приложение для обеспечения сквозного, оптимизированного и удобного интерфейса для Retrieval-Augmented Generation
— pip install goldenverba
Verba — это полностью настраиваемый AI-помощник для запросов и взаимодействия с вашими данными, как локальными, так и развернутыми в облаке.
Отвечает на вопросы, связанные с вашими документами, получает информацию из существующих баз знаний. Verba сочетает в себе современные технологии RAG и контекстно-зависимую базу данных Weaviate. Выбирайте между различными фреймворками RAG, типами данных, методами разбивки и поиска и поставщиками LLM в зависимости от конкретного случая использования.
Позволяет использовать разные LLM: как от HuggingFace и Ollama, так и от OpenAI, Cohere и Google.
🖥 GitHub
@ai_machinelearning_big_data
⚡️ Moondream WebGPU — небольшая VLM, поддерживающая обработку изображений, работает локально в браузере
Moondream WebGPU — это VLM (Vision-Language Model) с 1.86 миллиардами параметров.
После загрузки модель (1.8 ГБ) будет кэширована и повторно использована при повторном посещении страницы.
Все выполняется непосредственно в браузере с помощью Transformers.js и ONNX Runtime Web, то есть ваши разговоры не отправляются на сервер.
🤗 Hugging Face
@ai_machinelearning_big_data
🧠 Awesome AGI Survey
Как Далеко Мы Находимся От AGI?
AGI (artificial general intelligence) – это область теоретических исследований искусственного интеллекта, которая стремится создать программное обеспечение с интеллектом, подобным человеческому, и способностью к самообучению.
AGI, отличается способностью выполнять разнообразные задачи в реальном мире с эффективностью, сравнимой с человеческим интеллектом, отражает важнейшую веху в развитии искусственного интеллекта.
Здесь представлен большой структурированный список обязательных к прочтению статей по AGI, на которые стоит обратить внимание.
▪Github
@ai_machinelearning_big_data
⚡️ Как эффективно использовать явный и неявный фидбек в рекомендательных системах?
Расскажет опытный эксперт на открытом практическом уроке от OTUS, где вы:
— познакомитесь с двумя типами фидбека от пользователя: явным и неявным;
— обучите рекомендательные модели на разных типах фидбека;
— сравните их качество.
📌 Вебинар будет полезен дата-сайентистам и ML-спецам, которые хотят расширить область знаний и технологический стек.
Встречаемся 23 мая в 20:00 мск в преддверии старта курса «Machine Learning. Professional». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджера OTUS!
💣 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок: https://otus.pw/gF2g/
😐 Toon3D: Seeing Cartoons from a New Perspective
Новый инструмент для реконструкции сцен из мультфильмов и аниме.
Toon 3D может восстанавливать ракурсы камеры и плотную геометрию помещений.
Такие методы, как COLMAP, не могут реконструировать негеометрические изображения, нарисованные от руки, но Toon 3D справляется с этой задачей. Вы только посмотрите на примеры выше!
▪Github: https://github.com/ethanweber/toon3d
▪Paper: https://arxiv.org/abs/2405.10320
Dem
▪Proj: https://toon3d.studio
@ai_machinelearning_big_data
⚡️ Grounding DINO 1.5: Most Capable Open-World Object Detection Model Series.
DINO 1.5: самая мощная серия моделей IDEA Research для обнаружения объектов.
Это наиболее эффективный опенсорс инструмент для запуска на edge девайсах, с хорошей оптимизацией и высокой скоростью работы.
Исходный код выпущен в версии Apache 2.0. 💙
▪Github
▪Paper
▪Demo
@ai_machinelearning_big_data
🖥 Так можно использовать API GPT-4o vision в Jupyter Notebook
Удобство Python и мощь GPT-4o.
GPT-4o распознаёт вводимые жесты и подбирает максимально подходящие по виду графики кривых и генерирует код.
Распознаются даже довольно сложные композиции из разных линий и текста.
▪Github
@ai_machinelearning_big_data
Ищем дата-сайентистов, которые буду создавать и улучшать ML-модели для банковских и небанковских сервисов.
Обещаем свободу в своей зоне ответственности и сильное комьюнити, в котором можно учиться. Никто не будет навязывать свои методы, трекать время и контролировать каждое действие.
Читай подробнее на сайте и оставляй резюме к вакансиям:
Data Scientist
ML-разработчик
ML-разработчик (LLM)
⚡ Zeus Новый инструмент экосистемы Pytorch
Глубокое обучение потребляет довольно много энергии.
Например, обучение одного 200B LLM на инстансах AWS p4d потребляет около 11,9 ГВт-ч (источник: CIDR 2024 keynote), это же количество энергии позволяет в одиночку обеспечивать энергией более тысячи домохозяйств в среднем по США в течение года.
📌 Zeus - это инструмент с открытым исходным кодом от Pytorch, для измерения и оптимизации энергопотребления рабочих нагрузок при обучении моделей.
- Cредства измерения энергопотребления графического процессора
- Несколько инструментов оптимизации энергопотребления, которые позволяют найти наилучшие конфигурации ML и/или GPU
Zeus может принести пользу тем, кто хотел бы:
- измерить и оптимизировать затраты на электроэнергию
- снизить тепловыделение GPU (за счет снижения энергопотребления)
▪Github
▪Подробнее
▪Docs
@ai_machinelearning_big_data
Community Day на I’ML 2024: часть докладов доступна бесплатно 🔥
Онлайн-конференция по ML в продакшене I’ML 2024 впервые пройдет 21–22 мая онлайн. На ней будет Community Day — то есть бесплатный доступ к части докладов. Это хороший способ бесплатно поучаствовать в новой конференции, если не готовы купить билет.
В программу Community Day входит мастер-класс по построению RAG-приложения с использованием YaGPT, обсуждение перспектив LLM и 5 докладов. Все эти доклады и активности — для вас!
Общайтесь с коллегами во встроенном чате и переходите в дискуссии напрямую с сайта.
❗️Для участия в Community Day достаточно зарегистрироваться до 22 мая включительно.
А если хотите получить доступ ко всем докладам, используйте промокод MACHINELEARNING
. Он даст скидку на билет «Для частных лиц».
Реклама. ООО «Джуг Ру Груп». ИНН 7801341446
Хотите попробовать себя в роли аналитика и попрактиковаться на реальных задачах?
Приходите на бесплатный курс-симулятор Нетологии и Yandex Cloud «Основы анализа данных в SQL, Python, Power BI, DataLens».
В этой профессии много разных направлений — аналитик данных, BI-аналитик, продуктовый аналитик, Data Scientist. Но везде пригодится навык работы с инструментами-помощниками, которые вы и освоите на курсе.
Эксперты-практики расскажут, как делать простые отчёты, исследовать данные и строить интерактивные дашборды. А чтобы понять, что анализ данных — это точно ваше, вместе решите практические задачи из реальных кейсов.
Воспользуйтесь шансом попробовать новые инструменты и запишитесь на бесплатный курс Нетологии.
Регистрация: https://netolo.gy/c9KK
Реклама. ООО "Нетология" LatgBakJq
🪄 И снова Google, они только что анонсировали Illuminate → https://illuminate.withgoogle.com
Illuminate использует ИИ для переосмысления процесса обучения, превращая сложные исследовательские работы в увлекательные беседы.
Обсуждения создаются с помощью искусственного интеллекта и основаны на загруженных научных статьях.
Illuminate - это экспериментальная технология, которая использует ИИ для адаптации контента к вашим предпочтениям в обучении.
📌 Бегом записываться в лист ожидания, тут же можно послушать примеры: https://illuminate.withgoogle.com/home
@ai_machinelearning_big_data
🦙 Llama3-from-scratch
Очень подробный гайд по созданию LLaMa-3 с нуля!
Крутой репозиторий, в котором реализована llama 3 с нуля - умножение матриц с помощью multiple heads, позиционное кодирование (способ кодирования позиции слова внутри эмбеддинга), реализация механизма внимания и все остальное, здесь тщательно описано и объяснено.
Отличный репо для обучения, 3 к звезд за сутки⭐️.
▪Github
@ai_machinelearning_big_data
⚡️ PHUDGE3: Phi-3 как масштабируемая система оценивания LLM
В этой свежей статье Arxiv представляется PHUDGE — тонко настроенная модель Phi3, которая достигла результатов SOTA в 4 задачах: Feedback Test, Feedback OOD, MT Human, Preference Test, превзойдя все существующие модели по задержке и пропускной способности.
PHUDGE демонстрирует очень сильную корреляцию не только с GPT4, но и с человеческими аннотаторами на непросмотренных данных, а также в задачах абсолютного и относительного оценивания.
В этой статье Arxiv не только рассмотривается вопрос использования небольших LM для экономичных систем производственного уровня, но и показывается, что причинно-следственное моделирование не только медленно по своей природе, но иногда может препятствовать обучаемости моделей и должно быть заменено на более простые задачи, когда это возможно, чтобы сделать систему в целом быстрее и лучше.
📎 Arxiv
@ai_machinelearning_big_data
⚡️ Farfalle — open-source поисковой AI-движок
Позволяет использовать локальные (llama3, gemma, mistral) или облачные (Groq/Llama3, OpenAI/gpt4-o) LLM.
🖥 GitHub
🟡 Запустить онлайн
@ai_machinelearning_big_data
Machinelearning
🚀 Регистрация на хакатон «Ясная Система: сделай сложное понятным» от МТС стартовала! У тебя будет неделя, чтобы попрактиковаться в машинном обучении и сделать финтех инклюзивнее.
Призовой фонд – 375 000 рублей. Оставляй заявку до 24 мая и участвуй в соревновании онлайн из любого города России: https://cnrlink.com/mtshacktomskaimlbigdata
🤖 Задача – создать сервис, который сможет перевести сложные банковские тексты из датасета в ясные формулировки, подходящие для людей с ментальными особенностями, пожилых людей и иностранцев, плохо владеющих русским языком.
Церемония открытия соревнования пройдет 25 мая на фестивале «Система Fest» в Томском государственном университете. Посетители смогут поучаствовать в насыщенной программе мероприятия.
Для онлайн-участников МТС проведет два митапа с экспертами. 2 июня авторы 10 лучших проектов выступят с питчингами на церемонии награждения победителей.
➡️ Регистрируйся прямо сейчас, чтобы ничего не пропустить: https://cnrlink.com/mtshacktomskaimlbigdata
Product Meetup: ML-продукты | 28 мая в 19:00 мск.
В программе 3 доклада с теорией и кейсами. Коллеги расскажут:
– как используют теорию игр и data science в монетизационных продуктах;
– про динамическое ценообразование: как решили проблему плохого качества вывоза;
– как разработать 25 скорингов и не утонуть в операционке.
Забирайте место в зале или получите ссылку на трансляцию.
🔥 Встречайте CAT3D от Google
CAT3D позволяет создавать что угодно в 3D с помощью диффузионных моделей.
Достижения в области 3D-реконструкции позволили осуществить высококачественную 3D-съемку, однако для создания 3D-сцены пользователю приходилось собирать от сотен до тысяч изображений.
Теперь процесс 3D-реконструкции сильно упрощается.
CAT3D использует под капотом воссоздание реального мира с помощью многоракурсной диффузионной модели.
CAT3D может создавать целые 3D-сцены всего за одну минуту и превосходит существующие методы создания 3D-сцен.
▶️ Страничка CAT3D
🟡 Arxiv
@ai_machinelearning_big_data
🌟 ChatGPT теперь поддерживает Google Drive и OneDrive
OpenAI расширила возможности анализа данных в ChatGPT с использованием Google Drive и OneDrive.
Теперь файлы в чат-бот можно будет загружать напрямую из Google Drive и Microsoft OneDrive.
ChatGPT получит доступ к сервисам Google, таким как таблицы, документы, презентации и платформам Microsoft, таким как Excel, Word и PowerPoint.
Кроме того, в чат-бот внедрят расширяемое представление для таблиц и диаграмм. Когда пользователи добавляют набор данных, ChatGPT создаст интерактивную таблицу, которую можно развернуть в полноэкранном режиме. Наконец, можно будет кликать на определённые области таблицы, чтобы задать дополнительные вопросы или выбрать подсказки.
Например, пользователи смогут попросить ChatGPT объединить несколько электронных таблиц, содержащих ежемесячные расходы, и создать сводную с классификацией по типам расходов. Чат-бот также предлагает настраиваемые и интерактивные диаграммы, включая гистограммы, линии, круговые и точечные диаграммы. Все их можно будет загружать для использования в презентациях или документах.
Улучшения будут доступны пользователям ChatGPT Plus, Team и Enterprise в ближайшие недели.
📎 Подробнее
@ai_machinelearning_big_data
💥 Последний шанс попасть на международный хакатон «Лидеры цифровой трансформации». Тебя ждет 25 задач и призовой фонд – 50 000 000 рублей!
👨💻👨💻Старт разработки уже 3 июня! Не жди дедлайна, регистрируйся прямо сейчас
ЛЦТ-2024 – это не просто хакатон, а событие масштаба мирового уровня:
🔴10.000+ участников со всех уголков страны и мира
🔴5 международных партнеров, готовых поддержать твои идеи
🔴крупнейший ИТ-фестиваль 28-29 июня в Москве
Вместе с представителями столичных департаментов постановщиками задач стали: Сбербанк, Банк России, Госкорпорация «Росатом», Федеральная служба по интеллектуальной собственности (Роспатент), «Северсталь», Газпромбанк.Тех, национальный видеохостинг RUTUBE, приложение вертикальных видео Yappy, компания «Самолет», многопрофильная технологическая группа «Рексофт», Холдинг Т1, Sitronics Group, DDX TECH, компания «Автономные технологии». От регионов – Правительство Камчатского края и Администрация Волгоградской области.
🔴Подавай заявку прямо сейчас! Ищи команду в чате лидеров!
Друзья, этой осенью состоится грандиозное событие: Ai Conf 2024 – первая прикладная конференция по Data Science.
Программа будет строиться вокруг областей применения машинного обучения, а к выступлению приглашены не только спикеры из отраслей IT, ECommerce, но и реальный сектор.
Основные темы конференции:
- звук, зрение, изображения
- обработка естественного языка
- рекомендательные системы и поиск
- умные механизмы
- оптимизация использования железа и др.
До 15 июня принимаются заявки на доклады. Есть чем поделиться - подайте заявку https://tglink.io/44b4f48d80c3.
А 23 мая в 18:00 приглашаем на встречу докладчиков с программным комитетом, где обсудим какие темы будут актуальны на AI Conf. Встреча онлайн, регистрируйтесь на сайте!
Подробности о конфeренции AiConf 👉 https://tglink.io/a0f5deaa8d02
🔥 Исследование «AlphaMath Almost Zero: process Supervision without process» — прорыв в области решения математических задач с помощью LLM
Недавние достижения в области LLM значительно расширили их способности к математическим рассуждениям. Однако эти модели все еще не справляются со сложными задачами, требующими множества шагов рассуждения, что часто приводит к логическим или числовым ошибкам.
В данном исследовании представляется инновационный подход, который устраняет необходимость в ручном аннотировании, при помощи фреймворка Monte Carlo Tree Search (MCTS) для автоматического контроля и оценки процесса.
В работе показано, что усовершенствование LLM с помощью MCTS значительно повышает эффективность модели при решении сложных математических задач.
В отличие от других методов, таких как Program-of-thought и Chain-of-thought, при использовании MCTS не требуется никаких готовых решений.
📎 Arxiv
🟡 Обсуждение в треде X
@ai_machinelearning_big_data
🌟 LibreChat — улучшенный свободный клон ChatGPT
LibreChat — open-source клон ChatGPT:
— предоставляет удобный API
— работает с Groq, GPT-4 Vision, Mistral, Bing, Anthropic, OpenRouter, Vertex AI, Gemini и другими моделями
— можно запустить полностью локально
Запуск локально:
git clone https://github.com/danny-avila/LibreChat.git
cd LibreChat
cp .env.example .env
docker compose up -d
Это круто!
ИИ-агент Google просматривает демонстрацию агентов Openai и комментирует ее 🤯
@ai_machinelearning_big_data
⚡️ Continue — open-source расширение для VS Code и продуктов JetBrains для удобного внедрения AI-чатботов в свои рабочие процессы
Continue помогает очень удобно организовать использование AI в таких рабочих задачах как:
— Объяснение отдельных мест кода
— Автодополнение, рефакторинг функций
— Получение ответов на вопросы о своей кодовой базе
— Быстрое использование документации (и просто отдельных файлов) в качестве контекста
— Быстрый запуск действий с помощью /
-команд
— Мгновенное объяснение ошибок прямо в терминале
Continue позволяет использовать подходящую LLM для работы, будь то открытый или закрытый исходный код, локальная или удаленная работа, использование чата или автозаполнения.
Можно очень гибко настроить расширение в соответствии с существующими рабочими процессами.
🖥 GitHub
🟡 Доки
@ai_machinelearning_big_data
⚡️ Lobe Chat — open-source фреймворк ChatGPT/LLM
Поддерживает синтез речи, разные режимы и расширяемую (вызов функций) систему плагинов.
Позволяет реализовать развертывание в один клик частного чат-приложения OpenAI ChatGPT/Claude/Gemini/Groq/Ollama.
🖥 GitHub
@ai_machinelearning_big_data
⭐️ PaliGemma by Google is out! A family of 116 new models.
Еще один ништячок от Google, - "PaliGemma"! 🚀
Семейство из 116 новых моделей, которые могут подписывать изображения, отвечать на вопросы, распознавать объекты, сегментировать изображения и многое другое!
PaliGemma (Github) - это семейство моделей визуализации с архитектурой, состоящей из SIGLIP-So 400m в качестве кодера изображений и Gemma-2B в качестве декодера текста.
SigLIP - это современная модель, которая может распознавать как изображения, так и текст. Как и CLIP, он состоит из кодера изображений и текста. Как и в случае с PALI-3, комбинированная модель Paligemma работает на основе графических и текстовых данных, а затем может быть легко адаптирована для последующих задач, таких как создание субтитров.
Gemma - это модель для генерации текста, предназначенная только для декодера. Сочетание графического кодера Siglip и линейного адаптера Gemma позволяет использовать Paligemma в качестве мощной модели визуализации.
▪Блог: https://hf.co/blog/paligemma
▪Модели: https://hf.co/collections/google/paligemma-release-6643a9ffbf57de2ae0448dda
▪Demo: https://hf.co/spaces/google/paligemma
@ai_machinelearning_big_data