⚡️Phi-3-medium-4k-instruct
Майкрософт выпустили новые модели Phi-3!
В том числе модели 7B и 14B.
Также добавлена мультимодальная модель phi!
- Phi-3-Vision: https://huggingface.co/microsoft/Phi-3-vision-128k-instruct
- Phi-3-Small:
~8k: https://huggingface.co/microsoft/Phi-3-small-8k-instruct
~128k: https://huggingface.co/microsoft/Phi-3-small-128k-instruct
- Phi-3-Medium:
~4k: https://huggingface.co/microsoft/Phi-3-medium-4k-instruct
~128k: https://huggingface.co/microsoft/Phi-3-medium-128k-instruct
@ai_machinelearning_big_data
🔥🚀 MoRA: High-Rank Updating for Parameter-Efficient Fine-Tuning
MoRA - новый метод использования высокоранговых обновлений весов для файнтюнига моделей при сохранении того же количества обучаемых параметров, как и при использовании матриц низкого ранга.
Превосходит LoRa в задачах с интенсивным использованием памяти, помимо этого, модель достигает сопоставимой производительности в других задачах. Подробности тут.
▪repo: https://github.com/kongds/MoRA
▪abs: https://arxiv.org/abs/2405.12130
@ai_machinelearning_big_data
Стать сотрудником Яндекса быстрее и проще, чем кажется. Участвуйте в днях быстрого найма: решите тестовое, пройдите несколько секций собеседования и получите офер за несколько дней.
Ближайшее Fast Track мероприятия:
• 8–9 июня — для дата-инженеров, офер за 2 дня в DWH команды Маркета.
Зарегистрироваться
🔥 GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting
Только что был выпущен код для генерации 3D объектов с помощью Гауссовских сплатов.
Новый фреймворк обеспечивает высокое качество генераций и рендеринга всего по четырем входными изображениями.
git clone https://github.com/GaussianObject/GaussianObject.git --recursive
🦙 Llama3-from-scratch
Очень подробный гайд по созданию LLaMa-3 с нуля!
Крутой репозиторий, в котором реализована llama 3 с нуля - умножение матриц с помощью multiple heads, позиционное кодирование (способ кодирования позиции слова внутри эмбеддинга), реализация механизма внимания и все остальное, здесь тщательно описано и объяснено.
Отличный репо для обучения, 3 к звезд за сутки⭐️.
▪Github
@ai_machinelearning_big_data
⚡️ PHUDGE3: Phi-3 как масштабируемая система оценивания LLM
В этой свежей статье Arxiv представляется PHUDGE — тонко настроенная модель Phi3, которая достигла результатов SOTA в 4 задачах: Feedback Test, Feedback OOD, MT Human, Preference Test, превзойдя все существующие модели по задержке и пропускной способности.
PHUDGE демонстрирует очень сильную корреляцию не только с GPT4, но и с человеческими аннотаторами на непросмотренных данных, а также в задачах абсолютного и относительного оценивания.
В этой статье Arxiv не только рассмотривается вопрос использования небольших LM для экономичных систем производственного уровня, но и показывается, что причинно-следственное моделирование не только медленно по своей природе, но иногда может препятствовать обучаемости моделей и должно быть заменено на более простые задачи, когда это возможно, чтобы сделать систему в целом быстрее и лучше.
📎 Arxiv
@ai_machinelearning_big_data
⚡️ Farfalle — open-source поисковой AI-движок
Позволяет использовать локальные (llama3, gemma, mistral) или облачные (Groq/Llama3, OpenAI/gpt4-o) LLM.
🖥 GitHub
🟡 Запустить онлайн
@ai_machinelearning_big_data
Machinelearning
🚀 Регистрация на хакатон «Ясная Система: сделай сложное понятным» от МТС стартовала! У тебя будет неделя, чтобы попрактиковаться в машинном обучении и сделать финтех инклюзивнее.
Призовой фонд – 375 000 рублей. Оставляй заявку до 24 мая и участвуй в соревновании онлайн из любого города России: https://cnrlink.com/mtshacktomskaimlbigdata
🤖 Задача – создать сервис, который сможет перевести сложные банковские тексты из датасета в ясные формулировки, подходящие для людей с ментальными особенностями, пожилых людей и иностранцев, плохо владеющих русским языком.
Церемония открытия соревнования пройдет 25 мая на фестивале «Система Fest» в Томском государственном университете. Посетители смогут поучаствовать в насыщенной программе мероприятия.
Для онлайн-участников МТС проведет два митапа с экспертами. 2 июня авторы 10 лучших проектов выступят с питчингами на церемонии награждения победителей.
➡️ Регистрируйся прямо сейчас, чтобы ничего не пропустить: https://cnrlink.com/mtshacktomskaimlbigdata
Product Meetup: ML-продукты | 28 мая в 19:00 мск.
В программе 3 доклада с теорией и кейсами. Коллеги расскажут:
– как используют теорию игр и data science в монетизационных продуктах;
– про динамическое ценообразование: как решили проблему плохого качества вывоза;
– как разработать 25 скорингов и не утонуть в операционке.
Забирайте место в зале или получите ссылку на трансляцию.
🔥 Встречайте CAT3D от Google
CAT3D позволяет создавать что угодно в 3D с помощью диффузионных моделей.
Достижения в области 3D-реконструкции позволили осуществить высококачественную 3D-съемку, однако для создания 3D-сцены пользователю приходилось собирать от сотен до тысяч изображений.
Теперь процесс 3D-реконструкции сильно упрощается.
CAT3D использует под капотом воссоздание реального мира с помощью многоракурсной диффузионной модели.
CAT3D может создавать целые 3D-сцены всего за одну минуту и превосходит существующие методы создания 3D-сцен.
▶️ Страничка CAT3D
🟡 Arxiv
@ai_machinelearning_big_data
🌟 ChatGPT теперь поддерживает Google Drive и OneDrive
OpenAI расширила возможности анализа данных в ChatGPT с использованием Google Drive и OneDrive.
Теперь файлы в чат-бот можно будет загружать напрямую из Google Drive и Microsoft OneDrive.
ChatGPT получит доступ к сервисам Google, таким как таблицы, документы, презентации и платформам Microsoft, таким как Excel, Word и PowerPoint.
Кроме того, в чат-бот внедрят расширяемое представление для таблиц и диаграмм. Когда пользователи добавляют набор данных, ChatGPT создаст интерактивную таблицу, которую можно развернуть в полноэкранном режиме. Наконец, можно будет кликать на определённые области таблицы, чтобы задать дополнительные вопросы или выбрать подсказки.
Например, пользователи смогут попросить ChatGPT объединить несколько электронных таблиц, содержащих ежемесячные расходы, и создать сводную с классификацией по типам расходов. Чат-бот также предлагает настраиваемые и интерактивные диаграммы, включая гистограммы, линии, круговые и точечные диаграммы. Все их можно будет загружать для использования в презентациях или документах.
Улучшения будут доступны пользователям ChatGPT Plus, Team и Enterprise в ближайшие недели.
📎 Подробнее
@ai_machinelearning_big_data
💥 Последний шанс попасть на международный хакатон «Лидеры цифровой трансформации». Тебя ждет 25 задач и призовой фонд – 50 000 000 рублей!
👨💻👨💻Старт разработки уже 3 июня! Не жди дедлайна, регистрируйся прямо сейчас
ЛЦТ-2024 – это не просто хакатон, а событие масштаба мирового уровня:
🔴10.000+ участников со всех уголков страны и мира
🔴5 международных партнеров, готовых поддержать твои идеи
🔴крупнейший ИТ-фестиваль 28-29 июня в Москве
Вместе с представителями столичных департаментов постановщиками задач стали: Сбербанк, Банк России, Госкорпорация «Росатом», Федеральная служба по интеллектуальной собственности (Роспатент), «Северсталь», Газпромбанк.Тех, национальный видеохостинг RUTUBE, приложение вертикальных видео Yappy, компания «Самолет», многопрофильная технологическая группа «Рексофт», Холдинг Т1, Sitronics Group, DDX TECH, компания «Автономные технологии». От регионов – Правительство Камчатского края и Администрация Волгоградской области.
🔴Подавай заявку прямо сейчас! Ищи команду в чате лидеров!
Друзья, этой осенью состоится грандиозное событие: Ai Conf 2024 – первая прикладная конференция по Data Science.
Программа будет строиться вокруг областей применения машинного обучения, а к выступлению приглашены не только спикеры из отраслей IT, ECommerce, но и реальный сектор.
Основные темы конференции:
- звук, зрение, изображения
- обработка естественного языка
- рекомендательные системы и поиск
- умные механизмы
- оптимизация использования железа и др.
До 15 июня принимаются заявки на доклады. Есть чем поделиться - подайте заявку https://tglink.io/44b4f48d80c3.
А 23 мая в 18:00 приглашаем на встречу докладчиков с программным комитетом, где обсудим какие темы будут актуальны на AI Conf. Встреча онлайн, регистрируйтесь на сайте!
Подробности о конфeренции AiConf 👉 https://tglink.io/a0f5deaa8d02
🔥 Исследование «AlphaMath Almost Zero: process Supervision without process» — прорыв в области решения математических задач с помощью LLM
Недавние достижения в области LLM значительно расширили их способности к математическим рассуждениям. Однако эти модели все еще не справляются со сложными задачами, требующими множества шагов рассуждения, что часто приводит к логическим или числовым ошибкам.
В данном исследовании представляется инновационный подход, который устраняет необходимость в ручном аннотировании, при помощи фреймворка Monte Carlo Tree Search (MCTS) для автоматического контроля и оценки процесса.
В работе показано, что усовершенствование LLM с помощью MCTS значительно повышает эффективность модели при решении сложных математических задач.
В отличие от других методов, таких как Program-of-thought и Chain-of-thought, при использовании MCTS не требуется никаких готовых решений.
📎 Arxiv
🟡 Обсуждение в треде X
@ai_machinelearning_big_data
🌟 LibreChat — улучшенный свободный клон ChatGPT
LibreChat — open-source клон ChatGPT:
— предоставляет удобный API
— работает с Groq, GPT-4 Vision, Mistral, Bing, Anthropic, OpenRouter, Vertex AI, Gemini и другими моделями
— можно запустить полностью локально
Запуск локально:
git clone https://github.com/danny-avila/LibreChat.git
cd LibreChat
cp .env.example .env
docker compose up -d
Блокчейн TON ищет талантливых разработчиков!
Стартует масштабный хакатон “The Open League Hackathon” с призовым пулом $2,000,000 от команды блокчейна TON.
В поддержку хакатона все Web3-энтузиасты приглашаются на трёхдневные оффлайн встречи для нетворкинга в 13 городах мира:
📍Прага, Берлин, Киев, Варшава, Тбилиси, Белград, Сеул, Тайбэй (Тайвань), Гуруграм (Индия), Гонг-Конг, Минск, Москва и Санкт-Петербург.
Первые встречи начнутся уже 24 мая. Ищи свой город и регистрируйся здесь 👈 тык
Что вас ждет:
— 3 дня нетворка, лекций, конкурсов и работы над собственными проектами с поддержкой представителей TON Foundation и команд экосистемы TON
— Призовые $5.000 для трех лучших проектов на каждом оффлайн ивенте + много мерча и других бонусов
Не упусти возможность представить свое приложение 900 миллионам активных пользователей Telegram вместе с TON.
Регистрируйся — https://society.ton.org/activities/open-league
⚡️ Devon — open-source AI-программист
— curl -sSL https://raw.githubusercontent.com/entropy-research/Devon/main/install.sh | bash
Devon — AI-помощник, которого можно использовать для парного программирования;
open-source аналог Devin.
Использует API Anthropic, или OpenAI, или Groq
🖥 GitHub
🟡 Пример использования
@ai_machinelearning_big_data
⚡️ SELF-DISCOVER — система для улучшения способности LLM рассуждать
Исследователи из Google DeepMind и Университета Южной Калифорнии представили революционный подход к повышению способности к рассуждению больших языковых моделей (LLM). Их новая система «SELF-DISCOVER», презентованная на этой неделе на arXiV и Hugging Face, обещает существенные улучшения в решении сложных задач рассуждениий, потенциально революционизируя производительность ведущих моделей, таких как GPT-4 от OpenAI и PaLM 2.
Система демонстрирует повышение производительности до 32% по сравнению с традиционными методами, такими как цепочка мыслей (CoT). Этот подход основан на том, что LLM самостоятельно раскрывают внутренние структуры рассуждений, присущие задачам, для решения сложных проблем, например таких, как критическое мышление или пошаговый анализ.
Имитируя человеческие стратегии решения проблем, эта система работает в два этапа. Первый этап включает в себя составление связной структуры рассуждений, свойственной задаче, с использованием набора атомарных модулей рассуждения и примеров задач. На втором этапе – во время декодирования, LLM следуют этой самообнаруженной структуре, чтобы прийти к окончательному решению.
В обширном тестировании различных задач на рассуждение, включая Big-Bench Hard, Thinking for Action и Math, предложенный подход неизменно превосходил традиционные методы. Примечательно, что с помощью GPT-4 он достиг точности 81%, 85% и 73% по трем задачам, превзойдя методы цепочки мыслей и планирования и решения.
@ai_machinelearning_big_data
Открыта регистрация на Летнюю школу машинного обучения Сколтеха.
SMILES-2024 — 12-дневный интенсивный курс для молодых специалистов, посвящённый современным статистическим методам машинного обучения. Темы этого года: большие языковые модели, мультимодальные подходы, мультиагентные системы, генеративные подходы, методы самообучения.
К участию приглашаются бакалавры, магистры и аспиранты вузов России, активно вовлечённые в сферу машинного обучения и планирующие связать свою карьеру с ИИ.
Школа пройдёт с 1 по 13 августа на исторической площадке Царского села (г. Пушкин) и онлайн. Участие бесплатное, но на основе конкурсного отбора. Подробности и подача заявки — здесь.
⚡️ Layer-Condensed KV Cache
Многослойный кэш-память KV для эффективного инференса больших языковых моделей.
Обеспечивает в 26 раз более высокую пропускную способность (throughput) по сравнению со стандартными трансформерами и помогает увеличить производительность больших языковых моделей.
pip install xformers --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt
У команды AI-центра Тинькофф есть канал «Желтый AI». Там ребята делятся своими исследованиями, обсуждают тренды в индустрии, зовут на свои митапы и делятся выпусками подкаста «Желтый Club Talks» (про индустрию и исследования. Кастомные мемы и инсайды из поездок на топовые конференции типа NeurIPS точно заслуживают отдельной строчки!
Подписывайтесь💛
erid:2Vtzqw29DT8
Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673
🌟 Verba — open-source приложение для обеспечения сквозного, оптимизированного и удобного интерфейса для Retrieval-Augmented Generation
— pip install goldenverba
Verba — это полностью настраиваемый AI-помощник для запросов и взаимодействия с вашими данными, как локальными, так и развернутыми в облаке.
Отвечает на вопросы, связанные с вашими документами, получает информацию из существующих баз знаний. Verba сочетает в себе современные технологии RAG и контекстно-зависимую базу данных Weaviate. Выбирайте между различными фреймворками RAG, типами данных, методами разбивки и поиска и поставщиками LLM в зависимости от конкретного случая использования.
Позволяет использовать разные LLM: как от HuggingFace и Ollama, так и от OpenAI, Cohere и Google.
🖥 GitHub
@ai_machinelearning_big_data
⚡️ Moondream WebGPU — небольшая VLM, поддерживающая обработку изображений, работает локально в браузере
Moondream WebGPU — это VLM (Vision-Language Model) с 1.86 миллиардами параметров.
После загрузки модель (1.8 ГБ) будет кэширована и повторно использована при повторном посещении страницы.
Все выполняется непосредственно в браузере с помощью Transformers.js и ONNX Runtime Web, то есть ваши разговоры не отправляются на сервер.
🤗 Hugging Face
@ai_machinelearning_big_data
🧠 Awesome AGI Survey
Как Далеко Мы Находимся От AGI?
AGI (artificial general intelligence) – это область теоретических исследований искусственного интеллекта, которая стремится создать программное обеспечение с интеллектом, подобным человеческому, и способностью к самообучению.
AGI, отличается способностью выполнять разнообразные задачи в реальном мире с эффективностью, сравнимой с человеческим интеллектом, отражает важнейшую веху в развитии искусственного интеллекта.
Здесь представлен большой структурированный список обязательных к прочтению статей по AGI, на которые стоит обратить внимание.
▪Github
@ai_machinelearning_big_data
⚡️ Как эффективно использовать явный и неявный фидбек в рекомендательных системах?
Расскажет опытный эксперт на открытом практическом уроке от OTUS, где вы:
— познакомитесь с двумя типами фидбека от пользователя: явным и неявным;
— обучите рекомендательные модели на разных типах фидбека;
— сравните их качество.
📌 Вебинар будет полезен дата-сайентистам и ML-спецам, которые хотят расширить область знаний и технологический стек.
Встречаемся 23 мая в 20:00 мск в преддверии старта курса «Machine Learning. Professional». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджера OTUS!
💣 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок: https://otus.pw/gF2g/
😐 Toon3D: Seeing Cartoons from a New Perspective
Новый инструмент для реконструкции сцен из мультфильмов и аниме.
Toon 3D может восстанавливать ракурсы камеры и плотную геометрию помещений.
Такие методы, как COLMAP, не могут реконструировать негеометрические изображения, нарисованные от руки, но Toon 3D справляется с этой задачей. Вы только посмотрите на примеры выше!
▪Github: https://github.com/ethanweber/toon3d
▪Paper: https://arxiv.org/abs/2405.10320
Dem
▪Proj: https://toon3d.studio
@ai_machinelearning_big_data
⚡️ Grounding DINO 1.5: Most Capable Open-World Object Detection Model Series.
DINO 1.5: самая мощная серия моделей IDEA Research для обнаружения объектов.
Это наиболее эффективный опенсорс инструмент для запуска на edge девайсах, с хорошей оптимизацией и высокой скоростью работы.
Исходный код выпущен в версии Apache 2.0. 💙
▪Github
▪Paper
▪Demo
@ai_machinelearning_big_data
🖥 Так можно использовать API GPT-4o vision в Jupyter Notebook
Удобство Python и мощь GPT-4o.
GPT-4o распознаёт вводимые жесты и подбирает максимально подходящие по виду графики кривых и генерирует код.
Распознаются даже довольно сложные композиции из разных линий и текста.
▪Github
@ai_machinelearning_big_data
Ищем дата-сайентистов, которые буду создавать и улучшать ML-модели для банковских и небанковских сервисов.
Обещаем свободу в своей зоне ответственности и сильное комьюнити, в котором можно учиться. Никто не будет навязывать свои методы, трекать время и контролировать каждое действие.
Читай подробнее на сайте и оставляй резюме к вакансиям:
Data Scientist
ML-разработчик
ML-разработчик (LLM)
⚡ Zeus Новый инструмент экосистемы Pytorch
Глубокое обучение потребляет довольно много энергии.
Например, обучение одного 200B LLM на инстансах AWS p4d потребляет около 11,9 ГВт-ч (источник: CIDR 2024 keynote), это же количество энергии позволяет в одиночку обеспечивать энергией более тысячи домохозяйств в среднем по США в течение года.
📌 Zeus - это инструмент с открытым исходным кодом от Pytorch, для измерения и оптимизации энергопотребления рабочих нагрузок при обучении моделей.
- Cредства измерения энергопотребления графического процессора
- Несколько инструментов оптимизации энергопотребления, которые позволяют найти наилучшие конфигурации ML и/или GPU
Zeus может принести пользу тем, кто хотел бы:
- измерить и оптимизировать затраты на электроэнергию
- снизить тепловыделение GPU (за счет снижения энергопотребления)
▪Github
▪Подробнее
▪Docs
@ai_machinelearning_big_data