📐 Sketch Video Synthesis
Новая модель для создания скетчей из видео, представленных покадровыми кривыми Безье.
🖥 Code: https://github.com/yudianzheng/sketchvideo
🦾 Project: https://sketchvideo.github.io/
📚 Paper: https://arxiv.org/abs/2311.15306v1
@ai_machinelearning_big_data
Бесплатный доступ к российской облачной платформе и скидка 30% на все сервисы в 2024 году
Провайдер облачных и AI-технологий Cloud․ru создает платформу Cloud․ru Evolution — публичное облако на базе собственных разработок и свободно распространяемых компонентов.
До конца 2023 года Cloud․ru предлагает интересные условия: 30 дней бесплатного доступа к виртуальным машинам и контейнерам и скидку 30% на все сервисы платформы в 2024 году.
Преимущества платформы Cloud․ru Evolution:
😶🌫️ импортонезависимость;
😶🌫️ инфраструктура в дата-центрах уровня Tier III и соответствие 152-ФЗ;
😶🌫️ передовые облачные сервисы без legacy-компонентов;
😶🌫️ оплата только использованных или выделенных ресурсов;
😶🌫️ детальная документация и простой интерфейс на русском языке.
➡️ Подробнее о платформе и специальных условиях на сайте компании: cloud.ru/evolution
⚠️Как специалисту по машинному обучению попасть в крупную компанию?
Освоить востребованный скилл на бесплатном открытом уроке «Ассоциативные правила в теории рекомендательных систем» от OTUS и Марии Тихоновой – Senior Data Scientist в «SberDevices» и преподавателя ВШЭ.
🔹На вебинаре вы изучите теорию ассоциативных правил и примените полученные знания на практике
🔹Узнаете, как искать ассоциативные правила в покупательских корзинах и сможете находить ассоциативные правила в рекомендательных системах инструментами Python.
Занятие пройдёт 4 декабря в 18:00 мск и будет приурочено к старту курса «Machine Learning. Professional».
👉 Регистрация
https://otus.pw/ZU6T/?erid=LjN8KZz76
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
♟ ChessVision - A dataset for logically coherent multi-label classification.
Набор данных с изображениями шахматных досок в различных позициях.
🖥 Github: https://github.com/wojciechkusa/systematic-review-datasets
📕 Paper: https://arxiv.org/pdf/2311.12474v1.pdf
✨ Tasks: https://paperswithcode.com/task/question-answering
🔥Datasets: https://paperswithcode.com/dataset/blurb
@ai_machinelearning_big_data
🎮 Language Models are Super Mario: Absorbing Abilities from Homologous Models as a Free Lunch
В данной работе показано, что языковые модели (ЯМ), могут приобретать новые возможности за счет ассимиляции параметров однотипных моделей без переобучения или использования графических процессоров.
🖥 Code: https://github.com/yule-BUAA/MergeLM
📚 Paper: https://arxiv.org/abs/2311.03099
🔗 Dataset: https://paperswithcode.com/task/instruction-following
@ai_machinelearning_big_data
🔥 Diffusion360: Seamless 360 Degree Panoramic Image Generation based on Diffusion Models.
Модель для формирования панорамных изображений 360
на основе стабильной диффузии.
🖥 Code: https://github.com/archerfmy/sd-t2i-360panoimage
📚 Paper: https://arxiv.org/abs/2311.13141v1
🔗 Dataset: https://paperswithcode.com/dataset/sun360
@ai_machinelearning_big_data
🗣 HierSpeech++: Bridging the Gap between Semantic and Acoustic Representation by Hierarchical Variational Inference for Zero-shot Speech Synthesis
Синтез речи на основе больших языковых моделей получил широкое распространение.
Однако такие модели требуют большого объема данных и обладают теми же недостатками, что и предыдущие авторегрессионные модели речи, включая низкую скорость вывода и плохое качетсво речи.
В данной работе прелставлен HierSpeech++
, быстрый и надежный синтезатор речи для преобразования текста в речь (TTS
) и голоса (VC
).
Данная модель синтеза речи позволяют значительно повысить надежность и выразительность синтетической речи.
Кроме того, значительно улучшено естественность и сходство с диктором синтетической речи даже в сценариях синтеза речи с нулевым результатом.
🖥 Code: https://github.com/sh-lee-prml/hierspeechpp
🦾 Checkpoint: https://drive.google.com/drive/folders/1-L_90BlCkbPyKWWHTUjt5Fsu3kz0du0w?usp=sharing
⚡️ Demo: https://sh-lee-prml.github.io/HierSpeechpp-demo/
📚 Paper: https://arxiv.org/abs/2311.12454v1
🔗 Dataset: https://paperswithcode.com/dataset/libri-light
@ai_machinelearning_big_data
Что происходит в образовании с приходом AI? Как найти работу в сфере IT и какие навыки для этого нужны? Можно ли их получить в университете?
Узнайте на четвёртой конференции Yet another Conference on Education от Яндекса. Посмотреть записи конференции и получить инсайды от экспертов из IT можно прямо сейчас.
Горячая ссылка с пылу с жару ждет тебя.
Где ML-специалисту попрактиковаться перед собеседованием или подглядеть лучшие практики решения своих задач?
На Симуляторе ML вы не просто прокачаете отдельные навыки, а поймёте, как сводить бизнес-задачи к задачам машинного обучения — всё как на настоящей работе.
Вы научитесь:
- Понимать, какие у бизнеса есть проблемы и какими метриками их можно измерить
- Проводить А/В-тесты, чтобы подтверждать прирост метрик
- Формулировать задачу для модели
- Выбирать подходящую модель и обучать её
- Организовывать процесс доставки данных для модели
- Оборачивать модель в сервис и деплоить его
После симулятора вы точно найдете применение знаниям в работе или сможете успешно пройти собеседование на позицию в сфере Machine Learning и приносить пользу бизнесу уже с первых дней.
До конца ноября в karpovꓸcourses действуют скидки до 27%, успейте купить подписку на Симулятор по самой выгодной цене!
[Начать учиться]
Хотите начать увлекательный путь в мир машинного обучения и искусственного интеллекта?
Газпромбанк.Тех совместно с Финтех Хабом Банка России запускает прием заявок на программу «Машинное обучение LITE: базовый уровень» — для тех, кто только начинает осваивать машинное обучение.
Что предстоит изучать?
Основы и методы ML, математику, Python и нейронные сети.
Программа состоит из двух модулей:
- Теоретический модуль пройдет с 21 января по 16 февраля 2024 года
- Практический модуль пройдет с 26 февраля по 10 марта 2024 года для тех, кто показал высокие результаты по итогу первого модуля
Чтобы стать участником, подайте заявку на сайте программы до 17 января 2024 года — https://vk.cc/csyWZU
Реклама Банк ГПБ (АО), ИНН: 7744001497
💸 На AI Journey авторы лучшей статьи про искусственный интеллект получили 1 млн рублей
Сбер наградил группу исследователей из Университета Иннополис и МФТИ в составе Михаила Рудакова, Александра Безносикова, Ярослава Холодова и Александра Гасникова — они получили 1 млн рублей за свою статью «Техники сжатия активаций слоёв и градиентов для распределённого обучения моделей искусственного интеллекта».
Её и еще 37 работ других претендентов опубликуют в научном сборнике международной конференции AI Journey — «Путешествие в мир искусственного интеллекта». Всего для участия в отборе прислали более 270 заявок.
«Лучшую статью члены экспертной комиссии отобрали в силу её высокой научной ценности, огромного фундаментального и прикладного значения. Я поздравляю победителей и надеюсь, что они продолжат свои исследования в этом важном направлении», — рассказал первый заместитель председателя правления Сбера Александр Ведяхин.
@ai_machinelearning_big_data
Trino: как перехать с Vertica, и как устроен его оптимизатор запросов?
Расскажут эксперты компаний Avito и CedrusData на онлайн-митапе при поддержке JUG Ru Group.
🗓 24 ноября в 18:00 (МСК, GMT+3)
В программе:
✔ Дмитрий Рейман — «Как пересесть на Trino после Vertica»
Реальный кейс Авито по переводу аналитической платформы с Vertica на Trino с сохранением UX конечных пользователей.
✔ Владимир Озеров — «Архитектура и проблемы оптимизатора Trino»
Посмотрим, какие особенности архитектуры позволяют Trino быть эффективным. Где он неэффективен и какие улучшения возможны.
➡️ Регистрация на Timepad.
Ссылку на трансляцию отправят вам за 1 час до начала митапа.
Реклама. ООО "КВЕРИФАЙ ЛАБС"
❗️ Какие инструменты нужны для эффективного машинного обучения?
👉 Узнайте на бесплатном открытом уроке «Bagging, Random Forest, стекинг - ансамбли моделей для решения ML-задач» от OTUS и Марии Тихоновой – Senior Data Scientist в «SberDevices» и преподавателя ВШЭ.
🔹 На вебинаре узнаете, как применять ансамбли моделей для решения задач ML и изучите основные подходы к ансамблированию моделей
🔹 Разберем методы ансамблирования Bagging, Random Forest и стекинг
Занятие пройдёт 23 ноября в 18:00 мск и будет приурочено к старту курса «Machine Learning. Professional»
📌 Результаты урока:
Вы освоите такие популярные методы как Bagging, Random Forest и Стекинг
👉 РЕГИСТРАЦИЯ
https://otus.pw/k65H/
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
🔥Открытая трансляция главного зала HighLoad++ 2023!
Самая крутая новость ноября: 27 и 28 ноября пройдет открытая трансляция Главного зала HighLoad++ 2023. Это стало возможным благодаря поддержке нашего генерального партнёра, компании Яндекс.
👉Просто зарегистрируйтесь и смотрите: https://clck.ru/36eNfo
В программе доклады лучших спикеров:
✅Павел Капля (Яндекс) - Алиса 6 лет спустя.
✅Александр Кирсанов (VK, ВКонтакте) - Математический хайлоад: большие, очень большие и немыслимо большие числа.
✅Евгений Россинский (ИВИ) - Как из Python и палок собрать детектор аномалий для highload.
Вы сможете не только посмотреть интересные доклады ТОПовых разработчиков, но и задать им вопросы. Полная программа трека здесь. Регистрируйтесь и присоединяйтесь к просмотру!
Реклама. ООО "КОНФЕРЕНЦИИ ОЛЕГА БУНИНА". ИНН 7733863233.
👩💻 Запустили Программу грантов Yandex Open Source. Каждый год будем вознаграждать независимых разработчиков, которые создают и поддерживают проекты с открытым исходным кодом.
🔗 Подавайте заявки уже сегодня, все подробности про программу — в карточках.
👀 А если хотите разобраться, в чём смысл проектов с отрытым исходным кодом, смотрите yet another podcast про опенсорс.
Подписывайтесь 👉 @yandex
🔵Differentiable and accelerated spherical transforms with JAX
Новые алгоритмы для ускоренного и дифференцируемого вычисления обобщенных преобразований Фурье на сфере и группы вращения т.е. сферических гармонических преобразований и преобразований Вигнера.
Новый гибридный подход к автоматическому и ручному дифференцированию, позволяющий эффективно вычислять градиенты.
Алгоритмы реализованы в рамках дифференцируемого программирования JAX
.
🖥 Code: https://github.com/astro-informatics/s2fft
🦾 Project: https://astro-informatics.github.io/s2fft/
📚 Paper: https://arxiv.org/abs/2311.14670v1
@ai_machinelearning_big_data
🦜🦴Skeleton-of-Thought (новый шаблон LangChain!)
⭐️Большие Языковые модели могут работать параллельно и быстро⭐️.
В недавней работе Университета Цингуа и Microsoft Research показано, как можно значительно уменьшить время генерации LLM.
Данная техника сначала направляет LLM на генерацию скелета answer
☠️, а затем выполняет параллельные вызовы API для параллельного заполнения содержимого каждой точки скелета🚤.
▪Шаблон LangChain здесь: https://github.com/langchain-ai/langchain/tree/master/templates/skeleton-of-thought.
▪Посмотрите видео на YouTube о его создании: https://youtube.com/watch?v=wLRHwKuKvOE
▪Прочитать статью здесь: https://arxiv.org/abs/2307.15337
@ai_machinelearning_big_data
🖥 Swift Parameter-free Attention Network for Efficient Super-Resolution
Сверхразрешение изображений (SISR) - важнейшая задача низкоуровневого компьютерного зрения, направленная на восстановление изображений высокого разрешения по их аналогам низкого разрешения.
Традиционные механизмы внимания значительно улучшили производительность SISR, но такие механизмы часто приводят к сложной структуре сети и большому количеству параметров, что приводит к низкой скорости вывода и большому размеру модели.
Parameter-free Attention Network (SPAN) - новая высокоэффективная модель SISR, которая позволяет сбалансировать количество параметров, скорость вывода и качество изображения.
В SPAN используется новый механизм внимания без параметров, который использует симметричные функции активации для усиления качества генерации и подавления избыточной информации.
SPAN был протестирован на нескольких бенчмарках,которые показали что она превосходит существующие модели суперразрешения как по качеству изображения, так и по скорости вывода, достигая компромисса между качеством и скоростью.
Это делает SPAN весьма пригодной для использования в реальных приложениях, особенно в случаях с ограниченными ресурсами.
🖥 Code: https://github.com/hongyuanyu/span
🦾 Checkpoint: https://drive.google.com/file/d/1iYUA2TzKuxI0vzmA-UXr_nB43XgPOXUg/view?usp=sharing
📚 Paper: https://arxiv.org/abs/2311.12770v1
🔗 Dataset: https://paperswithcode.com/dataset/manga109
@ai_machinelearning_big_data
@Axenix_Ru — канал о развитии ИТ-консалтинга и цифровизации бизнеса.
Здесь команда Axenix (ex-Accenture) делится 30-летним опытом разработки и внедрения бизнес- и ИТ‑стратегий, исследованиями рынка ИТ-консалтинга, анонсами бизнес-форумов и новейшими технологическими разработками.
— Может ли сверхразумный ИИ нести в себе угрозу глобального уничтожения?
— Почему разработка голосовых помощников все еще единичная практика, а не тенденция?
— 10 сфер применения технологий «умного города» и причем тут ИИ?
— Почему «магазин будущего» до сих пор не появился, несмотря на развитие цифровых технологий?
Подписывайтесь на канал Axenix, чтобы следить за ИТ-консалтингом страны и развивать бизнес вместе с экспертами.
Реклама. ООО "АКСТИМ". ИНН 7705476338. erid: LjN8KCNtk
Решаем ML-задачи за 60 секунд, отправляем AI торговать на бирже и изучаем мультимодальную архитектуру — на онлайн-митапе Сбера при поддержке JUG Ru Group.
🗓 29 ноября в 18:00
В программе:
✔️ Александр Рыжков — «AutoML на практике: сделать AI за 60 секунд»Александр покажет, как быстро решать ML-задачи с использованием фреймворка LightAutoML.
✔️ Андрей Ахметов — «AI/ML в валютном трейдинге»
Как зарабатывают с AI в трейдинге, какие ML-модели используют, как анализируют данные и оценивают их результаты.
✔️ Андрей Кузнецов — «Мультимодальная архитектура OmniFusion — новый способ AI-коммуникации с пользователем?»
Доклад создании больших языковых моделей, способных одинаково хорошо работать с текстом и видео. А также о коммуникации моделей между собой.
Общайтесь с участниками митапа и задавайте вопросы спикерам в чате трансляции. Авторы лучших вопросов к каждому докладу получат сертификаты в магазин мерча SberShop.
➡️ Регистрация по ссылке.
Реклама. ПАО СБЕРБАНК. ИНН 7707083893.
Профессия AI-тренера, гонка нейросетей: о чем еще говорили на YaC 2023?
YaC 2023 — это сериал из 4 серий — про город, дом, интернет и людей. Главные герои — не только сервисы, но и команды, которые их разрабатывают.
✨ Нейросерия — одна из самых интересных. Яндекс рассказал:
- как генеративные нейросети меняют подход к поиску информации и работе с ней
- как pretrain модель влияет на качество ответов нейросети
- как компания разрабатывала языковые модели и нейросети, встраивала технологии в свои продукты и ввела новую профессию AI-тренера — специалиста, который работает над тем, чтобы нейронка выдавала качественные, этичные и безопасные ответы.
Посмотреть сериал полностью можно на Кинопоиске и Ютубе
@ai_machinelearning_big_data
🤖 Российская художница написала картину совместно с Kandinsky
Мария Суворова использовала ИИ для создания картин, уделив особое внимание логическому расположению цвета и тона. Такая методика предполагает установление баланса тона, цвета и динамики, что похоже на очень сложный аналитический процесс.
Суворова говорит, что для работы с Kandinsky нужно соединить два полюса, создавая эскиз по методу Матисса и постепенно дополнять его абстрактным видением.
Плоды ее творчества человека и искусственного интеллекта представила галерея «МастАРТ» на международной конференции AI Journey.
@ai_machinelearning_big_data
⭐️ Karpathy just uploaded what could be the best Intro to Large Language Models.
Обязательно к просмотру. Карпатый только что выложил, возможно, лучшее введение в большие языковые модели.
В лекции продолжительностью 1 час рассматривается абсолютно все: обучение, вывод, взлом, тонкая настройка и многое другое.
🔗 Смотреть здесь: https://youtube.com/watch?v=zjkBMFhNj_g
🔗 Слайды: https://drive.google.com/file/d/1pxx_ZI7O-Nwl7ZLNk5hI3WzAsTLwvNU7/view
ai_machinelearning_big_data
Новый фреймворк файнтюнинга ЛЛМ
Higgsfield AI выпустил бета версию фулл-стек легковесного фреймворка для тренировки больших моделей. Пользователи загружают датасет через веб интерфейс и получают модель, которая тренируется на их серверах. Доступны любые модели llama/mistral. Метод оплаты не требуется. Лучше всего работает с десктопным Chrome.
Попробовать запустить новую видео диффузию: https://higgsfield.ai/stable-diffusion
Зафайнтюнить ЛЛМ: https://higgsfield.ai/profile/submit
Github фреймворк который позволяет оркестрировать несколько ГПУ нод без необходимости менеджить Slurm/Kubernetes: https://github.com/higgsfield-ai/higgsfield
ai_machinelearning_big_data
🐬 ShareGPT4V:Improving Large Multi-Modal Models with Better Captions
🔥 Масштабный набор данных,содержащий изображения и тексты.
🔥 1,2 млн высококачественных подписей к ихображениям для предварительного обучения.
🔥 Программа для создания описания изображений, приближающаяся по возможностям к GPT4-Vision.
🔥 Большая мультимодальная модель, ShareGPT4V-7B
🖥 Code: https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V
🦾 Project: https://sharegpt4v.github.io/
⚡️ Demo: https://huggingface.co/spaces/Lin-Chen/ShareGPT4V-7B
📚 Paper: https://arxiv.org/pdf/2311.12793.pdf
🔗 Dataset: https://huggingface.co/datasets/Lin-Chen/ShareGPT4V
@ai_machinelearning_big_data
🪄 InternLM-XComposer
Multi-Objective Reinforcement Learning algorithms implementations.
MORL-Baselines - это библиотека алгоритмов многоцелевого обучения с подкреплением (MORL).
Данный репозиторий содержит рабочие реализации алгоритмов MORL в PyTorch.
🖥 Code: https://github.com/lucasalegre/morl-baselines
🦾 Project: lucasalegre.github.io/morl-baselines
🖥 Colab: https://colab.research.google.com/drive/1ByjuUp8-CJeh1giPOACqPGiglPxDnlSq?usp=sharing
📚 Paper: https://arxiv.org/abs/2311.12495v1
🔗 Dataset: https://paperswithcode.com/dataset/mo-gymnasium
@ai_machinelearning_big_data
Stability AI is releasing Stable Video Diffusion! 🔥
Stability AI выпустили опенсорс модель image-to-video.
Это новая модель преобразования изображения в видео, которая позволяет получить 14-25 кадров с разрешением 576x1024
при наличии контекстного кадра такого же размера.
🖥 Code: https://github.com/Stability-AI/generative-models
🦾 Announcement: https://stability.ai/news/stable-video-diffusion-open-ai-video-model
📚 Paper: https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets
🔗 Weights: https://github.com/Stability-AI/generative-models
@ai_machinelearning_big_data
👱♂️ ChatAnything: Facetime Chat with LLM-Enhanced Personas
FACETIME CHAT WITH LLM-ENHANCED PERSONAS.
Новая модель ChatAnything, которая способна придать жизнь разнообразным объектам, будь то животное, фрукт, монстр или даже ваше собственное фото, создавая говорящего персонажа. При помощи нейронных сетей и алгоритмов текст в речь, программа автоматически выбирает наиболее подходящий тон и настроение для созданного персонажа.
Вам предоставляется возможность создать любогоаватара, из текстовом описании или загрузив свое собственное изображение. После этого вы можете общаться с ним, используя текстовые сообщения или ваш голос.
🖥 Github: https://github.com/zhoudaquan/ChatAnything
📕 Paper: https://arxiv.org/abs/2311.06772
⭐️ Model: https://github.com/zhoudaquan/ChatAnything/blob/main/python_scripts/prepare_models.py
ai_machinelearning_big_data
➕ SA-Med2D-20M Dataset: Segment Anything in 2D Medical Imaging with 20 Million masks
Модель Segment Anything Model (SAM) достигла впечатляющих результатов при сегментации изображений и успех модели во многом объясняется наличием большого количества обучающих данных с метками.
Однако применение SAM для сегментации медицинских изображений не может дать хороших результатов, поскольку SAM не обладает медицинскими знаниями - она не использует медицинские изображения для обучения.
SA-Med2D-20M - крупномасштабный датасет по сегментации двумерных медицинских изображений, созданный на основе многочисленных гснимков.
Он состоит из 4,6 млн. двумерных медицинских изображений и 19,7 млн. соответствующих масок, охватывающих практически все тело и содержащий значительное разнообразие.
В данной работе описаны все датасеты, собранные в SA-Med2D-20M, и подробно описаны способы обработки этих наборов данных. Кроме того, приведена полная статистика SA-Med2D-20M, которая поможет исследователям построить базовые модели медицинского зрения или применить свои модели в медицинских приложениях.
🏆 Самая большая на сегодняшний день база данных по сегментации медицинских изображений (4,6 млн. изображений и 19,7 млн. масок) для обучения моделей.
🏆 Инструмент файнтюнинга на основе модели Segment Anything Model (SAM).
🏆 Всесторонняя оценка SAM-Med2D на крупномасштабных датасетах.
🖥 Github: https://github.com/OpenGVLab/SAM-Med2D
🖥 Colab: https://colab.research.google.com/github/OpenGVLab/SAM-Med2D/blob/main/predictor_example.ipynb
📕 Paper: https://arxiv.org/abs/2311.11969v1
⭐️ Dataset: https://arxiv.org/abs/2311.11969
ai_machinelearning_big_data