✅ Друзья, этой осенью в Москве состоится Ai Conf 2024 – первая прикладная тематическая конференция по Data Science.
Темы конференции:
- работа со звуком
- компьютерное зрение и генерация изображений
- обработка естественного языка
- рекомендательные системы и поиск
- умные механизмы
- разработка агентов
- академические исследования
- оптимизация использования железа и др.
Программа конференции будет строиться вокруг областей применения машинного обучения, а к выступлению приглашены не только спикеры из отраслей отраслей IT, Интернет и E-commerce, но и из отраслей реального сектора.
Вам есть чем поделиться? Отправляйте заявку на спикерство на сайте
🎁 Для всех наших спикеров предусмотрены бонусы: билет на конференцию; покроем ваши расходы на логистику, будь то поезд, самолет или автобус; предоставим вам номер в комфортабельном отеле рядом с местом проведения конференции; и, конечно, поможем подготовиться к выступлению.
Подробности о конфeренции AiConf
erid:2VtzqvzVtR3
Рекалма ООО «Конференции Олега Бунина»
ИНН 7733863233
⚡️ Cortex — AI-движок для создания LLM-приложений (поддерживает llama.cpp и TensorRT-LLM)
npm i -g @janhq/cortex
cortex init
cortex models pull janhq/TinyLlama-1.1B-Chat-v1.0-GGUF
cortex models start janhq/TinyLlama-1.1B-Chat-v1.0-GGUF
cortex chat --model janhq/TinyLlama-1.1B-Chat-v1.0-GGUF
⚡️ SynCHMR — реконструкция движения камеры и изменения положения отдельных точек по видео
На днях Yizhou Zhao, Tuanfeng Y. Wang и ещё несколько ребят из Adobe представили работу по SynCHMR — реконструкции движения камеры на основе видео.
Представленный ими метод позволяет восстанавливать траекторию движения камеры и облака точек сцены по видео.
▶️ Страничка SynCHMR
🟡 Arxiv
@ai_machinelearning_big_data
🌟 Open WebUI — удобный веб-интерфейс для LLM
Open WebUI — это расширяемый и удобный в использовании веб-интерфейс, предназначенный для работы полностью в автономном режиме.
Без проблем отображает выводы от разных LLM, включая Ollama, работает с OpenAI-совместимыми API.
🖥 GitHub
🟡 Доки
@ai_machinelearning_big_data
🌟 Elia — UI для получения ответов от LLM прямо в терминале
Elia — удобный терминальный UI для взаимодействия с LLM.
Корректно отображает вывод от ChatGPT, Claude, Llama 3, Phi 3, Mistral, Gemma и не только.
🖥 GitHub
@ai_machinelearning_big_data
🔥 MiniCPM-Llama3-V 2.5 — мультимодальная LLM-ка уровня GPT-4 (почти), которую можно запустить на телефоне
# клонируем репо и перемещаемся в папку
git clone https://github.com/OpenBMB/MiniCPM-V.git
cd MiniCPM-V
# создаём conda-окружение
conda create -n MiniCPM-V python=3.10 -y
conda activate MiniCPM-V
pip install -r requirements.txt
Как понять, подходит ли вам финтех?
Дата-аналитиками работают те, кому нравятся большие данные и большие зарплаты. Если узнали в этом описании себя — финтех для вас.
30 мая в 18:00 мск пройдёт день открытых дверей онлайн-магистратуры МФТИ и Нетологии «Финансовые технологии и аналитика». На встрече вы узнаете о задачах Data Analyst, трендах индустрии и карьерных возможностях для студентов вуза. Отдельно расскажем, как работает онлайн-образование и что нужно для поступления.
Записывайтесь на встречу, если хотите узнать больше о финтехе и возможностях онлайн-образования.
🔗Ссылка: https://netolo.gy/da9Q
Реклама ООО “Нетология” 2VSb5w9QTix
🔥 Ambient Diffusion — схема обучения ИИ-моделей на повреждённых данных
Исследователи из Техасского университета в Остине разработали инновационную схему обучения моделей на сильно поврежденных изображениях, метод получил название Ambient Diffusion. Для чего?
Последнее время то и дело возникают судебные иски — художники жалуются на незаконное использование их изображений.
И Ambient Diffusion как раз позволяет ИИ-моделям не копировать изображения, а скажем «черпать вдохновение» из них.
В ходе исследования команда исследователей обучила модель Stable Diffusion XL на наборе данных из 3 000 изображений знаменитостей. Изначально было замечено, что модели, обученные на чистых данных, откровенно копируют учебные примеры.
Однако когда обучающие данные были испорчены — случайным образом маскировалось до 90% пикселей, — модель все равно выдавала высококачественные уникальные изображения.
Возможности использования Ambient Diffusion выходят за рамки решения проблем с авторскими правами. По словам профессора Адама Кливанса, сотрудника проекта, «Ambient Diffusion может оказаться полезным и для научных и медицинских приложений. Это касается практически любых исследований, где дорого или невозможно получить полный набор неповрежденных данных — от визуализации черных дыр до некоторых видов магнитно-резонансной томографии».
▶️ Подробнее
🟡 Arxiv
@ai_machinelearning_big_data
Как работает обучение с подкреплением: классические алгоритмы SARSA и Q-learning
Почему 2 этих инструмента лежат в основе всех современных алгоритмов?
Расскажет опытный эксперт на открытом уроке от OTUS, где вы:
- познакомитесь с базовыми алгоритмами RL и поймете, чем оно отличается от остальных;
- узнаете о трех парадигмах ML и разберетесь с основными понятиями;
- определите, чем марковский процесс принятия решений отличается от случайного поиска.
Спикер Игорь Стурейко — PhD Physical and Mathematical Sciences, опытный руководитель команд. Встречаемся 28 мая в 20:00 мск в рамках курса «Reinforcement Learning». Все участники вебинара получат спец. цену на обучение!
Регистрируйтесь: https://clck.ru/3Aozr4
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ", ИНН: 9705100963
🔥🔥🔥 YOLOv10: Real-Time End-to-End Object Detection
⚡️ Вышла новая версия детектора объектов YOLOv10
Добавлена новая функция сквозного обнаружения объектов в реальном времени. Код выпущен под лицензией GNU GPL v3.0
По сравнению с YOLOv9-C, YOLOv10-B имеет на 46% меньшую задержку и использует на 25% меньше параметров при той же производительности.
▪Paper: arxiv.org/pdf/2405.14458
▪Github: https://github.com/THU-MIG/yolov10/
▪Demo :https://huggingface.co/spaces/kadirnar/Yolov10
▪Colab: https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/train-yolov10-object-detection-on-custom-dataset.ipynb#scrollTo=SaKTSzSWnG7s
@ai_machinelearning_big_data
⚡️ Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and Attribute Control
🤯 Face Adapter - это нечто!
🚀 Новый мощный адаптер для переноса лиц, который работает с предварительно обученными diffusion моделями.
🔄 Обеспечивает точный контроль над выражениями и чертами лиц.
Работает с видео и фото.
▪Github: https://github.com/FaceAdapter/Face-Adapter
▪Paper: https://arxiv.org/abs/2405.12970
▪HF: https://huggingface.co/FaceAdapter/FaceAdapter
▪Project: https://faceadapter.github.io/face-adapter.github.io/
@ai_machinelearning_big_data
Как юристу построить карьеру в IT, не меняя профессию
По прогнозам экспертов, к 2026 году автоматизацию рабочих процессов внедрят 40% юридических отделов. Услуги таких профессионалов на стыке IT и права нужны в бизнесе, в государственном секторе и в частной практике.
Вместе с НИУ ВШЭ в Нетологии разработали программу магистратуры «LegalTech: автоматизация юридических процессов». На дне открытых дверей вы узнаете о задачах специалиста, направлениях, перспективах профессии и принципах работы онлайн-магистратуры.
Встреча будет полезна начинающим юристам и смежным специалистам, кто хочет сменить направление работы или сделать следующий шаг в карьере. Ждём и опытных юристов — вы узнаете, как вырасти в должности и зарплате.
🕘Когда: 29 мая, 18:00 мск
🔗Запись: https://netolo.gy/da9K
Реклама ООО “Нетология” 2VSb5xXTTTe
🔥 open_clip — open-source реализация CLIP
— pip install open_clip_torch
Встречайте открытую реализацию CLIP (Contrastive Language-Image Pre-training от OpenAI).
CLIP — это нейросеть, разработанная OpenAI для выполнения задач визуального, а также языкового понимания. Алгоритмы нацелены на понимание связи между текстом и изображениями.
🖥 GitHub
🟡 Google Colab
@ai_machinelearning_big_data
Data Fest 2024 | Москва, 25 мая
Приглашаем на Data Fest 2024 в Москве, в гостях у VK! Весь день, 3 зала и 30+ спикеров в одном месте 🔥
Адрес: Москва, Ленинградский пр-кт 39 (БЦ Скайлайт, башня А)
Дата: 25 мая, суббота, 11:00
Участников ждут доклады из секций:
1. RecSys секция от хоста площадки VK
2. DS Career
3. NLP
4. Advanced LLM
5. CV
6. Speech
7. ML in Physics
8. Data Strategy
9. Open Source
Регистрация доступна по ссылке: https://ods.ai/events/fest2024-vk
Стартовал прием заявок для публикации статей по AI/ ML в научном журнале международной конференцию по искусственному интеллекту AI Journey.
Авторы лучшей научной работы получат вознаграждение в 1 млн рублей, а также получат возможность представить свое исследование перед научным сообществом на площадке конференции AI Journey.
Исследования участников будут опубликованы в специальном выпуске журнала «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics. Статьи могут быть написаны на русском или английском языке и должны представлять только не опубликованные ранее сведения. Другие правила предоставления и оформления материалов читайте на сайте. Заявки принимаются до 20 августа.
🌟 ChatTTS — генеративная text2speech модель с упором реалистичность
import ChatTTS
from IPython.display import Audio
chat = ChatTTS.Chat()
chat.load_models()
texts = ["<PUT YOUR TEXT HERE>",]
wavs = chat.infer(texts, use_decoder=True)
Audio(wavs[0], rate=24_000, autoplay=True)
Релиз YandexGPT 3 Lite
Яндекс представил облегченную версию генеративной модели третьего поколения. Нейросеть лучше справляется со сценариями, в которых важна скорость ответа. Например, чат-бот на сайте, исправление орфографических ошибок в текстах, анализ данных и так далее.
YandexGPT 3 Lite доступна клиентам Yandex Cloud для интеграции через API. Модель можно протестировать в демо-режиме бесплатно.
▪️Подробнее
@ai_machinelearning_big_data
📔 Curated list of 50+ textbooks on machine learning,
Большой список из более чем 50 учебников по машинному обучению, искусственному интеллекту, глубокому обучению, компьютерному зрению и т.д.
Книги со ссылками для скачивания в PDF и в веб формате.
📚 BOOKS: https://franknielsen.github.io/Books/CuratedBookLists.html
#books #книги
@ai_machinelearning_big_data
🌟 Sweep — AI-джун, который самостоятельно исправит мелкие ошибки в коде
Установка Sweep CLI:pip install sweepai
Работает очень просто: нужно описать ошибки, функции, которые необходимо реализовать, и Sweep:
— прочитает вашу кодовую базу
— спланирует изменения
— создаст pull request с нужным кодом
Особенно удобно использовать Sweep для написания тестов
🖥 GitHub
🟡 Доки
@ai_machinelearning_big_data
✍️ Яндекс открыл приём заявок на международную научную премию Yandex ML Prizeх
Премия вручается молодым исследователям, научным руководителям и преподавателям за достижения в области компьютерного зрения, машинного перевода, распознавания и синтеза речи, анализа данных и генеративных моделей.
В этом году будет 5 номинаций:
▪️ Первая публикация,
▪️ Исследователи,
▪️ Молодые научные руководители,
▪️ Научные руководители,
▪️ Преподаватели ML.
Лауреаты получат денежные премии. Исследователи — по 500 тысяч рублей, научные руководители и преподаватели — по миллиону рублей.
↗️ Приём заявок продлится до 21 июня, вручение премии состоится осенью.
Реклама. ООО "Яндекс", ИНН 7736207543.
⚡️ Adobe выпустила DMD2!
Новый усовершенствованный метод дистилляции, который может превратить диффузионные модели, такие как SDXL, в мощные одношаговые генераторы изображений.
Прошло много времени с тех пор, как мы видели какие-либо интересные обновления в экосистеме SD, так что это круто 🔥
▪Project page: https://tianweiy.github.io/dmd2/
▪Code: https://github.com/tianweiy/DMD2
▪Demo: https://4e4a5c6a8b08f76802.gradio.live
@ai_machinelearning_big_data
⚡️ SWE-agent — open-source ИИ-агент для дебаггинга или решения какой-то проблемы с кодом
Всё просто: сообщаем SWE-agent, какую проблему он должен решить в нашем коде, и агент пытается автоматически исправить ее, используя GPT-4 или другую LLM.
SWE-agent исправляет 12,29% ошибок в оценочном наборе SWE-bench, что не так много — зато его работа занимает всего 1.5 минуты.
🖥 GitHub
🟡 Обзор SWE-agent, YouTube
🟡 Связанное исследование, PDF
🟡 Посмотреть демо
@ai_machinelearning_big_data
🌟 WhisperKit — распознавание речи на устройствах Apple с помощью Whisper
— brew install whisperkit-cli
WhisperKit — это пакет Swift, который интегрирует модель распознавания речи Whisper от OpenAI с фреймворком CoreML от Apple для эффективного локального вывода на устройствах Apple.
🖥 GitHub
🟡 Hugging Face
@ai_machinelearning_big_data
⚡️ Релиз Aya 23 8B и 35B от Cohere
Cohere выпустили Aya 23: с 8 и 35 млрд параметрами.
Aya 23 объединяет модели семейства Command с недавно выпущенной коллекцией Aya.
Мультиязычная (поддерживает 23 языка).
Судя по бенчмаркам, 35B версия уделывает BX-7B, Mixtral8x7B, и другие модели, а 8B версия стабильно в тройке лидеров.
▶️ Hugging Face
🟡 Протестировать
@ai_machinelearning_big_data
⚡️ Uni-MoE — унифицированная мультимодальная LLM с архитектурой MoE
Встречайте совсем свежую работу Y. Li, S. Jiang и ещё нескольких человек, в которой они презентуют Uni-MoE.
Комплексные бенчмарки демонстрируют главное преимущество Uni-MoE — значительное снижение погрешности при работе со смешанными мультимодальными наборами данных, а также улучшение совместной работы и обобщения данных несколькими экспертами.
📎 Arxiv
@ai_machinelearning_big_data
⚡️ Mistral-7B-v0.3 доступна на HuggingFace
— pip install mistral_inference
Изменения в Mistral-7B-v0.3 по сравнению с предыдущими версиями:
— Увеличен словарь до 32768 слов;
— Добавлена поддержка более новой версии токенизатора v3;
— Модель теперь поддерживает вызов функций;
— Apache 2.0 лицензия.
from huggingface_hub import snapshot_download
from pathlib import Path
mistral_models_path = Path.home().joinpath('mistral_models', '7B-v0.3')
mistral_models_path.mkdir(parents=True, exist_ok=True)
snapshot_download(repo_id="mistralai/Mistral-7B-v0.3", allow_patterns=["params.json", "consolidated.safetensors", "tokenizer.model.v3"], local_dir=mistral_models_path)
🖥 BREAKING: Nvidia stock, $NVDA, is now trading with a market cap above $2.5 TRILLION for the first time in history.
Рыночная капитализация Nvidia впервые в истории достигла $2,5 трлн 💸.
Для сравнения, Nvidia сейчас больше, чем Tesla и Amazon ВМЕСТЕ взятые.
Более того, Nvidia сейчас больше, чем весь фондовый рынок Германии.
Капитализация Nvidia превышает рыночную капитализацию итальянского и австралийского фондовых рынков ВМЕСТЕ взятых.
5 лет назад рыночная капитализация Nvidia составляла всего 100 миллиардов долларов.
Сейчас это третья по величине публичная компания в мире, которая на 17% уступает Apple по размеру.
@ai_machinelearning_big_data
🌟 Microsoft Edge вскоре получит функцию закадрового перевода и дублирования видео в реальном времени с помощью ИИ
Браузер Microsoft Edge вскоре получит функцию закадрового перевода и дублирования видео в реальном времени на таких сайтах, как YouTube, LinkedIn, Coursera и т.д., благодаря использованию ИИ для перевода аудио на иностранные языки, сообщила Microsoft в ходе ежегодной конференции Microsoft Build 2024, стартовавшей 21 мая в Сиэтле (США).
В настоящее время эта функция поддерживает перевод с испанского на английский, а также перевод с английского на немецкий, хинди, итальянский, русский и испанский. Ожидается, что новая функция Edge на базе ИИ также сделает видео более доступными для слабослышащих или страдающих потерей слуха пользователей.
Microsoft сообщила, что Edge также будет поддерживать перевод устного контента в реальном времени на новостных сайтах, таких как Reuters, CNBC и Bloomberg. В дальнейшем компания планирует увеличить количество поддерживаемых сайтов, а также расширить возможности Edge по переводу большего количества языков.
Новая функция пополнит набор возможностей Edge на базе ИИ, появившихся у браузера благодаря интеграции с Copilot. В настоящее время Edge поддерживает возможность обобщения содержания видеороликов YouTube, но он пока не обладает способностью генерировать текстовые резюме для каждого видео, поскольку при их создании полагается на транскрипцию видео.
▶️ Демонстрация перевода в реальном времени
@ai_machinelearning_big_data
⚡️ Your Guide to Generative AI Courses
Лучший способ изучить генеративный ИИ - это создать собственный проект. Новый ресурс, который поможет вам погрузится в эту тему!
Новое руководство от DeepLearningAI
по созданию RAG приложения, с пошаговой схемой создания RAG и список кратких уроков, подготовленных кураторами, которые содержат как теоретические знания, так и практические примеры с кодом.
https://deeplearning.ai/resources/generative-ai-courses-guide/
@ai_machinelearning_big_data
⚡️ Cover-Agent — инструмент с открытым исходным кодом, включающий в себя реализацию TestGen-LLM от Meta для автоматического улучшения наборов тестов
— pip install git+https://github.com/Codium-ai/cover-agent.git
Cover-Agent использует генеративный искусственный интеллект для автоматизации и улучшения генерации тестов (сейчас в основном юнит-тестов).
Cover-Agent может запускаться через терминал, в будущем его планируется интегрировать в популярные CI-платформы.
🖥 GitHub
🟡 Связанная статья Arxiv
@ai_machinelearning_big_data