Telegram-канал ai_machinelearning_big_data - Machinelearning: Технологии

Machinelearning

25 апреля 2023 10:31

Collaborative Diffusion for Multi-Modal Face Generation and Editing

Multi-modal controls, framework synthesizes high-quality images consistent with the input conditions.

Проект, который позволяет использовать несколько модальностей для управления созданием и редактированием лица.

🖥 Github: https://github.com/ziqihuangg/collaborative-diffusion

⏩ Project: https://ziqihuangg.github.io/projects/collaborative-diffusion.html

⏩ Paper: https://arxiv.org/abs/2304.10530v1

⭐️ Dataset: https://paperswithcode.com/dataset/celeba-dialog

ai_machinelearning_big_data

Читать полностью…

Machinelearning

24 апреля 2023 19:34

Count anything

An empirical study on few-shot counting using segment anything

Исследование использования метода SAM для сложной задачи подсчета объектов по нескольким снимкам.

🖥 Github: https://github.com/vision-intelligence-and-robots-group/count-anything

⏩ Paper: https://arxiv.org/abs/2304.10817v1

🤗 Hugging face: https://huggingface.co/spaces/nebula/counting-anything

📌 Dataset: https://drive.google.com/file/d/1ymDYrGs9DSRicfZbSCDiOu0ikGDh5k6S/view?usp=sharing

ai_machinelearning_big_data

Читать полностью…

Machinelearning

24 апреля 2023 15:08

📸 Omni Aggregation Networks for Lightweight Image Super-Resolution

Omni Self-attention paradigm for simultaneous spatial and channel interactions,mining all the potential correlations across omni-axis.

Omni-SR, легковесный фреймворк для получения высокого разрешения изображений.

🖥 Github: https://github.com/francis0625/omni-sr

⏩ Paper: https://arxiv.org/abs/2304.10244v1

⭐️ Dataset: https://paperswithcode.com/dataset/manga109

ai_machinelearning_big_data

Читать полностью…

Machinelearning

23 апреля 2023 09:18

🧑‍💻 Learning to Program with Natural Language

This project introduces the Learning to Program (LP) method, which aims to learn the task program in text form from the training set using Large Language Models (LLMs) themselves.

Новый проект от Microsoft представляет метод Learning to Program (LP), который позволяет использовать естественный язык в качестве языка программирования для описания процедур задач, делая их легко понятными как для людей, так и для LLM.

🖥 Github: https://github.com/microsoft/naturallanguageprogram

⏩ Paper: https://arxiv.org/pdf/2304.10464v1.pdf

⭐️ Dataset: https://paperswithcode.com/dataset/math

ai_machinelearning_big_data

Читать полностью…

Machinelearning

20 апреля 2023 17:03

Understanding INT4 Quantization for Transformer Models: Latency Speedup, Composability, and Failure Cases

В данной работе исследуется возможность использования квантования INT4 для языковых моделей и показываем.

🖥 Github: https://github.com/microsoft/DeepSpeed

⏩ Paper: https://arxiv.org/pdf/2301.12017v1.pdf

⭐️ Dataset: https://paperswithcode.com/dataset/multinli

ai_machinelearning_big_data

Читать полностью…

Machinelearning

20 апреля 2023 09:55

Stability AI запускает первый набор языковых моделей StableLM

This repository contains Stability AI's ongoing development of the StableLM series of language models and will be continuously updated with new checkpoints. The following provides an overview of all currently available models. More coming soon.

StableLM предназначена для генерации текста и кода и будет использоваться в различных приложениях. Модель обучена и полностью готова к использованию всеми желающими абсолютно бесплатно. В данный момент готовы к использованию языковые модели с 3B и 7B (3 и 7 млрд.) параметрами.

🖥 Github: https://github.com/Stability-AI/StableLM

🤗 Hugging face: https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

ai_machinelearning_big_data

Читать полностью…

Machinelearning

19 апреля 2023 09:46

💻 Навык работы с большими данными открывает путь в ведущие IT-корпорации. Обычно такие корпорации используют MLOps — способ повышения производительности и создания надежных моделей корпоративного уровня.

📊 Занимаетесь дата-инжинирингом и хотите выйти на новый уровень? Эксперты топовых компаний обучат вас необходимым навыкам на практическом онлайн-курсе «MLOps» от OTUS.

👉 Определите свой уровень подготовки с помощью теста — https://otus.pw/UB4x/

🔥 Пройдете тест, получите велкам-скидку и доступ к 2 предстоящим открытым урокам:

✔️ Построим свой конвейер обучения моделей на Airflow и k8s.
✔️ DataFrame API: от Dask к PySpark

Читать полностью…

Machinelearning

18 апреля 2023 10:02

Разработчики, архитекторы, Data Science и R&D-специалисты Нижнего Новгорода, вы здесь? Сбер приглашает вас на инженерный митап RecSys Community, который пройдет 25 апреля в Сo-working Garage 💻

О чем расскажут спикеры?

✔️ Рассмотрят подходы к применению трансформеров в рекомендательных системах и поделятся успешными кейсам.

✔️ Покажут, как используют AmazMe для обработки персонализированных и мультимодальных рекомендаций.

✔️ Раскроют все секреты, какие изменения помогли сделать рекомендательную систему поиска друзей такой точной.

Конечно же, на митапе будут Q&A-сессии, кофе-брейк, розыгрыш мерча и интересное общение. Встречаемся 25 апреля в Co-working Garage по адресу: ул. Октябрьская, д.35. Сбор гостей в 18:30.

Зарегистрироваться!⚡️

Читать полностью…

Machinelearning

16 апреля 2023 17:01

SiLK - Simple Learned Keypoints

SiLK is a self-supervised deep learning keypoint model.

🖥 Github: https://github.com/facebookresearch/silk

⏩ Paper: https://arxiv.org/abs/2304.06194v1

⭐️ Dataset: https://paperswithcode.com/dataset/hpatches

ai_machinelearning_big_data

Читать полностью…

Machinelearning

16 апреля 2023 11:49

AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models

This repository contains information about AGIEval, data, code and output of baseline systems for the benchmark.

AGIEval, новый бенчмарк, специально разработанный для оценки моделей ориентированных, на вступительные экзамены, математические олимпиады и квалификационные экзамены для юристов.

🖥 Github: https://github.com/microsoft/agieval

⏩ Paper: https://arxiv.org/abs/2304.06364v1

⭐️ Dataset: https://paperswithcode.com/dataset/jec-qa

ai_machinelearning_big_data

Читать полностью…

Machinelearning

15 апреля 2023 12:10

🎨 Animated Drawings

A Method for Automatically Animating Children's Drawings of the Human Figure

Метод анимации детских рисунков от Meta.

🖥 Github: https://github.com/facebookresearch/AnimatedDrawings

⭐️Project: https://fairanimateddrawings.com/site/home

⏩ Paper: arxiv.org/pdf/2303.12741.pdf

ai_machinelearning_big_data

Читать полностью…

Machinelearning

14 апреля 2023 18:34

⭐️ Hard Patches Mining for Masked Image Modeling

We observe that the reconstruction loss can naturally be the metric of the difficulty of the pre-training task.

Мы предлагаем Hard Patches Mining (HPM), совершенно новую структуру для предварительного обучения MIM. Мы заметили, что потери на восстановление могут естественным образом служить метрикой сложности задачи предварительного обучения.

🖥 Github: https://github.com/haochen-wang409/hpm

⏩ Paper: https://arxiv.org/abs/2304.05919v1

⭐️ Dataset: https://paperswithcode.com/dataset/ade20k

ai_machinelearning_big_data

Читать полностью…

Machinelearning

14 апреля 2023 13:01

👀SEEM: Segment Everything Everywhere All at Once

Universal, interactive multi-modal interface for any types of segmentation with ONE SINGLE MODE.

SEEM позволяет пользователям легко сегментировать изображение, используя подсказки (промпты) различных типов, включая визуальные подсказки ( метки, рамки, каракули и сегменты изображения), языковые подсказки (текст и аудио) и т.д.

🖥 Github: https://github.com/ux-decoder/segment-everything-everywhere-all-at-once

⏩ Paper: https://arxiv.org/abs/2304.06718v1

⭐️ Dataset: https://paperswithcode.com/dataset/refcoco

ai_machinelearning_big_data

Читать полностью…

Machinelearning

13 апреля 2023 10:20

⛹️‍♂️ SportsMOT: A Large Multi-Object Tracking Dataset in Multiple Sports Scenes

A Large-Scale Multi-Object Tracking Dataset in Sports Scenes.

Новый крупный набор данных многообъектного отслеживания в различных видах спорта, собранных для трех видов спорта - баскетбола, волейбола и футбола.

🖥 Github: https://github.com/MCG-NJU/SportsMOT/tree/main/codes

⏩ Paper: https://arxiv.org/abs/2304.05170v1

⭐️ Dataset: https://paperswithcode.com/dataset/sportsmot

ai_machinelearning_big_data

Читать полностью…

Machinelearning

11 апреля 2023 12:47

⚜️ OpenAGI: When LLM Meets Domain Experts

Reinforcement Learning from Task Feedback (RLTF) mechanism, which uses the task-solving result as feedback to improve the LLM's task-solving ability

OpenAGI - исследовательская платформа AGI с открытым исходным кодом, специально разработанная для решения сложных, многоэтапных задач и сопровождаемая наборами данных по конкретным задачам, метриками оценки и разнообразным набором моделей.

git clone https://github.com/agiresearch/OpenAGI.git

🖥 Github: https://github.com/agiresearch/openagi

⏩ Paper: https://arxiv.org/pdf/2304.04370.pdf

⭐️ Dataset: https://drive.google.com/drive/folders/1AjT6y7qLIMxcmHhUBG5IE1_5SnCPR57e?usp=share_link

ai_machinelearning_big_data

Читать полностью…

Machinelearning

25 апреля 2023 09:05

📌 Как Airflow и k8s помогают строить эффективный конвейер?

📆 Узнайте 27 апреля в 20:00 на открытом уроке в OTUS. Вебинар приурочен к старту онлайн-курса «MLOps».

⚠️ На этом занятии мы построим свой конвейер обучения моделей на Airflow и k8s.

➡️ Для участия нужно зарегистрироваться:
https://otus.pw/M29e/

Нативная интеграция. Информация о продукте www.otus.ru

Читать полностью…

Machinelearning

24 апреля 2023 17:34

Сбер запускает новую нейролингвистическую модель GigaChat.

GigaChat может ответить как быстро справиться с тревогой или подсказать, как справиться с грустью и улучшить настроение. Но, помимо этого, нейросеть генерирует ответы и на другие вопросы с помощью метода supervised fine-tuning, reinforcement learning with human feedback, а также на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge-Awareness).
GigaChat расширяет опыт взаимодействия с поисковыми запросами и учитывает контекст во время генерации ответа. И все это на русском языке.

На данный момент GigaChat находится в статусе закрытого бета-тестирования. Если вас привлекает перспектива стать одним из первых пользователей, получивших бесплатный доступ после его официального релиза, переходите по ссылке в Телеграм-канал.

Читать полностью…

Machinelearning

24 апреля 2023 14:08

А вы уже успели приобрести жильё по программе льготной ипотеки для IT-специалистов? Нет? Тогда эта новость для вас!
Застройщик ЛСР предлагает в апреле скидки всем, кто оформит IT-ипотеку:
1% — на однокомнатную квартиру или студию;
2% — на двухкомнатную квартиру;
3% — на 3-5-комнатную квартиру.
Скидка предоставляется на покупку недвижимости во всех объектах застройщика. Еще один момент: важно быть сотрудником компании-партнёра ЛСР.
Что делать, если ваша компания не является партнёром застройщика? Подать заявку на её включение в список! Важно: требования к компании включают аккредитацию Минцифры России и использование налоговых льгот.
Подробнее об акции здесь .

Реклама. ООО "ЛСР. НЕДВИЖИМОСТЬ-СЗ" LjN8K2f4Y

Читать полностью…

Machinelearning

22 апреля 2023 08:46

LLM Zoo: democratizing ChatGPT

Model "Phoenix", achieving competitive performance among open-source English and Chinese models while excelling in languages with limited resources

LLM Zoo - это проект, который предоставляет данные, модели и бенчмарки для больших языковых моделей.

🖥 Github: https://github.com/freedomintelligence/llmzoo

⏩ Paper: https://arxiv.org/abs/2304.10453v1

⭐️ Parameters: https://huggingface.co/FreedomIntelligence/phoenix-chat-7b

ai_machinelearning_big_data

Читать полностью…

Machinelearning

20 апреля 2023 15:03

Практический вебинар VK Cloud: Погружение в MLflow API. Готовые рецепты и сценарии использования

⏰ Когда: 4 мая, 16:00 по Москве
📍 Регистрация

На вебинаре спикеры покажут основные этапы работы с ML-моделями в MLflow. Вы узнаете, как оценивать и сравнивать модели и выводить их в production.

В программе:

🔹 Принципы работы с MLflow на Jupyter в облаке и решение основных задач: логирования метрик, моделей и параметров.
🔹Сравнение различных ML-моделей и экспериментов с помощью извлеченных метрик.
🔹 Разбор большинства методов MLflow API.
🔹 Деплой ML-модели и демонстрация основных сценариев использования на практике.

Спикеры:

— Александр Волынский, технический менеджер продукта Cloud ML Platform, VK Cloud
— Сергей Артюхин, преподаватель курса «Симулятор ML», karpov.courses

Вебинар будет полезен дата-сайентистам, MLOps- и DevOps-инженерам и аналитикам данных.

Зарегистрироваться

Читать полностью…

Machinelearning

19 апреля 2023 11:46

Inpaint Anything: Segment Anything Meets Image Inpainting

Inpaint Anything is able to remove the object smoothly.

"Inpaint Anything" - новый проект, который позваоляет удалить / заполнить / заменить что угодно на картинке (помощью промпта).

🖥 Github: https://github.com/geekyutao/Inpaint-Anything

⏩ Paper: https://arxiv.org/abs/2304.06790

⭐️ Dataset: https://segment-anything.com/dataset/index.html

ai_machinelearning_big_data

Читать полностью…

Machinelearning

18 апреля 2023 12:01

💻 Graph classification with Transformers

This notebook shows how to fine-tune the Graphormer model for Graph Classification on a dataset available on the hub.

В этой статье мы рассмотрим, как можно выполнять классификацию графов с помощью библиотеки Transformers.

🤗Hugging face blog: https://huggingface.co/blog/graphml-classification

⏩ Intro to Graphs: /channel/ai_machinelearning_big_data/3214

🖥 Github: https://github.com/huggingface/blog/blob/main/notebooks/graphml-classification.ipynb

⏩ Paper: https://arxiv.org/abs/2106.05234

⭐️Dataset: https://ogb.stanford.edu/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

17 апреля 2023 12:18

📝 An open, billion-scale corpus of images interleaved with text.

MultimodalC4 is a multimodal extension of c4 that interleaves millions of images with text.

Открытый миллиардный корпус изображений, чередующихся с текстом.

🖥 Github: https://github.com/allenai/mmc4

⏩ Paper: https://arxiv.org/abs/2304.06939v1

⭐️ Dataset: https://paperswithcode.com/dataset/c4

ai_machinelearning_big_data

Читать полностью…

Machinelearning

16 апреля 2023 15:00

❓ Как стать высокооплачиваемым специалистов в ML?

Совершенствуй мастерство ML в сообществе единомышленников. 25 апреля — старт продвинутого онлайн-курса «Machine Learning Advanced» от OTUS.

Приглашаем на курс тех, кто хочет вырасти до позиции Middle или Senior уровня.

🧑‍💻 В программе:
- Продвинутые ML-алгоритмы и кейсы решения нестандартных задач
- Работа в production: настройка окружения, оптимизация кода, построение end-to-end пайплайнов и внедрение решений.
- Уникальный исследовательский проект по машинному обучению

⚠️ Вебинары в формате Live coding, где преподаватель с «чистого листа» показывает решение актуальных задач ML.

Ответьте на 10 вопросов и проверьте, насколько вы готовы к обучению на углубленном курсе - «Machine Learning. Advanced» от OTUS и его партнера — Сбера.

👉 ПРОЙТИ ТЕСТ:
https://otus.pw/pXFb/

Читать полностью…

Machinelearning

16 апреля 2023 09:53

Ищу ML специалиста для решения задачи компьютерного зрения

Мы компания metadreamteam.io - амбициозная команда XR разработчиков и 3Д артистов, работающая на американском рынке, которая делает проекты для всего мира! От Екомерс до real estate. От внедрения лучших решений на рынке до создания своих разработок с нуля.

Сейчас делаем свою разработку по примерке часов в режиме реального времени.

Работа удаленная. Фриланс. Оплата от $25 в час
(160 - 400 тыс руб за проект)

Если ты хочешь работать с лучшими в индустрии, делать амбициозные проекты и зарабатывать в валюте - тогда заполняй эту форму, чтобы присоединиться к нам! https://forms.gle/ovrkQDMasSBWsR538

Читать полностью…

Machinelearning

15 апреля 2023 11:10

Хотите узнать, как создавать нейронные сети и заработать от 150 тысяч рублей в месяц?

Изучение нейросетей может открыть множество возможностей для развития карьеры.💪

Почему нейросети это перспективно:

👉Тут много платят
👉Можно работать из любой точки Мира
👉Есть возможность продавать AI проекты на заказ с чеком 1 500 000 ₽

AI и нейросети доступны для изучения даже для людей далеких от мира IT, ведь опыт программирования НЕ нужен☝️

🔥Мы помогли уже тысячам людей получить профессию, которая будет востребована минимум ближайшие 30 лет!

Присоединяйтесь к нашему 3-дневному интенсиву по ИИ и получите полезные навыки и знания в короткий срок!

Читать полностью…

Machinelearning

14 апреля 2023 16:34

Почему именно ChatGPT стал прорывом в развитии нейросетей? Что происходит там под капотом на самом деле?

📢📢 Посмотрим на ChatGPT глазами ML-специалистов 17 апреля в 18:00 на открытом уроке «Towards ChatGPT».

Вебинар приурочен к старту онлайн-курса «Natural Language Processing (NLP)» в OTUS. На занятии мы разберем подход, позволивший ChatGPT добиться таких высот.

💻Что вас ждет на занятии?

— Поговорим про трансформерные и генеративные модели, лежащие в основе ChatGPT
— Разберем подход обучения с подкреплением на основе отзывов (RLHF), идею тюнинга инструкций и модель InstructGPT.
— Узнаем, благодаря чему трансформерным моделям удалось достичь таких высот.

Спикер — Мария Тихонова, руководитель курсов по ML в OTUS и Senior Research Data Scientist в команде AGI NLP в SberDevices. Не упустите возможность познакомиться с преподавателем курса и оценить формат обучения! Продолжить изучать NLP вы сможете уже на курсе, доступном в рассрочку.

При покупке курса вы бесплатно получите доступ к подготовительному курсу по Python, который познакомит с основными возможности языка.

👉Пройдите тест на уровень вашей подготовки и зарегистрируйтесь: https://otus.pw/i7yA/

Читать полностью…

Machinelearning

14 апреля 2023 11:01

Х5 Tech проведет Data science meetup #1

В программе:

🎯 Кто такие Data-спецназ X5 Tech, как пришли к автоматизации А/Б тестирования в оффлайне и что делать математику в ритейле

Расскажут Мария Шабалкова и Александр Сахнов, X5 Tech

🎯 Различия поведения пользователя на устройствах с экраном и без и как адаптировать ML-модели под изменение поведение пользователя на примере умной колонки

Выступит Прохор Гладких, SberDevices

🎯 Как правильно построить процесс разметки и освободить сотрудников от классификации обращений на 1000+ классов

Поделится Андрей Сон, Alfa-Bank

📅 26 апреля, начало в 18:00
🌐 Формат - онлайн

Зарегистрироваться

Читать полностью…

Machinelearning

13 апреля 2023 09:20

🚀 Смотрите международную конференцию Data Fusion 2023 в прямом эфире прямо сейчас! Конференция посвящена работе с данными и развитию технологий искусственного интеллекта.

Data Fusion 2023 – это точка сближения науки и бизнеса. Конференция будет полезна разработчикам и специалистам в области Data Science, CDO, бизнес-заказчикам DS-продуктов и сервисов, представителям государства и науки.

Присоединяйтесь к экспертам Банка ВТБ, Яндекса, Сколтеха, «Газпром нефти», ВШЭ и многим другим.

👉 Смотрите международную конференцию Data Fusion 2023 по ссылке: https://cnrlink.com/datafusion2023online

Читать полностью…

Machinelearning

11 апреля 2023 10:47

Стартовал набор в ШАД — двухгодичную программу Академии Яндекса для тех, кто хочет исследовать Machine Learning и работать в IT-индустрии. Обучение проходит по 4 направлениям:
— data science
— инфраструктура больших данных
— разработка машинного обучения
— анализ данных в прикладных науках

Для опытных разработчиков и ML-исследователей есть альтернативный образовательный трек.
Программа ШАДа полностью бесплатна. Учиться можно дистанционно или офлайн — в одном из 6 филиалов. Скорее переходите по ссылке и заполняйте анкету участника: https://clck.ru/344m9d

Чтобы узнать подробности об обучении в ШАДе и задать вопросы кураторам программы, приходите на День открытых дверей 13 апреля. Ссылка для регистрации: https://academy.yandex.ru/dataschool/enroll#openday

Читать полностью…