Telegram-канал ai_machinelearning_big_data - Machinelearning: Технологии

Machinelearning

06 августа 2023 10:55

🧍‍♂ Reconstructing Three-Dimensional Models of Interacting Humans

Tools to process and visualize the IMAR Vision Datasets: CHI3D, FlickrCI3D, HumanSC3D, FlickrSC3D and Fit3D.

Наборы инструментов и датасетов для задач 3d реконструкций, сегментации и обнаружения людей.

🖥 Github: https://github.com/sminchisescu-research/imar_vision_datasets_tools

📕 Paper: https://arxiv.org/abs/2308.01854v1

⭐️ Project: https://ci3d.imar.ro/

☑️ Dataset: https://paperswithcode.com/dataset/chi3d

ai_machinelearning_big_data

Читать полностью…

Machinelearning

04 августа 2023 18:02

Яндекс Практикум ищет авторов на курсы по машинному обучению и «Математика для анализа данных»
Частичная занятость (2-3 часа в день)

Яндекс Практикум — это сервис онлайн-образования, где каждый может освоить современные цифровые профессии.

Задача автора — создавать и улучшать образовательный контент, чтобы обучение было актуальным.

Что предстоит делать?
Помимо теории нужно будет придумывать квизы, тесты, практические задания, дополняя это примерами из вашей профессиональной жизни.

Почему вам стоит стать автором курса?
● Помощь тысячам людей получить востребованную IT-профессию.
● Прокачка себя и подтверждение своей экспертности.
● Дополнительных доход на удалёнке.

Оставьте отклик на сайте, пройдите отбор и станьте проводником в мир IT-профессий 👇
Автор курса «Математика для анализа данных»
Автор курсов по машинному обучению

Читать полностью…

Machinelearning

04 августа 2023 10:01

Приглашаем на новую конференцию от Яндекса по прикладному ML — Practical ML Conf 2023. Регистрация уже открыта!

7 сентября мы проведём большую конференцию по прикладному Machine Learning, где обсудим все новости, которые происходят в ML-отрасли. Это будет хардовая конференция для экспертов: с глубокими техническими докладами и главными ML-инженерами отрасли.

Поговорим о ключевых вопросах индустрии: генеративных моделях, Research, NLP, Hardware, CV, RecSys, MLOps и Ecomm. Обсудим реальное применение ML в бизнесе, поделимся кейсами и их решениями. Вот лишь несколько докладов из нашей программы:

🔸Алексей Морозов, руководитель группы модернизации нейронных сетей, Яндекс Поиск. Расскажет про zero-cost fault tolerance в распределённом глубоком обучении.

🔸Валерий Ильин, руководитель группы разработки компьютерного зрения и бизнес-процессов на роботе, Яндекс Маркет. Объяснит, как устроено компьютерное зрение роботов на складах Маркета.

🔸Андрей Зимовнов, ML-директор, Дзен. Расскажет, как в Дзене переосмыслили item2item-рекомендации.

🔸Александр Ледовский, руководитель команды DS и аналитики в монетизации, Авито. Объяснит, как работают рекламные аукционы и автобиддинг в продуктах продвижения Авито.

Зарегистрироваться на участие в конференции и узнать все подробности про доклады и спикеров можно здесь.

И подписывайтесь на @Yandex4Developers, там мы скоро начнём рассказывать о программе Practical ML Conf 2023

Читать полностью…

Machinelearning

03 августа 2023 16:02

Как маленькая нейроязыковая модель победила большую облачную

Разработчики Яндекс Клавиатуры рассказали, как отказались от n-граммной модели и выбрали нейроязыковую, поделились итоговой архитектурой модели и показали, насколько получился прирост по метрике saved keys в разных группах приложениях.

🔗 Хабр: https://habr.com/ru/companies/yandex/articles/751598/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

03 августа 2023 11:02

📣 Центр непрерывного образования ФКН приглашает на Летнюю школу по аналитике и Data Science!

Вас ждут лекции и мастер-классы от спикеров из Яндекса, МТС, Тинькофф, Альфа-Банка, Х5 Group, Дзен, Genotek, Мегафона и не только.

Приглашаем всех, кто хочет разобраться:

🔷 Зачем осваивать анализ данных? Как справиться с огромным потоком данных в компании и использовать их на пользу бизнеса?
🔷 Какие сегодня есть тренды в ИИ и как устроены современные технологии?
🔷 Как Data Science применяется в разных индустриях: ритейле, телекоме и медицине? Какие знания в области нужны для работы аналитика в банке?
🔷 Что нужно изучить, чтобы стать аналитиком данных или специалистом по Data Science? Чем аналитик данных отличается от специалиста по data science?
Школа подойдет как тем, кто только решил освоить новую профессию, так и начинающим специалистам.

🗓 Когда: 19-20 августа 2023
📌 Где: здание Вышки в Москве на Покровском бульваре, 11

Участие бесплатное для всех желающих, нужно зарегистрироваться до 14 августа.

Читать полностью…

Machinelearning

02 августа 2023 18:45

5 августа, в 11:00 по белградскому времени пройдёт вебинар о карьере разработчиков в сербском офисе Nebius. Подключайтесь!

Мы поговорим обо всём, что стоит знать кандидату. Вы сможете познакомиться с одним из тимлидов разработки Nebius и узнаете про:

— Процесс собеседования
— Критерии отбора
— Переезд
— Плюсы работы в нашем сербском офисе

Вебинар пройдёт на русском языке. Он будет полезен всем опытным разработчикам, которые рассматривают Сербию как страну для переезда или уже здесь находятся.

Регистрация обязательна

#реклама, https://nebius.com
Erid: LdtCKUBSC

Читать полностью…

Machinelearning

02 августа 2023 11:28

Этой осенью состоится международная конференция AI Journey 2023, в рамках которой с марта по август проходит отбор научных работ по искусственному интеллекту и машинному обучению.

Самые интересные работы будут опубликованы в научном журнале с международной аудиторией, а автор лучшей статьи получит приз - 1 миллион рублей.

Не упустите свой шанс принять участие в отборе и получить возможность опубликовать свою статью, а также выступить с докладом на конференции AI Journey! Поторопитесь — осталось совсем немного времени! Подать заявку и ознакомиться с Правилами отбора можно на сайте AI Journey

Читать полностью…

Machinelearning

01 августа 2023 19:03

Курс по соревновательному Data Science👨‍💻

🏆 Хочешь покорить Kaggle и научиться выигрывать соревнования по анализу данных? Тогда курс "Введение в соревновательный Data Science" - это именно то, что тебе нужно!

🎯 В отличие от большинства курсов по машинному обучению, этот курс сконцентрирован на практике, а не на теории. Поэтому на нем будет более 200 практических заданий, интервью с Kaggle Grand Masters и, конечно же, внутренние соревнования для отработки техник.

⚡️В программе курса тебя ждет:
* Продвинутая работа с pandas и numpy
* Генерация, визуализация и фильтрация признаков
* Модуль про SOTA градиентные бустинги и то как их тюнить
* Стекинг и блендинг моделей
* Ускорение вычислений и оптимизация памяти
* Парсинг данных из открытых источников
* Работа с Kaggle Api и различными облачными вычислительными сервисам
* Нейронки для табличных данных
* Интервью с Kaggle Grand Masters и многое другое

🚀 Еще ребята проводят еженедельные открытые вебинары, на которых разбирают решения победителей с чемпионатов, делают обзоры предстоящих соревнование и рассказывают про необычные техники, с которыми сталкиваются на практике.

🔗 Подписывайся на их телеграмм канал, чтобы подробнее узнать про курс и следить за открытыми вебинарами.

Читать полностью…

Machinelearning

01 августа 2023 10:57

Как создавать качественные ML-системы

Команда VK Cloud перевела две статьи о ML-проектах. В первой части подробнее о жизненном цикле, ценности для бизнеса, важности проектной документации и концепциях PoC или MVP.

Во второй части: Data-centric ИИ, данны для обучения, разметка и очистка, синтетические данные, Data Engineering и ETL.

💼 Habr: https://habr.com/ru/companies/vk/articles/749850/

⏩ Habr2: https://habr.com/ru/companies/vk/articles/749852/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

31 июля 2023 15:00

Для старта карьеры в машинном обучении не хватает опыта?

Решайте реальные рабочие задачи на Симуляторе ML. Под руководством ведущих Data Scientists — Валерия Бабушкина и Богдана Печёнкина — вы не просто прокачаете отдельные навыки, а поймёте, как сводить бизнес-задачи к задачам машинного обучения. Поработав над проектами различного уровня сложности, вы научитесь:

- Понимать, какие у бизнеса есть проблемы и какими метриками их можно измерить
- Проводить А/В-тесты, чтобы подтверждать прирост метрик
- Формулировать задачу для модели
- Выбирать подходящую модель и обучать её
- Организовывать процесс доставки данных для модели
- Оборачивать модель в сервис и деплоить его

После симулятора вы сможете успешно пройти собеседование на позицию в сфере Machine Learning, получить хорошую работу и приносить пользу бизнесу уже с первых дней.

Симулятор работает в режиме подписки и постоянно пополняется новыми задачами.

Присоединяйтесь!

Читать полностью…

Machinelearning

30 июля 2023 12:00

NeRF-Det: Learning Geometry-Aware Volumetric Representation for Multi-View 3D Object Detection

NeRF-Det - это новый метод обнаружения трехмерных объектов на основе RGB-изображений. В методе NeRF используется для явной оценки 3D-геометрии объекта, что повышает эффективность распознавания.

🖥 Github: https://github.com/facebookresearch/nerf-det

📕 Paper: https://arxiv.org/abs/2307.14620v1

⚡ Project: https://chenfengxu714.github.io/nerfdet/

🔗 Dataset: https://paperswithcode.com/dataset/arkitscenes

ai_machinelearning_big_data

Читать полностью…

Machinelearning

29 июля 2023 10:36

🐧 Tracking Anything in High Quality

Новый фреймворк для высокопроизводительного отслеживания и сегментации объектов.

🖥 Github: https://github.com/jiawen-zhu/hqtrack

📕 Paper: https://arxiv.org/abs/2307.13974v1

🔗 Dataset: https://paperswithcode.com/dataset/ovis

ai_machinelearning_big_data

Читать полностью…

Machinelearning

28 июля 2023 09:01

🦙 LLM Attacks

Universal and Transferable Attacks on Aligned Language Models.

Метод атак, заставляющий llm модели генерировать нежелательное поведение.

🖥 Github: https://github.com/llm-attacks/llm-attacks

📕 Paper: https://arxiv.org/abs/2307.15043v1

🔗 Dataset: https://paperswithcode.com/dataset/ethics-1

ai_machinelearning_big_data

Читать полностью…

Machinelearning

25 июля 2023 12:01

⏩ Edge Guided GANs with Multi-Scale Contrastive Learning for Semantic Image Synthesis

ECGAN новая система для решения сложной задачи семантического синтеза изображений.

🖥 Github: https://github.com/ha0tang/ecgan

📕 Paper: https://arxiv.org/abs/2307.12084v1

🔥 Dataset: https://paperswithcode.com/dataset/cityscapes

ai_machinelearning_big_data

Читать полностью…

Machinelearning

24 июля 2023 12:01

🗣 DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection and Instruction-Aware Models for Conversational AI.

Studio: самая большая и разнообразная коллекция диалоговых датасетов, объединенных в единый формат.

🖥 Github: https://github.com/salesforce/DialogStudio

📕 Paper: https://arxiv.org/abs/2307.10172v2

🔥 Dataset: https://paperswithcode.com/dataset/dialogstudio

ai_machinelearning_big_data

Читать полностью…

Machinelearning

04 августа 2023 20:01

✅ LISA: Reasoning Segmentation via Large Language Model

New segmentation task -- reasoning segmentation. The task is designed to output a segmentation mask given a complex and implicit query text.

LISA раскрывает новые возможности сегментации мультимодальных LLM и позволяет решать сложные задачи рассуждения на знание реального мира.

🖥 Github: https://github.com/dvlab-research/lisa

📕 Paper: https://arxiv.org/abs/2308.00692v2

☑️ Dataset: https://github.com/dvlab-research/lisa#dataset

ai_machinelearning_big_data

Читать полностью…

Machinelearning

04 августа 2023 12:01

🦩 OpenFlamingo: An Open-Source Framework for Training Large Autoregressive Vision-Language Models

An open-source framework for training large multimodal models.

OpenFlamingo - семейство авторегрессионных моделей для обучения LMM в стиле Flamingo с параметрами от 3B до 9B.

OpenFlamingo можно использовать для создания подписи к изображению или для создания тейзисов на основе изображения. Преимуществом такого подхода является возможность быстрой адаптации к новым задачам с помощью внутриконтекстного обучения.

pip install open-flamingo

🖥 Github: https://github.com/mlfoundations/open_flamingo

📕 Paper: https://arxiv.org/abs/2308.01390

⭐️ Demo: https://huggingface.co/spaces/openflamingo/OpenFlamingo

☑️ Dataset: https://paperswithcode.com/dataset/flickr30k

ai_machinelearning_big_data

Читать полностью…

Machinelearning

03 августа 2023 18:09

💼 Introducing Qwen-7B: Open foundation and human-aligned models (of the state-of-the-arts)

Qwen-7B outperforms the baseline models of a similar model size, and even outperforms larger models of around 13B parameters, on a series of benchmark datasets.

Большая языковая модель на основе трансформеров, которая предварительно обучена на большом объеме данных, включая веб-тексты, книги, кодексы и т.д.

По сравнению с моделями аналогичного размера, значительно превосходит конкурентов на ряде эталонных датасетов.

Токенизатор модели, включает более 150 к. токенов.

🖥 Github: https://github.com/QwenLM/Qwen-7B

📕 Paper: https://github.com/QwenLM/Qwen-7B/blob/main/tech_memo.md

☑️ Dataset: https://paperswithcode.com/dataset/mmlu

ai_machinelearning_big_data

Читать полностью…

Machinelearning

03 августа 2023 14:02

⚡️ Improving Pixel-based MIM by Reducing Wasted Modeling Capability

A new method that explicitly utilizes low-level features from shallow layers to aid pixel reconstruction.

MMPreTrain - это набор инструментов для предварительного обучения с открытым исходным кодом, основанный на PyTorch. Он является частью проекта OpenMMLab.

🖥 Github: https://github.com/open-mmlab/mmpretrain

📕 Paper: https://arxiv.org/abs/2308.00261v1

⭐️Project: mmpretrain.readthedocs.io/en/latest/

☑️ Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data

Читать полностью…

Machinelearning

02 августа 2023 20:45

🚀 Unified Model for Image, Video, Audio and Language Tasks

UnIVAL is a 0.25B-parameter unified model that is multitask pretrained on image and video-text data and target image, video and audio-text downstream tasks.

Унифицированная модель с для задач обработки изображений, видео, аудио и языка.

🖥 Github: https://github.com/mshukor/unival

📕 Paper: https://arxiv.org/abs/2307.16184

⭐️Project: https://unival-model.github.io/

☑️ Demo: https://huggingface.co/spaces/mshukor/UnIVAL

ai_machinelearning_big_data

Читать полностью…

Machinelearning

02 августа 2023 13:28

🔥 MetaGPT: Meta Programming for Multi-Agent Collaborative Framework

MetaGPT, an innovative framework that infuses effective human workflows as a meta programming approach into LLM-driven multi-agent collaboration.

MetaGPT - инновационный фреймворк, позволяющий назначать различные роли GPT для создания ит-продуктов и решения сложных задач. MetaGPT принимает на вход однострочное описание задачи и выдает пользовательские истории / конкурентный анализ / требования / структуры данных / API / документы и т.д.

🖥 Github: https://github.com/geekan/metagpt

📕 Paper: https://arxiv.org/abs/2308.00352v1

☑️ Roadmap: https://github.com/geekan/MetaGPT/blob/main/docs/ROADMAP.md

ai_machinelearning_big_data

Читать полностью…

Machinelearning

01 августа 2023 21:02

⏩ SEED-Bench: Benchmarking Multimodal LLMs with Generative Comprehension

A benchmark for evaluating Multimodal LLMs using multiple-choice questions.

Система генерации вопросов с несколькими вариантами ответов, ориентированных на конкретные параметры оценки, включающая процессы автоматической фильтрации и ручной проверки.

🖥 Github: https://github.com/ailab-cvc/seed-bench

📕 Paper: https://arxiv.org/abs/2307.16125v1

☑️ Dataset: https://paperswithcode.com/dataset/seed-bench

ai_machinelearning_big_data

Читать полностью…

Machinelearning

01 августа 2023 13:02

🦙 ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs

🔨ToolLLM aims to construct open-source, large-scale, high-quality instruction tuning SFT data to facilitate the construction of powerful LLMs with general tool-use capability.

Открытая платформа для обучения, настройки и оценки больших языковых моделей.

git clone git@github.com:OpenBMB/ToolBench.git

🖥 Github: https://github.com/openbmb/toolbench

📕 Paper: https://arxiv.org/abs/2307.16789v1

⭐️Project: openbmb.github.io/ToolBench/

☑️ Demo: https://github.com/openbmb/toolbench#web-ui

ai_machinelearning_big_data

Читать полностью…

Machinelearning

31 июля 2023 17:02

📷 Powerful Multi-Task Transformers for Scene Understanding

TaskExpert, a novel multi-task mixture-of-experts model that enables learning multiple representative task-generic feature spaces and decoding task-specific features in a dynamic manner.

Мощные многозадачные модели трансформеров для анализа и понимания сцен.

🖥 Github: https://github.com/prismformore/multi-task-transformer

📕 Paper: https://arxiv.org/abs/2307.15324v1

🔗 State of art: https://paperswithcode.com/sota/monocular-depth-estimation-on-cityscapes-3d?p=joint-2d-3d-multi-task-learning-on-cityscapes

ai_machinelearning_big_data

Читать полностью…

Machinelearning

31 июля 2023 11:06

👗 Fashion Matrix: Editing Photos by Just Talking

Hierarchical AI system called Fashion Matrix dedicated to editing photos by just talking.

Fashion Matrix объединяет различные визуальные и языковые модели и в комплексного ИИ-помощника в области моды.

Система состоит из трех модулей: Fashion Assistant, Fashion Designer и AutoMasker, которые используют LLM в качестве поддержки интеллектуальной обработки текста.

🖥 Github: https://github.com/Zheng-Chong/FashionMatrix

⭐️ Project:

📕 Paper: https://arxiv.org/abs/2307.13240

👁 Video: https://www.youtube.com/watch?v=1z-v0RSleMg&t=3s

⏩ Demo : https://3040fb6b6c32c3715e.gradio.live/

🔗 Dataset: https://paperswithcode.com/dataset/densepose

ai_machinelearning_big_data

Читать полностью…

Machinelearning

30 июля 2023 10:04

⚡️Маст-хэв список для программистов, каналы с последними книжными новинками, библиотеками, разбором кода и актуальной информацией, связанной с вашим языком программирования.
Лучший способ получать свежие обновлении и следить за трендами в разработке.

Python: t.me/pythonl
C#: t.me/csharp_ci
C/C++/ t.me/cpluspluc
Машинное обучение: t.me/machinelearning_interview
Data Science: t.me/data_analysis_ml
Devops: t.me/devOPSitsec
Go: t.me/Golang_google
Базы данных: t.me/sqlhub
Rust: t.me/rust_code
Javascript: t.me/javascriptv
React: t.me/react_tg
PHP: t.me/phpshka
Android: t.me/android_its
Мобильная разработка: t.me/mobdevelop
Linux: t.me/+A8jY79rcyKJlYWY6
Big Data: t.me/bigdatai
Хакинг: t.me/linuxkalii
Java: t.me/javatg

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy

🎞 YouTube канал: uproger" rel="nofollow">https://www.youtube.com/@uproger

😆ИТ-Мемы: t.me/memes_prog

🇬🇧Английский: t.me/english_forprogrammers

Читать полностью…

Machinelearning

29 июля 2023 09:36

Just wanted to share with you that CrunchDAO is organizing the ADIA Lab Market Prediction Competition with a 100 000 USD Prize pool!

Here is what we offer (on top of the 100 000$ Prize pool) for you to participate).

- 128$ (40$Crunch) if you score > 3.5

- 320$ (100$Crunch) if you score > 4

These rewards are paid in $Crunch (you can swap it against USDC whenever you want).

They are only intended for you and can only work if you register through this link : https://crunchdao.com/live/adialab

The challenge of the competition is to rank the investments from best to worst at each given date. The scoring function for the competition is based on Spearman's rank correlation, which measures how well the predicted ranking of the investments matches up with the actual ranking.

Читать полностью…

Machinelearning

27 июля 2023 09:02

ANNOUNCING SDXL 1.0

The Stability AI team is proud to release as an open model SDXL 1.0, the next iteration in the evolution of text-to-image generation models.

Stability AI объявили о выпуске Stable Diffusion 1.0 XL, новой версии популярной модели для генерации изображений. SDXL 1.0 представляет собой базовую модель с 3,5B параметров и пайплайн с ансамблем моделей из 6,6B параметров.

💫 Announcement: https://stability.ai/blog/stable-diffusion-sdxl-1-announcement

🖥 Github: https://github.com/Stability-AI/generative-models

⭐️ Clip: https://clipdrop.co/stable-diffusion

ai_machinelearning_big_data

Читать полностью…

Machinelearning

25 июля 2023 10:02

Думаете о международной карьере, но боитесь, что не хватит английского? Практикуйте его в разговорных клубах для IT-специалистов.

За пять дней вы:

- узнаете, как готовиться к собеседованию на английском
- попробуете использовать фреймворк STAR на примере собеседования
- потренируетесь вести дискуссию и вежливо отстаивать свою точку зрения
- получите подарки от Яндекс Практикума

Формат: закрытый телеграм-канал и два воркшопа в Zoom. В канале вы получите чек-листы и будете решать упражнения. На воркшопах — сможете попрактиковаться с преподавателем и другими студентами.

Ведущая: Василиса Шеромова. Преподаватель на курсах английского для работы в IT. Опыт преподавания: больше 10 лет. Пять лет работала менеджером по маркетингу в IT-компаниях.

Читать полностью…

Machinelearning

24 июля 2023 11:01

❗️Как пройти техническое собеседование на ML-специалиста?

⚠️ Узнайте на примере mock-интервью с преподавателями курса «MLOps» в OTUS!

На открытом уроке вы сможете наблюдать один из этапов собеседования при найме ML-специалистов — ML System Design секцию.

👉 Для удачного прохождения этого этапа не достаточно только знания алгоритмов машинного обучения. Также проверяются навыки проектирования ML систем, которые могут успешно работать в промышленной среде.

Больше инструментов MLOps ждет вас на курсе. Обратите внимание: возможные способы оплаты обучения.

👉 РЕГИСТРАЦИЯ
https://otus.pw/oCXA/

Нативная интеграция. Информация о продукте www.otus.ru

Читать полностью…