Х5 Tech проведет Data science meetup #1
В программе:
🎯 Кто такие Data-спецназ X5 Tech, как пришли к автоматизации А/Б тестирования в оффлайне и что делать математику в ритейле
Расскажут Мария Шабалкова и Александр Сахнов, X5 Tech
🎯 Различия поведения пользователя на устройствах с экраном и без и как адаптировать ML-модели под изменение поведение пользователя на примере умной колонки
Выступит Прохор Гладких, SberDevices
🎯 Как правильно построить процесс разметки и освободить сотрудников от классификации обращений на 1000+ классов
Поделится Андрей Сон, Alfa-Bank
📅 26 апреля, начало в 18:00
🌐 Формат - онлайн
Зарегистрироваться
🚀 Смотрите международную конференцию Data Fusion 2023 в прямом эфире прямо сейчас! Конференция посвящена работе с данными и развитию технологий искусственного интеллекта.
Data Fusion 2023 – это точка сближения науки и бизнеса. Конференция будет полезна разработчикам и специалистам в области Data Science, CDO, бизнес-заказчикам DS-продуктов и сервисов, представителям государства и науки.
Присоединяйтесь к экспертам Банка ВТБ, Яндекса, Сколтеха, «Газпром нефти», ВШЭ и многим другим.
👉 Смотрите международную конференцию Data Fusion 2023 по ссылке: https://cnrlink.com/datafusion2023online
Стартовал набор в ШАД — двухгодичную программу Академии Яндекса для тех, кто хочет исследовать Machine Learning и работать в IT-индустрии. Обучение проходит по 4 направлениям:
— data science
— инфраструктура больших данных
— разработка машинного обучения
— анализ данных в прикладных науках
Для опытных разработчиков и ML-исследователей есть альтернативный образовательный трек.
Программа ШАДа полностью бесплатна. Учиться можно дистанционно или офлайн — в одном из 6 филиалов. Скорее переходите по ссылке и заполняйте анкету участника: https://clck.ru/344m9d
Чтобы узнать подробности об обучении в ШАДе и задать вопросы кураторам программы, приходите на День открытых дверей 13 апреля. Ссылка для регистрации: https://academy.yandex.ru/dataschool/enroll#openday
Instruction Tuning with GPT-4
First attempt to use GPT-4 to generate instruction-following data for LLM finetuning.
Это репозиторий для GPT-4-LLM, целью которого является обмен данными, сгенерированными GPT-4 для построения LLM, с помощью контролируемого обучения и обучения с подкреплением.
🖥 Github: https://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLM
⏩ Paper: https://arxiv.org/abs/2304.03277v1
⏩ Project: https://instruction-tuning-with-gpt-4.github.io/
ai_machinelearning_big_data
Painter → SegGPT: Vision Foundation Models from BAAI
SegGPT, a generalist model for segmenting everything in context.
Фреймворк, которые объединяет различные задачи сегментации в универсальную контекстную систему обучения, которая подходит для различных типов сегментации.
🖥 Github: https://github.com/baaivision/painter
⏩ Paper: https://arxiv.org/abs/2304.03284v1
⏩ Demo: https://huggingface.co/spaces/BAAI/SegGPT
💨 Dataset: https://paperswithcode.com/dataset/youtube-vos
ai_machinelearning_big_data
StackLLaMA: A hands-on guide to train LLaMA with RLHF
In this post, we went through the entire training cycle for RLHF, starting with preparing a dataset with human annotations.
В этой статье блога мы покажем все этапы обучения модели LlaMa для ответов на вопросы на Stack Exchange с RLHF.
🤗 Hugging face: https://huggingface.co/blog/stackllama
⏩ Demo: https://huggingface.co/spaces/philschmid/igel-playground
💨 Dataset: https://huggingface.co/datasets/HuggingFaceH4/stack-exchange-preferences
📌 Paper: https://arxiv.org/abs/2302.13971
ai_machinelearning_big_data
Segment Anything
The Segment Anything Model (SAM) produces high quality object masks from input prompts such as points or boxes, and it can be used to generate masks for all objects in an image.
Новая модель от Meta - Segment Anything, нейросеть, которая в один клик может вырезать любой объект из фото или видео.
🖥 Github: https://github.com/facebookresearch/segment-anything
⭐️ Project: https://segment-anything.com/
⏩ Paper: https://arxiv.org/abs/2304.02643v1
💨 Dataset: https://segment-anything.com/dataset/index.html
ai_machinelearning_big_data
Ищем учеников на бесплатное обучение по созданию искусственного интеллекта с нуля. Опыт программирования не важен!🤖
Всего за 3 вечера под руководством Дмитрия Романова - основателя Университета Искусственного Интеллекта, лидера обучения AI-разработке в РФ, вы с легкостью напишете свой первый искусственный интеллект👨💻
Какие нейронные сети вы создадите?
▫️Классификация людей на входящих и выходящих из автобуса
▫️Обнаружение возгораний
▫️Оценка стоимости квартир
▫️Оценка резюме соискателей
▫️Прогнозирование стоимости полиметаллов
▫️Сегментация изображений самолетов
▫️Распознавание команд умного дома⠀
Лучше освоить навыки создания нейронных сетей вам помогут домашние задания с проверкой от кураторов.⠀
Приходите на бесплатное обучение и напишите искусственный интеллект за 3 вечера💪
Регистрация по ссылке
⚡️Token Merging for Stable Diffusion
Token Merging (ToMe) speeds up transformers by merging redundant tokens, which means the transformer has to do less work.
Используя только чистый python и pytorch, Token Merging для SD ускоряет генерацию изображений в 2 раза, за счет объединения лишних токенов.pip install tomesd
🖥 Github: https://github.com/dbolya/tomesd
⏩ Paper: https://arxiv.org/abs/2303.17604v1
💨 Blog: https://research.facebook.com/blog/2023/2/token-merging-your-vit-but-faster/
ai_machinelearning_big_data
vid2vid-zero for Zero-Shot Video Editing
We propose vid2vid-zero, a simple yet effective method for zero-shot video editing.
Мы предлагаем vid2vid-zero, простой, но эффективный метод редактирования видео.
🖥 Github: https://github.com/baaivision/vid2vid-zero
⏩ Paper: https://arxiv.org/abs/2303.17599v1
💨 Dataset: https://paperswithcode.com/dataset/sounddescs
ai_machinelearning_big_data
WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research
Propose a three-stage processing pipeline for filtering noisy data and generating high-quality captions, where ChatGPT.
Конвейер обработки для фильтрации зашумленных данных и создания высококачественных титров.
🖥 Github: https://github.com/xinhaomei/wavcaps
⏩ Paper: https://arxiv.org/abs/2303.17395v1
💨 Dataset: https://paperswithcode.com/dataset/sounddescs
ai_machinelearning_big_data
3D Line Mapping Revisited
LIMAP is a toolbox for mapping and localization with line features.
Интерфейсы для различных геометрических операций над 2D/3D линиями.
🖥 Github: https://github.com/cvg/limap
⏩ Paper: https://arxiv.org/abs/2303.17504v1
💨 Dataset: https://paperswithcode.com/dataset/hypersim
ai_machinelearning_big_data
DPF: Learning Dense Prediction Fields with Weak Supervision
🖥 Github: https://github.com/cxx226/dpf
⏩ Paper: https://arxiv.org/abs/2303.16890v1
💨 Dataset: https://paperswithcode.com/dataset/pascal-context
ai_machinelearning_big_data
AutoAD: Movie Description in Context
MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Descriptions.
MAD - это масштабный набор данных, собранный из аудиоописаний фильмов.
🖥 Github: https://github.com/Soldelli/MAD
⏩ Paper: https://arxiv.org/abs/2303.16899v1
💨 Dataset: https://paperswithcode.com/dataset/lsmdc
ai_machinelearning_big_data
One-Stage 3D Whole-Body Mesh Recovery with Component Aware Transformer
🖥 Github: https://github.com/IDEA-Research/OSX
⏩ Paper: http://arxiv.org/abs/2303.16160
⭐️ Project: https://osx-ubody.github.io/
💨 Dataset: https://paperswithcode.com/dataset/expose
ai_machinelearning_big_data
⛹️♂️ SportsMOT: A Large Multi-Object Tracking Dataset in Multiple Sports Scenes
A Large-Scale Multi-Object Tracking Dataset in Sports Scenes.
Новый крупный набор данных многообъектного отслеживания в различных видах спорта, собранных для трех видов спорта - баскетбола, волейбола и футбола.
🖥 Github: https://github.com/MCG-NJU/SportsMOT/tree/main/codes
⏩ Paper: https://arxiv.org/abs/2304.05170v1
⭐️ Dataset: https://paperswithcode.com/dataset/sportsmot
ai_machinelearning_big_data
⚜️ OpenAGI: When LLM Meets Domain Experts
Reinforcement Learning from Task Feedback (RLTF) mechanism, which uses the task-solving result as feedback to improve the LLM's task-solving ability
OpenAGI - исследовательская платформа AGI с открытым исходным кодом, специально разработанная для решения сложных, многоэтапных задач и сопровождаемая наборами данных по конкретным задачам, метриками оценки и разнообразным набором моделей.git clone https://github.com/agiresearch/OpenAGI.git
🖥 Github: https://github.com/agiresearch/openagi
⏩ Paper: https://arxiv.org/pdf/2304.04370.pdf
⭐️ Dataset: https://drive.google.com/drive/folders/1AjT6y7qLIMxcmHhUBG5IE1_5SnCPR57e?usp=share_link
ai_machinelearning_big_data
DiffMimic: Efficient Motion Mimicking with Differentiable Physics
Utilizing differentiable physics simulators (DPS), DiffMimic simplifies policy learning into a state matching problem, providing faster and more stable convergence than reinforcement learning-based techniques.
В данном фреймворке используются дифференцируемые физические симуляторы (DPS) и предлагается эффективный метод имитации движения, получивший название DiffMim.
🖥 Github: https://github.com/jiawei-ren/diffmimic
⏩ Paper: https://arxiv.org/abs/2304.03274v1
⏩ Project: https://diffmimic.github.io/
⭐️ Demo: https://diffmimic-demo-main-g7h0i8.streamlit.app/
⭐️ Video: https://youtu.be/B0unbsvGsLc
ai_machinelearning_big_data
Хотите быстро и эффективно погрузиться в мир искусственного интеллекта? Опыт программирования не важен!🤖
Всего за 3 вечера, под руководством наших экспертов в области ИИ, вы напишите 9 нейросетей и поймете как применить их на практике!👨💻
Какие нейронные сети вы создадите?
▫️Классификация людей на входящих и выходящих из автобуса
▫️Обнаружение возгораний
▫️Оценка стоимости квартир
▫️Оценка резюме соискателей
▫️Прогнозирование стоимости полиметаллов
▫️Сегментация изображений самолетов
▫️Распознавание команд умного дома
Наш интенсив идеально подходит для начинающих в области ИИ, а также для тех, кто хочет обновить свои знания и узнать о последних тенденциях.
Приходите на бесплатное обучение и напишите искусственный интеллект за 3 вечера💪
Регистрация по ссылке
🔥 Что такое согласованность данных и почему с ней все так сложно
Понятие согласованности данных сложное, неоднозначное и включает в себя широкий спектр определений, лишь частично совпадающих друг с другом. Команда VK Cloud перевела статью, в которой автор определяет термин «согласованность» в области распределенных БД и рассуждает на тему этой самой согласованности.
ai_machinelearning_big_data
Компьютерное зрение — технология, которая превращает настоящее в будущее. Уже сейчас ИИ с нами каждый день — направляет роботов-пылесосов и снимает блокировку телефона по FaceID. А в ближайшие 20 лет, по прогнозам экспертов, мы сможем легко купить себе беспилотный автомобиль, прокатиться на поезде без машиниста или получить диагноз от ИИ в районной больнице.
Если у вас есть опыт в Data Science — научитесь обучать CV-модели и работайте с передовыми технологиями. Для этого Яндекс Практикум запускает курс «Компьютерное зрение на базе нейронных сетей».
В программе — «три кита» компьютерного зрения: классификация, детекция и сегментация. За 3 месяца вы обучите модели, которые умеют:
— определять границы и сетку для пазла Судоку,
— узнавать настроение человека по фотографии;
— выявлять элементы дорожного движения для беспилотного автомобиля.
— сегментировать спутниковые снимки, чтобы определять местоположение объекта.
Вы освоите полный цикл работы с CV-моделями с нуля до релиза. А ещё — будете учиться у наставников — экспертов в области компьютерного зрения.
Записывайтесь в первый поток и работайте над технологиями, о которых писали фантасты.
WeakTr: Exploring Plain Vision Transformer for Weakly-supervised Semantic Segmentation
🖥 Github: https://github.com/hustvl/weaktr
⏩ Paper: https://arxiv.org/abs/2304.01184v1
💨 Dataset: https://paperswithcode.com/dataset/imagenet
ai_machinelearning_big_data
⭐️ HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace
Language serves as an interface for LLMs to connect numerous AI models for solving complicated AI tasks!
Система, использующая LLM (например, ChatGPT) для подключения различных моделей ИИ в сообществах машинного обучения (например, HuggingFace) для решения задач ИИ.
🖥 Github: https://github.com/microsoft/JARVIS
⏩ Paper: https://arxiv.org/abs/2303.17604v1
ai_machinelearning_big_data
Пока вы тренируете ИИ, чтобы совершенствовать навыки, развивать науку, создать стартапы, другие тренируют его, чтобы украсть ваши идеи, код, криптоактивы, деньги со счетов - выкрасть все, что имеет хоть какую-либо ценность.
Или вы думаете, что ребята из Северной Кореи тренируют ИИ, чтобы он про Ким Чен Ыну оды писал? На даркнет площадках уже вовсю идет работа по использованию ИИ в сложных атаках на простых пользователей.
Ваша задача не только заработать, но и не потерять. Удивительно, но ИИ, который используется злоумышленниками, можно использовать и для защиты данных. Мы будем говорить обо всем этом на CyberWeekend, с 5 по 15 апреля. И мы ждем тебя, мероприятие бесплатное, подписывайся на канал и будь в курсе событий.
Ищем учеников на бесплатное обучение по созданию искусственного интеллекта с нуля. Опыт программирования не важен!🤖
Всего за 3 вечера под руководством Дмитрия Романова - основателя Университета Искусственного Интеллекта, лидера обучения AI-разработке в РФ, вы с легкостью напишете свой первый искусственный интеллект👨💻
Какие нейронные сети вы создадите?
▫️Классификация людей на входящих и выходящих из автобуса
▫️Обнаружение возгораний
▫️Оценка стоимости квартир
▫️Оценка резюме соискателей
▫️Прогнозирование стоимости полиметаллов
▫️Сегментация изображений самолетов
▫️Распознавание команд умного дома⠀
Лучше освоить навыки создания нейронных сетей вам помогут домашние задания с проверкой от кураторов.⠀
Приходите на бесплатное обучение и напишите искусственный интеллект за 3 вечера💪
Регистрация по ссылке
⚠️Пройдите тест на углубленные знания в сфере Machine Learning
🔓 Вырвитесь из однотипных задач. Освойте продвинутые подходы.
Ответьте на 10 вопросов и проверьте, насколько вы готовы к обучению на углубленном курсе - «Machine Learning. Advanced» от OTUS и его партнера — Сбера.
⏰ Время прохождения теста ограничено 30 минут
📌 РЕЗУЛЬТАТ ПРОХОЖДЕНИЯ КУРСА:
Вы освоите продвинутые приемы машинного обучения, которые позволят вам уверенно себя чувствовать на ведущих Middle/ Senior позициях и справляться даже с нестандартными задачами.
Протестируйте обучение на открытом уроке:
✅ Байесовское А/B-тестирование — https://otus.pw/peDS/
🖌ПРОЙТИ ТЕСТ:
https://otus.pw/dXVx/
Системная и бизнес-аналитика: чем занимаются специалисты этого направления в банке? Узнаешь на лекции Digital Лектория Газпромбанк.Тех.
Александр Чунаев, Head профессии по системному анализу в розничном блоке, расскажет:
— чем уникальна работа системного и бизнес-аналитика в крупной компании
— какие компетенции и навыки необходимы востребованным специалистам
— что из терминологии и инструментов аналитики является основным стеком бизнес-аналитиков
— как выглядит карьерный путь в сфере аналитики.
Когда: 7 апреля, 16:00 (по МСК)
Регистрируйся на вебинар — s.gpb.ru/m/xt9YoS5DI
И готовь вопросы спикеру: авторы трех самых интересных получат памятный приз от Газпромбанк.Тех!
🔉 Три темы, которые затронут на апрельском Дзен-митапе про рекомендательные системы:
1. Факторизация: как обучить её в реальном времени и перенести с ALS на SGD;
2. Как сэкономить вычислительные ресурсы во время обучения рекомендательных систем;
3. Как улучшить рекомендации и способы отбора кандидатов для пользователя.
После докладов участников ждут ML-квиз и афтепати, на котором можно будет познакомиться с единомышленниками. Митап начнется 13 апреля в 19:00 в московском офисе Дзена.
Переходите по ссылке и регистрируйтесь
Intern Meetup Week в Яндексе 🎉
С 17 по 20 апреля в Яндексе пройдёт неделя митапов для начинающих разработчиков. Будет доступен офлайн и онлайн формат.
19 апреля состоится митап для направлений ML и аналитика.
Регистрация по ссылке: https://clck.ru/33qW5b
В программе лекции экспертов о технологиях, общение с руководителями команд и рекрутерами, нетворкинг и подарки.
При отборе на митапы у вас есть шанс получить приглашение на пробное собеседование на стажировку в Яндекс 🔥
📆Когда: 19 апреля 18:00 - 21:30, сбор гостей с 17:30
🌐Где: офис Яндекса, ул. Льва Толстого, 16, м.Парк Культуры и трансляция онлайн
Все подробности и регистрация по ссылке: https://clck.ru/33qW5b
А чтобы быть в курсе всех новостей Young&&Yandex, подписывайтесь на чат-бот.
Ищем учеников на бесплатное обучение по созданию искусственного интеллекта с нуля. Опыт программирования не важен!🤖
Всего за 3 вечера под руководством Дмитрия Романова - основателя Университета Искусственного Интеллекта, лидера обучения AI-разработке в РФ, вы с легкостью напишете свой первый искусственный интеллект👨💻
Какие нейронные сети вы создадите?
▫️Классификация людей на входящих и выходящих из автобуса
▫️Обнаружение возгораний
▫️Оценка стоимости квартир
▫️Оценка резюме соискателей
▫️Прогнозирование стоимости полиметаллов
▫️Сегментация изображений самолетов
▫️Распознавание команд умного дома⠀
Лучше освоить навыки создания нейронных сетей вам помогут домашние задания с проверкой от кураторов.⠀
Приходите на бесплатное обучение и напишите искусственный интеллект за 3 вечера💪
Регистрация по ссылке