Ultra fast ControlNet with 🧨 Diffusers
ControlNet provides a minimal interface allowing users to customize the generation process up to a great extent.
Новый пайплайн StableDiffusionControlNetPipeline, в статье показано, как его можно применять для различных задач. Давайте контролировать!
🤗 Hugging face blog: https://huggingface.co/blog/controlnet
🖥 Colab: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/controlnet.ipynb
🖥 Github: https://github.com/lllyasviel/ControlNet
⏩ Paprer: https://arxiv.org/abs/2302.05543
@ai_machinelearning_big_data
⭐️ SplineCam: Exact Visualization and Characterization of Deep Network Geometry and Decision Boundaries, CVPR 2023
Exact method for computing partitions of a Deep Neural Network
🖥 Github: http://github.com/AhmedImtiazPrio/SplineCAM
🖥 Colab: https://bit.ly/splinecam-demo
⏩ Paper: http://arxiv.org/pdf/2302.12828.pdf
⭐️ Project: http://imtiazhumayun.github.io/splinecam
ai_machinelearning_big_data
🖥 pyribs: A Bare-Bones Python Library for Quality Diversity Optimization
A bare-bones Python library for quality diversity optimization.
🖥 Github: https://github.com/wjn1996/hugnlp
⏩ Paper: https://arxiv.org/abs/2303.00191v1
⭐️ Dataset: https://paperswithcode.com/dataset/quality-diversity-benchmark-suite
@ai_machinelearning_big_data
😊 HugNLP
HugNLP is a unified and comprehensive NLP library based on HuggingFace Transformer.
HugNLP — это новая универсальная NLP библиотека основанная на Hugging Face, для повышения удобства и эффективности работы c текстами.
🖥 Github: https://github.com/wjn1996/hugnlp
⏩ Paprer: https://arxiv.org/abs/2302.14286v1
⭐️ Dataset: https://paperswithcode.com/dataset/clue
⏩ HF for complex text classification: https://huggingface.co/blog/classification-use-cases
@ai_machinelearning_big_data
В @Selectel появились новые конфигурации выделенных серверов с GPU для Machine Learning, инференса и других задач, связанных с обработкой больших данных. Вы можете арендовать одну из готовых конфигураций или собрать собственную: например, с NVMe-дисками, большим объемом памяти, несколькими видеокартами или сетевой картой 10 Гбит/с — под любые требования вашего проекта.
На все проекты в аккаунте вы получаете бесплатный безлимитный канал 1 Гбит/c. Серверы по умолчанию соответствуют стандартам 152-ФЗ — российского закона о персональных данных.
Вы можете арендовать сервер даже на день, чтобы протестировать все возможности GPU, но при долгосрочной аренде на 3, 6 и 12 месяцев действуют скидки до 15%. Чтобы заказать сервер, достаточно сделать пару кликов в удобной панели — и никакого установочного платежа.
Регистрируйтесь по ссылке и заказывайте выделенный сервер c GPU: https://slc.tl/vhka6
Реклама ООО Селектел Pb3XmBtzsznTqpXrcbeF5CSCByyCeyTAiAcCx6U
💡 The ChatGPT Cheat Sheet
Подробная шпаргалка по работе с ChatGpt.
💨 Cheat Sheet
ai_machinelearning_big_data
Какими навыками должен обладать IT-архитектор — специалист, отвечающий за проектирование функциональных частей продукта? Расскажет Владимир Григорьев, Архитектор стрима «Розничный Миддл», на ближайшей лекции Digital Лектория Газпромбанка.
Когда: 2 марта, 18:00 (по МСК)
О чем: об истории и причинах появления специальности ИТ-архитектора, разных видах специалистов и требованиях к ним, рабочих задачах и организации работы, а также роли ИТ-архитекторов в Газпромбанке.
Присоединяйся к лекции, чтобы узнать больше о профессии IT-архитектора. Регистрация открыта: https://www.gpbspace.ru/digital-lectory-hall-form/
Video Localized Narratives
Video Localized Narratives, a new form of multimodal video annotations connecting vision and language.
Новая модель от Google позволяет генерировать аннотации к видео, фиксируя даже сложные события.
Авторы уже аннотировали 20 тыс. видео из датасетов OVIS, UVO и Oops, в общей сложности 1,7 млн. слов.
🖥 Github: https://github.com/google/video-localized-narratives
⭐️Paper: https://arxiv.org/abs/2302.11217v1
⏩ Project: https://www.youtube.com/watch?v=0ORZvDDbDjA
💻 Dataset : https://paperswithcode.com/dataset/video-localized-narratives
ai_machinelearning_big_data
💨 3D Object Tracking
Multi-modality tracker that fuses information from visual appearance and geometry to estimate object poses.
Список алгоритмов по отслеживанию 3D-объектов.
🖥 Github: https://github.com/dlr-rm/3dobjecttracking
⭐️Paper: https://arxiv.org/abs/2302.11458v1
⏩ Video: https://www.youtube.com/watch?v=0ORZvDDbDjA
💻 Dataset : https://paperswithcode.com/dataset/ycb-video
ai_machinelearning_big_data
🔍 A meta-dataset for few-shot image classification
Meta Album is a meta-dataset created for few-shot learning, meta-learning, continual learning and so on.
Meta-datase — это набор метаданных, созданный , состоящий из 40 датасетов разбитых на 10 уникальных категорий. Это постоянно пополняемый набор метаданных.
⭐️ Meta-dataset: https://meta-album.github.io/
🖥 Github: https://github.com/ihsaan-ullah/meta-album
⭐️Paper: https://arxiv.org/abs/2302.08909v1
ai_machinelearning_big_data
Работать там, где живешь, а не жить там, где работаешь?
Да, и мы в Тинькофф поддерживаем такой формат работы. Поэтому открыли свои центры разработки не только в Москве, но и еще в 24 городах России, Беларуси, Армении и Казахстана.
Для нашей команды эти распределенные IT-хабы — возможность выбирать комфортный город для работы. Не переезжать в столицу, чтобы делать флагманские продукты, а создавать их там, где удобно. Или не оставаться на одном месте, а свободно перемещаться между офисами — встречаться и работать с коллегами по всей стране!
Посмотреть открытые вакансии в наши центры разработки и оставить резюме можно на этой странице: https://l.tinkoff.ru/tcr-2023-tinkoff
🚀 Slapo: A Schedule Language for Large Model Training
Slapo is a schedule language for progressive optimization of large deep learning model training.
Slapo позволяет использовать набор примитивов на PyTorch, запуская их по расписанию, для оптимизации обучения без изменения самой модели.
🚀 Мощная оптимизация.pip3 install slapo
🖥 Github: https://github.com/awslabs/slapo
⭐️Paper: https://arxiv.org/abs/2302.08005v1
💻 Docs: https://awslabs.github.io/slapo/
ai_machinelearning_big_data
Ежегодная серия соревнований по машинному обучению Data Fusion Contest 2023 открыта!
Вас ждут две задачи в уникальном турнирном соревновании от команд ВТБ и ODS.AI:
🗡 В задаче Атака участники будут создавать атаки на нейросеть, обученную на транзакционных данных.
🛡 В задаче Защита — наоборот, учиться защищать свои модели от заранее оговоренного вида атак.
🏆 Призеров определит турнир — лучшие команды обеих задач столкнутся друг с другом за призовой фонд в 2,000,000 рублей!
💪 Участников также ждет много мерча, онлайн митапы с воркшопами, и возможность фундаментально прокачаться в новых DS/ML методах.
Подробности и регистрация — на сайте.
Совместная магистерская программа «Науки о данных» Университета науки и технологий МИСИС и СберОбразования позволит освоить востребованную профессию Data Scientist начинающим специалистам, интересующимся Big Data, а также тем, кто уже имеет опыт работы с данными, но хочет углубить свои знания в этой сфере 🧑💻
Обучение будет проходить в онлайн-формате, что позволит совмещать учебу и работу. Вы получите все преимущества очной формы обучения – диплом государственного образца, общежитие, проездной и др.Образовательный процесс будет отслеживать команда методистов, преподавателей и тьюторов с опытом организации обучения в Data Science более 3 лет.
Эксперты из крупнейших IT-компаний России поделятся с вами наработанным опытом – вы получите нужные знания и навыки в программировании, математике, машинном и «глубоком» обучении. А в третьем семестре сможете выбрать трек для более узкой специализации – Artificial Intelligence Developer, Big Data Engineer, Machine Learning Developer.
Подробнее о программе 📌
🌐 Как организовать работу над ML-экспериментами с помощью MLflow
MLOps — набор практик и инструментов, которые помогают стандартизировать и повысить эффективность процессов работы с машинным обучением. Эксперты VK Cloud и Karpov.Courses выпустили на Хабре полезную статью, где показали последовательность действий по выстраиванию MLOps-подхода в облаке с помощью JupyterHub и MLflow. Подробнее тут.
ai_machinelearning_big_data
🧬 Примите участие в международной конференции Data Fusion 2023 от ВТБ, которая пройдёт 13-14 апреля.
Конференция будет полезна разработчикам и специалистам в области Data Science, CDO, бизнес-заказчикам DS-продуктов и сервисов, представителям государства и науки.
Первый день конференции будет посвящен аспектам управления данными, практикам перехода на доверенные технологии, доступности дата-сетов для ИИ и другим темам, актуальным для CDO и руководителей бизнес-подразделений.
Программа 14 апреля адресована data science специалистам и исследователям. Темы докладов и сессий распределены по трем стримам: «ML+», «AI Classic», «ML Environment».
На конференции представят новейшие технологии и инструменты, а также будут проведены практические сессии и выступления ведущих предприятий. Не пропустите возможность улучшить свои навыки и расширить свои знания в области Data Science.
Участие в конференции бесплатное. Успейте зарегистрироваться по ссылке: https://cnrlink.com/datafusion1
⭐️ Dropout Reduces Underfitting from Meta
Early dropout helps underfitting models fit the data better and achieve lower training loss. Late dropout helps improve the generalization performance of overfitting models.
Early dropout (ранний отсев) помогает подгонять недообученные модели и достигать меньших потерь при обучении. Late dropout (поздний отсев) помогает улучшить производительность моделей и решает проблему переобучения.
🖥 Github: https://github.com/facebookresearch/dropout
⏩ Paper: https://arxiv.org/abs/2303.01500v1
⭐️ Dataset: https://paperswithcode.com/dataset/oxford-102-flower
ai_machinelearning_big_data
🔥 Приглашаем на открытый урок углубленного курса «Machine Learning. Professional» в OTUS 9 марта в 18:00 мск — Рекомендательные системы на основе SVD алгоритма
✅ На занятии мы обсудим один из самых мощных алгоритмов классического ML для построения рекомендательных систем, основанный на сингулярном разложении матрицы. А после короткой теоретической части, вы примените его на практике.
Познакомитесь с задачей рекомендательных систем. Изучите подход на основе SVD разложения матрицы для построения рекомендательной системы. Примените его на практике.
🧑💻Кому подходит этот урок:
- IT-специалистам которые хотят освоить продвинутые методы ML и перейти в Data Science
- Дата-сайентистам, желающим углубиться в профессию
- Тем кто самостоятельно изучает Data Science и уже изучил основы ML
👉 Пройдите вступительный тест для участия в вебинаре
https://otus.pw/8LTCX/
👁 Deep Contextual Video Compression
A group-based offset diversity where the cross-group interaction is proposed for better context mining.
Официальная реализация Pytorch для нейронного сжатия видео и изображений.
🖥 Github: https://github.com/microsoft/dcvc
⭐️Paper: https://arxiv.org/abs/2302.14402v1
💻 Dataset : https://paperswithcode.com/dataset/vimeo90k-1
ai_machinelearning_big_data
📃OccDepth: A Depth-aware Method for 3D Semantic Occupancy Network
Maybe the first academic open work on stereo 3D SSC method with vision-only input.
Первый метод SSC под названием OccDepth, который использует неявную информацию из стереоизображений для восстановления трехмерных геометрических структур.
🖥 Github: https://github.com/megvii-research/occdepth
⭐️Paper: https://arxiv.org/abs/2302.13540v1
💻 Dataset : https://paperswithcode.com/dataset/nyuv2
ai_machinelearning_big_data
🌐 Как наладить технологии автоматического перевода в своём проекте?
В статье на Хабре Андрей Соколов из команды прикладных исследований ВКонтакте подробно и доступным языком рассказал о том, как они сделали свой переводчик для постов и сообщений в мессенджере. Материал будет полезен для тех, кто тоже хочет попробовать использовать и развернуть переводы у себя в проекте.
Для чтения статьи не потребуется специальный уровень знаний: в ней нет излишних технических подробностей. При этом в ней вы найдёте ссылки на полезные ресурсы и выдержки из интересных источников.
ai_machinelearning_big_data
📡 Learning Visual Representations via Language-Guided Sampling
New approach deviates from image-text contrastive learning by relying on pre-trained language models to guide the learning rather than minimize a cross-modal similarity.
Новый альтернативный подход к визуальному обучению: с использованием языкового сходства для выборки семантически схожих пар изображений.
🖥 Github: https://github.com/mbanani/lgssl
⭐️Paper: https://arxiv.org/abs/2302.12248v1
⏩Pre-trained Checkpoints: https://www.dropbox.com/sh/me6nyiewlux1yh8/AAAPrD2G0_q_ZwExsVOS_jHQa?dl=0
💻 Dataset : https://paperswithcode.com/dataset/redcaps
ai_machinelearning_big_data
🔥 Загляните вглубь алгоритма k Nearest Neighbours и попробуйте его на практике! 1 марта в 18:00 мск пройдет вебинар в рамках онлайн-курса «Machine Learning. Professional» в OTUS.
Тема урока: «Мы похожи на свое окружение: алгоритм k Nearest Neighbours для задачи классификации» — https://otus.pw/wyLh/
✅ На занятии мы поговорим о задаче классификации, крайне востребованном классе задач в области ML сегодня. Мы изучим алгоритм kNN для ее решения, а затем применим его на практике.
В результате урока мы:
- Познакомимся с популярным алгоритмом машинного обучения kNN
- Узнаем, как устроен алгоритм kNN
- Освоим принципы решения задачи классификации с помощью kNN
⚠️ Урок будет полезен IT-специалистам, которые хотят освоить продвинутые методы ML и перейти в Data Science. Продолжить обучение на курсе возможно в рассрочку.
👉 Пройдите вступительный тест для участия в вебинаре
https://otus.pw/wyLh/
27 марта NewProLab запускает 12-й обновленный поток интенсивной онлайн-программы Data Engineer для быстрого старта в дата-инжиниринге и погружения в новые практики и инструменты
📌Кому подойдет программа:
дата-инженеры, аналитики данных, бэкенд-разработчики, техлиды и менеджеры
📌Длительность 8 недель (27 марта – 26 мая):
- 20 занятий с преподавателями в зуме
- 6 лабораторных работ - задач с реальными данными
- общий чат с участниками и поддержка координатора
📌Что дает программа:
1) научитесь решать типичные задачи DE и сможете работать дата-инженером
2) структурируете ваши знания и познакомитесь с новыми инструментами
3) поработаете с облачным кластером для решения лаб с реальными данными
4) видеозаписи и другие материалы программы останутся у вас навсегда
📌Лабы, которые предстоит выполнить:
1) Подготовка инфраструктуры
2) Batch-обработка
3) Потоковая обработка данных
4) Data-сервис
5) Сервис персонализации
6) Хранилище для BI-дашборда
📌Преподаватели – практики из ведущих компаний России и мира, рассказывают о сложном простым языком и ответят на все ваши вопросы
Оставляйте заявки по ссылке: https://clck.ru/33cDTa
📌По промокоду birthday23 вы получите скидку 23% при покупке программы
🔍 Planar Object Tracking via Weighted Optical Flow
Method for planar object 8 degrees-of-freedom pose.
WOFT - новый невероятно точный метод отслеживания объектов.
⭐️ Project: https://cmp.felk.cvut.cz/~serycjon/WOFT/
🖥 Github: https://github.com/serycjon/WOFT
⭐️Paper: arxiv.org/pdf/2301.10057.pdf
💻 Dataset : https://www3.cs.stonybrook.edu/~hling/data/POT-210/planar_benchmark.html
ai_machinelearning_big_data
💠 MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation
MultiDiffusion - модель, позволяющая создавать любые изображения, используя предварительно обученную модель диффузии текста в изображение, без дополнительного обучения и настройки.
⭐️ Project: https://multidiffusion.github.io/
🖥 Github: https://github.com/omerbt/MultiDiffusion
⭐️Paper: https://arxiv.org/abs/2302.08113v1
💻 Dataset: https://paperswithcode.com/dataset/coco
ai_machinelearning_big_data
👁 EdgeYOLO: An Edge-Real-Time Object Detector
EdgeYOLO reaches 34FPS with 50.6% AP in COCO2017 dataset and 25.9% AP in VisDrone2019 (image input size is 640x640, batch=16, post-process included).
Новый детектор обнаружения небольших объектов с высокой точностью, не требующий больших вычислительных мощностей.
🖥 Github: https://github.com/lsh9832/edgeyolo
⭐️Paper: https://arxiv.org/abs/2302.07483v1
⭐️ Weights: https://github.com/LSH9832/edgeyolo/releases/tag/v0.0.0
💻 Dataset: https://paperswithcode.com/dataset/visdrone
ai_machinelearning_big_data
3D-aware Conditional Image Synthesis (pix2pix3D)
Model synthesizes a 3d photo from different viewpoints.
3D генеративная модель для управляемого синтеза фотореалистичных изображений.
🖥 Github: https://github.com/dunbar12138/pix2pix3D
⭐️ Project: https://huggingface.co/TencentARC/T2I-Adapter
⭐️Paper: https://arxiv.org/abs/2302.08509
💻 Dataset: https://paperswithcode.com/dataset/coco
ai_machinelearning_big_data
T2I-Adapter
Network that can provide extra guidance to pre-trained text-to-image models while freezing the original large text-to-image models.
T2I-Adapter набор aдаптеров для диффузионных моделей(~ 70 млн параметров ).Подходит для широкого спектра задач text-to-image, генерация скетчей, редактирование изображений по тексту, объединение нескольких адаптеров вместе и многое другое.
🖥 Github: https://github.com/TencentARC/T2I-Adapter
🤗 Hugging Face: https://huggingface.co/TencentARC/T2I-Adapter
⭐️Paper: https://arxiv.org/abs/2302.08453v1
💻 Dataset: https://paperswithcode.com/dataset/coco
ai_machinelearning_big_data
↪️ Zero-shot image-to-text generation with BLIP-2
The model bridges the gap between vision and natural language modalities by adding a transformer between pre-trained models.
BLIP-2 — это новая модель визуального языка, которую можно использовать для нескольких задач преобразования изображения в текст. Это эффективный подход, который можно применять для получения качественных промптов.
💨 Hugging Face: https://huggingface.co/blog/blip-2
💻 Demo: https://huggingface.co/spaces/Salesforce/BLIP2
🖥 Github: https://github.com/salesforce/LAVIS
⭐️Paper: https://arxiv.org/abs/2301.12597
ai_machinelearning_big_data