⏩ PODA: Prompt-driven Zero-shot Domain Adaptation
DR: PODA — это простой метод аугментация признаков, управляемый одним текстовым описанием.
🖥 Github: https://github.com/astra-vision/poda
⏩ Paprer: https://arxiv.org/abs/2212.03241v1
❤️ Pretrainde model: https://drive.google.com/drive/folders/15-NhVItiVbplg_If3HJibokJssu1NoxL?usp=share_link
⭐️ Dataset: https://paperswithcode.com/dataset/cityscapes
@ai_machinelearning_big_data
⭐️ Robust Point Cloud Segmentation with Noisy Annotations
A point-wise confidence selection to obtain reliable labels from the historical predictions of each point.
🖥 Github: https://github.com/pleaseconnectwifi/PNAL
🌐 Project: https://shuquanye.com/PNAL_website/
⏩ Paprer: https://arxiv.org/abs/2212.03242v1
⭐️ Dataset: https://paperswithcode.com/dataset/scannet
@ai_machinelearning_big_data
✔️ L2SR: Learning to Sample and Reconstruct for Accelerated MRI
fastMRI — это совместный исследовательский проект Facebook AI Research (FAIR) и NYU Langone Health, целью которого является изучение использования ИИ для ускорения МРТ-сканирования. NYU Langone Health выпустила полностью анонимные наборы данных МРТ.
🖥 Github: https://github.com/facebookresearch/fastMRI
❤️ Website: https://fastmri.org/
⏩ Paprer: https://arxiv.org/abs/2211.16799v1
⭐️ Dataset: https://fastmri.med.nyu.edu/
@ai_machinelearning_big_data
⭐️ Zero-Shot Image Restoration Using Denoising Diffusion Null-Space Model
DDNM может решать различные задачи по восстановлению изображений без какой-либо оптимизации и тонкой настройки!git clone https://github.com/wyhuai/DDNM.git
🖥 Github: https://github.com/wyhuai/ddnm
❤️ Project: https://wyhuai.github.io/ddnm.io/
⏩ Paprer: https://arxiv.org/abs/2212.00490v1
⭐️ Datasets: https://paperswithcode.com/dataset/div2k
@ai_machinelearning_big_data
⭐️ MixVoxels: Mixed Neural Voxels for Fast Multi-view Video Synthesis
MixVoxels позволяет генерировать динамические 4D-сцены как смесь статических и динамических вокселей и позволяет обрабатывать их с помощью различных сетей.
🖥 Github: https://github.com/fengres/mixvoxels
⏩ Paprer: https://arxiv.org/pdf/2212.00190.pdf
✅️Project: https://fengres.github.io/mixvoxels/
⭐️ Datasets: https://github.com/facebookresearch/Neural_3D_Video
@ai_machinelearning_big_data
🟡 OpenAI открыла API обновленной модели Davinci на базе GPT-3
Новая версия Davinci — text-davinci-003 — получила высокие оценки пользователей в решении логических задач, прописывании мотивации персонажей, стилизации текста для конкретной аудитории и создании креативного контента. Davinci хорошо понимает смысл текста и успешно решает задачи, связанные с поиском причинно-следственных связей.
➡️ Beta
➡️ Video
➡️ Paper
@ai_machinelearning_big_data
➕ Interactive Visual Feature Search
Interactive Visual Feature Search, новая интерактивную визуализацию, которую можно применнить для любой CNN. Инструмент позволяет выделять область изображения и искать изображения из данного набора данных с наиболее похожими формами.
🖥 Github: https://github.com/lookingglasslab/visualfeaturesearch
🗒 Paper: https://arxiv.org/abs/2211.15060v1
⭐️ Dataset: https://paperswithcode.com/dataset/imagenet-sketch
🔩 Demo: https://colab.research.google.com/github/lookingglasslab/VisualFeatureSearch/blob/main/notebooks/Interactive_Visual_Feature_Search_Basic_Demo.ipynb
@ai_machinelearning_big_data
⭐️ Cleanlab
cleanlab автоматически находит и исправляет ошибки в любом наборе данных машинного обучения. Этот пакет искусственного интеллекта, облегчает работу с беспорядочными данными.
🖥 Github: https://github.com/cleanlab/cleanlab
👣 Docs: https://docs.cleanlab.ai/
📌 Examples: https://github.com/cleanlab/examples
⏩ Paprer: https://arxiv.org/abs/2211.13895v1
⭐️ Datasets: https://paperswithcode.com/dataset/celeba
@ai_machinelearning_big_data
✅ ADGC: Awesome Deep Graph Clustering
ADGC представляет собой набор (SOTA) методов кластеризации глубоких графов статьи, код и наборы данных).
🖥 Github: https://github.com/yueliu1999/awesome-deep-graph-clustering
⏩ Paprer: https://arxiv.org/abs/2211.12875v1
⭐️ Datasets: https://drive.google.com/drive/folders/1thSxtAexbvOyjx-bJre8D4OyFKsBe1bK?usp=sharing
@ai_machinelearning_big_data
🎨 Inversion-Based Creativity Transfer with Diffusion Models
Генеративная модель для создания выразительного арта. git clone https://github.com/zyxElsa/creativity-transfer.git
🖥 Github: https://github.com/zyxelsa/creativity-transfer
⏩ Paprer: https://arxiv.org/abs/2211.13203v1
⭐️ Pretrained model: https://huggingface.co/CompVis/stable-diffusion-v-1-4-original/resolve/main/sd-v1-4.ckpt
@ai_machinelearning_big_data
Яндекс назвал лауреатов своей ежегодной научной премии
Ученые, которые занимаются исследованиями в области компьютерных наук, получат по миллиону рублей на развитие своих проектов. В 2022 году лауреатами стали шесть молодых ученых:
•Максим Великанов — занимается теорией deep learning, изучает бесконечно широкие нейронные сети и статистическую физику;
•Петр Мокров — исследует градиентные потоки Вассерштейна, нелинейную фильтрацию и байесовскую логистическую регрессию;
•Максим Кодрян — занимается deep learning, а также оптимизацией и генерализацией нейросетевых моделей;
•Руслан Рахимов — работает с нейронной визуализацией, CV и deep learning;
•Сергей Самсонов — изучает алгоритмы Монте-Карло с марковскими цепями, стохастическую аппроксимацию и другие темы;
•Тарас Хахулин — работает в области компьютерного зрения.
Круто, что отдельно выделяют и научных руководителей. В этом году гранты получили двое — Дмитрий Ветров, заведующий Центром глубинного обучения и байесовских методов ВШЭ, и Алексей Наумов, доцент факультета компьютерных наук ВШЭ, заведующий Международной лаборатории стохастических алгоритмов и анализа многомерных данных.
Подробнее о премии и лауреатах 2022 года — на сайте.
Какие изменения произошли с библиотекой PyTorch-LifeStream за год?
Об этом рассказал Иван Киреев, исполнительный директор по исследованию данных в лаборатории по искусственному интеллекту Сбера во время международной конференции AI Journey.
Библиотека PyTorch-LifeStream нужна для построения нейронных сетей на событийных данных. В основном, изменилась структура библиотеки. Она была разбита на несколько модулей, благодаря чему в ней стало проще ориентироваться. Также изменилась система конфигурирования, появилось больше примеров использования библиотеки.
Всего в структуре библиотеки на текущий момент четыре блока:
1. Перепроцессинг данных
2. Загрузка
3. Набор слоёв
4. Набор фреймворков обучения
Что касается конфигурации, то была подключена Hydra. Все конфигурации хранятся в yaml-файлах, которые удобно редактировать.
Крупнейшие игроки российского технологического рынка присоединяются к Кодексу этики в сфере искусственного интеллекта. Свод правил разработал Альянс в сфере ИИ и обнародовал в рамках международной конференции по искусственному интеллекту AI Journey.
На конференции к Кодексу присоединились Datanа, Factory 5, ГК «GlobalTruck», ГеомирАгро, Цифровая платформа КАМАЗ, ГК Медси, Самолет, Сибур, Северсталь Менеджмент, РЖД, Русагро Технологии, Уралхим. Всего Кодекс поддержали 113 российских компаний и организаций.
«В нашем понимании развитие технологий ИИ в России должно ориентироваться исключительно на интересы человека, качество его жизни и благополучие. Именно на основе доверия граждан мы вместе с участниками Альянса и Кодекса этики продолжим создавать новую цифровую экосистему для технологического развития нашей страны», — так прокомментировал Кодекс зампред Правительства РФ Дмитрий Чернышенко.
🎨 Kandinsky 2.0
Kandinsky 2.0 — первая мультиязычная диффузия для генерации изображений по тексту
- два мультилингвальных текстовых энкодера, эмбеддинги которых конкатенируются
- больше UNet (1.2 млрд параметров)
- динамический трешхолдинг в процессе сэмплирования
🖥 Github
➡️ Habr статья
🖥 Demo
🤗 Model
@ai_machinelearning_big_data
🚀 Stable Diffusion web UI
UI на основе библиотеки Gradio для Stable Diffusion. Большое количество фич для генерации контента с удобным интерфейсом.
🖥 Github: https://github.com/AUTOMATIC1111/stable-diffusion-webui
⏩ Scripts: https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Custom-Scripts
⭐️ Features: https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features
@ai_machinelearning_big_data
DiffusionInst: Diffusion Model for Instance Segmentation
DiffusionInst — первый алгоритм диффузионной модели для сегментации объектов.
🖥 Github:https://github.com/chenhaoxing/DiffusionInst
🌐 Instruction: https://github.com/chenhaoxing/DiffusionInst/blob/main/GETTING_STARTED.md
⏩ Paprer: https://arxiv.org/abs/2212.02773v2
⭐️ Dataset: https://paperswithcode.com/dataset/lvis
@ai_machinelearning_big_data
🎶 Melody transcription via generative pre-training
Sheet Sage транскрибирует вашу любимую песню в лид-лист, содержащий ноты и аккорды!
🖥 Github: https://github.com/chrisdonahue/sheetsage
⏩ Paprer: https://arxiv.org/abs/2212.01884v1
⭐️ Dataset: https://www.hooktheory.com/theorytab
@ai_machinelearning_big_data
🅰️ Онлайн-конференция Alfa Digital Open от Альфа-Банка.
Там ждут не только тестировщиков, аналитиков, UX/UI-дизайнеров, маркетологов и коллег из диджитал-среды. Конференция будет интересна всем, кто интересуется технологиями и инновациями.
Спикеры из Альфы расскажут:
📊 Чем продвинутая аналитика помогает сервисам.
📱 Как изменилась мобильная разработка за этот год.
🤖 Какие чат-боты используют в Альфе и что за метрики для контроля помощников существуют у банка.
❤️ Как развивают внутренние приложения для сотрудников.
📅 13 декабря, 17:00
🌐 Score Jacobian Chaining: Lifting Pretrained 2D Diffusion Models for 3D Generation
Метод, который преобразует предварительно обученную 2D-генеративную модель диффузии на изображениях в 3D-генеративную модель, не требуя каких-либо 3D-данных. pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
🖥 Github: https://github.com/pals-ttic/sjc
⏩ Paprer: https://arxiv.org/abs/2212.00774v1
✅️Colab: https://colab.research.google.com/drive/1zixo66UYGl70VOPy053o7IV_YkQt5lCZ
@ai_machinelearning_big_data
🛠 BEVPoolv2: A Cutting-edge Implementation of BEVDet Toward Deployment
BEVPoolv2 модернизирeует процесс обработки данных с точки зрения инженерной оптимизации, уменьшая затраты как в аспектах вычислений, так и в аспектах хранения данных.
🖥 Github: https://github.com/HuangJunJie2017/BEVDet
⭐️ Dataset: https://github.com/HuangJunJie2017/BEVDet/blob/dev2.0/docs/en/datasets/nuscenes_det.md
🗒 Paper: https://arxiv.org/abs/2211.17111v1
🔩 Configs: https://github.com/HuangJunJie2017/BEVDet/blob/dev2.0/configs/bevdet/bevdet-r50.py
@ai_machinelearning_big_data
🖥 RecBole
RecBole разработан на основе Python и PyTorch для воспроизведения и разработки алгоритмов рекомендаций в единой, комплексной и эффективной структуре для исследовательских целей.pip install recbole
🖥 Github: https://github.com/RUCAIBox/RecBole
🗒 Paper: https://arxiv.org/abs/2211.15148v1
⭐️ Dataset: https://paperswithcode.com/dataset/movielens
🔩 Docs: https://recbole.io/docs/
@ai_machinelearning_big_data
✔️ Fast-SNARF: A Fast Deformer for Articulated Neural Fields
🖥 Github: https://github.com/xuchen-ethz/fast-snarf
🗒 Paper: https://arxiv.org/abs/2211.15601v1
➡️ Dataset: https://paperswithcode.com/dataset/amass
@ai_machinelearning_big_data
✅ Dense Interspecies Face Embedding
Face Embedding, который решает проблему крайних различий в форме между объектами на фото.
🖥 Github: https://github.com/kingsj0405/DIFE
👣 Project: https://yangspace.co.kr/dife/
⏩ Paprer: https://openreview.net/forum?id=m67FNFdgLO9
⭐️ Datasets: https://paperswithcode.com/dataset/lvis
@ai_machinelearning_big_data
✔️ Natural Language YouTube Searcher
Нейросеть, которая по заданной ссылку (на любом язык) не только покахывает кадр, который вы ищите, но и указывает на какой он секунде.
🖥 Colab
🖥 Github
❕ Open Ai Clip
@ai_machinelearning_big_data
👻 GhostNetV2: Enhance Cheap Operation with Long-Range Attention
Новая архитектура GhostNetV2 для мобильных приложений.
🖥 Github: https://github.com/leondgarse/keras_cv_attention_models
🖥 GhostNetV2: https://github.com/likyoo/GhostNetV2-PyTorch
⏩ Paprer: https://arxiv.org/abs/2211.12905v1
⭐️ Dataset: https://paperswithcode.com/dataset/ade20k
@ai_machinelearning_big_data
🖥 TorchScale - A Library for Transformers at (Any) Scale
TorchScale - набор инструментов с открытым исходным кодом, который позволяети разработчикам эффективно и действенно масштабировать Transformers. pip install torchscale
🖥 Github: https://github.com/microsoft/torchscale
⏩ Paprer: https://arxiv.org/abs/2211.13184v1
⭐️ Pypi: https://pypi.org/project/torchscale/
@ai_machinelearning_big_data
💨 SinDiffusion: Learning a Diffusion Model from a Single Natural Image
SinDiffusion значительно улучшает качество и разнообразие сгенерированных изображений по сравнению с существующими подходами на основе GAN.
🖥 Github: https://github.com/weilunwang/sindiffusion
➡️ Paper: https://arxiv.org/abs/2211.12445v1
📌 Project: https://github.com/WeilunWang/SinDiffusion/blob/main
➡️ Dataset: https://paperswithcode.com/dataset/places
@ai_machinelearning_big_data
🟥 StableDiffusion 2.0
- Новая модель, которая позволяет легко и быстро менять местами части изображения.
- Новые модели преобразования текста в изображение.
- Диффузионные модели со сверхвысоким разрешением.Повышает разрешение изображений в 4 раза.
- Обновленная модель отрисовки
🖥 GitHub
🚀 Demo
➡️ Read
▶️ Paint by Example
@ai_machinelearning_big_data
В AIRI создали модель на основе ДНК человека для решения задач по биоинформатике
Об этом рассказал директор по поисковым исследованиям AIRI Михаил Бурцев на международной конференции AI Journey. Он отметил, что сейчас наиболее важными прорывами будут те, которые связаны с языковыми моделями. В институте AIRI также начали исследования в этом направлении — модель GENA позволяет разбивать последовательности на кусочки, что увеличивает размер текста, который может попадать на вход. Для этого использовалась последняя сборка референсного генома человека.
Также институт AIRI разработал алгоритм MemUp, который позволяет решить задачу предсказания длинных последовательностей. Это память на основе предсказаний элементов с высокой неопределенностью.
На текущий момент модель основана на ДНК человека, но если добавить туда ДНК других видов, то модель не только сможет выучить, как устроено описание организма человека, но и описание других организмов. Например, обезьян, птиц, змей и так далее. В конечном итоге это позволит решить больше задач по биоинформатике.
🎶 ComMU: Dataset for Combinatorial Music Generation
Набор данных для генерации музыки различных жанров.
Набор данных содержит 11 144 MIDI-сэмплов, написанных и созданных профессиональными композиторами.
🖥 Github: https://github.com/POZAlabs/ComMU-code
⏩ Paper: https://arxiv.org/abs/2211.09385v1
🖥 Dataset: https://github.com/POZAlabs/ComMU-code/tree/master/dataset
🎧 Demo: https://pozalabs.github.io/ComMU/
🎼 MuseGAN: https://github.com/salu133445/musegan
@ai_machinelearning_big_data