👁 Detection Transformers with Assignment
Deformable-DETR превосходит все существующие традиционные детекторы на основе трансформеров.
🖥 Github: https://github.com/jozhang97/deta
📎 Installation: https://github.com/fundamentalvision/Deformable-DETR
⏩ Paprer: https://arxiv.org/abs/2212.06137v1
⭐️ Dataset: https://paperswithcode.com/dataset/lvis
@ai_machinelearning_big_data
⏩ SINE: SINgle Image Editing with Text-to-Image Diffusion Models
Модель диффузии для генерации контента всего лишь из одного изображения. git clone git@github.com:zhang-zx/SINE.git
🖥 Github: https://github.com/zhang-zx/sine
➡️ Project: https://zhang-zx.github.io/SINE/
⏩ Paprer: https://arxiv.org/abs/2212.04489
❤️ Colab: https://colab.research.google.com/github/zhang-zx/SINE/blob/master/SINE.ipynb
⭐️ Dataset: https://drive.google.com/drive/folders/1oD2gwMkR25BvaXobuCrDyOn0_xI-dlmF?usp=sharing
@ai_machinelearning_big_data
✅ Learning Video Representations from Large Language Models
Новая Модель отт мета, которая автоматичеси генерирует текстовое описание для видео.
🖥 Github: https://github.com/facebookresearch/lavila
💡 Demo: https://huggingface.co/spaces/nateraw/lavila
⏩ Paprer: http://arxiv.org/abs/2212.04501
❤️ Colab: https://colab.research.google.com/drive/1gHWiEWywIotRivYQTR-8NQ6GJC7sJUe4
⭐️ Dataset: https://paperswithcode.com/dataset/hmdb51
@ai_machinelearning_big_data
DiffusionInst: Diffusion Model for Instance Segmentation
DiffusionInst — первый алгоритм диффузионной модели для сегментации объектов.
🖥 Github:https://github.com/chenhaoxing/DiffusionInst
🌐 Instruction: https://github.com/chenhaoxing/DiffusionInst/blob/main/GETTING_STARTED.md
⏩ Paprer: https://arxiv.org/abs/2212.02773v2
⭐️ Dataset: https://paperswithcode.com/dataset/lvis
@ai_machinelearning_big_data
🎶 Melody transcription via generative pre-training
Sheet Sage транскрибирует вашу любимую песню в лид-лист, содержащий ноты и аккорды!
🖥 Github: https://github.com/chrisdonahue/sheetsage
⏩ Paprer: https://arxiv.org/abs/2212.01884v1
⭐️ Dataset: https://www.hooktheory.com/theorytab
@ai_machinelearning_big_data
🅰️ Онлайн-конференция Alfa Digital Open от Альфа-Банка.
Там ждут не только тестировщиков, аналитиков, UX/UI-дизайнеров, маркетологов и коллег из диджитал-среды. Конференция будет интересна всем, кто интересуется технологиями и инновациями.
Спикеры из Альфы расскажут:
📊 Чем продвинутая аналитика помогает сервисам.
📱 Как изменилась мобильная разработка за этот год.
🤖 Какие чат-боты используют в Альфе и что за метрики для контроля помощников существуют у банка.
❤️ Как развивают внутренние приложения для сотрудников.
📅 13 декабря, 17:00
🌐 Score Jacobian Chaining: Lifting Pretrained 2D Diffusion Models for 3D Generation
Метод, который преобразует предварительно обученную 2D-генеративную модель диффузии на изображениях в 3D-генеративную модель, не требуя каких-либо 3D-данных. pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
🖥 Github: https://github.com/pals-ttic/sjc
⏩ Paprer: https://arxiv.org/abs/2212.00774v1
✅️Colab: https://colab.research.google.com/drive/1zixo66UYGl70VOPy053o7IV_YkQt5lCZ
@ai_machinelearning_big_data
🛠 BEVPoolv2: A Cutting-edge Implementation of BEVDet Toward Deployment
BEVPoolv2 модернизирeует процесс обработки данных с точки зрения инженерной оптимизации, уменьшая затраты как в аспектах вычислений, так и в аспектах хранения данных.
🖥 Github: https://github.com/HuangJunJie2017/BEVDet
⭐️ Dataset: https://github.com/HuangJunJie2017/BEVDet/blob/dev2.0/docs/en/datasets/nuscenes_det.md
🗒 Paper: https://arxiv.org/abs/2211.17111v1
🔩 Configs: https://github.com/HuangJunJie2017/BEVDet/blob/dev2.0/configs/bevdet/bevdet-r50.py
@ai_machinelearning_big_data
🖥 RecBole
RecBole разработан на основе Python и PyTorch для воспроизведения и разработки алгоритмов рекомендаций в единой, комплексной и эффективной структуре для исследовательских целей.pip install recbole
🖥 Github: https://github.com/RUCAIBox/RecBole
🗒 Paper: https://arxiv.org/abs/2211.15148v1
⭐️ Dataset: https://paperswithcode.com/dataset/movielens
🔩 Docs: https://recbole.io/docs/
@ai_machinelearning_big_data
✔️ Fast-SNARF: A Fast Deformer for Articulated Neural Fields
🖥 Github: https://github.com/xuchen-ethz/fast-snarf
🗒 Paper: https://arxiv.org/abs/2211.15601v1
➡️ Dataset: https://paperswithcode.com/dataset/amass
@ai_machinelearning_big_data
✅ Dense Interspecies Face Embedding
Face Embedding, который решает проблему крайних различий в форме между объектами на фото.
🖥 Github: https://github.com/kingsj0405/DIFE
👣 Project: https://yangspace.co.kr/dife/
⏩ Paprer: https://openreview.net/forum?id=m67FNFdgLO9
⭐️ Datasets: https://paperswithcode.com/dataset/lvis
@ai_machinelearning_big_data
✔️ Natural Language YouTube Searcher
Нейросеть, которая по заданной ссылку (на любом язык) не только покахывает кадр, который вы ищите, но и указывает на какой он секунде.
🖥 Colab
🖥 Github
❕ Open Ai Clip
@ai_machinelearning_big_data
👻 GhostNetV2: Enhance Cheap Operation with Long-Range Attention
Новая архитектура GhostNetV2 для мобильных приложений.
🖥 Github: https://github.com/leondgarse/keras_cv_attention_models
🖥 GhostNetV2: https://github.com/likyoo/GhostNetV2-PyTorch
⏩ Paprer: https://arxiv.org/abs/2211.12905v1
⭐️ Dataset: https://paperswithcode.com/dataset/ade20k
@ai_machinelearning_big_data
🖥 TorchScale - A Library for Transformers at (Any) Scale
TorchScale - набор инструментов с открытым исходным кодом, который позволяети разработчикам эффективно и действенно масштабировать Transformers. pip install torchscale
🖥 Github: https://github.com/microsoft/torchscale
⏩ Paprer: https://arxiv.org/abs/2211.13184v1
⭐️ Pypi: https://pypi.org/project/torchscale/
@ai_machinelearning_big_data
💨 SinDiffusion: Learning a Diffusion Model from a Single Natural Image
SinDiffusion значительно улучшает качество и разнообразие сгенерированных изображений по сравнению с существующими подходами на основе GAN.
🖥 Github: https://github.com/weilunwang/sindiffusion
➡️ Paper: https://arxiv.org/abs/2211.12445v1
📌 Project: https://github.com/WeilunWang/SinDiffusion/blob/main
➡️ Dataset: https://paperswithcode.com/dataset/places
@ai_machinelearning_big_data
✅ pypop7 (Pure-PYthon library of POPulation-based black-box OPtimization)
Интерфейс для более чем 60 вариантов различных алгоритмов оптимизации.$ pip install pypop7
🖥 Github: https://github.com/evolutionary-intelligence/pypop
⏩ Paprer: https://arxiv.org/abs/2212.05652v1
⭐️ Derivative-Free Optimization (DFO): https://link.springer.com/article/10.1007/s10208-021-09513-z
@ai_machinelearning_big_data
🚀 evosax: JAX-based Evolution Strategies
QDax — это инструмент для ускорения алгоритмов Quality-Diversity (QD) и нейроэволюции.
🖥 Github: https://github.com/adaptive-intelligent-robotics/qdax
🎷 Evosax: https://github.com/RobertTLange/evosax
⏩ Paprer: https://arxiv.org/abs/2212.04180v1
🚀 Docs: https://qdax.readthedocs.io/en/latest/
❤️ Colab: https://colab.research.google.com/github/adaptive-intelligent-robotics/QDax/blob/main/examples/mapelites.ipynb
⭐️ Dataset: https://paperswithcode.com/dataset/brax
@ai_machinelearning_big_data
⏩ PODA: Prompt-driven Zero-shot Domain Adaptation
DR: PODA — это простой метод аугментация признаков, управляемый одним текстовым описанием.
🖥 Github: https://github.com/astra-vision/poda
⏩ Paprer: https://arxiv.org/abs/2212.03241v1
❤️ Pretrainde model: https://drive.google.com/drive/folders/15-NhVItiVbplg_If3HJibokJssu1NoxL?usp=share_link
⭐️ Dataset: https://paperswithcode.com/dataset/cityscapes
@ai_machinelearning_big_data
⭐️ Robust Point Cloud Segmentation with Noisy Annotations
A point-wise confidence selection to obtain reliable labels from the historical predictions of each point.
🖥 Github: https://github.com/pleaseconnectwifi/PNAL
🌐 Project: https://shuquanye.com/PNAL_website/
⏩ Paprer: https://arxiv.org/abs/2212.03242v1
⭐️ Dataset: https://paperswithcode.com/dataset/scannet
@ai_machinelearning_big_data
✔️ L2SR: Learning to Sample and Reconstruct for Accelerated MRI
fastMRI — это совместный исследовательский проект Facebook AI Research (FAIR) и NYU Langone Health, целью которого является изучение использования ИИ для ускорения МРТ-сканирования. NYU Langone Health выпустила полностью анонимные наборы данных МРТ.
🖥 Github: https://github.com/facebookresearch/fastMRI
❤️ Website: https://fastmri.org/
⏩ Paprer: https://arxiv.org/abs/2211.16799v1
⭐️ Dataset: https://fastmri.med.nyu.edu/
@ai_machinelearning_big_data
⭐️ Zero-Shot Image Restoration Using Denoising Diffusion Null-Space Model
DDNM может решать различные задачи по восстановлению изображений без какой-либо оптимизации и тонкой настройки!git clone https://github.com/wyhuai/DDNM.git
🖥 Github: https://github.com/wyhuai/ddnm
❤️ Project: https://wyhuai.github.io/ddnm.io/
⏩ Paprer: https://arxiv.org/abs/2212.00490v1
⭐️ Datasets: https://paperswithcode.com/dataset/div2k
@ai_machinelearning_big_data
⭐️ MixVoxels: Mixed Neural Voxels for Fast Multi-view Video Synthesis
MixVoxels позволяет генерировать динамические 4D-сцены как смесь статических и динамических вокселей и позволяет обрабатывать их с помощью различных сетей.
🖥 Github: https://github.com/fengres/mixvoxels
⏩ Paprer: https://arxiv.org/pdf/2212.00190.pdf
✅️Project: https://fengres.github.io/mixvoxels/
⭐️ Datasets: https://github.com/facebookresearch/Neural_3D_Video
@ai_machinelearning_big_data
🟡 OpenAI открыла API обновленной модели Davinci на базе GPT-3
Новая версия Davinci — text-davinci-003 — получила высокие оценки пользователей в решении логических задач, прописывании мотивации персонажей, стилизации текста для конкретной аудитории и создании креативного контента. Davinci хорошо понимает смысл текста и успешно решает задачи, связанные с поиском причинно-следственных связей.
➡️ Beta
➡️ Video
➡️ Paper
@ai_machinelearning_big_data
➕ Interactive Visual Feature Search
Interactive Visual Feature Search, новая интерактивную визуализацию, которую можно применнить для любой CNN. Инструмент позволяет выделять область изображения и искать изображения из данного набора данных с наиболее похожими формами.
🖥 Github: https://github.com/lookingglasslab/visualfeaturesearch
🗒 Paper: https://arxiv.org/abs/2211.15060v1
⭐️ Dataset: https://paperswithcode.com/dataset/imagenet-sketch
🔩 Demo: https://colab.research.google.com/github/lookingglasslab/VisualFeatureSearch/blob/main/notebooks/Interactive_Visual_Feature_Search_Basic_Demo.ipynb
@ai_machinelearning_big_data
⭐️ Cleanlab
cleanlab автоматически находит и исправляет ошибки в любом наборе данных машинного обучения. Этот пакет искусственного интеллекта, облегчает работу с беспорядочными данными.
🖥 Github: https://github.com/cleanlab/cleanlab
👣 Docs: https://docs.cleanlab.ai/
📌 Examples: https://github.com/cleanlab/examples
⏩ Paprer: https://arxiv.org/abs/2211.13895v1
⭐️ Datasets: https://paperswithcode.com/dataset/celeba
@ai_machinelearning_big_data
✅ ADGC: Awesome Deep Graph Clustering
ADGC представляет собой набор (SOTA) методов кластеризации глубоких графов статьи, код и наборы данных).
🖥 Github: https://github.com/yueliu1999/awesome-deep-graph-clustering
⏩ Paprer: https://arxiv.org/abs/2211.12875v1
⭐️ Datasets: https://drive.google.com/drive/folders/1thSxtAexbvOyjx-bJre8D4OyFKsBe1bK?usp=sharing
@ai_machinelearning_big_data
🎨 Inversion-Based Creativity Transfer with Diffusion Models
Генеративная модель для создания выразительного арта. git clone https://github.com/zyxElsa/creativity-transfer.git
🖥 Github: https://github.com/zyxelsa/creativity-transfer
⏩ Paprer: https://arxiv.org/abs/2211.13203v1
⭐️ Pretrained model: https://huggingface.co/CompVis/stable-diffusion-v-1-4-original/resolve/main/sd-v1-4.ckpt
@ai_machinelearning_big_data
Яндекс назвал лауреатов своей ежегодной научной премии
Ученые, которые занимаются исследованиями в области компьютерных наук, получат по миллиону рублей на развитие своих проектов. В 2022 году лауреатами стали шесть молодых ученых:
•Максим Великанов — занимается теорией deep learning, изучает бесконечно широкие нейронные сети и статистическую физику;
•Петр Мокров — исследует градиентные потоки Вассерштейна, нелинейную фильтрацию и байесовскую логистическую регрессию;
•Максим Кодрян — занимается deep learning, а также оптимизацией и генерализацией нейросетевых моделей;
•Руслан Рахимов — работает с нейронной визуализацией, CV и deep learning;
•Сергей Самсонов — изучает алгоритмы Монте-Карло с марковскими цепями, стохастическую аппроксимацию и другие темы;
•Тарас Хахулин — работает в области компьютерного зрения.
Круто, что отдельно выделяют и научных руководителей. В этом году гранты получили двое — Дмитрий Ветров, заведующий Центром глубинного обучения и байесовских методов ВШЭ, и Алексей Наумов, доцент факультета компьютерных наук ВШЭ, заведующий Международной лаборатории стохастических алгоритмов и анализа многомерных данных.
Подробнее о премии и лауреатах 2022 года — на сайте.
Какие изменения произошли с библиотекой PyTorch-LifeStream за год?
Об этом рассказал Иван Киреев, исполнительный директор по исследованию данных в лаборатории по искусственному интеллекту Сбера во время международной конференции AI Journey.
Библиотека PyTorch-LifeStream нужна для построения нейронных сетей на событийных данных. В основном, изменилась структура библиотеки. Она была разбита на несколько модулей, благодаря чему в ней стало проще ориентироваться. Также изменилась система конфигурирования, появилось больше примеров использования библиотеки.
Всего в структуре библиотеки на текущий момент четыре блока:
1. Перепроцессинг данных
2. Загрузка
3. Набор слоёв
4. Набор фреймворков обучения
Что касается конфигурации, то была подключена Hydra. Все конфигурации хранятся в yaml-файлах, которые удобно редактировать.
Крупнейшие игроки российского технологического рынка присоединяются к Кодексу этики в сфере искусственного интеллекта. Свод правил разработал Альянс в сфере ИИ и обнародовал в рамках международной конференции по искусственному интеллекту AI Journey.
На конференции к Кодексу присоединились Datanа, Factory 5, ГК «GlobalTruck», ГеомирАгро, Цифровая платформа КАМАЗ, ГК Медси, Самолет, Сибур, Северсталь Менеджмент, РЖД, Русагро Технологии, Уралхим. Всего Кодекс поддержали 113 российских компаний и организаций.
«В нашем понимании развитие технологий ИИ в России должно ориентироваться исключительно на интересы человека, качество его жизни и благополучие. Именно на основе доверия граждан мы вместе с участниками Альянса и Кодекса этики продолжим создавать новую цифровую экосистему для технологического развития нашей страны», — так прокомментировал Кодекс зампред Правительства РФ Дмитрий Чернышенко.