👁 EdgeYOLO: An Edge-Real-Time Object Detector
EdgeYOLO reaches 34FPS with 50.6% AP in COCO2017 dataset and 25.9% AP in VisDrone2019 (image input size is 640x640, batch=16, post-process included).
Новый детектор обнаружения небольших объектов с высокой точностью, не требующий больших вычислительных мощностей.
🖥 Github: https://github.com/lsh9832/edgeyolo
⭐️Paper: https://arxiv.org/abs/2302.07483v1
⭐️ Weights: https://github.com/LSH9832/edgeyolo/releases/tag/v0.0.0
💻 Dataset: https://paperswithcode.com/dataset/visdrone
ai_machinelearning_big_data
3D-aware Conditional Image Synthesis (pix2pix3D)
Model synthesizes a 3d photo from different viewpoints.
3D генеративная модель для управляемого синтеза фотореалистичных изображений.
🖥 Github: https://github.com/dunbar12138/pix2pix3D
⭐️ Project: https://huggingface.co/TencentARC/T2I-Adapter
⭐️Paper: https://arxiv.org/abs/2302.08509
💻 Dataset: https://paperswithcode.com/dataset/coco
ai_machinelearning_big_data
T2I-Adapter
Network that can provide extra guidance to pre-trained text-to-image models while freezing the original large text-to-image models.
T2I-Adapter набор aдаптеров для диффузионных моделей(~ 70 млн параметров ).Подходит для широкого спектра задач text-to-image, генерация скетчей, редактирование изображений по тексту, объединение нескольких адаптеров вместе и многое другое.
🖥 Github: https://github.com/TencentARC/T2I-Adapter
🤗 Hugging Face: https://huggingface.co/TencentARC/T2I-Adapter
⭐️Paper: https://arxiv.org/abs/2302.08453v1
💻 Dataset: https://paperswithcode.com/dataset/coco
ai_machinelearning_big_data
↪️ Zero-shot image-to-text generation with BLIP-2
The model bridges the gap between vision and natural language modalities by adding a transformer between pre-trained models.
BLIP-2 — это новая модель визуального языка, которую можно использовать для нескольких задач преобразования изображения в текст. Это эффективный подход, который можно применять для получения качественных промптов.
💨 Hugging Face: https://huggingface.co/blog/blip-2
💻 Demo: https://huggingface.co/spaces/Salesforce/BLIP2
🖥 Github: https://github.com/salesforce/LAVIS
⭐️Paper: https://arxiv.org/abs/2301.12597
ai_machinelearning_big_data
🚀 Universal Guidance for Diffusion Models
Algorithm successfully generates quality images with guidance functions including segmentation, face recognition, object detection, and classifier signals.
Универсальный алгоритм, который позволяет управлять диффузионными моделями без необходимости повторного обучения каких-либо компонентов.
🖥 Github: https://github.com/arpitbansal297/universal-guided-diffusion
💨 Paper: https://arxiv.org/abs/2302.07121v1
🗳Dataset: https://paperswithcode.com/dataset/imagenet
ai_machinelearning_big_data
🧩 LEGO-Net: Learning Regular Rearrangements of Objects in Rooms
Model takes an input messy scene and attempts to clean the scene via iterative denoising.
LEGO-Net итеративный метод обучения регулярной перестановке объектов в захламленных комнатах.
💨 Project: https://ivl.cs.brown.edu/#/projects/lego-net
✅️ Paper: https://arxiv.org/pdf/2301.09629.pdf
ai_machinelearning_big_data
💭 Speech Synthesis, Recognition, and More With SpeechT5
Новая модель для синтеза и распозновании речи SpeechT5 от huggingface.
▪преобразование речи в текст для автоматического распознавания речи и идентификации говорящего
▪преобразование текста в речь для синтеза звука
▪речь в речь для преобразования речи в разные голоса или улучшения речи.
🖥 Github: https://huggingface.co/blog/speecht5
💨 Demo: https://huggingface.co/spaces/Matthijs/speecht5-asr-demo
🗣 Voice Conversion: https://huggingface.co/spaces/Matthijs/speecht5-vc-demo
🗳Automatic Speech Recognition: https://huggingface.co/spaces/Matthijs/speecht5-asr-demo
ai_machinelearning_big_data
🤗 PEFT: Parameter-Efficient Fine-Tuning of Billion-Scale Models on Low-Resource Hardware
Parameter-Efficient Fine-Tuning (PEFT) methods enable efficient adaptation of pre-trained language models (PLMs) to various downstream applications without fine-tuning all the model's paramete
PEFT позволяют добиться высокой производительности моделей на слабом железе, с небольшым количество обучаемых данных, .
🖥 Github: https://github.com/huggingface/peft
💨 Hugging Face: https://huggingface.co/blog/peft
🖥 Colab: https://colab.research.google.com/drive/1jCkpikz0J2o20FBQmYmAGdiKmJGOMo-o
ai_machinelearning_big_data
UniPC: A Unified Predictor-Corrector Framework for Fast Sampling of Diffusion Models
Унифицированный корректор (UniC) для диффузионных моделей для улучшения качества генераций, который работает значительно лучше, по сравнению с предыдущими методами.
🖥 Github: https://github.com/wl-zhao/unipc
💨 Project: https://unipc.ivg-research.xyz/
✅️ Paper: https://arxiv.org/abs/2302.04867v1
⭐️ Dataset: https://paperswithcode.com/dataset/lsun
ai_machinelearning_big_data
Hard Prompts Made Easy: Discrete Prompt Tuning for Language Models
From a given image, we first optimize a hard prompt using the PEZ algorithm and CLIP encoder.
Модель для преобразование изображений в текстовые подсказки для стабильной диффузии.
Автоматически генерирует текстовые подсказки как для преобразования текста в изображение, так и для преобразования текста в текст.
🖥 Github: https://github.com/YuxinWenRick/hard-prompts-made-easy
🖥 Colab: https://colab.research.google.com/drive/1VSFps4siwASXDwhK_o29dKA9COvTnG8A?usp=sharing
✅️ Paper: hhttps://arxiv.org/abs/2302.03668v1
⭐️ Dataset: https://paperswithcode.com/dataset/ag-news
ai_machinelearning_big_data
Gen-1: The Next Step Forward for Generative AI
Use words and images to generate new videos out of existing
Новейший ИИ-алгоритм Gen-1, который может изменить стиль видео по текстовому запросу или картинке.
ones.
https://research.runwayml.com/gen1
⭐️ Project: https://research.runwayml.com/gen1
✅️ Paper: https://arxiv.org/abs/2302.03011
📌Request form: https://docs.google.com/forms/d/e/1FAIpQLSfU0O_i1dym30hEI33teAvCRQ1i8UrGgXd4BPrvBWaOnDgs9g/viewform
ai_machinelearning_big_data
🖥 Microsoft launches the new Bing, with ChatGPT built in
The new Bing offers you reliable, up-to-date results – and complete answers to your questions. Of course, it also cites the sources.
Новый Bing будет создан на основе существующего интерфейса Bing, чтобы предоставить вам новый тип поиска.
▪После создания списка релевантных ссылок Bing консолидирует надежные источники в Интернете, чтобы получить один обобщенный ответ.
▪Выполните поиск по разговору, тексту и мнению. Bing принимает сложные поисковые запросы и предоставляет подробный ответ.
▪В чате вы можете естественно общаться в чате и задавать дополнительные вопросы при первоначальном поиске, чтобы получать персонализированные ответы.
▪Bing можно использовать как творческий инструмент. Это поможет вам писать статьи, истории или даже делиться идеями для проекта.
🔥 Waiting list: https://www.bing.com/new
📹Video: https://www.youtube.com/watch?v=zhdwVdSFn54&t=7s
ai_machinelearning_big_data
Open-sources PhyCV: The First Physics-inspired Computer Vision Library
Unlike traditional algorithms that are a sequence of hand-crafted empirical rules, physics-inspired algorithms leverage physical laws of nature as blueprints.
PhyCV - новый класс алгоритмов компьютерного зрения, высокой точности, которые имитируют распространение света через физические объекты. Алгоритмы основаны на уравнениях дифракции света в оптических системах.pip install phycv
🖥 Github: https://github.com/JalaliLabUCLA/phycv
📝 Paper: https://arxiv.org/abs/2301.12531v1
🎥 Video: https://www.youtube.com/watch?v=PJXXwXVyjdk&embeds_euri=https%3A%2F%2Fwww.imveurope.com%2F&feature=emb_logo
⭐️ Project: https://photonics.ucla.edu/2022/05/12/jalali-lab-open-sources-phycv-a-physics-inspired-computer-vision-library/
@ai_machinelearning_big_data
🖥 Google's Bard
Experimental conversational AI service, powered by LaMDA, that we’re calling Bard.
Google анонсировал свой ответ ChatGPT — Bard на базе языковой модели LaMDA.
Article
ai_machinelearning_big_data
16 февраля приглашаем на онлайн-трансляцию Avito Analytics meetup #9.
Аналитики из Авито, VK и EXPF поделятся опытом оценки пользовательского контента и построения репутационной системы, расскажут, как отчёты по метрикам позволяют видеть ущерб сразу в денежном эквиваленте и зачем применять методы сокращения дисперсии.
Зарегистрируйтесь, чтобы получить напоминание о трансляции.
Реклама. ООО «Авито Тех». LdtCKaTeL
Ежегодная серия соревнований по машинному обучению Data Fusion Contest 2023 открыта!
Вас ждут две задачи в уникальном турнирном соревновании от команд ВТБ и ODS.AI:
🗡 В задаче Атака участники будут создавать атаки на нейросеть, обученную на транзакционных данных.
🛡 В задаче Защита — наоборот, учиться защищать свои модели от заранее оговоренного вида атак.
🏆 Призеров определит турнир — лучшие команды обеих задач столкнутся друг с другом за призовой фонд в 2,000,000 рублей!
💪 Участников также ждет много мерча, онлайн митапы с воркшопами, и возможность фундаментально прокачаться в новых DS/ML методах.
Подробности и регистрация — на сайте.
Совместная магистерская программа «Науки о данных» Университета науки и технологий МИСИС и СберОбразования позволит освоить востребованную профессию Data Scientist начинающим специалистам, интересующимся Big Data, а также тем, кто уже имеет опыт работы с данными, но хочет углубить свои знания в этой сфере 🧑💻
Обучение будет проходить в онлайн-формате, что позволит совмещать учебу и работу. Вы получите все преимущества очной формы обучения – диплом государственного образца, общежитие, проездной и др.Образовательный процесс будет отслеживать команда методистов, преподавателей и тьюторов с опытом организации обучения в Data Science более 3 лет.
Эксперты из крупнейших IT-компаний России поделятся с вами наработанным опытом – вы получите нужные знания и навыки в программировании, математике, машинном и «глубоком» обучении. А в третьем семестре сможете выбрать трек для более узкой специализации – Artificial Intelligence Developer, Big Data Engineer, Machine Learning Developer.
Подробнее о программе 📌
🌐 Как организовать работу над ML-экспериментами с помощью MLflow
MLOps — набор практик и инструментов, которые помогают стандартизировать и повысить эффективность процессов работы с машинным обучением. Эксперты VK Cloud и Karpov.Courses выпустили на Хабре полезную статью, где показали последовательность действий по выстраиванию MLOps-подхода в облаке с помощью JupyterHub и MLflow. Подробнее тут.
ai_machinelearning_big_data
27 февраля на TeamLead Conf 2023 пройдет "Яндекс-трек: R&D и культура компании". Для тимлидов, руководителей и СТО!
В этом треке мы поговорим о том, как в IT-компаниях с разной корпоративной культурой устроены R&D-департаменты, в которых рождаются, тестируются и запускаются технологические решения. Какова роль инженеров и менеджеров в компаниях с разной культурой? Как построены процессы генерации и приоритизации идей и инноваций?
Приходите послушать!
👉Программа Яндекс-трека: https://teamleadconf.ru/moscow/2023/yatrack?utm_source=tg&utm_medium=track&utm_campaign=ai_machinelearning_big_data
⚠️Пройдите тест на углубленные знания в сфере Machine Learning. Professional — https://otus.pw/lc4B/
🔓 Ответьте на 10 вопросов и проверьте, насколько вы готовы к обучению на продвинутом курсе «Machine Learning. Professional» от OTUS и его партнера — Сбера
⏰ Время прохождения теста ограничено 30 минут
📌 РЕЗУЛЬТАТ ПРОХОЖДЕНИЯ КУРСА:
Серьезное портфолио с проектами и возможность претендовать на Junior+ и Middle позиции Data Scientist
Протестируйте обучение на открытых уроках rehcf:
✅ Мы похожи на свое окружение: алгоритм k Nearest Neighbours для задачи классификации — https://otus.pw/szvM/
✅Деревья решений в машинном обучении — https://otus.pw/S2kO/
👉 ПРОЙТИ ТЕСТ:
https://otus.pw/lc4B/
Как построить систему геоаналитики с применением ML?
Когда: 20 февраля, 17:00 (мск)
📍 Регистрация
Эксперты расскажут про особенности создания ML-решений на примере построения системы предиктивной аналитики на основе геопространственных данных.
В программе:
🔹 Разбор кейсов и специфики построения ML-моделей и подходов к разработке проектов.
🔹Обсуждение выбора технологического стека для работы с Machine Learning: какие инструменты пригодятся, как их выбрать и применять.
🔹 QA-сессия со экспертами вебинара.
Спикеры:
🔹 Александр Мамаев, руководитель отдела машинного обучения и анализа данных, PREDICT, VK
🔹Артем Агафонов, руководитель группы геоаналитики, PREDICT, VK
🔹Александр Волынский, PM сервиса Cloud ML Platform, VK Cloud
Зарегистрироваться
Защита от кибератак - любопытная тема, особенно когда чуть ли не каждый месяц взламывают сервисы и личные данные утекают в общий доступ.
МИФИ совместно со SkillFactory проводят трёхдневный бесплатный онлайн-практикум по кибербезопасности.
Программа такая:
В первый день будут обучать основам Python, работе с Linux и цифровой криминалистике.
На второй день познакомят с шифрами и криптоанализом RSA.
А на третий день объяснят как взломать систему лицензирования и дадут попробовать самому это сделать.
Кроме того, на практикуме будет соревнование по кибербезопасности. Участвовать смогут как новички, так и люди с опытом. Это полезно, чтобы испробовать и получше усвоить изученное. А победитель получает курс по SQL!
Так что если всегда привлекала сфера кибербезопасности, получить реальный опыт и познакомиться с профессией можно онлайн 15, 16 и 17 февраля в 19:00 по МСК. Регистрируйтесь по ссылке: https://go.skillfactory.ru/ifrk_w
📌 Artificial intelligence? Problem solution fit? Product market fit?
Приглашаем в акселератор по развитию ИИ-стартапов!
Мы: Акселератор INNOACCELAI ОЭЗ «Иннополис», аккредитованный в Фонде содействия инновациям!
Что: ОЭЗ «Иннополис» запустила ARTIFICIAL INTELLIGENCE АКСЕЛЕРАТОР и приглашает Вас принять участие в акселерационной программе INNOACCELAI БЕСПЛАТНО!
Фонд содействия инноваций выделяет грант 780 000 рублей на участие в программе.
Когда: Прием заявок открыт до 3 марта 2023 года.
Продолжительность программы 16 недель.
Технологический фокус:
⚡️рекомендательные системы и интеллектуальные системы поддержки принятия решений
⚡️компьютерное зрение
⚡️обработка естественного языка
⚡️перспективные методы и технологии в AI
⚡️распознавание и синтез речи
Что получим?
⚡️лучших трекеров для быстрого роста
⚡️обучение у ведущих экспертов рынка
⚡️индивидуальный подход к разработке траектории развития
⚡️нетворкинг
⚡️привлечение мер гос.поддержки и инвестиции
⚡️пилоты с партнерами
⚡️возможность стать резидентом ОЭЗ «Иннополис»
Подать заявку на участие может любой ИИ-стартап и мы расскажем, Вам как получить грант на участие в акселераторе от Фонда содействия инноваций!
Оставь заявку на сайте
С уважением,
команда акселератора ОЭЗ «Иннополис»
+7 (985) 848-25-60
info@innoaccelai.ru
⭐️ In-N-Out: Face Video Inversion and Editing with Volumetric Decomposition
The core idea is to represent the face in a video using two neural radiance fields, one for in-distribution and the other for out-of-distribution data, and compose them together for reconstruction.
Новая модель от Adobe Research, для редактирования видео с поддержкой 3D, позволяет манипулировать объектами в условиях сдвига данных. (OOD generalization).
⭐️ Project: https://in-n-out-3d.github.io/
✅️ Paper: https://arxiv.org/abs/2302.03668v1
@ai_machinelearning_big_data
🌐 Гайд по созданию Big Data-проектов в облаке
Big Data-проекты, как известно, проще реализовать в облаке из-за большого объема данных, внушительных вычислительных ресурсов, разветвленного технологического стека и мощной инфраструктуры.
На Хабр вышла интересная статья, где рассказывается о нюансах и неочевидных особенностях запуска процессов при работе с большими данными в облаке.
ai_machinelearning_big_data
Сбер празднует День российской науки и запускает сайт для всех российских гиков, гениев и просто энтузиастов науки. На сайте можно много и хорошо почитать об исследованиях и разработках (R&D), а также о самых прорывных трендах в направлениях:
▪️блокчейн
▪️нейронауки
▪️AR/VR
▪️геймификация
▪️интернет вещей
▪️кибербезопасность
▪️искусственный интеллект
▪️робототехника.
Среди представленных для изучения R&D-проектов — блокчейн-платформа и Volumetric студия, которая позволяет создать эффект присутствия, платформы для построения и повышения эффективности моделей машинного обучения и многое другое.
Кроме того на сайте можно узнать и присоединиться к мероприятиям, которые проводят исследователи Сбера, получить информацию о партнёрских проектах лабораторий Сбера с центрами искусственного интеллекта на базе ВШЭ, Сколтеха и МФТИ.
ai_machinelearning_big_data
🔥 Weekend Offer для ML- и мобильных разработчиков в VK
Это шанс попасть в команду профессионалов за одни выходные. С командой Дзена вы будете делать высоконагруженный сервис со 150 тысячами RPS, сложными алгоритмами, сотнями тестов и релизов. В команде Маруси – решать задачи не только умного ассистента, но и других направлений экосистемы VK с помощью голосовых технологий. Команда Почты Mail.ru и Антиспама разбирается с хранилищем информации, полученной из разных сервисов, фильтруя, структурируя и предоставляя ее пользователю в удобном виде.
Первая встреча: 03–17 февраля
Детальное знакомство: суббота, 18 февраля.
Финальное собеседование: воскресенье, 19 февраля.
Узнать больше о командах и задачах, а также оставить отклик можно тут.
ai_machinelearning_big_data
🤖 Как создать прототип системы контроля доступа транспорта и людей на территорию? Практика с AI в облаке
⏰ Когда: 16 февраля, 17:00 MSK
📍 https://vk.company/ru/press/events/968/
На вебинаре разберем, как за 1 час создать прототип системы для автоматизации доступа людей и транспорта на территорию. Занятие пройдет с применением сервиса Vision от VK Cloud. Для того, чтобы выполнять задания, рекомендуем заранее подключить его в личном кабинете VK Cloud.
В программе:
▪️ Обзор инструментов и моделей в сервисе Vision от VK Cloud.
▪️ Практика с Vision: разработка системы контроля доступа транспорта и людей на территорию.
▪️ QA-сессия.
Спикер:
🔸 Димитрий Муштаков, Product Manager сервиса Vision в VK Cloud.
🖥 PyGlove: Manipulating Python Programs
Manipulating Python Programs with symbolic object-oriented programming .
PyGlove от Google - методология символьного объектно-ориентированного программирования на Python, позволяет напрямую манипулировать объектами (создание ML моделей на метаязыке), что значительно упрощает написание метапрограмм. Подробный пример efficiently_exchange_ml_ideas_as_codepip install pyglove
🖥 Github: https://github.com/google/pyglove
📃 Docs: https://pyglove.readthedocs.io/
✅️ Paper: https://arxiv.org/abs/2302.01918v1
⭐️ Project: https://texturepaper.github.io/TEXTurePaper/
ai_machinelearning_big_data
✅️ TEXTure: Semantic Texture Transfer using Text Tokens
Novel method for text-guided generation, editing, and transfer of textures for 3D shapes. Leveraging a pretrained depth-to-image diffusion mode
TEXTure принимает исходный рендер и текстовое описание и рисует модель с высококачественными текстурами, используя итеративный процесс на основе диффузии.
🖥 Github: https://github.com/TEXTurePaper/TEXTurePaper
✅️ Paper: https://arxiv.org/abs/2302.01721v1
⭐️ Project: https://texturepaper.github.io/TEXTurePaper/
ai_machinelearning_big_data