27 февраля на TeamLead Conf 2023 пройдет "Яндекс-трек: R&D и культура компании". Для тимлидов, руководителей и СТО!
В этом треке мы поговорим о том, как в IT-компаниях с разной корпоративной культурой устроены R&D-департаменты, в которых рождаются, тестируются и запускаются технологические решения. Какова роль инженеров и менеджеров в компаниях с разной культурой? Как построены процессы генерации и приоритизации идей и инноваций?
Приходите послушать!
👉Программа Яндекс-трека: https://teamleadconf.ru/moscow/2023/yatrack?utm_source=tg&utm_medium=track&utm_campaign=ai_machinelearning_big_data
⚠️Пройдите тест на углубленные знания в сфере Machine Learning. Professional — https://otus.pw/lc4B/
🔓 Ответьте на 10 вопросов и проверьте, насколько вы готовы к обучению на продвинутом курсе «Machine Learning. Professional» от OTUS и его партнера — Сбера
⏰ Время прохождения теста ограничено 30 минут
📌 РЕЗУЛЬТАТ ПРОХОЖДЕНИЯ КУРСА:
Серьезное портфолио с проектами и возможность претендовать на Junior+ и Middle позиции Data Scientist
Протестируйте обучение на открытых уроках rehcf:
✅ Мы похожи на свое окружение: алгоритм k Nearest Neighbours для задачи классификации — https://otus.pw/szvM/
✅Деревья решений в машинном обучении — https://otus.pw/S2kO/
👉 ПРОЙТИ ТЕСТ:
https://otus.pw/lc4B/
Как построить систему геоаналитики с применением ML?
Когда: 20 февраля, 17:00 (мск)
📍 Регистрация
Эксперты расскажут про особенности создания ML-решений на примере построения системы предиктивной аналитики на основе геопространственных данных.
В программе:
🔹 Разбор кейсов и специфики построения ML-моделей и подходов к разработке проектов.
🔹Обсуждение выбора технологического стека для работы с Machine Learning: какие инструменты пригодятся, как их выбрать и применять.
🔹 QA-сессия со экспертами вебинара.
Спикеры:
🔹 Александр Мамаев, руководитель отдела машинного обучения и анализа данных, PREDICT, VK
🔹Артем Агафонов, руководитель группы геоаналитики, PREDICT, VK
🔹Александр Волынский, PM сервиса Cloud ML Platform, VK Cloud
Зарегистрироваться
Защита от кибератак - любопытная тема, особенно когда чуть ли не каждый месяц взламывают сервисы и личные данные утекают в общий доступ.
МИФИ совместно со SkillFactory проводят трёхдневный бесплатный онлайн-практикум по кибербезопасности.
Программа такая:
В первый день будут обучать основам Python, работе с Linux и цифровой криминалистике.
На второй день познакомят с шифрами и криптоанализом RSA.
А на третий день объяснят как взломать систему лицензирования и дадут попробовать самому это сделать.
Кроме того, на практикуме будет соревнование по кибербезопасности. Участвовать смогут как новички, так и люди с опытом. Это полезно, чтобы испробовать и получше усвоить изученное. А победитель получает курс по SQL!
Так что если всегда привлекала сфера кибербезопасности, получить реальный опыт и познакомиться с профессией можно онлайн 15, 16 и 17 февраля в 19:00 по МСК. Регистрируйтесь по ссылке: https://go.skillfactory.ru/ifrk_w
📌 Artificial intelligence? Problem solution fit? Product market fit?
Приглашаем в акселератор по развитию ИИ-стартапов!
Мы: Акселератор INNOACCELAI ОЭЗ «Иннополис», аккредитованный в Фонде содействия инновациям!
Что: ОЭЗ «Иннополис» запустила ARTIFICIAL INTELLIGENCE АКСЕЛЕРАТОР и приглашает Вас принять участие в акселерационной программе INNOACCELAI БЕСПЛАТНО!
Фонд содействия инноваций выделяет грант 780 000 рублей на участие в программе.
Когда: Прием заявок открыт до 3 марта 2023 года.
Продолжительность программы 16 недель.
Технологический фокус:
⚡️рекомендательные системы и интеллектуальные системы поддержки принятия решений
⚡️компьютерное зрение
⚡️обработка естественного языка
⚡️перспективные методы и технологии в AI
⚡️распознавание и синтез речи
Что получим?
⚡️лучших трекеров для быстрого роста
⚡️обучение у ведущих экспертов рынка
⚡️индивидуальный подход к разработке траектории развития
⚡️нетворкинг
⚡️привлечение мер гос.поддержки и инвестиции
⚡️пилоты с партнерами
⚡️возможность стать резидентом ОЭЗ «Иннополис»
Подать заявку на участие может любой ИИ-стартап и мы расскажем, Вам как получить грант на участие в акселераторе от Фонда содействия инноваций!
Оставь заявку на сайте
С уважением,
команда акселератора ОЭЗ «Иннополис»
+7 (985) 848-25-60
info@innoaccelai.ru
⭐️ In-N-Out: Face Video Inversion and Editing with Volumetric Decomposition
The core idea is to represent the face in a video using two neural radiance fields, one for in-distribution and the other for out-of-distribution data, and compose them together for reconstruction.
Новая модель от Adobe Research, для редактирования видео с поддержкой 3D, позволяет манипулировать объектами в условиях сдвига данных. (OOD generalization).
⭐️ Project: https://in-n-out-3d.github.io/
✅️ Paper: https://arxiv.org/abs/2302.03668v1
@ai_machinelearning_big_data
🌐 Гайд по созданию Big Data-проектов в облаке
Big Data-проекты, как известно, проще реализовать в облаке из-за большого объема данных, внушительных вычислительных ресурсов, разветвленного технологического стека и мощной инфраструктуры.
На Хабр вышла интересная статья, где рассказывается о нюансах и неочевидных особенностях запуска процессов при работе с большими данными в облаке.
ai_machinelearning_big_data
Сбер празднует День российской науки и запускает сайт для всех российских гиков, гениев и просто энтузиастов науки. На сайте можно много и хорошо почитать об исследованиях и разработках (R&D), а также о самых прорывных трендах в направлениях:
▪️блокчейн
▪️нейронауки
▪️AR/VR
▪️геймификация
▪️интернет вещей
▪️кибербезопасность
▪️искусственный интеллект
▪️робототехника.
Среди представленных для изучения R&D-проектов — блокчейн-платформа и Volumetric студия, которая позволяет создать эффект присутствия, платформы для построения и повышения эффективности моделей машинного обучения и многое другое.
Кроме того на сайте можно узнать и присоединиться к мероприятиям, которые проводят исследователи Сбера, получить информацию о партнёрских проектах лабораторий Сбера с центрами искусственного интеллекта на базе ВШЭ, Сколтеха и МФТИ.
ai_machinelearning_big_data
🔥 Weekend Offer для ML- и мобильных разработчиков в VK
Это шанс попасть в команду профессионалов за одни выходные. С командой Дзена вы будете делать высоконагруженный сервис со 150 тысячами RPS, сложными алгоритмами, сотнями тестов и релизов. В команде Маруси – решать задачи не только умного ассистента, но и других направлений экосистемы VK с помощью голосовых технологий. Команда Почты Mail.ru и Антиспама разбирается с хранилищем информации, полученной из разных сервисов, фильтруя, структурируя и предоставляя ее пользователю в удобном виде.
Первая встреча: 03–17 февраля
Детальное знакомство: суббота, 18 февраля.
Финальное собеседование: воскресенье, 19 февраля.
Узнать больше о командах и задачах, а также оставить отклик можно тут.
ai_machinelearning_big_data
🤖 Как создать прототип системы контроля доступа транспорта и людей на территорию? Практика с AI в облаке
⏰ Когда: 16 февраля, 17:00 MSK
📍 https://vk.company/ru/press/events/968/
На вебинаре разберем, как за 1 час создать прототип системы для автоматизации доступа людей и транспорта на территорию. Занятие пройдет с применением сервиса Vision от VK Cloud. Для того, чтобы выполнять задания, рекомендуем заранее подключить его в личном кабинете VK Cloud.
В программе:
▪️ Обзор инструментов и моделей в сервисе Vision от VK Cloud.
▪️ Практика с Vision: разработка системы контроля доступа транспорта и людей на территорию.
▪️ QA-сессия.
Спикер:
🔸 Димитрий Муштаков, Product Manager сервиса Vision в VK Cloud.
🖥 PyGlove: Manipulating Python Programs
Manipulating Python Programs with symbolic object-oriented programming .
PyGlove от Google - методология символьного объектно-ориентированного программирования на Python, позволяет напрямую манипулировать объектами (создание ML моделей на метаязыке), что значительно упрощает написание метапрограмм. Подробный пример efficiently_exchange_ml_ideas_as_codepip install pyglove
🖥 Github: https://github.com/google/pyglove
📃 Docs: https://pyglove.readthedocs.io/
✅️ Paper: https://arxiv.org/abs/2302.01918v1
⭐️ Project: https://texturepaper.github.io/TEXTurePaper/
ai_machinelearning_big_data
✅️ TEXTure: Semantic Texture Transfer using Text Tokens
Novel method for text-guided generation, editing, and transfer of textures for 3D shapes. Leveraging a pretrained depth-to-image diffusion mode
TEXTure принимает исходный рендер и текстовое описание и рисует модель с высококачественными текстурами, используя итеративный процесс на основе диффузии.
🖥 Github: https://github.com/TEXTurePaper/TEXTurePaper
✅️ Paper: https://arxiv.org/abs/2302.01721v1
⭐️ Project: https://texturepaper.github.io/TEXTurePaper/
ai_machinelearning_big_data
❓Хотите стать специалистом по компьютерному зрению? Сделайте первые шаги на открытом уроке онлайн-курса «Компьютерное зрение».
🔥9 февраля в 20:00 мск пройдет открытый урок «Kornia — убийца OpenCV?». На занятии мы обсудим дифференцируемую библиотеку Computer Vision — Kornia.
Вы узнаете:
- Почему Kornia применяется в обучении нейронных сетей и PyTorch, а OpenCV — нет
- За счет чего Kornia работает в разы быстрее, чем OpenCV
- Какие продвинутые функции потерь и алгоритмы для моделей CV предоставляет Kornia
- Как написать алгоритм, которые автоматически сшивает несколько фотографий в панорамный снимок
- Почему Kornia — это лучший инструмент для задач, связанных с геометрией изображений
🧑💻 Для участия пройдите вступительный тест: https://otus.pw/VJV2/
🔥 Dreamix: Video Diffusion Models are General Video Editors
New Google's text-based motion model.
Given a small collection of images showing the same subject, Dreamix can generate new videos with the subject in motion.
Всего из нескольких картинок или видео новая модель от Google - Dreamix генерирует видео по текстовому описанию!
На видео Dreamix превращает обезьяну в танцующего медведя по промпту «Медведь танцует и прыгает под веселую музыку, двигая всем телом».
⭐️ Project: https://dreamix-video-editing.github.io/
✅️ Paper: https://arxiv.org/pdf/2302.01329.pdf
⭐️ Video: https://www.youtube.com/watch?v=xcvnHhfDSGM
ai_machinelearning_big_data
🔊 Audio-Visual Segmentation (AVS)
AVS to estimate pixel-wise segmentation masks for all the sounding objects, no matter the number of visible sounding objects
Большой датасет и модель сегментации объектов, издающих звук на видео.
🖥 Github: https://github.com/OpenNLPLab/AVSBench
✅️ Paper: https://arxiv.org/pdf/2301.13190.pdf
⭐️ Project: https://opennlplab.github.io/AVSBench/
✅️ Dataset: http://www.avlbench.opennlplab.cn/download
🔹 Benchmark: http://www.avlbench.opennlplab.cn/
ai_machinelearning_big_data
🚀 Universal Guidance for Diffusion Models
Algorithm successfully generates quality images with guidance functions including segmentation, face recognition, object detection, and classifier signals.
Универсальный алгоритм, который позволяет управлять диффузионными моделями без необходимости повторного обучения каких-либо компонентов.
🖥 Github: https://github.com/arpitbansal297/universal-guided-diffusion
💨 Paper: https://arxiv.org/abs/2302.07121v1
🗳Dataset: https://paperswithcode.com/dataset/imagenet
ai_machinelearning_big_data
🧩 LEGO-Net: Learning Regular Rearrangements of Objects in Rooms
Model takes an input messy scene and attempts to clean the scene via iterative denoising.
LEGO-Net итеративный метод обучения регулярной перестановке объектов в захламленных комнатах.
💨 Project: https://ivl.cs.brown.edu/#/projects/lego-net
✅️ Paper: https://arxiv.org/pdf/2301.09629.pdf
ai_machinelearning_big_data
💭 Speech Synthesis, Recognition, and More With SpeechT5
Новая модель для синтеза и распозновании речи SpeechT5 от huggingface.
▪преобразование речи в текст для автоматического распознавания речи и идентификации говорящего
▪преобразование текста в речь для синтеза звука
▪речь в речь для преобразования речи в разные голоса или улучшения речи.
🖥 Github: https://huggingface.co/blog/speecht5
💨 Demo: https://huggingface.co/spaces/Matthijs/speecht5-asr-demo
🗣 Voice Conversion: https://huggingface.co/spaces/Matthijs/speecht5-vc-demo
🗳Automatic Speech Recognition: https://huggingface.co/spaces/Matthijs/speecht5-asr-demo
ai_machinelearning_big_data
🤗 PEFT: Parameter-Efficient Fine-Tuning of Billion-Scale Models on Low-Resource Hardware
Parameter-Efficient Fine-Tuning (PEFT) methods enable efficient adaptation of pre-trained language models (PLMs) to various downstream applications without fine-tuning all the model's paramete
PEFT позволяют добиться высокой производительности моделей на слабом железе, с небольшым количество обучаемых данных, .
🖥 Github: https://github.com/huggingface/peft
💨 Hugging Face: https://huggingface.co/blog/peft
🖥 Colab: https://colab.research.google.com/drive/1jCkpikz0J2o20FBQmYmAGdiKmJGOMo-o
ai_machinelearning_big_data
UniPC: A Unified Predictor-Corrector Framework for Fast Sampling of Diffusion Models
Унифицированный корректор (UniC) для диффузионных моделей для улучшения качества генераций, который работает значительно лучше, по сравнению с предыдущими методами.
🖥 Github: https://github.com/wl-zhao/unipc
💨 Project: https://unipc.ivg-research.xyz/
✅️ Paper: https://arxiv.org/abs/2302.04867v1
⭐️ Dataset: https://paperswithcode.com/dataset/lsun
ai_machinelearning_big_data
Hard Prompts Made Easy: Discrete Prompt Tuning for Language Models
From a given image, we first optimize a hard prompt using the PEZ algorithm and CLIP encoder.
Модель для преобразование изображений в текстовые подсказки для стабильной диффузии.
Автоматически генерирует текстовые подсказки как для преобразования текста в изображение, так и для преобразования текста в текст.
🖥 Github: https://github.com/YuxinWenRick/hard-prompts-made-easy
🖥 Colab: https://colab.research.google.com/drive/1VSFps4siwASXDwhK_o29dKA9COvTnG8A?usp=sharing
✅️ Paper: hhttps://arxiv.org/abs/2302.03668v1
⭐️ Dataset: https://paperswithcode.com/dataset/ag-news
ai_machinelearning_big_data
Gen-1: The Next Step Forward for Generative AI
Use words and images to generate new videos out of existing
Новейший ИИ-алгоритм Gen-1, который может изменить стиль видео по текстовому запросу или картинке.
ones.
https://research.runwayml.com/gen1
⭐️ Project: https://research.runwayml.com/gen1
✅️ Paper: https://arxiv.org/abs/2302.03011
📌Request form: https://docs.google.com/forms/d/e/1FAIpQLSfU0O_i1dym30hEI33teAvCRQ1i8UrGgXd4BPrvBWaOnDgs9g/viewform
ai_machinelearning_big_data
🖥 Microsoft launches the new Bing, with ChatGPT built in
The new Bing offers you reliable, up-to-date results – and complete answers to your questions. Of course, it also cites the sources.
Новый Bing будет создан на основе существующего интерфейса Bing, чтобы предоставить вам новый тип поиска.
▪После создания списка релевантных ссылок Bing консолидирует надежные источники в Интернете, чтобы получить один обобщенный ответ.
▪Выполните поиск по разговору, тексту и мнению. Bing принимает сложные поисковые запросы и предоставляет подробный ответ.
▪В чате вы можете естественно общаться в чате и задавать дополнительные вопросы при первоначальном поиске, чтобы получать персонализированные ответы.
▪Bing можно использовать как творческий инструмент. Это поможет вам писать статьи, истории или даже делиться идеями для проекта.
🔥 Waiting list: https://www.bing.com/new
📹Video: https://www.youtube.com/watch?v=zhdwVdSFn54&t=7s
ai_machinelearning_big_data
Open-sources PhyCV: The First Physics-inspired Computer Vision Library
Unlike traditional algorithms that are a sequence of hand-crafted empirical rules, physics-inspired algorithms leverage physical laws of nature as blueprints.
PhyCV - новый класс алгоритмов компьютерного зрения, высокой точности, которые имитируют распространение света через физические объекты. Алгоритмы основаны на уравнениях дифракции света в оптических системах.pip install phycv
🖥 Github: https://github.com/JalaliLabUCLA/phycv
📝 Paper: https://arxiv.org/abs/2301.12531v1
🎥 Video: https://www.youtube.com/watch?v=PJXXwXVyjdk&embeds_euri=https%3A%2F%2Fwww.imveurope.com%2F&feature=emb_logo
⭐️ Project: https://photonics.ucla.edu/2022/05/12/jalali-lab-open-sources-phycv-a-physics-inspired-computer-vision-library/
@ai_machinelearning_big_data
🖥 Google's Bard
Experimental conversational AI service, powered by LaMDA, that we’re calling Bard.
Google анонсировал свой ответ ChatGPT — Bard на базе языковой модели LaMDA.
Article
ai_machinelearning_big_data
16 февраля приглашаем на онлайн-трансляцию Avito Analytics meetup #9.
Аналитики из Авито, VK и EXPF поделятся опытом оценки пользовательского контента и построения репутационной системы, расскажут, как отчёты по метрикам позволяют видеть ущерб сразу в денежном эквиваленте и зачем применять методы сокращения дисперсии.
Зарегистрируйтесь, чтобы получить напоминание о трансляции.
Реклама. ООО «Авито Тех». LdtCKaTeL
🌃 STEPS: Joint Self-supervised Nighttime Image Enhancement and Depth Estimation
The first method that jointly learns a nighttime image enhancer and a depth estimator, without using ground truth for either task.
Новый метод распознавания объектов и ночных фотографиях и крупный, размеченный датасет.
🖥 Github: https://github.com/ucaszyp/steps
✅️ Paper: https://arxiv.org/abs/2302.01334v1
⭐️ Dataset: https://drive.google.com/drive/folders/1n2WsaGtB-tRiPyee-vAYF6Cd7EZr4RGe
ai_machinelearning_big_data
🚀 Conditional Flow Matching
Conditional Flow Matching is a fast way to train Continuous Normalizing Flow models.
🖥 Github: https://github.com/atong01/conditional-flow-matching
✅️ Paper: https://arxiv.org/abs/2302.00482v1
⭐️ Dataset: https://paperswithcode.com/dataset/celeba
ai_machinelearning_big_data
🔊 Audio AI Timeline
Here we will keep track of the latest AI models for audio generation, starting in 2023!
Список последних моделей ИИ для генерации звука 2023 года.
▪SingSong: Generating musical accompaniments from singing.
- Paper
▪AudioLDM: Text-to-Audio Generation with Latent Diffusion Models
- Paper
▪Moûsai: Text-to-Music Generation with Long-Context Latent Diffusion
- Paper
- Code
▪Make-An-Audio: Text-To-Audio Generation with Prompt-Enhanced Diffusion Models
- Paper
▪Noise2Music
▪RAVE2
- Paper
- Code
▪MusicLM: Generating Music From Text
- Paper
▪Msanii: High Fidelity Music Synthesis on a Shoestring Budget
- Paper
- Code
- HH
▪ArchiSound: Audio Generation with Diffusion
- Paper
- Code
▪VALL-E: Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers
- Paper
Full list
ai_machinelearning_big_data
⭐️ The State of Computer Vision at Hugging Face 🤗
Over 3000 models, and over 100 datasets on the Hugging Face Hub.
Более 3000 моделей компьютерного зрения и более 100 датасетов на Hugging Face Hub.
💨 Topics:
Supported vision tasks and Pipelines
Training your own vision models
Integration with timm
Diffusers
Support for third-party libraries
Datasets
⏩ Code:
HugsVision
Model documentation
Hugging Face notebooks
Hugging Face example scripts
Task pages
Timm
➡️ Computer Vision applications:
Generate 3D voxels from a predicted depth map of an input image
Open vocabulary semantic segmentation
Narrate videos by generating captions
Classify videos from YouTube
Zero-shot video classification
Visual question-answering
Use zero-shot image classification to find best captions for an image to generate similar images
🤗 AutoTrain
AutoTrain
Image classification
Automatic model evaluation
🦾 Zero-shot models
CLIP
OWL-ViT
CLIPSeg
GroupViT
X-CLIP
🚀 Deployment
Deploying TensorFlow Vision Models in Hugging Face with TF Serving
Deploying ViT on Kubernetes with TF Serving
Deploying ViT on Vertex AI
Deploying ViT with TFX and Vertex AI
✅️ Full list
@ai_machinelearning_big_data