ai_machinelearning_big_data | Технологии

Telegram-канал ai_machinelearning_big_data - Machinelearning

27348

Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml

Подписаться на канал

Machinelearning

🖥ChatGPT Advanced Data Analysis

Бесплатный курс углубленного анализа данных c ChatGPT

Этот курс входит в специализацию Специализация Prompt Engineering

https://www.coursera.org/learn/chatgpt-advanced-data-analysis

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🚀 Introducing YOLO-NAS Pose : A Game-Changer in Pose Estimation 🚀

This Model is a redefinition of pose estimation's potential.

Компьютерное зрение достигло значительных успехов, и последний скачок произошел благодаря модели YOLO-NAS Pose.

Эта модель открывает новые возможности обнаружения и оценки позы людей на выдео.

- Ошеломляющее снижение задержки на 38,85% на мощных процессорах Intel Xeon.

-Модель поднимает YOLOv8 на новую высоту по качеству обнаружения.

-Ориентирована на работу в режиме реального времени, уникальное сочетание точности и скорости.

- Невероятное улучшение на 0,27 балла на AP@0.5-0.9

Для решения различных задач модель выпускается в четырех вариантах, каждый из которых имеет свой размер и время задержки.

🖥 Github: https://github.com/Deci-AI/super-gradients

📕 Notebook: https://colab.research.google.com/drive/1O4N5Vbzv0rfkT81LQidPktX8RtoS5A40

🚀 Demo: https://huggingface.co/spaces/Deci/YOLO-NAS-Pose-Demo

🌐 Colab: https://colab.research.google.com/drive/1agLj0aGx48C_rZPrTkeA18kuncack6lF

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

⚡️ EntitySeg Toolbox: Towards open-world and high-quality image segmentation

EntitySeg - это инструментарий с открытым исходным кодом, предназначенный для сегментации изображений с открытым миром и высоким качеством.

На сегодняшний день в EntitySeg реализованы следующие алгортмы:

Open-World Entity Segmentation (TPAMI2022)
High Quality Segmentation for Ultra High-resolution Images (CVPR2022)
CA-SSL: Class-Agnostic Semi-Supervised Learning for Detection and Segmentation (ECCV2022)
High-Quality Entity Segmentation (ICCV2023 Oral)
Rethinking Evaluation Metrics of Open-Vocabulary Segmentaion --- released

🖥 Github: https://github.com/qqlu/entity

📕 Paper: https://arxiv.org/abs/2311.03352v1

🌐 Dataset: https://paperswithcode.com/dataset/coco

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

⚡️ OpenAI DevDay, Opening Keynote

OpenAI DevDay сейчас идет онлайн конференции для разработчиков от OpenAI.

OpenAI
выпустит GPT-5 GPT-4-Turbo, новая модель превосходит старую во всем:

— Можно писать промты длинной в 128 тысяч токенов — это 365 страниц примерно обычной книги!

— Поддерживает возможность загружать собственные документы (PDF и прочие дипломы);
— Можно может писать ответы в JSON-формате;
— Обновили базу данных до апреля 2023 года;
— Цена будет дешевле, работа по API для разработчиков — в 3 раза меньше цена для промта и в 2 раза для генераций.
— Голоса ChatGPT теперь не отличить от человеческих.
— GPT-4 turbo стала намного умнее.
— В 3 раза меньше цена для промта и в 2 раза для генераций.

Выпущен: https://github.com/openai/whisper

https://www.youtube.com/watch?v=U9mJuUkhUzk

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

🎧 Video2Music: Suitable Music Generation from Videos using an Affective Multimodal Transformer model

Video2Music: Suitable Music Generation from Videos using an Affective Multimodal Transformer model.

Многочисленные исследования в области генерации музыки продемонстрировали впечатляющую производительность, однако практически ни одна модель не способна напрямую генерировать музыку для сопровождения видео.

В данной работе представлен генеративный музыкальный ИИ-фреймворк Video2Music, который может генерировать музыку под предоставленное видео.

Сначала была собрана уникальная коллекцию музыкальных клипов. Затем проанализированы музыкальные видеоролики, чтобы получить семантические характеристики, характеристики смещения сцены, движения и эмоций.

Эти отличительные признаки используются в качестве исходных данных для модели генерации музыки.

Затем транскрибируются аудиофайлы в MIDI и аккорды, а также извлекаются такие характеристики, как плотность нот и громкость.

В результате был собран набор мультимодальных данных под названием MuVi-Sync, на котором обучена модель для генерации музыки на основе видео. Эта модель включает в себя новый механизм, обеспечивающий сходство между видео и музыкой. Наконец, выполняется постобработка на основе регрессионной модели на базе biGRU для оценки плотности и громкости нот на основе характеристик видео.

Это обеспечивает динамическую визуализацию генерируемых аккордов с изменяющимся ритмом и громкостью.

В ходе экспериментов показано, что фреймворк позволяет генерировать музыку, соответствующую видеоконтенту с точки зрения эмоций. Музыкальное качество, а также качество согласования музыки и видео подтверждается в ходе исследования.

Модель AMT, а также новый датасет MuVi-Sync представляют собой перспективный шаг для задачи генерации музыки для видео.

🖥 Github: https://github.com/amaai-lab/video2music

📕 Paper: https://arxiv.org/abs/2311.00968v1

Demo: https://llmrec.github.io/

🌐 Dataset: https://zenodo.org/records/10057093

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

🖥 TORCH UNCERTAINTY

Comprehensive PyTorch Library for deep learning uncertainty quantification techniques.

TorchUncertainty - это, фреймворк для использования методов квантования неопределенности для повышения надежности глубоких нейронных сетей. Пакет предоставляет многоуровневый API, включая:

▪готовые к обучению базовые модели на исследовательских датасетах, таких как ImageNet и CIFAR
▪базовые системы глубокого обучения, доступные для обучения на ваших наборах данных
предварительно настроенные веса для этих базовых сетей на ImageNet и CIFAR
▪готовые слои, доступные для использования в ваших сетях
▪методы постобработки в стиле scikit-learn, такие как Temperature Scaling.
Более полный список реализованных методов в справке по API.

pip install torch-uncertainty

🖥 Github: https://github.com/ensta-u2is/torch-uncertainty

📕 Paper: https://arxiv.org/abs/2311.01434v1

Project: https://llmrec.github.io/

👣 Api: https://torch-uncertainty.github.io/api.html

🌐 Dataset: https://paperswithcode.com/dataset/cifar-10

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

Открыта регистрация на новый трек “Системный инженер” оплачиваемой ротационной программы Excellence!

Excellence — ротационная программа развития в международной FMCG-компании JTI. В рамках трека «Системный инженер» тебя ждут 3 ротации в разных командах JTI — от 5 до 12 месяцев в каждой. За это время ты погрузишься в ключевые процессы автоматизации производства на одной из крупнейших фабрик в структуре JTI и обретёшь необходимые знания для дальнейшей роли.

Узнать больше на сайте программы

Для кого эта программа?
Для тех, у кого уже есть опыт работы с АСУ ТП или в смежных областях.
Для тех, кто владеет английским на уровне Intermediate и выше.

Мы предлагаем:
— Стартовая зарплата от 165 000 руб. гросс
— ДМС с расширенной стоматологией и страхование жизни;
— Помощь с переездом в Санкт-Петербург для участников из других городов.

Успей подать заявку на участие в отборе до 8 ноября

Реклама. ООО «Дж.Т.И. Россия».ИНН 7703386329
Erid: LatgBjpJ5

Читать полностью…

Machinelearning

🔥 Learn from Andrew Ng! Generative AI for Everyone

Instructed by AI pioneer Andrew Ng, Generative AI for Everyone offers his unique perspective on empowering you and your work with generative AI.

Узнайте, как работает генеративный искусственный интеллект в новом бесплатном курсе от легендарного Эндрю Ына. Как использовать ИИ в профессиональной или личной жизни и как он повлияет на работу, бизнес и общество.

Вы познакомитесь с реальными примерами работы ии, изучите типичные кейсы использования, получите возможность практической работы с инструментами генеративного ИИ, чтобы применить полученные знания на практике и получить представление о влиянии ИИ на бизнес и общество.

Этот курс доступен для всех и не предполагает наличия опыта кодинга или работы с искусственным интеллектом.

https://www.deeplearning.ai/courses/generative-ai-for-everyone/

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

Три совета джунам от технических директоров и героев нового выпуска шоу «1х1» 🤓 Это Станислав Макеев и Никита Илясов, которые руководят разработкой в Лавке и Еде.

⬇️ «Образование нужно»
Да, знание уравнений в частных производных вряд ли пригодится на практике, но научит разбираться в сложных темах и строить конструкции в голове.

⬇️ «Слушайте фидбэк»
Для этого рядом нужны более опытные коллеги. В сообществе сильных специалистов вы будете расти быстрее.

⬇️ «Создайте систему знаний»
Она позволит легко вернуться к вещам, которые вам когда-то понравились, и не потерять полезную информацию.

Подписывайтесь 👉 @yandex

Читать полностью…

Machinelearning

Руководитель ML-направления в Яндекс Учебник
Москва / гибрид
Team Lead

Яндекс Учебник — это платформа, которая помогает проще и эффективнее осваивать школьную программу. Мы хотим изменить парадигмы образования, чтобы ускорить изучение тем и повысить качество их закрепления. Для этого мы разрабатываем GPT в Учебнике — инструмент, который упростит процесс обучения как для ребёнка, так и для учителя. Мы стремимся, чтобы машинное обучение и GPT в частности помогали выстраивать оптимальный образовательный маршрут, выполнять задания и прорабатывать ошибки.

Какие задачи вас ждут
- руководить процессом разработки нейросети, которая будет учить школьников информатике: анализировать успехи, составлять учебные планы, давать советы и искать проблемные области, и всё это — с индивидуальным подходом;
- налаживать взаимодействие между продуктом и командой ML, которая обучает первые версии моделей, основанных на YaGPT;
- совместно с командой ML разрабатывать методические инструменты, которые будут на основе больших данных о поведении пользователя оценивать, какие его навыки нуждаются в проработке, и помогать совершенствовать их.

Мы ждем, что вы
- знаете Python и SQL, работали с SciPy, Pandas, Torch, TensorFlow;
- хорошо понимаете принципы ML и применяли их на практике;
- можете с нуля построить пайплайн обучения модели: формулирование требований, выбор метрик, выбор алгоритма машинного обучения, сбор данных, обучение алгоритма, оценка качества, развёртка в продакшн;
- понимаете, как модель будет работать в продакшне, с учётом ограничений;
- руководили командой.

Будет плюсом, если вы
- проектировали и разрабатывали высоконагруженные ML-сервисы.

Откликнуться
Контакт в тг: @bachinina_ek

Читать полностью…

Machinelearning

PERF: Panoramic Neural Radiance Field from a Single Panorama

PERF - новая систему синтеза 360-градусного обзора, которая генерирует Nerf я на основе одной панорамы.

PERF позволяет осуществлять трехмерное перемещение по сложным сценам без затратного и утомительного сбора изображений.


Многочисленные эксперименты на Replica и новом датасете PERF-in-the-wild демонстрируют превосходство PERF над другими современными методами. Модель подходит для задач преобразование панорамы в 3D, текста в 3D и стилизации 3D-сцен.

🖥 Github: https://github.com/perf-project/PeRF

⚡️Project: https://perf-project.github.io/

📕 Paper: https://arxiv.org/abs/2310.16831v1

Dataset: https://paperswithcode.com/dataset/replica

/channel/ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔅 FreeNoise: Tuning-Free Longer Video Diffusion via Noise Rescheduling

totally no tuning less than 20% extra time support 512 frames

LongerCrafter (FreeNoise) - это новый метод генерации длинных видео, не требующих настроек, на основе предварительно обученных моделей диффузии.

Обширные эксперименты показывают превосходство данного метода по сравнению с предыдущими для расширения генеративных возможностей диффузионных моделей видео.

Промт, который был использован для генерации видео: "Чихуахуа в костюме космонавта, парящая в космосе, кинематографическое освещение, эффект свечения";
Разрешение: 1024 x 576; Кадры: 64.


🖥 Github: https://github.com/arthur-qiu/LongerCrafter

📕 Paper: https://arxiv.org/abs/2310.15169

Project: http://haonanqiu.com/projects/FreeNoise.html

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Masked Space-Time Hash Encoding for Efficient Dynamic Scene Reconstruction

Masked Space-Time Hash (MSTH) - новый метод эффективного восстановления динамических 3D-сцен из многоракурсного видео.

🖥 Github: https://github.com/masked-spacetime-hashing/msth

🤗 HH: https://huggingface.co/datasets/masked-spacetime-hashing/Campus

📕 Paper: https://arxiv.org/abs/2310.17527v1

Dataset: https://paperswithcode.com/dataset/mip-nerf-360

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Открыта регистрация на отборочный этап Всероссийского хакатона по биометрии с призовым фондом 1 000 000 рублей!

Тебе предстоит решить интересные задачи, чтобы победить в отборочном туре и принять участие в финале Всероссийского хакатона по биометрии, который пройдет уже 24-25 ноября в Москве. 

Кейсы:
• Создание дипфейков для тестирования
• Обнаружение дипфейков
• Некооперативный фронтальный алгоритм защиты от атак предъявления
• Решения для использования новых биометрических модальностей на пользовательских устройствах
⠀ ⠀
🗓 Даты отборочного этапа в ОНЛАЙН-ФОРМАТЕ:  3-5 ноября 2023 года   
❗️Даты финала:  24-25 ноября 2023 года  📍 Место: Москва
❗️ Формат: смешанный (отборочный этап в онлайн-формате, а финал на площадке в Москве)
👉 Регистрация на отборочный тур открыта до 29 октября 2023 года: https://tglink.io/4ed0cc6120bd

Реклама. ООО "АКСЕЛЕРАТОР ВОЗМОЖНОСТЕЙ". ИНН 9704005146. erid: LjN8KXChL

Читать полностью…

Machinelearning

💥Прокачайтесь в машинном обучении на бесплатных Тренировках по ML от Яндекса

ML — новое направление Тренировок от Яндекса, которое посвящено классическому машинному обучению. Курс разработан совместно со Школой анализа данных и подойдёт для выпускников технических вузов и начинающих ML-специалистов.
Тренировки пройдут с 30 октября по 29 ноября.

Тренировки по ML — это отличная возможность прокачаться в теме, закрепить знания и подготовиться к отбору в IT-компанию. Здесь вас ждут лекции от экспертов Яндекса, домашние задания и еженедельные онлайн-разборы.

🏆 Участники, которые проявят себя лучше других, получат фаст-трек в Яндекс, а те, кто пройдёт больше половины курса — сертификат о прохождении, который украсит портфолио.

Как проходят Тренировки по ML

1️⃣ Регистрируетесь: участвовать могут все желающие бесплатно и без конкурсного отбора. Старт Тренировок 30 октября.
2️⃣ Смотрите лекции и самостоятельно решаете задачи, которые определяют ваше место в рейтинге участников
3️⃣ Проверяете себя на еженедельных онлайн-разборах
4️⃣ Получаете награды от Яндекса

Я в деле!

Если вы уже чувствуете себя уверенно в направлении ML, то скорее подавайте заявку на оплачиваемую стажировку.

Читать полностью…

Machinelearning

🚀 Whisper-V3 / Consistency Decoder

Improved decoding for stable diffusion vaes.

Многие упустили из виду, что на Dev Day компания OpenAI выложила в открытый доступ сразу две модели, и на них стоит обратить внимание.

Первая из них - Whisper-V3, лучшая из существующих OSS-моделей распознавания речи. Она демонстрирует значительные улучшения по сравнению с Whisper-V2 на десятках языков.

Whisper остается одной из лучших фундаментальных моделей всех времен. В отличие от предыдущих работ, в которых создавались сложные конвейеры, Whisper представляет собой большой трансформер, который преобразует звук непосредственно в текст, со специальными "метаязыковыми" лексемами, позволяющими выполнять элегантную многозадачность: определение языка, перевод, распознавание голоса и т.д. Его первый автор - легендарный Алек Рэдфорд - человек, ответственный почти за все революционные статьи OAI.

Скорее всего Whisper позволил получить не менее триллиона высококачественных разговорных лексем из интернет-видео/аудиозаписей для GPT-4 и последующих проектов.

Второй открытый проект - это декодер согласованности (Consistency Decoder) из работы "Consistency Models" (Модели согласованности) под руководством Доктор Янге Сонг.

Янг был одним из первопроходцев в области диффузионных моделей. Вы можете заменить декодер Stable Diffusion на Consistency Decoder, и это улучшит рендеринг текстов, лиц и геометрических фигур.

- Whisper paper: https://arxiv.org/abs/2212.04356
- Whisper-V3 checkpoint: https://github.com/openai/whisper/discussions/1762
- Consistency Models: https://arxiv.org/abs/2303.01469
- Consistency Decoder release: https://github.com/openai/consistencydecoder

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

Команда «Море данных» открывает вакансии.

Основные направления работы: цифровое образование, анализ качества речи с помощью ии, цифровые двойники способные к рассуждению, digital hr. (Пример)

Middle/Senior Data Scientist (NLP) на постоянную основу.

Оклад: 200 000 − 400 000 ₽
Возможно временное оформление: договор ГПХ, самозанятые, ИП
Возможен гибкий график
Требования:
— знание NLP стека
— понимание принципов устройства и обучения LLM и генеративных трансформеров
— опыт разработки NLP-моделей
— желателен опыт дообучения LLM
— интерес к сфере образования

Резюме присылать в тг @ana_vitvit с пометкой ‘Data Scientist’

Prompt engineer
Оклад: 90 000-160 000 руб.
Обязанности: написание промптов и промпт-сценариев для больших языковых моделей
Требования:
— Понимание принципов работы LLM, тюнинга поведения LLM с помощью промптов; обучаемость.
— Подтвержденный опыт проектов с прмт инженерией для языковых моделей
— интерес к сфере образования

Резюме присылать в тг @ana_vitvit с пометкой ‘промт инженер’

Проджект менеджер дата-интенсивных проектов
Оклад: по результатам собеседования

Требуется опыт ПМ на дата интенсивных и технических проектах не менее 3х лет. Agile. Работа с front , back, devops, data science и machine learning специалистами.

Резюме присылать в тг @ana_vitvit с пометкой ‘проджект менеджер’

Читать полностью…

Machinelearning

🤖Обучение с подкреплением - метод машинного обучения, который сегодня находит широкое применение в разных областях: автоматизация на производстве, здравоохранение, робототехника и других. Особое место в этом списке занимает сфера трейдинга и финансов.

🔥В OTUS стартует курс “Reinforcement Learning”, на котором специалисты смогут освоить RL-алгоритмы на практике и использовать их, в том числе, с целью управления финансовым портфелем.

8.11 в 20.00 приглашаем на урок «Применение обучения с подкреплением на финансовых рынках».

Вы узнаете:

- как применить обучение с подкреплением для анализа рынка
- как создать модель рынка для обучения торгового агента
- что нужно для построения полноценного торгового робота
- какие алгоритмы помогают в прогнозировании поведения финансового рынка

👉 Регистрация https://otus.pw/1f8T/

При поступлении в группу возможны разные способы оплаты и рассрочка платежа

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KNWXz

Читать полностью…

Machinelearning

🔥 One of the most beautiful interactive visualizations on how LLMs work.

Хотите понять, как работают большие языковые модели?

Эта статья поможет вам понять основные концепции в интерактивной форме!

Одна из самых красивых визуализаций того, как работают LLM.

http://ig.ft.com/generative-ai/

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

Erid:2VtzqxJMzEK

Регистрация на отборочный этап Всероссийского хакатона по биометрии!

Если ты молодой специалист, жаждущий новых вызовов и возможностей, не упусти шанс побороться за часть призового фонда в размере 1.000.000 рублей! Зарегистрируйся на отборочный тур прямо сейчас, выбери кейс и стань частью Всероссийского хакатона по биометрии.

Кейсы:
• Разработка инструмента для создания дипфейков
• Разработка инструмента для обнаружения дипфейков
• Фронтальный алгоритм защиты от атак предъявления для лицевой биометрии
• Решения для использования новых биометрических модальностей на пользовательских устройствах

Хакатон пройдёт в два этапа:
• Отборочный тур онлайн 10-12 ноября
• Финал офлайн 25 ноября в Москве

Победители соревнования получат ценные призы и возможность представить свои проекты перед экспертами и топ-менеджерами биометрических вендоров и крупных технологических компаний. Мероприятие проводится при поддержке Центра Биометрических Технологий. Генеральный партнёр мероприятия – Сбер, официальные партнёры – IT-компании «InnoView», Ovision. Хакатон проводится при поддержке Минспорта, Федерации Спортивного Программирования и Минцифры.

Даты отборочного этапа в онлайн-формате: 10-12 ноября 2023 года   
Даты финала: 25 ноября 2023 года   
Место: Москва
Формат: смешанный (отборочный этап в онлайн-формате, а финал – на площадке в Москве)

Подробности и регистрация до 6 ноября 2023 года по ссылке: https://clck.ru/36PH5y

Собирай команду, решай задачу и выигрывай на Всероссийском хакатоне по биометрии
Реклама. ООО «Акселератор Возможностей». ИНН 9704005146

Читать полностью…

Machinelearning

⚡️ LLMRec: Large Language Models with Graph Augmentation for Recommendation

LLMRec - это новый фреймворк и датасет, улучшающий рекомендательные системы путем применения простых, но эффективных стратегий дополнения графов на основе LLM.

🖥 Github: https://github.com/hkuds/llmrec

📕 Paper: https://arxiv.org/abs/2311.00423v1

Project: https://llmrec.github.io/

🌐 Dataset: https://llmrec.github.io/#

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

🚀 Важное событие в области искусственного интеллекта! Восьмая глобальная онлайн-конференция AI Journey 2023 в сфере ИИ.

С 22 по 24 ноября главные эксперты по ИИ из России и других стран поделятся информацией о новых трендах в области искусственного интеллекта и машинного обучения. Конференцию также можно посмотреть онлайн.

Кроме того, AI Journey 2023 объявит официальных финалистов AI Journey Science и вручит награды победителям международных онлайн-соревнований AI Challenge и AIJ Contest.

Смотрим тут.

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥 Learning From Mistakes Makes LLM Better Reasoner

LEMA fine-tunes LLMs on mistakecorrection data pairs generated by GPT-4.

Большие языковые модели недавно продемонстрировали замечательные способности к рассуждениям при решении математических задач. Для дальнейшего улучшения этих возможностей в данной работе предлагается метод обучения на ошибках (LeMa), аналогичный процессам обучения человека.

Если взять студента, который не смог решить математическую задачу, для достижения успеха, студент узнает, какую ошибку он допустил и как ее исправить. Имитируя этот процесс обучения, основанный на ошибках, LeMa производит тонкую настройку LLM на парах данных "ошибка-исправление", генерируемых GPT-4.

В частности, сначала собираются неточные пути рассуждений от различных ЛЛМ, а затем используется GPT-4 в качестве "корректора", чтобы (1) определить ошибочный шаг, (2) объяснить причину ошибки, (3) исправить ошибку и сформировать окончательный ответ.

LeMa стабильно улучшает производительность моделей по сравнению с тонкой настройкой и превосходит показатели SOTA, достигнутые другими моделями с открытым исходным кодом на различных сложных задачах.

🖥 Github: https://github.com/microsoft/codet

📕 Paper: https://arxiv.org/pdf/2310.20689v1.pdf

Dataset: https://paperswithcode.com/dataset/math

@ai_machinelearning_big_data

Читать полностью…

Machinelearning

🪄IC|TC: Image Clustering Conditioned on Text Criteria

New methodology for performing image clustering based on user-specified criteria in the form of text by leveraging modern Vision-Language Models and Large Language Models

В данной работе представлена новая методика кластеризации изображений на основе заданных пользователем текстовых описаний с использованием современных моделей "зрение-язык" и больших языковых моделей.

Метод Image Clustering Conditioned on Text Criteria (IC TC), представляет собой новую парадигму кластеризации изображений и требует минимального вмешательства человека и предоставляет пользователю полный контроль над результатами кластеризации. Эксперименты показали, что IC TC может эффективно кластеризовать изображения с различными критериями, такими как действия человека, его физическое местоположение или настроение, значительно превосходя при этом другие решения.

🖥 Github: https://github.com/sehyunkwon/ictc

📕 Paper: https://arxiv.org/pdf/2310.18297v2.pdf

Tasks: https://paperswithcode.com/task/clustering

/channel/ai_machinelearning_big_data

Читать полностью…

Machinelearning

Работаешь на пределе → Выгораешь → Прокрастинируешь → Опять надо работать на пределе

Этот порочный круг можно разорвать с тем самым Neiry Mind Tracker

Наш софт обрабатывает электрическую активность твоего мозга и дает персональные рекомендации: когда мозг готов к работе, а когда пора отдохнуть...
😖 Иначе ты снова поймаешь ту самую прокрастинацию

Это функцию мы называем «Нейропомодоро», потому что это похоже на тот самый таймер: ты работаешь 20-30 минут и потом софт говорит, что пора сделать паузу...
❗️ Только в нашем случае — это персональный таймер, основанный на твоей РЕАЛЬНОЙ усталости

Под капотом — настоящая наука и длительные исследования нейрофизиологов

Узнай подробнее о майнд-трекере Neiry: https://neiry.ru/mindtracker?utm_source=tg_in&utm_medium=3110mac&utm_term=adP3

Реклама. ООО "НЕЙРИ". ИНН 9701140612. erid: LjN8KXJnS

Читать полностью…

Machinelearning

Запусти стартап и получи грант на его развитие

Заполняй заявку в акселератор Сбера для студентов, аспирантов и научных сотрудников вузов. Регистрация открыта!

За 6 месяцев ты:
— узнаешь, какие этапы нужно пройти, чтобы создать стартап
— соберешь команду или присоединишься к существующей
— создашь бизнес-проект под руководством наставника
— достигнешь первых бизнес-результатов: предзаказы, договоренности о пилотировании или MVP устройства

Какие есть преимущества?
— лучшие команды представят проекты на Демо-дне, где их оценят топ-менеджеры Сбера и других корпораций, бизнес-ангелы
— победители получат призы от Сбера, смогут рассчитывать на гранты от Moscow Seed Fund и на специальный грант Президента РФ для магистров

Выпускники программы создали более 1500 технологических стартап-проектов и привлекли больше 420 млн рублей на их развитие.
Хочешь так же? Регистрируйся!

Читать полностью…

Machinelearning

❗️Как легко получить Spark кластер на 10 узлов?
Современные облачные инфраструктуры позволяют сделать это всего за несколько шагов.

▶️ 9 ноября в 20:00 мск в рамках онлайн-курса MLOps от OTUS пройдёт открытый урок «Big Data в облаках».

На открытом уроке:
🔹Рассмотрим как создать в Yandex Cloud Spark кластер.
🔹 Что лучше использовать в качестве хранилища: HDFS или S3.
🔹 Как можно экономить за счет динамического выделения ресурсов.

✅ Владение инструментами MLOps открывает новые карьерные горизонты специалистам ML, Data Scientist’ам и Software инженерам.

👉 РЕГИСТРАЦИЯ

https://otus.ru/lessons/ml-bigdata/?utm_source=telegram&utm_medium=cpm&utm_campaign=ml-bigdata&utm_content=lesson-09-11-2023&utm_term=ai_machinelearning_big_data#event-3489

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KLt6S

Читать полностью…

Machinelearning

CS25: Transformers United V3

Новые лекции на курсе по Трансформерам от Стенфорда! На Stanford CS 25 "Transformers United" выступали такие звездные гости, как Андрей Карпаты, Ноам Браун, Лукас Бейер и сам Джефф Хинтон!

Вышел новый доклад, посвящённый созданию и рецептам создания универсальных ИИ-агентов в открытых мирах:


- MineDojo: открытый фреймворк и мультимодальная база данных для обучения агентов Minecraft.
- Voyager: агент для пожизненного обучения в Minecraft на базе LLM.
- Eureka: GPT-4 развивает функции вознаграждения, чтобы научить руку робота крутить ручку.
- VIMA: один из самых ранних мультимодальных LLM с.
- Взгляд в будущее: перспективные направления исследований.

☑️ Slides: https://drive.google.com/file/d/1lWIhijUaTZkkWOC_YwZHMoI0h7EAWVPL/view

📑 Lectures: https://web.stanford.edu/class/cs25

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🕵️ Detecting Pretraining Data from Large Language Models


Min-K% Prob, простой и эффективный метод, который позволяет определить, была ли LLM предварительно обучена на заданном тексте, а также для обнаружения защищенного авторским правом текста.

Датасет WikiMIA служит бенчмарком, предназначенным для обнаружения данных предварительного обучения.


🖥 Github: https://github.com/swj0419/detect-pretrain-code

📕 Paper: https://arxiv.org/pdf/2310.16789.pdf

📘 WikiMIA Benchmark:

Project: https://swj0419.github.io/detect-pretrain.github.io/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔇 Efficient Large-Scale Audio Tagging

AudioSet pre-trained models ready for downstream training and extraction of audio embeddings.

Трансформеры доминируют в области по работе с адуио и заменили CNN в качестве современной нейросетевой архитектуры.

Трансформеры отлично справляются с огромными аудио датасетами и подходят для создания мощных предварительно обученных моделей.

Однако трансформеры являются сложными моделями и масштабируются квадратично по отношению к длине данных, что делает их медленными.

В данной модели используются динамические CNN, которые достигают лучшей производительности на задачах разметки аудио данных и хорошо масштабируются, достигая производительности трансформеров и даже превосходя их.

🖥 Github: https://github.com/fschmid56/efficientat

📕 Paper: https://arxiv.org/abs/2310.15648v1

Demo: https://21527a47f03813481c.gradio.live/

ai_machinelearning_big_data

Читать полностью…
Подписаться на канал