Telegram-канал sberloga - Sberloga: Неотсортированное

Sberloga

18 июня 2024 09:33

Подборка статей от друга сообщества

Лайк, репост статьи приветствуются 👍

🔍 How to Detect Causal Lead-Lag Relationship in Multivariate Time-Series❓
https://www.linkedin.com/posts/nikita-iserson_causality-leadlag-finance-activity-7201121191581900800-P9Qa
про lead-lag зависимости во временных рядах

🔍 Large Language Models for Alternative Financial Data Extraction❓
ht tps://www.linkedin.com/posts/nikita-iserson_topicmodeling-namedentityrecognition-relationextraction-activity-7208718110554566656-5Owl
про всякие последние подходы / библиотеки экстракции финансовых данных из текста (NER, REL, ABSA) с помощью LLM.

🔍 How to Avoid Overfitting and Spurious Correlations with Domain Knowledge?❓
https://www.linkedin.com/posts/nikita-iserson_benignoverfitting-spuriouscorrelations-domainknowledge-activity-7202199071636307969-t8oR
про монотонные ограничения в разных типах моделей, упомянул AutoWOE

Читать полностью…

Sberloga

23 мая 2024 13:42

Друг из сообщества написал статью о том как начать работать с GNN для временных рядов. В комментариях можно найти ссылки на статьи, книги, доки. 👏

Лайк, репост статьи приветствуются 👍

https://www.linkedin.com/posts/nikita-iserson_graphneuralnetworks-gnn-timeseriesforecasting-activity-7199312050571866113-kImK

Так же у нас есть чатик для обсуждения графов
/channel/sberlogawithgraphs на случай если вы захотите в эту тему погрузиться и нужна будет помощь 💪

Читать полностью…

Sberloga

22 апреля 2024 08:29

💻 Улучшаем навыки программирования!

💬 Уже занимаюсь DS наверное лет 10, еще с тех пор когда слова "Data Science" даже не употреблялись. И, как мне видится, за все это время мало что изменилось с точки зрения написания кода - сложно читаемый, не воспроизводимый и непригодный для использования в production-системах. Кроме этого выявляются многочисленные проблемы, такие как нарушение логики, лики, ошибки реализации тех или иных функций которые в конечном счете влияют на результат.

💬 Хочу поговорить о том как можно улучшить свои скилы в плане написания production ready кода.
Ниже представлены несколько ресурсов, которые помогут систематизировать информацию, понять текущие пробелы в знаниях и начать их изучение:

1⃣ https://goodresearch.dev/
Сайт с базовыми знаниями о том как создавать и вести любой научный проект. От создания структуры проекта, работы с git, написание кода, документации, тестов и т.д. Кратко, понятно, а главное все по делу. Где нужно - есть дополнительные ссылки с более детальной информацией.
В общем если вы видели в своей жизни только jupyter notebook и не знаете с чего начать более сложный проект - начните с этого сайта.

2⃣ https://refactoring.guru/
Паттерны проектирования - нужно знать. Вы же на python код пишите все-таки. Кроме этого есть отдельный раздел по рефакторингу кода, который содержит типичные ошибки при написании кода и принципы которые помогут избегать их.
У меня сложная история с изучением этого материала, связанная с написанием проекта по парсингу документов судебных решений. История полная боли, ошибок, самоосознания насколько фиговый код я пишу, и в итоге - переписыванием кода с нуля, причем 2 или 3 раза. После переработки, код стал чище, понятнее, а главное - можно было легко его доработать.
Мой совет - изучите тему, даже если не все запомните, при реализации проекта вам будут приходить правильные мысли и возможно не потратите уйму времени на переписывание собственного кода.

3⃣ Lott Phillips - Python Object Oriented Programming 4th Edition (2021, Packt)
ООП в python. Конечно я считаю, что посмотрев 2 скринкаста ниже можно основную информацию подчерпнуть сразу потратив всего 2 часа
https://www.youtube.com/watch?v=r1Y7m5bB7l8
https://www.youtube.com/watch?v=Eetg5HIxNow
Прочитать книгу все равно рекомендую если вы хотите улучшить свои хард скилы

4⃣ Luciano Ramalho - Fluent Python- Clear, Concise, and Effective Programming (2022, O'Reilly Media)
Думаю эта книга станет отличным дополнением для людей которые уже знают python и хотят узнать что-то новое. Там с первых строк будет понятно, что книга не для новичка - concurrency, async, метапрограммирование, датаклассы, ООП, функции, структуры данных. Вас ждет погружение в мир Python на максималках

🧑‍💻 Напишите в комментах свои рекомендации и чем вы пользовались

Читать полностью…

Sberloga

18 февраля 2024 12:50

Митап Победителей в Лотерею 27 февраля!

Всем привет! Как вы, возможно, знаете Гипотеза Лотерейного Билета предполагает, что в нейросетях можно найти мощные подсети, способные обучаться не хуже полных сетей. Наши друзья погрузились в тему и хотят рассказать об этом. Приходите на наш митап, чтобы узнать о том, как можно выявить и оптимизировать такие подсети, и как это открывает двери к нейросетям следующего поколения. 🚀

🔍 Что будет на митапе:
- Узнаем какой прогресс по этой теме существует в мире.
- Посмотрим на работу с подсетью MobileNet_V3, потерявшей половину весов и менее 1% accuracy без дообучения весов.
- Откроем черный ящик нейросетей и разберемся, что происходит внутри.
- Поговорим про перспективы и возможности для разработки совсем иных нейросетей с меньшим количеством параметров, но с гораздо большими возможностями.

На мероприятии выступят:
- Голощапов Владислав (независимый исследователь)
- Денис Кузнеделев (Сколтех, Центр технологий искусственного интеллекта, Резидент исследовательского отдела ООО «ЯНДЕКС», лауреат Yandex ML Prize) 🌟

Доклады:
1. Ансамбль синапсов – структурная единица нейронной сети (Влад Голощапов)
2. История Оптимального хирурга для спарсификации нейронных сетей, в теории и на практике (Денис Кузнеделев)
3. Глубокий анализ полезности весов - путь к успешному прунингу (Влад Голощапов)
4. Как извлечь пользу из прунинга. Нейросети с адаптивно обучаемой архитектурой (Влад Голощапов)

Обязательная регистрация по ссылке

📅 27.02.2024
🕓 18:00 - 22:00
📍 Точка кипения

ODS Moscow

Читать полностью…

Sberloga

16 января 2024 17:26

I'ML Meetup: Обучение и запуск в прод моделей на больших данных

Дмитрий Бугайченко, Сбер — «Практический ML на больших данных»

Сергей Саввов — «Слияние LLM»

https://wildcard.timepad.ru/event/2746307/?utm_campaign=JRG_IMLmeetup&utm_medium=newsletter&utm_source=email

Читать полностью…

Sberloga

25 декабря 2023 09:42

https://github.com/EulerSearch/embedding_studio
Знакомые знакомых сделали open-source либу на тему эмбедингов
Поставьте звездочку как откроете почитать о ней. Ребятам приятно будет. Если будут вопросы или комментарии - пишите обязательно 👍

PS присылайте мне в личку cвои библиотеки которые не стыдно показать и рассказать, напишу о них (@boyadzhi )

Читать полностью…

Sberloga

12 декабря 2023 17:18

📊 Опубликовали бенчмарк RealCode_eval

https://github.com/NLP-Core-Team/RealCode_eval

RealCode_eval - наш новый бенчмарк по оценке возможностей генерации кода языковыми моделями. Задача для модели состоит в генерации тела для функции (или метода) в реальных репозиториях с гитхаба. Популярные существующие бенчмарки по генерации кода, такие как HumanEval, MBPP или AlphaCode, состоят из задач соревновательного программирования, таких как на LeetCode или CodeForces. RealCode же проверяет модели в условиях реальной разработки. Функции взяты из репозиториев на питоне, опубликованных летом 2023 года. Это означает, что популярные открытые модели Codellama и Starcoder этих репозиториев не видели.

Для оценки сгенерированных функций используем execution-based подход: подставляем сгенерированное тело функции в файл, запускаем тесты репозитория и сравниваем количество пройденных тестов между сгенерированным и настоящим телом функции.

Читать полностью…

Sberloga

01 декабря 2023 11:29

DeepMind, возможно, снова резко ~~пнули~~ ~~кинули~~ двинули (!) науку вперёд (как с AlphaFold):
представили GNoME (Graph Networks for Material Exploration)

1) Это графовая сетка, способная не только предсказывать кристаллические структуры материалов, но и их стабильность
2) Все найденные материалы (а их уже, по словам ДМ, 380,000 - стабильных, и 2.2 млн всего) будут выложены в открытый доступ
3) За последнеи десять лет вычислительным путём было найдено около 28 тысяч стабильных кристаллических структур ⇒ то есть DM, по их подсчётам, набросал эквивалент ~800 лет ресерча
4) Среди обнаруженного - 52,000 потенциально новых структур графен-подобных материалов (сверхпроводники), 528 аналогов литиевых проводников (аккумуляторы)
5) Состоит из двух путей: структурного (аналоги известных материалов) и композиционного (~рандомная генерация) ➟ проверка на стабильность ➟ дальнейшая проверка (Density Functional Theory)

📚 Папира
🎥 Минутный видос - дашборд, как люди заходили и использовали БД с материалами (чут чут ~~кусат~~ завораживает)
📚 Беркли делает лабу для автономного синтеза материалов. Выглядит модно, и за 17 дней эксперимента насинтезировала 41/58 материалов - для сравнения, человеку могут потребоваться недели-месяцы на один материал ~~(особенно когда нет финансирования...)~~

Читать полностью…

Sberloga

27 ноября 2023 12:13

Салют, GigaChat!
Речевые технологии и большие языковые модели

4 декабря приглашаем ML-разработчиков и Data Science-специалистов на встречу с командами разработки продакшн GigaChat и речевых технологий.
На митапе SberDevices ведущие разработчики GigaChat расскажут о новой модели, поделятся деталями сбора данных для предобучения и метриках, которых достигают 7B и 29B модели, лежащие в основе GigaChat.
Мы также поговорим о наших подходах в разработке речевых технологий (ASR/TTS):
— создание моделей распознавания речи;
— дообучение для задач распознавания речи и эмоций;
— какие модификации мы сделали в обучении, архитектуре и инференсе моделей TTS, чтобы победить прод и научить модель разговаривать лучше и др.

В программе:

— Федор Минькин, технический директор GigaChat — «Открытие митапа, о команде, обзор разработки GigaChat»
— Григорий Лелейтнер (команда GigaChat) — «Что мы улучшили в процессе pre-training LLM»
— Эмиль Шакиров и Никита Сидоров (команда GigaChat) — «Наш путь в процессе Alignment для совершенства моделей глубокого обучения»
— Александр Максименко (команда Speech) — «Speech-only Pre-training: обучение универсального аудиоэнкодера»
— Григорий Федоров (команда Speech) — «Intended Query Detection: распознаем только нужные запросы»
— Гриша Стерлинг (команда Speech) — «Как мы заставили модель синтеза речи 2023 года говорить лучше модели 2018 года»

Участвуйте в дискуссиях с другими участниками митапа и задавайте вопросы спикерам во время докладов.

Количество мест в офлайне ограничено. Для участия необходимо зарегистрироваться на сайте https://sberdevices-meetup.jugru.org/

Читать полностью…

Sberloga

22 ноября 2023 17:58

⚡️ MERA – Multimodal Evaluation for Russian-language Architectures

В рамках AI Journey Алена Феногенова (SberDevices) и Денис Димитров (Sber AI) рассказали о новом открытом бенчмарке для русского языка для оценки фундаментальных моделей.

▪️ С помощью сложнейших для языковых моделей задач, MERA тестирует всё – от знаний о мире до этики и логики. Теперь оценить возможности таких гигантов, как ChatGPT, GigaChat, YandexGPT и LLAMA, можно в единых экспериментальных условиях.

✅ Подробнее в статье на Хабре

Участники проекта – Альянс ИИ, SberDevices, Sber AI, MTS AI, Skoltech, НИУ ВШЭ и другие.

🌐 Новый бенчмарк MERA
🤗 Датасеты бенчмарка
🌐 Репозиторий проекта

Подписывайтесь 👉 Salute AI

#конференция_AI_Journey #MERA

Читать полностью…

Sberloga

22 ноября 2023 10:46

https://habr.com/ru/companies/sberbank/articles/775590/

Читать полностью…

Sberloga

31 октября 2023 17:46

Реклама yandexgpt в лужниках 👏

Читать полностью…

Sberloga

24 сентября 2023 13:39

/channel/sberloga?boost
посчу не много все равно, не пожалейте бустиков 😇

Читать полностью…

Sberloga

28 июля 2023 09:02

https://www.bairbie.me
Кидайте свои фотки которые получились 😎
Если уже фильм смотрели поделитесь впечатлениями, стоит ли сходить.
Маркетинг конечно потрясающий у фильма

Читать полностью…

Sberloga

12 июля 2023 14:16

⚡️⚡️⚡️Kandinsky 2.2 выходит в свет

Вот и наступил долгожданный знаменательный день, когда мы готовы порадовать комьюнити новой версией генеративной модели Kandinsky 2.2.

Не буду долго томить вас лирикой и историями, как мы маленькими шагами двигались к качественному скачку эти 3 месяца с момента релиза 2.1, а просто расскажу о ключевых нововведениях:
📌 разрешение генераций теперь достигло 1024 px
📌 генерировать можно с различным соотношением сторон (ура, конец монополии квадратных генераций!)
📌 изображения стали максимально близки к фотореалистичным
📌 у модели появилась возможность изменения частей изображения за счёт внедрения механики ControlNet (пока только на основе карты глубины)
📌 версии 2.1 и 2.2 встроены в самый большой и известный фреймворк генеративных моделей - Diffusers

⚡️В телеграм боте теперь 6 режимов:
1) генерация картинки по тексту
2) смешивание двух изображений
3) смешивание изображения и текста
4) создание вариаций входной картинки
5) локальные изменения с помощью ControlNet механики 💥
6) создание стикеров и стикерпаков по текстовым запросам 💥

Воспользоваться моделью можно тут:
Telegram bot
fusionbrain.ai
Diffusers
rudalle.ru
Салют

📕Почитать подробнее про Kandinsky 2.2 можно в новой статье на Хабре.

❓По вопросам сотрудничества и развития модели пишите в ЛС - с радостью обсудим все идеи😉

P.S. По неожиданной случайности сегодня еще День Фотографа, с чем всех причастных торжественно поздравляю📸 Такой вот подарок для сообщества от нашей команды🎉

@complete_ai

Читать полностью…

Sberloga

30 мая 2024 11:17

Уже не новость, что
Docker hub перестал работать в России
И сразу же начали появляться зеркала, чтобы все работало, например
хуёкер.ioВ принципе какое решение, такое и название🤣

А вот чего я еще не встречал, так это российские аналоги докера:
Коробки — российский аналог Docker

Ну что, на Коробки переходим? 🤣

Читать полностью…

Sberloga

13 мая 2024 12:54

Секция Career от Reliable ML на Data Fest 2024
25 мая в офисе VK, Москва

Всем привет!

Есть у нас с Димой такая традиция, каждый год в конце мая мы организуем секцию Reliable ML на Data Fest. А в этом году делаем аж три секции.

А все почему? Потому что очень много крутых докладов. Приходите послушать и обсудить!

Публикуем расписание секции Карьера, которая пройдет 25 мая офлайн в офисе VK в Москве.

Сначала поговорим с вами о рынке труда и карьерных вопросах со стороны работника/кандидата, а потом - со стороны руководителей команд.

Регистрация на площадку на 25 мая тут.

В этот же день после обеда будет вторая наша офлайн секция - Data Strategy. Расписание опубликуем чуть позже.

Ваш @Reliable ML

#datafest #offline #ods #career #reliable_ml #business

Читать полностью…

Sberloga

18 апреля 2024 15:00

🔎 Ищешь работу в сфере аналитики, датасаенса или дата инженерии? Тогда подписывайся на канал в Telegram - Sberlogajobs!

📊 У нас публикуются только актуальные вакансии от ведущих компаний. Мы поможем тебе найти работу мечты!

💼 Подписывайся прямо сейчас: /channel/sberlogajobs

Не упусти свой шанс на успешное трудоустройство! 😉 #vacancy #jobsearch #analytics #datascience #dataengineering

Читать полностью…

Sberloga

23 января 2024 13:26

Коллеги, всем привет!

Давно мы не сообщали об обновлениях LightAutoML, но все это время мы не сидели сложа руки - сегодня ночью на PyPI появился релиз LAMA 0.3.8.1 с множеством полезных обновлений:

1) Теперь из коробки вам доступны 9 SOTA архитектур табличных нейросетей таких как MLP, DenseNet, DenseLight, ResNet, SNN, TabNet, NODE, FTTransformer и AutoInt++. Также были добавлены SOTA методы кодирования признаков - PLR и SoftEmb.

2) По многочисленным заявкам в LightAutoML был добавлен алгоритм SSWARM для расчета Shapely значений итоговой модели. Алгоритм позволяет работать с произвольной итоговой моделью (состоящей не только из бустингов) и если сравнивать его с KernelExplainer из SHAP, то удается получить нужные значения на 2-4 порядка быстрее (примерно на уровне TreeExplainer, который поддерживает только бустинги).

3) Всеми любимые отчеты о разработке моделей теперь можно строить для TabularUtilizedAutoML пресета

4) В новой версии LightAutoML поддерживает версии питона 3.8 - 3.11 включая оба конца, что позволяет использовать ее как на Kaggle, так и в Google Colab

5) Исправлено большое количество добавленных ранее багов и проблем с зависимостями (так, например, решена проблема с версией scikit-learn - теперь случайный лес работает в мультиаутпут задачах и временных рядах) 🙃

С примерами использования нововведений можно ознакомиться в нашем обновленном туториале и в кернелах (Tabular_NN, SSWARM_SHAP) на Kaggle.

Будем рады услышать ваш фидбек, а также вопросы/замечания/предложения по работе LightAutoML

Читать полностью…

Sberloga

29 декабря 2023 11:20

С наступающим! В последний рабочий день рекомендую посмотреть на еще одну либу наших друзей:

Augmentex - твой карманный аугментер текста.

Мы недавно вместе с коллегами опубликовали супер-либ SAGE. И зовётся супер-либ не случайно, тк состоит из генеративной части и нашей библиотеки Augmentex.

Если вы хотите получить возможность аугментации текстов на основе добавления опечаток, перестановок и др. и вам не нужны механики генеративной аугментации или custom имитации ошибок- это ваш выбор. Иначе юзайте SAGE.

Например, Augmentex работает на CPU и умеет, на основе general частот ngramm, заменять корректные символы/наборы символов на их комплиментарные ошибки. Тоже самое можно делать и на уровне слов. Встроена возможность добавлять пробелы между символами или склеивать слова и многое другое, см. мануал в репо.

Мы уже поддерживаем 2 языка - русский и английский, а также имитации general ошибок ввода с ПК и мобильной (поддержка Android/IOS раскладок) клавиатур.

Также мы планируем добавить наши bbox атаки , о которых я говорил в своих постах и на выступлениях. Атаки включают и encoders и LLM дискриминацию. Следите за обновлениями!

P. S. Использование атак в генерации батча при обучении наших моделей, добавляет устойчивости и апает метрики качества на 2-5%.
@dealerAI

Ставьте звездочки и присылайте свои либы о которых хотите рассказать (@boyadzhi)

Читать полностью…

Sberloga

18 декабря 2023 16:14

https://www.ted.com/playlists/841/the_must_watch_ted_talks_on_ai_from_2023

Читать полностью…

Sberloga

01 декабря 2023 12:11

Mattermost ODS

После отключения ods.ai в slack сообщество разбежалось по разным каналам, чатам и мессенджерам. Кто-то кого-то банил, кто-то с кем-то спорил, где-то все тормозило и так далее.
Все это время нас регулярно спрашивали о площадке для общения сообщества, есть ли что-то "как раньше".
"Как раньше" уже не будет никогда, но мы подняли сервер Mattermost, на который может зайти любой, имеющий аккаунт на ods.ai.

Технические детали:
Авторизация сделана через OAuth, на бесплатной версии mattermost это работает только через Gitlab. Поэтому мы подняли сервер авторизации, который притворяется Gitlab сервером, а сам берет доступы с сайта ods.ai. Это объясняет, почему авторизация на сервере такая кривая ;-) Потихоньку прикрутим прямее.

Инструкция по подключению - здесь.

Ваш @Reliable ML

#ods #mattermost

Читать полностью…

Sberloga

30 ноября 2023 13:28

Делимся уникальным курсом от команды SmartSpeech

Георгий Господинов, Александр Максименко, Павел Богомолов, Гриша Стерлинг — специалисты SberDevices, которые также примут участие в нашем митапе «Салют, GigaChat!», запустили третью итерацию своего знаменитого курса по голосовым технологиям для магистров МФТИ.

Курс охватывает широкий спектр тем:
▪️Детекция ключевых слов.
▪️Распознавание речи.
▪️Диаризация и верификация спикера.
▪️Синтез речи и многое другое.

🌐 GitHub репозиторий с открытыми материалами курса, включая записи лекций, слайды и домашние задания. Пригодится всем, кто стремится к глубокому пониманию речевых технологий и их применению в реальных проектах.

💡 Ждём вас на встрече с авторами курса и другими экспертами SberDevices на митапе «Салют, GigaChat!» о речевых технологиях и больших языковых моделях: 4 декабря, Москва (офлайн + онлайн). Ваши коллеги и друзья также приветствуются!

✅ Регистрация на митап обязательна

Подписывайтесь 👉 Salute AI

#SmartSpeech #митап_Салют_GigaChat #митап

Читать полностью…

Sberloga

23 ноября 2023 07:01

Друзья, мы решили тоже попробовать в опенсорс по графам.
Библиотек сейчас много, обычно они поверх PyG или Torch Spatiotemporal.
Часто они заточены под конкретные задачи и требуют хорошей теоретической базы.
Мы же заметили что DS обычно (вряд ли в правда именно в этой группе) неохотно пробуют графовые сетки, не зная с чего начать.
Поэтому, чтобы снизить порог входа и, например, быстро проверить — дадут ли графовые данные прибавку именно в вашей задаче (например, если нужно принять решение о закупке) мы собрали из наших наработок небольшую библиотеку.
Пара слоев с парой типов графовых сверток (с фичами ребер и без), optuna для подбора архитектуры, функций активации и параметров и mlflow опционально для трекинга экспериментов + небольшие плюшки типа автоподбор размера батча. Реально не замахиваемся на великое и вечное, просто инструмент для быстрого старта. Если найдете время попробовать — будем очень признательны за фидбек и обязательно отработаем. Если поправите ошибок — будем долго вспоминать добрыми словами, поставите звезду — выпьем за ваше здоровье.
Если просто возникнет желание потроллить / набросить — тоже велкам, а то чет чат умирает )
https://github.com/MobileTeleSystems/CoolGraph

Читать полностью…

Sberloga

22 ноября 2023 11:12

Дорогу Kandinsky Video 🎬

🥇Рад представить вам нашу новую модель с новой архитектурой, которая является первой российской end-to-end нейросетью по синтезу видео по тексту - это был реальный вызов для нас!

Внутри наша модель состоит из двух этапов, которые отвечают за две важные задачи синтеза: генерация ключевых кадров (для управления сюжетной линией видео) и генерация дополнительных кадров (для плавности движений).

А теперь чуть-чуть подробнее:

📌 в качестве генератора кадров используется модель Kandinsky 3.0
📌разрешение генераций 512 пикселей
📌генерировать можно с различным соотношением сторон
📌можно выбрать частоту кадров для плановности
📌генерация занимает от 1 до 3 минут (зависит от степени плавности, которой вы хотите добиться при синтезе)

Ссылки на проект:
Telegram bot
сайт проекта
rudalle.ru
GitHub

Почитать подробнее про Kandinsky Video можно в новой статье на Хабре.

По вопросам сотрудничества и развития модели пишите в ЛС - с радостью обсудим все идеи🤝

@complete_ai

Читать полностью…

Sberloga

02 ноября 2023 11:55

Купил новую клаву ⌨️

Читать полностью…

Sberloga

24 сентября 2023 14:01

Наконец дошли руки до Stable Diffusion, интересно конечно еще способы применения посмотреть. Например видел кейсы с дизайнами интерьера, хочу теперь найти старые фотки квартиры до ремонта и попробовать сгенерировать новые

Читать полностью…

Sberloga

24 сентября 2023 07:06

2 видео об ИИ который проходит игру Tomb Rider - геймплей и процесс создания.
Геймплей это конечно куча склеек роликов, однако то как несколько моделей объединяют для решения задачи показывает невообразимый потенциал их использования

https://youtu.be/PTsIFF_Qw4U?si=5YIteS46TiKhSO1j
https://youtu.be/0wTf_bbkW2U?si=n9HH3AQFM02VJo1B

Читать полностью…

Sberloga

13 июля 2023 09:01

Видеозаписи докладов - Reliable ML - 3 июня 2023 - Data Fest Online
Видео и презентации докладов первого дня секции

Опубликованы видео и презентации докладов первого дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме ML System Design. Можно смотреть, пересматривать и наслаждаться! 😊

Все доклады, их описания и презентации можно найти на сайте ODS.ai, а также в плейлисте на YouTube.

Ссылки отдельно по докладам:

- Евгений Финогеев - Автоматизация заведения новых товаров на маркетплейс с использованием ML (видео, презентация)

- Михаил Масагутов - Опыт составления дизайн документа при проектировании ML системы: прогнозирование продаж в магазинах (видео, презентация, диздок)

- Любава Ткаченко - Опыт составления дизайн документа при проектировании ML системы: сервис для кластеризации магазинов (видео, презентация, диздок опубликуем в репозитории чуть позже)

- Андрей Денисенко - Как построить real-time ML на криптобирже (видео, презентация)

- Максим Берёзов - Алгоритм маршрутизации без компромисса между качеством и скоростью (видео, презентация)

- Павел Филонов - Паттерны инференса ML-моделей (видео, презентация)

- Павел Филонов - Тестовое ML System Design Interview (видео, материалы)

- Дмитрий Колодезев - Reliable ML: Устойчивость моделей после выкатки в прод (видео, презентация)

- Валерий Бабушкин - Метрики и функции потерь при дизайне систем машинного обучения (видео, презентация)

- Даниил Дранга - Дебаты: Fullstack Data Scientist или DS & Machine Learning Engineer — cтоит ли разделять роли? [Виктор Кантор – Big Data Director, МТС vs. Дмитрий Жванский – Expert Data Scientist, Райффайзен Банк] (видео, презентация)

- Дмитрий Раевский - FailConf - DS: почему бывает так больно (видео, презентацию опубликуем чуть позже)

Ваш @Reliable ML

#tech #business #reliable_ml #ml_system_design

Читать полностью…

Sberloga

07 июня 2023 20:15

Приветствую сообщество! Сегодня решил выложить в опенсурс свою диалоговую систему вместе со всеми моделями и кодом.

Скачать можно тут: https://github.com/Den4ikAI/Anfice-chatbot

Сделано на основе FRED-T5-XL и нескольких энкодеров (подробности на гите)
Если будете тестировать, просьба написать фидбек в лс

Демо бот: @anficechatbot

Читать полностью…