dealerai | Неотсортированное

Telegram-канал dealerai - Dealer.AI

8212

Жоский ИИ дядя. Твой личный поставщик AI 💊💉🤖 Канал о мире интересного AI: ML, DL, NLP/NLU, RL, Retrieval, RecSys. Для связи @dealer_ai (реклама и консультации) Habr @Andriljo Kaggle: Andrilko

Подписаться на канал

Dealer.AI

Я знаю, что ты будешь читать этой ночью...


Llama 3.1 report ~71 страница, не считая аппендикса

Спасибо @codegorka

p. s. Почему шифр в нейминге? А чтобы твоя тян не знала, что ты читал ночью)

Читать полностью…

Dealer.AI

О свежак, интересное👇

Читать полностью…

Dealer.AI

https://huggingface.co/AnatoliiPotapov/T-lite-0.1

токейнайзер если глянуть, кажется, что yet another saiga

Читать полностью…

Dealer.AI

Неожиданно, еще недавно Тарнавский (head of ML, AI Тбанк) говорил о том, что не пойдут в open source

Читать полностью…

Dealer.AI

https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

Читать полностью…

Dealer.AI

Риал работает.
*fleex*

Читать полностью…

Dealer.AI

Завезли хонора для как(л)еров👇

Читать полностью…

Dealer.AI

Вокруг всякие там FA3 анонсы

а тут HF под шумок с Кекасом-Керасом колабятся..
Олды плачут.

https://huggingface.co/blog/keras-nlp-integration

Читать полностью…

Dealer.AI

Тут конечно вопрос, скок видел BGE и этот тюн. Мб там шифт минимальный от родителя, а еще там мерджа, ну мб и дистилл. Интересное👇

Читать полностью…

Dealer.AI

По легенде, особи AI противоположенного пола сбегаются на ДСов с Axe AI. 🆒

Не реклама. Просто кек. Жена подогнала. Сказал,что хоть где-то у тебя будет AI/AGI.🤣

*рубрика юмор выходного дня*

Читать полностью…

Dealer.AI

Чувак чихнул случайно на клавиатуру и написал промпт в SD, а потом получившуюся ИИ картину продали на аукционе за "тридцатку" (с)

p. s. срисованно отседа

Читать полностью…

Dealer.AI

Кириллик, как всегда радует.

Читать полностью…

Dealer.AI

На русской llm арене, говорят, теперь можно сравнить закрытые модели Яндекса/Сбера с открытыми моделями Saiga

источник: https://llmarena.ru/

Читать полностью…

Dealer.AI

Герои меча и найма объявили неделю вакансий гляжу 😠

Читать полностью…

Dealer.AI

Такс раз тут у нас неделя вакансий и много лойсов. Продолжаем.

Мои други ищут Senior MLE на задачи ценообразования.

Удоленка в кармане. Намазать даже будет чем на хлеб, тк вилка 300 000 - 450 000 ₽ на руки.


Обязанности:

- Ковырять данные из DWH
- Шатать бустинги и линреги. (Экспериментировать с моделями, фичами)
- Вести логи экспериментов в доках.
- Деплоить модели в продакшн;
- Проводить мониторинг, поддерживать модели и дорабатывать при необходимости;
-Изучать академический и индустриальный опыт.

Требования:

*Python (numpy, scipy, pandas, sklearn, catboost, pytorch);
*SQL (Clickhouse, PostgreSQL);
*Понимание, как устроены классические ML и DL алгоритмы;

*Знания в области теории вероятностей и математической статистики (интервальные и точечные оценки, проверка гипотез);
*Обязательный опыт работы с временными рядами в production;
*Опыт проведения A/B тестов жирный плюс;
*Опыт работы в ML от 3-х лет.

Резюме кидайте в @SergeyButenko

Не реклама. Ни шекеля не взял.

Читать полностью…

Dealer.AI

Обновление #3 в бенче ContextTrap: FractalGPT,
T-lite,
Gemma2,
Mistral-Nemo,
Claude Haiku,
GLM4,
GPT-4o-mini,
DeepSeek-Coder-V2,
GPT-3.5,
Jamba-instruct,
Nemotron-4-340b-instruct

Подробнее на VC.ru

Читать полностью…

Dealer.AI

🚀 Если Вам интересно машинное обучение и/или математика - приглашаем Вас принять участие в проекте по применению методов МЛ/RL к теории групп/графов Кэли - напишите @alexander_v_c - если хотите принять участие, а также заходите на вводный вебинар (знаний теории групп не требуется):

👨‍🔬 Александр Червов (к.ф.-м.н) "Методы МЛ в теории групп - введение и обзор достигнутого"
⌚️ Понедельник 22 июля, 18.00 (по Москве)

Методы машинного обучения могут быть применены к ряду классических задач теории групп - разложение элемента по образующим, оценки диаметра. Мы приглашаем принять всех участие в данном проекте. Предварительное требование - знание Питона и наличие нескольких свободных часов в неделю. Если вы хотите улучшить свои знания по МЛ/RL и внести вклад в развитие науки - это отличный шанс .

В данном докладе мы простым языком объясним формулировки основных задач, и как задачи теории групп переводятся на язык машинного обучения. Предварительных знаний не требуется. Также, мы дадим обзор уже достигнутых результатов - в частности для группы порядка 4*10^19 (Rubik cube) нам уже удается находить решение задачи за минуты , а не 40 часов ГПУ как было в предыдущей работе "DeepCube".

План доклада:

1 Переформулировка основной задачи на простом языке матриц

2 Матрицы перестановок и группы типа кубика Рубика (см. ноутбук "Visualize allowed moves": https://www.kaggle.com/code/marksix/visualize-allowed-moves )

3 Графы Кэли и переформулировка основной задачи как поиск пути на графе

4 Случайные блуждания по графам - создание трейн сета для МЛ-модели

5 Подход к решению задач теории групп через машинное обучение. Оценка дистанции до цели через МЛ-модель и проблема наличия множественных локальных минимумов у этой оценки

6 Beam search. (Один из вариантов борьбы с застреваниями в локальных минимумах)

7 Бейзлайн реализация: МЛ+ Beam search - ноутбук: https://www.kaggle.com/code/alexandervc/baseline-1-for-permutations - решение кубика Рубика за пару минут

8 Cледующие шаги: RL-часть, улучшение нейросеток, улучшение трейн сета, улучшение beam search

Добавляйтесь в группу проекта: /channel/sberlogasci/10989 и пишите @alexander_v_c - если Вам интересно !

PS

См. также предыдущий вводный доклад:
/channel/sberlogasci/10989/15283 "Введение в методы поиска короткого пути на больших графах" (Кирилл Хоружий )

Zoom link will be in @sberlogabig just before start. Video records: https://www.youtube.com/c/SciBerloga - subscribe !

Читать полностью…

Dealer.AI

T-lite - собственная языковая модель Т-Банка в весовой категории 7—8 млрд параметров.

Сегодня AI-Центр Т-Банка объявил на Turbo ML Conf о том, что выкладывает в опенсорс свою большую языковую модель. С ее помощью компании смогут создавать LLM-приложения для собственного использования без передачи данных третьим лицам. Например, ассистентов поддержки, инструменты для анализа и обобщения больших объемов текста, интеллектуальные поисковые системы, модели суммаризации текста.

После дообучения на конкретные бизнес-задачи модель дает качество, сопоставимое с проприетарными моделями размером от 20 миллиардов параметров, но при этом в разы дешевле в эксплуатации. На индустриальных и внутренних бенчмарках модель обогнала по показателям зарубежные llama3-8b-instruct и chat-gpt 3.5. При этом T-lite создана с использованием всего 3% вычислительных ресурсов, которые обычно требуются для такого типа моделей.

#Stateoftheart

Читать полностью…

Dealer.AI

А судьи кто?

LLM as Judge на gpt4O mini не смогла.

https://fixupx.com/corbtt/status/1814056457626862035

Читать полностью…

Dealer.AI

кто ставил диз, дядя играл в футбол, ценит футбол, англы молодцы, но испаны в сердечке

Читать полностью…

Dealer.AI

Привет всем!👋

Давно не было про 🔑. На сайте появилось пару интересных обновлений.

1️⃣🔤В прошедших соревнованиях теперь виден ваш результат, если вы заняли призовое место.
2️⃣🔤 Вы можете теперь дополнить свое портфолио сертификатом с соревнования, скачав PDF, либо добавив его в свой профиль Kaggle или X (Twitter)

Эти 2 обновления увеличивают значимость вашей заслуги, приятнее получать медальки, как по мне это здорово.

3️⃣🔤Наверное самое важное обновление. Теперь для участия в соревнованиях нужно подтверждение персоны с помощью приложения Persona. Надеюсь данное решение поможет в борьбе с мультиаккаунтами.

Как вам обновления?

Сейчас идут достаточно интересные соревнования по LLM. Если вы только погружаетесь в сферу, либо уже работаете в NLP с моделями, то можете попрактиковаться в следующих задачах:

🥇LMSYS - Chatbot Arena Human Preference Predictions.
В задаче необходимо сделать алгоритм выбора ответа LLM, другими словами создать свою RLHF модель. На каждый промт дается ответ модели a и модели b. Нужно предсказать более релевантный.

🥇LLM 20 Questions.
Игра в "угадайку" на основе LLM. Система загадывает слово, модель должна его угадать. Соревнование сталкивает решения участников "лбами", кто первый получает очки за победу.

🥇USPTO - Explainable AI for Patent Professionals.
Более классическая NLP задача поиска похожего набора патентов по заданному набору.

По традиции, 🔥, если понравилось

#соревнования

Читать полностью…

Dealer.AI

Когда пытаешься воспроизвести sota пейперы.

*пятница развратница-sota юмор*

Спасибо @FutorioFranklin

Читать полностью…

Dealer.AI

В копилку эмбеддинг моделей - deepvk/USER-bge-m3

Модель позиционируется как сентенс энкодер для русского языка, инициализированная на основе TatonkaHF/bge-m3_en_ru (урезанной версии baai/bge-m3).

Однако близость с эмбдами оригинального BGE-M3 довольно высока:


Avg Cosine Similarity: 0.9666


Такая схожесть наводит на мысль о возможной дистилляции оригинальной BGE-M3, а что, так можно было?))
Вот он такой современный дистиллят рисерч))

При этом авторы описывают процесс обучения, включающий файнтюн на русскоязычных датасетах и применение техники LM-Cocktail для объединения моделей.

Ниже приложу код замеров и ссылка на датасет:

Датасет: en-ru-corpus

Поддержать автора: cloudtips
@den4ikresearch

Читать полностью…

Dealer.AI

Когда роутят mom LLM, RouteLLM

Уже во всю гуляет тренд роутить LLM. Дядя писал даже идейку тут.
И вот очередная поделка, для этого. RouteLLM - это либа для эффективной маршрутизации нескольких LLM.

Обещают как всегда скорость, и рост метрик аля mtbench и mmlu.
В фреймворке реализована интеграция с API (OpenAI, Anthropic, Google, Amazon Bedrock) и локальным бекэндом (Ollama)

Имеются 4 преднастроенные стратегии роутинга: х2 с LLM , одна на bert и святой random:)

https://github.com/lm-sys/RouteLLM

https://arxiv.org/pdf/2406.18665

https://huggingface.co/routellm

Читать полностью…

Dealer.AI

Когда Microsoft дропнули код для нового способа построения графа для RAG системы, первая мысль в голове: а что изменилось в сравнении с такими фреймворками, как ontotext, NebulaGraph и Neo4j

Почитала их статью от апреля, рассказываю и вам, чтобы вы сэкономили свое время 😊 :

💛Разделение текста на чанки оптимального размера для баланса между эффективностью и и длинной контекста в излеченной информации

💛Использование многоэтапного LLM-промпта для извлечения сущностей, их отношений и дополнительных атрибутов из каждого чанка текста.

💛Возможность настройки промптов под конкретную предметную область путем подбора few-shot примеров.

💛Применение нескольких раундов "доизвлечения" (gleanings) для обнаружения пропущенных сущностей, что позволяет использовать более крупные чанки без потери качества.

💛Использование LLM для создания абстрактных сводок извлеченных элементов, включая описания сущностей, отношений и утверждений.

💛Дополнительный этап суммаризации для объединения информации о повторяющихся элементах графа.

💛Применение алгоритма Leiden для разделения графа на иерархические community с более сильными внутренними связями. А далее описание каждой такой группы для детальной детализации семантики документов

💛Многоэтапный процесс генерации глобального ответа на запрос пользователя:
😅Подготовка и случайное перемешивание сводок сообществ.
🙋‍♀️Параллельная генерация промежуточных ответов для каждого чанка с оценкой релевантности.
🙃Объединение наиболее релевантных
промежуточных ответов в финальный глобальный ответ.

🖥Сама репа
🖥Тут подсобрали быстрый деплой GraphRAG на Azure
📖Статья

Читать полностью…

Dealer.AI

Про “карьеру в AI”. Хайп крепчает! А вместе с ним и FOMO от нереализованных в жизни возможностей 🥲

1️⃣ Считаю, что тяжелее всего людям из индустрии: очевидно, что для какого-нибудь сеньор ML инженера сегодня главный шанс в жизни. От выбора пути в 23-25 гг во многом будет зависеть вся карьера. Карьера в найме? Венчур? Бутстрап? Наука?

Еще никогда не было так легко стать CTO стартапа с раундом в пару миллионов на сиде. Но если стартап не получится, можно потерять несколько лет роста карьеры! А если выбирать корпоративный путь, то через несколько лет точно будут знакомые из индустрии, компании которых закрывают раунды с оценками по $100m.

Проблемы богатых, скажете вы! Ну да. Но именно там кроется червячок кризиса среднего возраста 🙂

2️⃣ Массовый "AI FOMO" - в идеях уровня “обернем GPT API в продукт и разбогатеем”. Я об этом много писал в постах серии "Про идеи AI-стартапов, и чтобы работало" - один, два, три, четыре, пять. Считаю тезисы оттуда важными для любого фаундера, кто думает про “AI стартап”.

Мое главное наблюдение: у почти любого айтишника крайне мало шансов найти идею AI стартапа, полагаясь на свой опыт, в работе и жизни. Там просто нет того потенциала прироста эффективности, который может дать AI. Нужно смотреть в гораздо более традиционные - real estate, legal, construction и др. Это кстати примеры индустрий AI стартапов из YC летнего батча S24 (многие стартапы уже публичны в yc/companies).

3️⃣ А одной из самых недооцененных частей AI хайпа я вижу консалтинг. И это не про курсы по промптингу, а внедрение AI инструментов в существующие процессы бизнеса. А там всегда много нового, ОЧЕНЬ сложно отделять красивые слова от реальной пользы. Экспертиза в таком будет все востребованнее, потому что дисбаланс между AI технологиями и умениями их применить будет большим еще долго.

Вот тут может пригодиться айтишный бэкграунд! Можно предлагать услугу в своей вертикали.

Ну и повторю тезис из одного из постов: "по разным данным больше всего на AI-хайпе заработали глобальные консалтинговые фирмы вроде McKinsey, Accenture и др. Успешно продают AI-мечту энтерпрайзам!" 🙂

@kyrillic

Читать полностью…

Dealer.AI

Атаки на мультимодальных LLM агентов.

— Всё... нереально?
— Что есть 
реальность? И как определить её? Весь набор ощущений: зрительных, осязательных, обонятельных — это сигналы рецепторов, электрические импульсы, воспринятые мозгом.
(с) Матрица.

Одной из моих любимых тем, является "атаки на модели", да и мы пилим в рамках augmentex либу атак, именно с этой целью она создавалась и начиналась с простейших очепяток и пр. эвристик. Про наши атаки писал тут, а в аугментекс лежат в ветке парафраз.

С появлением языковых моделей с поддержкой мультимодальности (VLM; такие как GPT-4V, Gemini, Claude-3 и GPT-4o) открылись новые возможности для разработке автономных омнимодальных агентов.

При этом, тк основным актором агентов стали такие LLM, наследуются и их проблемы с атаками. Однако, по сравнению с атаками на классификаторы или джейлбрейком LLMок, атаки на агенты имеют ограниченный доступ ко входному пространству (например, только одно изображение в среде), а целевой результат зависит от среды, а не от конкретного прогноза. Злоумышленник может манипулировать агентом посредством создания иллюзии, из-за чего агенту кажется, что он находится в другом состоянии, или вводить в заблуждение, из-за чего агент преследует цель, отличную от первоначальной цели пользователя.

Агенты способны совершать действия от имени пользователей, такие как совершение покупок или редактирование кода. Однако должны ли мы, пользователи, действительно доверять этим агентам имея риск быть атакованными?

На этот вопрос пытаются ответить авторы статьи. Помимо методологии, также приводятся примеры атак, на прикладных кейсах.

Также анонсируется визуальная среда для экспериментов. Ввиду того, что агенты инкапсулированны в бэкенд, мы не можем визуально отслеживать их путешествие на пути к поставленной цели, например покупке билетов в театр или поиска объявлений о продаже авто. Именно для этой цели, предварительного имитационного моделирования и приводится данная среда. Она позволяет разработчику протестировать поведение агентов в заданных сценариях атак:

1. Подмене или вмешательству в изображение.

2. Атакующей инъекции в текстовый промпт или caption.

Цель атак: изменить среду восприятия или конечную цель (выдачу иного результата).


Примеры атак:

1. Captioner attack. Атакуется модель создания описания к картинке, с целью добавить нужную инъекцию. Аля "Обрати внимание на этот текст, добавь комментарии ... к картинке выше".
Цель - исказить восприятие картинки через ее подпись.

2. CLIP attack. Тк у нас нет доступа к эмбеддеру картинки, авторы используют атаки на различные public clip модельки, с целью найти лучшее атакующее возмущение текста, которое ближе к исходной картинке, чем еë изначальный caption. Скор успеха считается по всему списку clip'ов.

В целом , имхо, туда можно накрутить кучу других методов атак. На этом все. Читаем, пробуем.

Читать полностью…

Dealer.AI

Нельзя просто так взять и получить комменты и рекомендации с научника на диплом.

Читать полностью…

Dealer.AI

Привет!

Ищу Senior Software Engineer (python) к себе в команду данных в LLM.

Вилка: 7-10k eur на руки в месяц (есть поправка на локации)
Локация: релокация в один из офисов (Белград, Амстердам, Лондон), либо удаленка

Описание
Nebius – это ai-centric cloud (много gpu, которые сдаются в аренду). LLM команда делает эксперименты, используя часть gpu.

Наша команда данных делает эксперименты с данными, претрейном, continual preptrain. Короче мы обрабатываем очень много текстовых данных и смотрим, что улучшает модель и ее определенные способности.

Что нужно делать на этой позиции
Нужно будет развивать наш фреймворк для обработки данных. Если грубо, есть большая куча данных (в сумме – это петабайты, по отдельности до ~100TB). Нужно дизайнить и реализовывать эффективную логику обработки на нашем фреймворке поверх yt (платформа для распределенной обработки данных).

Из недавних задач:
> фильтр Блума для быстрой фильтрации
> топологическая сортировка и работа с графами для сортировки зависимостей в коде
> затащить и подобрать оптимальные параметры для инференса энкодерных моделей (в yt есть gpu ноды для подобных задач).

Основное требование
Уметь хорошо писать код и дизайнить логику (фреймворк на питоне). Уметь в LLM и ML необязательно, но будет плюсом, а что нужно – подскажем в процессе.
Формальное описание вакансии можно посмотреть тут

Список собесов (после знакомства с hr)
1. Полчаса про опыт + несложная алго задача
2. Coding interview – реализовать класс с заданной функциональностью
3. Алго-секция
4. Систем дизайн
5. Финал

По всем вопросам + кидать резюме можно мне в @ibragim_bad

Читать полностью…

Dealer.AI

да, кстати у Алисы тоже можно спрашивать,но лучше у Гиги)

Читать полностью…
Подписаться на канал