First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev
🖥 Гайд по PostgreSQL для продвинутых разработчиков
PostgreSQL – одна из самых мощных СУБД с открытым исходным кодом. Этот гайд подробно охватывает ключевые аспекты PostgreSQL: от внутренней архитектуры до приёмов оптимизации. Мы рассмотрим администрирование, производительность, расширения, инструменты, а также сравним популярные ORM для Python и Go. В конце приведён список продвинутых вопросов, часто встречающихся на собеседованиях.
🟠Гайд
@sqlhub
Мы решили задачу омографов и ударений в русском языке
Мы опубликовали библиотеку silero-stress
для расстановки ударений в обычных словах и омографах:
1️⃣ Расставляет ударения, решает омографы, ставит букву ё;
2️⃣ "Знает" порядка 4М русских слов и словоформ и порядка 2K омографов;
3️⃣ Простановка ударения в обычном 1 слове занимает где-то 0.5 ms, а в предложении на 400 символов с 2 омографами - порядка 30 ms;
4️⃣ Общий размер библиотеки составляет порядка 50 мегабайт (архив весит порядка 30 мегабайт), что является сжатием словарей и всех датасетов примерно в 400 раз;
5️⃣ Опубликована под популярной и простой лицензией (MIT);
6️⃣ Не содержит раздутого кода, лишних библиотек, гигабайтов академических артефактов;
7️⃣ Зависит только от стандартной библиотеки питона и работает на всех последних версиях PyTorch.
Ставим ⬆️ habr.com/ru/articles/955130/
Ставим ⭐️ https://github.com/snakers4/silero-stress
Google не будет исправлять проблему ASCII smuggling в ИИ-помощнике Gemini
Разработчики Google сообщили, что проблема «контрабанды ASCII-символов» (ASCII smuggling) в Gemini не получит исправлений. Такая атака может использоваться для обмана ИИ-ассистента с целью предоставления пользователям фальшивой информации, изменения поведения модели и скрытого отравления данных.
Читать полностью
#xakep
@linux_potok
Привет!
Встречайте четырнадцатый выпуск подкаста "Капитанский мостик", обсуждение новостей из мира ИИ за прошедшую неделю и не только. Выпуск традиционно ведут Валентин Малых и Дмитрий Колодезев.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
всем привет, сегодня-завтра последние дни, когда можно податься с докладом на сибирский ДатаФест 18 октября!
если у вас есть задумка доклада, не стесняйтесь, мы поможем ее довести до продашен-реди состояния, будем рады всех видеть
еще раз ссылка на подачу: https://ods.ai/tasks/speakers_siberia6
🤔Экспериментальная модель 🖥Extract-0 за $196 превзошла 👩💻 GPT-4 и 👩💻 o3 в извлечении данных?
Исследователь Энрике Годой из 🇧🇷Бразилии представил ИИ-модель Extract-0, специализированную LLM с 7 миллиардами параметров, которая демонстрирует новый уровень эффективности в извлечении структурированной информации из документов. Согласно исследованию, данная языковая модель превосходит по производительности популярные универсальные модели, включая GPT-4.1, o3 и GPT-4.1-2025. Ресёрчер ставит под сомнение устоявшуюся парадигму, где доминирующим фактором эффективности считается исключительно масштаб модели.
Ключ к успеху Extract-0 кроется в новаторской трехэтапной методологии обучения, которая позволила достичь высокой точности при минимальных затратах. Процесс включает генерацию 280 128 синтетических примеров данных с сохранением контекстной памяти, параметроэффективную тонкую настройку (LoRA), затрагивающую всего 0.53% весов модели, и обучение с подкреплением (GRPO) с использованием семантической функции вознаграждения. Такой подход позволяет ИИ-агенту понимать смысловую эквивалентность данных, а не простое текстуальное совпадение.
В ходе тестирования на эталонном наборе из 1000 задач по извлечению информации Extract-0 достиг среднего показателя вознаграждения 0.573, значительно опередив GPT-4.1 (0.457) и o3 (0.464).
◀️Для адаптации ❗️ DeepSeek-R1-Distill-Qwen-7B применялся метод Low-Rank Adaptation (LoRA), который изменил всего 0.53% от общего числа параметров модели (40.4 млн из 7.66 млрд).
◀️Изначально базовая модель без дообучения имела средний результат 0.232 и валидность JSON на уровне 42.7%.
◀️После этапа контролируемой тонкой настройки (Supervised Fine-Tuning) производительность модели выросла до 0.507, а валидность JSON достигла 79.9%.
◀️Финальный этап обучения с подкреплением (GRPO) позволил достичь итогового результата в 0.573 со средней валидностью JSON в 89.0%, что представляет собой кумулятивное улучшение на 147.0% по сравнению с базовой моделью.
🦆xAI обвиняет OpenAI в 💣диверсии и 📖краже исходного кода
В самом сердце Кремниевой долины разворачивается драма, достойная шпионского романа. Компания 😎Илона Маска xAI обвиняет своего главного конкурента, OpenAI, не просто в переманивании сотрудников, а в организации целенаправленной стратегической кампании по хищению коммерческих тайн.
xAI заявляет о краже двух главных активов: 🖥всего исходного кода и уникальной стратегии развертывания дата-центров, которую назвали 📄 "секретным соусом".
Как утверждает xAI в иске, в этой истории замешаны 🥷❗️три ключевые фигуры. Один из инженеров (Сюэчэнь Ли) признался в хищении всей кодовой базы xAI, второй (Джимми Фрейтюр) использовал технологию AirDrop для копирования исходного кода на личные устройства, а один из финансовых руководителей передал OpenAI конфиденциальные данные об операционной эффективности компании. OpenAI наняла его с целью получения конфиденциальных данных об операционной эффективности компании.
👍В иске представлены конкретные даты, имена, технологии и цифровые артефакты. У xAI есть вырисовывается весьма серьезная обвинительная доказательная база, вероятно, полученная в результате внутреннего 🕵️форензик-расследования.
Cогласно материалам дела, охота велась целенаправленно, ведь, вербовкой обоих инженеров, находящихся по разные стороны Атлантики, занимался один и тот же рекрутер из OpenAI по имени Тифа Чен, а это указывает на скоординированный характер действий.
👆Представитель OpenAI называет иск xAI "попыткой преследования со стороны господина Маска", пытаясь свести технический и юридический спор к личной неприязни.
✋ @Russian_OSINT
Пост для любителей обучать нейросети на работе, после работы, вместо работы, на выходных, в отпуске, с женой или вместо жены.
На прошлой неделе стартовал Wunder RNN Challenge —соревнование по нейронкам от HFT-фонда Wunder Fund.
Участникам предстоит создать модель, предсказывающую следующее состояние рынка на основе последовательности предыдущих состояний. Именно с такими задачами каждый день работают кванты.
Когда
15 сентября — 1 декабря
Призовой фонд
$13,600
Вы будете работать с реальными биржевыми данными.
Победители получат денежные призы, возможность пообщаться с нашими квантами, а главное — утонченное интеллектуальное удовлетворение от решения сложной задачи.
Wunder Fund с 2014 года занимается HFT, высокочастотным алгоритмическим трейдингом. Мы торгуем на многих биржах по всему миру — как традиционных, так и криптовалютных. Наш дневной торговый оборот превышает $10 млрд.
>_ Участвовать
Обзор PostgreSQL 18 от Павла Лузанова — что нового в открытой СУБД? 🖥
Вышла новая версия PostgreSQL. По традиции, делимся обзором обновлений от Павла Лузанова, нашего руководителя отдела образовательных программ.
Павел рассказал о том, как реализованы изменения в части производительности, мониторинга, работы очистки, команд SQL.
▶️ Полный обзор смотрите на наших видеохостингах: Rutube, YouTube, Дзен и ВК.
Значительное количество изменений в новой версии внесли разработчики из России, в том числе специалисты Postgres Professional. Ежегодно за вклад в открытую СУБД мы получаем десятки памятных медалей сообщества.
🐘 Новые функции ваниллы будут доступны и в Postgres Pro. Через несколько недель представим обновления СУБД — быстрый релиз возможен благодаря непрерывному слиянию изменений в течение года. Чтобы не пропустить — подпишитесь на техническую рассылку.
✔️ Deutsche Bank: бум ИИ держит экономику США, но он нестабилен
Deutsche Bank предупреждает: нынешний рост инвестиций в ИИ неустойчив.
Расходы на дата-центры и оборудование удерживают США от рецессии, но без них рост ВВП близок к нулю. Goldman оценивает капзатраты в $368 млрд к августу 2025 года.
К 2030 году отрасли потребуется $2 трлн годовой выручки, но прогнозируется дефицит в $800 млрд. Продуктивность от ИИ придёт, но слишком медленно, чтобы оправдать такие масштабы инвестиций.
Fortune
✔️ KAT-Dev-32B и KAT-Coder - новые модели для Кодинга.
KAT-Dev-32B достигает 62,4% на SWE-Bench Verified, входя в топ-5 среди всех open-source моделей.
KAT-Coder идёт ещё дальше - 73,4%, что ставит его в один ряд с ведущими проприетарными решениями.
HF
✔️ InclusionAI выпустила Ring-flash-linear-2.0 — эффективную гибридную модель
InclusionAI анонсировала Ring-flash-linear-2.0, открытое решение с комбинированным вниманием (линейным + стандартным). При активации лишь 6,1 млрд параметров она демонстрирует производительность, сопоставимую с плотной моделью на 40 млрд параметров.
Модель основана на Ling-flash-base-2.0 и дообучена на 1 триллионе токенов. Благодаря использованию MoE и гибридной архитектуре она достигает почти линейной временной сложности и устойчивого потребления памяти - что ускоряет и удешевляет инференс.
Ring-flash-linear-2.0 поддерживает контексты длиной до 128 000 токенов, показывая конкурентные результаты в задачах рассуждения, математики, программирования и генерации текста.
Модель распространяется под лицензией MIT.
HF
✔️ Новый прорыв в Science Magazine: технология для «переписывания» ДНК
В Science Magazine опубликовано исследование, которое описывает новую технологию редактирования ДНК. Она позволяет вносить крупные и точные изменения прямо в нужное место генома человека — то, чего не могли обеспечить существующие методы вроде CRISPR.
CRISPR работает грубо: разрезает ДНК и надеется, что клетка правильно её восстановит. Более точные версии редактируют лишь крошечные участки - десятки или сотню «букв» ДНК. Но большинство болезней связано не с одной мутацией, а с распределёнными изменениями по всему геному.
Учёные нашли решение в бактериальных «прыгающих генах» - так называемых мостовых РНК. Они позволяют безопасно и точно вставлять, удалять или переставлять фрагменты длиной до 1 миллиона пар оснований.
В эксперименте новая технология исправила ДНК-повторы, вызывающие атаксию Фридрейха - редкое неврологическое заболевание. Тот же подход можно применить к болезни Хантингтона и другим тяжёлым наследственным патологиям.
В институте Arc уверены: комбинация их ДНК-модели Evo (для проектирования «здоровых» последовательностей) и метода Bridge recombination (для внедрения изменений) может стать основой будущей «Тьюринговой машины для биологии» — системы, способной переписывать геном с высокой точностью.
Paper
✔️ ByteDance выпустила модель Lynx, которая превращает одну фотографию человека в реалистичный видеоролик.
Лицо сохраняется точным, а движения выглядят плавно и естественно.
Главное новшество - два специальных адаптера. ID-adapter закрепляет лицо во всех кадрах, чтобы оно не «менялось» при генерации, а Ref-adapter переносит детали исходного фото - волосы, глаза, текстуру кожи.
Lynx построена на Diffusion Transformer и обучена на базе из 50,2 млн пар изображений и видео с разными выражениями лица, светом и фоном. Это помогает модели уверенно сохранять идентичность человека даже в сложных условиях.
Моделька выйдет персонализированное видео высокого качества, где совпадают лицо, мимика и мелкие детали внешности.
byteaigc
✔️ Kaggle и Google проведут бесплатный пятидневный интенсив по ИИ-агентам.
С 10 по 14 ноября участников ждут ежедневные лекции, практические задания и финальный проект для портфолио. В программе — основы архитектуры агентов, работа с Tool Use и API, контекст-инженеринг и память, метрики качества и оптимизация, а также создание первой мультиагентной системы по протоколу Agent2Agent. Регистрация открыта, участие доступно всем без отбора.
Rsvp
@ai_machinelearning_big_data
#news #ai #ml
🔥 Китайский ИИ ставит рекорды: Qwen3-Max набирает 100 баллов по математике!
Алибаба представляет новое поколение флагманских моделей, которые устанавливают новые стандарты в мире искусственного интеллекта. Главная звезда — Qwen3-Max — впервые в истории китайских больших языковых моделей набрала максимальные 100 баллов в престижных математических тестах AIME25 и HMMT.
Ключевые достижения:
• Qwen3-Max (Base): Более 1 триллиона параметров, обучена на 36 триллионах токенов, поддерживает контекст до 1 млн. токенов
• Qwen3-Max (Thinking): Показывает 100% точность на сложных математических тестах AIME 25 и HMMT
• Qwen3-Max (Instruct): 69.6% в SWE-Bench (кодинг) и 74.8% в Tau2 Bench (инструменты)
Но это только начало! На конференции Yunqi представлена целая экосистема мощных моделей.
👁️ Qwen3-VL: Монстр визуального понимания
Мультимодальная модель, которая уже доступна в открытом доступе. Она способна:
- Превращать рукописные эскизы веб-страниц в HTML/CSS код
- Детально анализировать изображения и видео
- Понимать сложные временные последовательности
🔊 Qwen3-Omni: Универсальный мультимодальный ИИ
Первая в мире end-to-end модель, объединяющий текст, изображения, аудио и видео. Достигает state-of-the-art результатов в 22 бенчмарках.
🌐 Qwen3-LiveTranslate: Революция в переводе
Модель для живого перевода с поддержкой 18 языков, включая шумные среды. Уже превосходит аналоги от Google и OpenAI.
Вывод: Алибаба демонстрирует впечатляющий прогресс в разработке ИИ, особенно в областях математики, компьютерного зрения и мультимодального обучения. Их открытые модели задают новые ориентиры для всей индустрии.
Qwen Chat | Cайт исследований Qwen
#КитайскийИИ #КитайAI #Qwen3 #ИскусственныйИнтеллект #МашинноеОбучение #Нейросети #AIРеволюция
Исследователи вынудили ChatGPT решать CAPTCHA
Специалисты компании SPLX, специализирующейся на автоматизированном тестировании безопасности для ИИ-решений, продемонстрировали, что с помощью промпт-инжектов можно обойти защиту агента ChatGPT и заставить его решать CAPTCHA.
Читать полностью
#xakep
@linux_potok
👣 Rust становится обязательным для Git 3.0: что это значит?
19 сентября 2025 — Команда Git объявила: начиная с версии Git 3.0, Rust станет обязательной зависимостью.
Без него система контроля версий просто не запустится.
Ключевое: Почему Rust?
- До сих пор Git писали в основном на C, но Rust добавляет больше безопасности и защиты от ошибок, таких как утечки памяти. Это шаг к более надежному коду.
Брайан Карлсон, один из ключевых разработчиков Git, заявил: «В Git 3.0 без Rust ничего не будет работать — он станет обязательной частью».
Что это значит для пользователей?
Для обычных пользователей Git ничего особо не изменится — достаточно установить Rust при сборке или обновлении Git.
Разработчикам плагинов и расширений стоит проверить совместимость.
Когда ждать? Релиз Git 3.0 пока не датирован, но обсуждение уже идет в списках рассылки Git lore.kernel.org/git.
Rust уже доказал свою полезность в проектах вроде Linux kernel, а теперь укрепляет позиции в Git, обещая меньше багов и выше стабильность.
🟠 Подробнее
@rust_code
👨🔬 В России зафиксирован мировой рекорд в квантовых вычислениях на ионах иттербия
Учёные в рамках национального «Квантового проекта» (ФИАН и Российский квантовый центр) установили новый мировой рекорд. Им удалось реализовать крупнейший в мире алгоритм на кудитах — многокубитную операцию на десяти ионах иттербия.
Почему это важно?
— Рекордная операция — «обобщенный гейт Тоффоли».
— Это прорыв в точности вычислений для решения практических задач: от логистики до создания новых материалов.
— Разработанный метод универсален и может быть применен к другим платформам (сверхпроводники, атомы, фотоны).
Как отметил директор ФИАН Николай Колачевский, этот результат является важным шагом на пути к созданию 50-кубитного квантового компьютера к 2030 году.
Всем привет!
Представляем вашему вниманию пятнадцатый выпуск подкаста "Капитанский мостик", он посвящен важным новостям прошедшей недели. Ведущие выпуска - Валентин Малых и Дмитрий Колодезев.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
💡 RND1 - новая экспериментальная модель с 30 миллиардами параметров, построенная по архитектуре Sparse Mixture-of-Experts, где активно 3 миллиарда параметров.
Она была преобразована из предварительно обученной авторегрессионной модели (Qwen3-30B-A3B) и затем дополнительно обучена на 500 миллиардах токенов, чтобы полностью поменять поведениие диффузионной модели.
Обычные модели (AR, автогрессионные) пишут текст слово за словом, а RND1 создаёт всё предложение сразу и потом пошагово уточняет его, как будто “проявляет” текст из шума.
Это - Diffusion Language Model (DLM), аналог диффузионных моделей, которые рисуют картинки, только здесь она “рисует” слова.
🔄 Как её сделали
Команда Radical Numerics придумала, как превратить готовую модель в диффузионную без обучения с нуля.
Они просто поменяли тип внимания и дообучили модель на новой задаче.
Этот метод называется AR-to-Diffusion Conversion (A2D) - то есть конверсия из автогрессионной модели в диффузионную.
Как это происходит:
1. Берут сильную GPT-подобную модель.
2. Меняют механизм внимания — теперь модель видит весь контекст сразу.
3. Продолжают обучение по диффузионной задаче.
4. Используют разные скорости обучения для разных частей сети, чтобы модель не забыла старое, но научилась новому способу мышления.
⚙️ Что под капотом
▪ Mixture-of-Experts (MoE) - у модели 30 млрд параметров, но реально работают только 3 млрд за раз. Это делает её мощной, но экономной.
▪ Непрерывное дообучение - старые знания не стираются, а “встраиваются” в новый режим.
▪ Огромные батчи - модель учится на больших партиях данных, чтобы стабилизировать обучение, ведь она не обрабатывает все токены сразу.
✔️ Почему это интересно
- Параллельная генерация - текст создаётся быстрее, без пошаговой задержки.
- Меньше затрат - активных параметров всего 3 млрд, при этом качество как у больших GPT.
- Новая архитектура - открывает дорогу гибридным моделям, сочетающим плюсы AR и DLM.
- Полностью открытый код и веса - можно исследовать, изменять, запускать самому.
- Первый серьёзный шаг к самосовершенствующемуся ИИ- модель может не только обучаться, но и помогать в проектировании следующей версии.
Это реально интересный метод, RND1 показывает, что ИИ можно не просто обучать, а перестраивать - менять его саму логику мышления без начала “с нуля”.
Похоже, это может стать фундаментом для систем Recursive Self-Improvement (RSI), когда ИИ способен создавать и улучшать самого себя.
🟠Blog: https://radicalnumerics.ai/blog/rnd1
🟠Code: https://github.com/RadicalNumerics/RND1
🟠Report: https://radicalnumerics.ai/assets/rnd1_report.pdf
🟠Веса: https://huggingface.co/radicalnumerics/RND1-Base-0910
@ai_machinelearning_big_data
#RND1 #RadicalNumerics #AI #DLM #DiffusionModel #MoE #OpenSource
🚀 Острые пузырьки
Партнёрства OpenAI с производителями чипов Nvidia и AMD вызвали критику из-за риска формирования замкнутого цикла финансирования и финансовой нестабильности.
Почему эксперты говорят об «ИИ-пузыре»:
↖️ https://kod.ru/artificial-intelligence-bubble
🫡 Лавочку прикроют
Набирающая популярность модель для генерации видео Sora будет урезана из-за многочисленных жалоб на нарушение авторских прав со стороны правообладателей.
Что изменится:
https://kod.ru/openai-zacensurit-sora
🚨 Уязвимости в Google Gemini: утечка данных и геолокации
В AI-ассистенте Google Gemini нашли три критические дыры. Из-за них злоумышленники могли похищать личные данные и отслеживать местоположение.
Схема атаки простая: хакер внедрял вредоносный промпт, а Gemini выполнял его как обычную команду.
🔹 Gemini Cloud Assist — через prompt-injection можно было атаковать облачные ресурсы и запускать фишинг.
🔹 Gemini Search Personalization Model — баг в персонализации поиска позволял управлять Gemini через историю Chrome.
🔹 Gemini Browsing Tool — давал возможность напрямую выкачивать сохранённые данные.
Подробнее: cybersecuritynews.com/google-gemini-vulnerabilities
#cybersecuritynews
🔥 Новая SOTA среди моделей на 1.5B параметров
QuestA 🤖 показывает двузначный прирост Pass@1 и даже обгоняет ранние 32B-модели:
- AIME24: 72.50% (+10.73%)
- AIME25: 62.29% (+12.79%)
- HMMT25: 41.67% (+10.11%)
🚀 Секрет в обучении: QuestA использует RL с scaffolded-problems — это снимает конфликт между лёгкими и сложными задачами и даёт более масштабируемое рассуждение.
🔓 Всё в открытом доступе:
- Модель: https://huggingface.co/foreverlasting1202/QuestA-Nemotron-1.5B
- Тренировочный пайплайн: https://github.com/foreverlasting1202/QuestA
- Статья: https://arxiv.org/abs/2507.13266
- Блог: https://mercurial-kidney-02d.notion.site/QuestA-Expanding-Reasoning-Capacity-in-LLMs-via-Question-Augmentation-216b21d08abb81a1bcecfe79e7d1e88a?pvs=73
#LLM #Reasoning #AI #SOTA
@data_analysis_ml
🚀 Обновление Giga-Embeddings: лидер ruMTEB и открытая лицензия
Мы выпускаем обновление Giga-Embeddings — 3B модель для преобразования текста в семантические векторы. Идеально для RAG, поиска и кластеризации.
📈 Метрики #1 в ruMTEB (74.1) — уверенный отрыв среди open-source.
🧩 Зачем это вам
• Надёжный RAG без галлюцинаций: точнее извлекает факты из базы.
• Поиск по документам и тикетам, FAQ-боты, дубликаты/кластеризация.
• Быстрый старт в проде: свободная лицензия, коммерческое использование разрешено.
⚙️ Как попробовать за 60 секунд
# pip install sentence-transformers
from sentence_transformers import SentenceTransformer
m = SentenceTransformer("ai-sage/Giga-Embeddings-instruct")
emb = m.encode([
"Как настроить доступ к базе знаний?",
"Инструкция по онбордингу саппорта",
])
print(emb.shape) # (2, D)
Qwen3Guard: Китайский ИИ-страж для безопасного AI
Компания Qwen представила специализированную модель-сторож — Qwen3Guard, первая в своем семействе модель ИИ, созданная исключительно для безопасности. Эта модель определяет уровень риска в запросах пользователей и ответах моделей на 119 языках.
Что это такое?
Qwen3Guard — это "песочница" для ИИ, которая анализирует контент и присваивает ему один из трех уровней риска: Безопасный
, Спорный
или Небезопасный
.
Две версии для разных задач
• Qwen3Guard-Gen — для анализа готовых текстов (офлайн-фильтрация датасетов)
• Qwen3Guard-Stream — для реального времени проверки во время генерации ответа
Ключевые преимущества
• Трехуровневая классификация рисков
• Поддержка 119 языков, включая русский
• Модели разного размера (0.6B, 4B, 8B) для любых мощностей
• Лидирующие результаты в тестах безопасности
Технические детали
Qwen3Guard-Stream использует архитектурное решение с двумя легковесными классификаторами в последнем слое Transformer, что позволяет анализировать токены по мере их генерации без значительных задержек.
Где использовать?
— Безопасная фильтрация обучающих данных
— Сигналы вознаграждения в RLHF
— Реальная модерация чатов
— Предотвращение jailbreak-атак
HuggingFace | ModelScope | Aliyun Service
#КитайскийИИ #КитайAI #AIбезопасность #Qwen #Модерация #ИИ
Всем привет!
Встречайте тринадцатый выпуск подкаста "Капитанский мостик", он посвящен важным новостям прошедшей недели. Ведущие выпуска - Валентин Малых и Дмитрий Колодезев. Снова с участием Алексея Натекина.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
🎙 Vikhr Borealis ● Speech-to-Text ● Транскрипция русской речи в текст ● Portable by NerualDreming
Ссылка на оригинальный релиз: https://huggingface.co/Vikhrmodels/Borealis
Репакер: #NerualDreming
Дата обновления: 25 сентября 2025
Версия: 1.0
Категории: #stt, #speechtotext, #audiollm
Платформа: #Windows
Место на диске: 20 ГБ
Системные требования: NVIDIA GPU с не менее 6 ГБ VRAM
Совместимость: #Nvidia
🖥 Описание софта
Borealis - это первая audio llm c ASR для русского языка от команды Vikhr. Важным отличием от других моделей является поддержка пунктуации в распознанных аудио. По замерам команды Vikhr, Borealis показывает меньшее количество ошибок и лучше соблюдает пунктуацию по сравнению с Whisper.
В этой портативной сборке я сделал удобную оболочку, в которую можно загрузить как аудио, так и видео и легко превратить речь в текст. Давайте поддержим отечественного производителя!
🟣 Распознавание речи в текст для русского языка
🟣 Корректная расстановка знаков препинания
🟣 Более низкое количество ошибок по сравнению с аналогами
🟣 Возможность обработки как аудио, так и видео файлов
🟣 Удобный и простой в использовании интерфейс
⁍ Скачайте Установщик или готовое Окружение.
⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути).
⁍ Если скачали установщик, запустите файл install.bat и дождитесь окончания установки.
⁍ Для запуска программы используйте файл run_demo.bat.
⁍ Интерфейс приложения автоматически откроется в вашем браузере.
Друзья, у нас для сообщества ODS отличная новость! 🚀
Overnight Finance Challenge: ETH/USDC Predictions – новое соревнование, где нужно спрогнозировать курс ETH/USDC. Организатор – проект Overnight.fi (DeFi-протокол с дельта-нейтральными стратегиями и своим стейблкоином). Задача - реальный кейс из мира финансовых данных.
Призовой фонд – $2,500, $1,500, $1,000 за три лучшие модели.
👉 Вся информация и ссылка для регистрации: https://linkly.link/2F5sN
✔️ Мэттью МакКонахи сказал в интервью, что хочет собственную LLM — обученную только на его книгах, заметках, дневниках и личных интересах.
Идея в том, чтобы он мог задавать ей вопросы и получать ответы исключительно из этого источника, без какого-либо внешнего влияния.
Личная модель как цифровое отражение себя — это не просто тренд, а новый формат взаимодействия с ИИ.
Полное интервью
@vistehno
Всем привет!
Представляем вашему вниманию двенадцатый выпуск подкаста "Капитанский мостик", он посвящен важным новостям прошедшей недели. Ведущие выпуска - Валентин Малых и Дмитрий Колодезев.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
🧬🤖 Paper2Agent: оживляем научные статьи
Open-source инструмент от исследователей из Stanford, который превращает статические статьи в интерактивных AI-ассистентов.
📌 Как это работает:
- Paper2MCP анализирует статью и её код( если есть), извлекает ключевые методы и превращает их в инструменты внутри MCP-сервера.
- Agent layer подключает этот сервер к чат-агенту (например, Claude Code или Chatgpt).
Поле чего, у каждой статьи появляется свой ИИ-ассистент, который:
- объясняет папиру на простом языке;
- запускает код без ручного копания в репозиториях, зависимостях и API-ключах;
- объединяет данные и пайплайны из разных работ.
Каждый MCP-сервер включает:
- Tools — функции (например, прогноз изменения экспрессии генов).
- Resources — текст, код, датасеты.
- Prompts — шаблоны для пошаговых сценариев.
Фактически Paper2Agent помогает конвертировать научные работы в полноценные рабочие инструменты.
Чтобы повторить методы их статьи, приходилось вручную ставить окружения, импортировать десятки модулей и гадать с входными данными. Paper2Agent позволяет это сделать через диалоговый интерфейс.
🟠Github
@ai_machinelearning_big_data
#ai #ml #aiagent
группа энтузиастов, которая включает людей из ODS, в частности Валентина Малых и Дмитрия Бабаева, сделала бенчмарк для агентного написания кода SWE-MERA
подробности про бенчмарк можно прочитать в статье на Habr; также бенчмарк будет представлен на конференции EMNLP в Китае в ноябре, научная статья тут
если вы интересуетесь ИИ-генерацией кода, присоединяйтесь к тестированию моделей, инструкция есть на сайте, будем рады вашему фидбеку!