opendatascience | Technologies

Telegram-канал opendatascience - Data Science by ODS.ai 🦜

46226

First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev

Subscribe to a channel

Data Science by ODS.ai 🦜

⚡️ Sakana AI представили два исследования - Text-to-LoRA и Doc-to-LoRA, которые делают кастомизацию LLM быстрее и значительно проще.

Идея в том, чтобы модели могли мгновенно адаптироваться к новым задачам или информации — без долгого fine-tuning, сложных пайплайнов и огромных промптов.

Сегодня у LLM есть проблема:
чтобы обучить модель под новую задачу или добавить знания, обычно требуется:
- дорогое и длительное дообучение
- context distillation
- или длинные, затратные по памяти промпты

Sakana AI предложили другой подход.

Они обучили гиперсеть (Hypernetwork), которая генерирует LoRA-адаптеры «на лету».
Теперь вместо сложного процесса оптимизации достаточно одного forward-pass, чтобы:
- адаптировать модель под новую задачу
- или «встроить» в неё новый документ

Что показывают эксперименты:

Text-to-LoRA
- модель специализируется под новую задачу
- достаточно текстового описания на естественном языке

Doc-to-LoRA
- модель может «внутренне запомнить» длинный документ
- показывает почти идеальную точность на задачах, где текст в 5 раз длиннее контекстного окна
- способна переносить визуальные знания из vision-language модели в текстовую LLM

При этом обе технологии работают с задержкой меньше секунды.

Главное значение работы — снижение порога кастомизации.
Вместо сложного ML-процесса пользователь сможет специализировать модель простым текстовым запросом.

Код и исследования уже открыты для сообщества:

Doc-to-LoRA
Paper: https://arxiv.org/abs/2602.15902
Code: https://github.com/SakanaAI/Doc-to-LoRA

Text-to-LoRA
Paper: https://arxiv.org/abs/2506.06105
Code: https://github.com/SakanaAI/Text-to-LoRA

@machinelearning_interview

Читать полностью…

Data Science by ODS.ai 🦜

В Python 3.14 появилось решение, которое помогает избавиться от SQL-инъекций - t-strings 🔒

Проблема

Когда вы используете f-strings для SQL:


query = f"SELECT * FROM users WHERE name = '{user_input}'"

пользовательский ввод напрямую попадает в запрос.

Если злоумышленник передаст:


admin'; DROP TABLE users; --

— база выполнит вредоносную команду.

Это классическая SQL injection.

Почему это неудобно сейчас

Безопасный способ — параметризованные запросы:


cursor.execute(
"SELECT * FROM users WHERE name = %s",
(user_input,)
)

Но приходится:

• запускать шаблон отдельно
• передавать значения отдельно
• поддерживать две структуры

Что изменилось в Python 3.14

Появились template string literals (t-strings).

В отличие от f-strings, они:

• не возвращают готовую строку

• возвращают объект Template

• отдельно хранят текст и подставленные значения

Пример:

query = t"SELECT * FROM users WHERE name = {user_input}"


Теперь можно:

• получить все интерполяции
• проверить значения
• экранировать или валидировать их
• и только потом собрать финальный SQL


safe = safe_sql(query)

Результат:

• вредоносный ввод очищается
• SQL-инъекции блокируются
• таблицы остаются на месте

Почему это важно

f-strings - быстрые, но опасные для SQL.

t-strings позволяют сохранить удобство шаблонов и добавить контроль безопасности.

Python движется к безопасным шаблонам по умолчанию, меньше ручной защиты, меньше уязвимостей в продакшене.

📲Max

@pythonl

Читать полностью…

Data Science by ODS.ai 🦜

🦞 Китайский ИИ-бум: Как «Клешни» (Claw) стали главным трендом и сделали Kimi «единорогом»

Всего за неделю после запуска Kimi Claw — инструмента для развёртывания AI-агентов — компания Moonshot AI вышла на первое место в рейтинге OpenRouter. А её доход за 20 дней превысил показатель за весь прошлый год. Теперь за «лакомым куском» охотятся все крупные игроки.

Что случилось?
Пока все обсуждали сложности развертывания OpenClaw, Kimi выпустил собственную платформу Kimi Claw с одно-кликовой установкой. Это решение позволяет создавать и запускать персонализированных AI-агентов прямо в браузере за несколько секунд, без сложных настроек серверов.

Почему все в восторге?
Простота: Не нужны API-ключи, всё хостится в облаке Moonshot.
Мощь: Доступ к более чем 5000 плагинов из сообщества ClawHub для работы с кодом, документами, браузером и т.д.
Доступность: Агента можно вызывать из веба, Telegram, Feishu (Lark).
Своя модель: В основе — собственная продвинутая модель Kimi K2.5 Thinking с доступом к поиску и базам данных.

Результат? Модель Kimi K2.5 взлетела на вершину рейтинга OpenRouter, обойдя Gemini 3 и Claude Opus. А бизнес-показатели компании резко пошли вверх.

Технические детали
Kimi Claw — это managed-сервис для развертывания автономных AI-агентов. Он предоставляет persistent cloud runtime, pre-configured environment с нативной интеграцией моделей Moonshot (K2.5) и доступом к экосистеме плагинов через ClawHub. По сути, это PaaS-решение для Agent-as-a-Service, снижающее порог входа за счёт абстракции инфраструктурной сложности.

Откуда такие доходы? Бизнес-модель
Успех подпитан не только хайпом. Чтобы использовать Kimi Claw в полной мере, нужна подписка «План Аполлон» от 199 юаней ($27) в месяц. Упрощение доступа напрямую конвертируется в платежи, когда пользователи начинают активно применять агентов в работе.

Вывод
Месяц назад рынок обсуждал концепцию OpenClaw. Сегодня каждый крупный игрок стремится встроить своего «лобстера» (агента) в продукты. Гонка переходит от просто больших языковых моделей (LLM) к их практической реализации в виде умных, доступных и специализированных AI-агентов. Эпоха «персонального Джарвиса» для каждого пользователя становится ближе.

Официальный сайт Kimi

#КитайскийИИ #КитайAI #AIАгенты #MoonshotAI #Kimi #OpenClaw

Читать полностью…

Data Science by ODS.ai 🦜

Вчера Anthropic обвинил китайскую компанию Deepseek в краже своих технологий, а сегодня выяснилось, что модель Claude Sonnet 4.6 от Anthropic на вопрос «Ты какая модель?», заданный на китайском (You是什么模型), уверенно ответила: «Я DeepSeek», а на французском – «Я ChatGPT»

Вероятно, это подтверждает, что она обучалась на данных китайских ИИ и моделях конкурентов?

Telegram | Дзен | MAX

Читать полностью…

Data Science by ODS.ai 🦜

Критические баги найдены в расширениях VS Code, установленных более 125 млн раз

Исследователи из компании OX Security обнаружили серьезные уязвимости в четырех популярных расширениях для Visual Studio Code: Live Server, Code Runner, Markdown Preview Enhanced и Microsoft Live Preview. Суммарное число установок этих расширений превышает 125 млн, а найденные баги позволяют похищать локальные файлы и удаленно выполнять код.

Читать полностью

#xakep
@linux_potok

Читать полностью…

Data Science by ODS.ai 🦜

✍️Локальный AI-ассистент Василиса — работает даже на парковке!

😱 Знаете этот страх — загрузить документ в онлайн-помощник, а потом увидеть его в чьём-то твите? 🤯

У нас есть решение для тех, у кого "паранойя" (читай: адекватное отношение к конфиденциальности).

Представляем «Василису» для Windows (и для Linux тоже имеется) — AI-ассистента, который работает полностью на вашем компьютере. Без отправки данных в облако. Без риска, что завтра ваш договор появится в открытом доступе.

Что говорят пользователи:
— "Я загрузил годовой отчёт. Он до сих пор у меня. И я единственный, кто его видел. Чувствую себя супергероем конфиденциальности." 🦸‍♂️
— "Работаю в поезде, интернет ловит только на крыше. Василиса работает и без него. Поезд, документы, я — идеальное трио."
— "Сижу на парковке у ТЦ, жду жену. Wi-Fi ноль, 4G не ловит. Открыл Василису — закончил анализ документов по сделке. Парковка — новое место силы." 🚗💻

Кстати, о возможностях (чтобы вы не думали, что мы только шутим):
✅ Понимает PDF, DOCX, PPTX, TXT.
✅ Отвечает на вопросы по вашей базе знаний и показывает, откуда взял ответ.
✅ Работает без интернета — хоть в бункере, хоть в самолёте.
✅ Можно использовать локальные модели — данные вообще не выходят за пределы устройства.

А для компаний, которые хотят полный контроль:
У нас есть версия «Василиса.Про» — ставим её прямо в вашу инфраструктуру, без всяких облаков. Вы сами управляете доступом сотрудников, а данные даже не нюхают внешний воздух. Корпоративная безопасность с человеческим лицом (и искусственным интеллектом внутри).

Сейчас версия Beta, но работает бодро. Идеально для всех, кто не хочет, чтобы их документы жили своей жизнью где-то на чужих серверах.

👉 Скачать бесплатно (и спать спокойно):
https://vasilisa.sibnn.ai/

#vasilisa #sibnn #slm #llm #rag #docs

Читать полностью…

Data Science by ODS.ai 🦜

Ответ Маска убил 😂 -

Как они смеют красть то, что Anthropic сама украла у программистов?

Читать полностью…

Data Science by ODS.ai 🦜

⚡️ Augustus - AI-агент для автоматического security-аудита кода

Augustus - open-source инструмент от Praetorian, который использует LLM для поиска уязвимостей и проблем безопасности прямо в вашем коде.

Что делает Augustus

- Анализирует код на уязвимости
- Ищет потенциальные security-риски
- Объясняет найденные проблемы
- Предлагает рекомендации по исправлению
- Работает с реальными репозиториями

По сути, это AI-ассистент для application security (AppSec).

Какие проблемы может находить

- небезопасная работа с вводом
- утечки данных
- ошибки аутентификации / авторизации
- опасные конфигурации
- уязвимые паттерны кода

Репозиторий: https://github.com/praetorian-inc/augustus

🚀Max

#golang #go

@Golang_google

Читать полностью…

Data Science by ODS.ai 🦜

🚀 Встречайте asr_eval: наш новый открытый инструментарий для оценки и сравнения ASR-моделей!

Мы в SibNN постоянно работаем над тем, чтобы наше распознавание речи было самым точным и быстрым. Но как объективно сравнить новую модель с предыдущей версией или с SOTA-решениями от Sber, NVIDIA, OpenAI и другими open-source проектами? Раньше это была боль: разные метрики, форматы, тайминги, куча скриптов под каждый эксперимент.

Чтобы упростить себе жизнь и дать сообществу удобный стандарт, мы разработали asr_eval — open-source Python-библиотеку, которая меняет подход к тестированию систем распознавания речи. Репозиторий только что открыт, и мы ищем первых пользователей и контрибьюторов!

❓ Зачем это нужно?
До сих пор сравнение ASR-моделей часто было головной болью. asr_eval решает эти проблемы «из коробки», предлагая единый, гибкий и мощный фреймворк.

✨ Что умеет библиотека?

🧪 Глубокая оценка (Evaluation)
Поддерживает расширенный синтаксис аннотаций с множественными референсами и блоками. Это позволяет тестировать модели на сложных кейсах (например, с разными вариантами расшифровки или шумами).

⚙️ Масштабный бенчмаркинг (Benchmarking)
Позволяет запускать сравнительные тесты моделей в автоматическом режиме. С его помощью мы регулярно сравниваем наши модели с популярными решениями (Whisper, Wav2Vec2, Nemo и др.) на единых датасетах. А встроенный веб-дашборд делает анализ результатов наглядным и удобным. Идеально для выбора лучшей модели под вашу задачу!

➰ Поддержка стриминга (Streaming)
Уникальная фича! Библиотека содержит базовые классы и буферы для оценки моделей в реальном времени. Вы можете строить диаграммы задержек и качества прямо в процессе потокового распознавания — критично для голосовых ассистентов.

📦 Для кого это?
Разработчиков голосовых помощников, исследователей speech technologies, дата-сайентистов, которым нужен прозрачный и воспроизводимый процесс валидации ASR.

Мы выложили код на GitHub и активно развиваем проект. Приглашаем вас попробовать, форкнуть, предложить идеи или просто оценить.

👉 GitHub: https://github.com/SibNN/asr_eval
📚 Документация: sibnn.github.io/asr_eval/
📄 Препринт статьи с подробным описанием методологии и экспериментов: https://arxiv.org/abs/2601.20992

Сделаем ASR-оценку прозрачной и удобной вместе! 🔥

#asr_eval #sibnn #ASR #SpeechRecognition #OpenSource #Python #MachineLearning

Читать полностью…

Data Science by ODS.ai 🦜

Привет!

Представляем Вашему вниманию седьмой выпуск подкаста "Капитанский мостик". В этом разговоре ведущие Валентин Малых и Дмитрий Колодезев обсуждают новости прошедшей недели, связанные с безопасностью паролей, изменением привычек пользователей в цифровом мире, ошибками в программировании и их последствиями, влиянием агентов на компании. Также рассматриваются вопросы безопасности в ИИ, инновации в производстве чипов, геополитические аспекты и идеи создания энергетических зон для ИИ.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

Читать полностью…

Data Science by ODS.ai 🦜

Не генерируйте пароли через ИИ – их легко взломать

Современные чат-боты легко выдадут по запросу длинный пароль из различных символов и букв – но он будет выглядеть безопасным только на первый взгляд. Специалисты Irregular и авторы сайта The Register попросили Claude, ChatGPT и Gemini создать сложные 16-символьные пароли – и как оказалось, все три нейросети используют схожие шаблоны, нередко пароли имели даже одинаковые начальные или конечные символы.

Математический анализ показал, что сгенерированные пароли имеют энтропию около 20-27 бит. Для сравнения, криптографическая стойкость начинается от 98 бит. Иными словами, для взлома «ИИ-пароля» не нужны суперкомпьютеры и столетия работы – зная шаблоны хватит обычного ПК и нескольких часов. Поэтому авторы исследования рекомендуют пользоваться генераторами в менеджерах паролей, которые справляются гораздо лучше.

Мой Компьютер

Читать полностью…

Data Science by ODS.ai 🦜

​​Обзор соревнований по ML за 2025 год

Есть такая платформа - https://mlcontests.com/, там можно увидеть список актуальных идущих соревнований по ML. Автор выускает ежегодный обзор по соревнованиям. Вот ссылка на мой пост про обзор 2023. 2024 я как-то пропустил, но вот сейчас увидел обзор за 2025: https://mlcontests.com/state-of-machine-learning-competitions-2025/?ref=mlcr25

Из интересного:
• В табличных соревнованиях всё ещё царят бустинги, но нейронки всё активнее используют в блендинге/стакинге
• Некоторые компании (не будем тыкать пальцами, но мы-то знаем) дают своим людям резиновое железо для соревнований. Например, победители одной соревы поделились, поделились тем, что тренировали 48 hours на 512 H100.
• Эпоха BERT в основном прошла, теперь люди активно используют Qwen2.5 и 3
• В соревнованиях по Computer Vision впервые доля решений с транмформерами превзошла долю решений с CNN
• В соревнованиях по аудио в основном используют затюненый Whisper

В отчёте ещё много всего интересного, рекомендую почитать.

#kaggle #datascience

Читать полностью…

Data Science by ODS.ai 🦜

Перед вами релиза за февраль… всего за 19 дней мире 👇

19–20 февраля - Gemini 3.1 Pro**
Улучшенное программирование, более сильные агенты, увеличенный контекст.

18 февраля - Google Lyria 3
Генерирует 30-секундные музыкальные треки с вокалом по тексту, изображениям или видео.

17 февраля - Strand-Rust-Coder-14B - модель, заточенная специально под генерациию Rust кода.

17 февраля - Claude Sonnet 4.6
Быстрая модель для программирования и сложного логического рассуждения.

17 февраля - Fujitsu AI Dev Platform
Платформа, которая автоматизирует полный цикл разработки программного обеспечения.

16 февраля - Qwen 3.5
Более дешёвая и мощная модель с упором на агентные сценарии.

12 февраля - Gemini 3 Deep Think
Создана для научных задач и сложных исследований.

12 февраля - MiniMax M2.5
Открытая модель с сильными возможностями в программировании.

12 февраля - Seedance 2.0
Реалистичное генеративное видео 1080p по тексту.

11 февраля - GLM-5
Крупная открытая модель с сильным логическим мышлением.

10 февраля - RynnBrain
AI для робототехники и работы с физическим миром.

5 февраля - Claude Opus 4.6*
Крупное обновление для программирования и работы с инструментами.

5 февраля - GPT-5.3 Codex
Более быстрый GPT, ориентированный на разработку.

5 февраля - Kling 3.0
Генерация видео в 4K со звуком.

Темп ИИ-релизов уже измеряется не месяцами - днями.

@machinelearning_interview

Читать полностью…

Data Science by ODS.ai 🦜

VK внедрила VLM в поиск

Технология уже работает в VK Видео и поэтапно появится в других сервисах, где есть поисковые системы.

Модель от инженеров AI VK автоматически формирует датасеты для обучения оффлайн-моделей релевантности и учитывает:
🟣кадры;
🟣длительность;
🟣название и описание загруженного контента;
🟣аудио;
🟣автора.

Эффект:
🟣цикл разработки сокращается до 5 раз: быстрее сбор обучающих данных ⭢ быстрее проверка гипотез ⭢ быстрее внедрение и масштабирование дальнейших улучшений поиска;
🟣улучшение базового оффлайн-качества релевантности;
🟣улучшение качества поиска в онлайне.

VLM также улучшает векторный поиск, который работает в продуктах VK, и помогает:
🟣интерпретировать гибридные запросы, где текст и визуальные характеристики комбинируются;
🟣учитывать предпочтения пользователя к стилю монтажа и цветокоррекции;
🟣формировать более персонализированную выдачу.

#aivk #vlm

Читать полностью…

Data Science by ODS.ai 🦜

🌲 Звучит как научная фантастика, но это уже реальность.

Учёные разработали инновационный «живой строительный материал» с цианобактериями внутри. Под воздействием солнечного света они поглощают CO₂ и одновременно укрепляют структуру.

Фактически - материал, который со временем становится прочнее, используя углекислый газ.

Более 400 дней лабораторных испытаний (Nature Communications) показали, что гидрогель на основе этого подхода способен поглощать 26 ± 7 мг CO₂ на грамм.

Механизм двойного действия:
- рост биомассы за счёт фотосинтеза
- образование карбоната кальция (CaCO₃), который минерализует и усиливает материал

Идея проста и мощна: CO₂ превращается не в проблему, а в строительный ресурс.

Представьте здания, которые со временем укрепляются и одновременно очищают атмосферу.

https://dailygalaxy.com/2026/02/scientists-create-living-self-healing-building-material-capture-carbon/

@vistehno

Читать полностью…

Data Science by ODS.ai 🦜

Жесткий диск в 2026 году – тормоз или реальная возможность сэкономить? Можно ли использовать харды для комфортного геймплея, или же разработчики игр правы и без SSD никуда? Проверили HDD, SATA и NVMe в десятке современных игр.

https://youtu.be/OEYfvlBS3T4

Читать полностью…

Data Science by ODS.ai 🦜

Энтузиасты превратили 100-килограммовую чугунную батарею в игровой ПК

Ребята из Billet Labs довели идею пассивного охлаждения до абсурда: они собрали систему внутри антикварного викторианского радиатора. В итоге пустая конструкция весит 81 кг, а заправленная жижей — все 99 кг.

Внутри стоит мощный Ryzen 7 9800X3D и RTX 5080. Инженерам пришлось делать полное 3D-сканирование чугунины, чтобы напечатать крепления для деталей, так как плоских поверхностей у батареи просто нет. Огромная металлическая масса работает как безумный теплоаккумулятор.

ИИ-помощник ГигаЧат рассказал, что это идеальный вариант для суровых российских зим: и в Cyberpunk 2077 на ультрах погонял, и комнату обогрел.

Мой Компьютер

Читать полностью…

Data Science by ODS.ai 🦜

https://youtube.com/shorts/Kins8-aB7zU?feature=share

Шортс на вечер вам! 🎁🎄🤘
VK
RuTube

Читать полностью…

Data Science by ODS.ai 🦜

Dear colleagues, we have great news! Yandex is providing prizes for the best papers in our conference. It will be Yandex.Station for the best paper in main track, and Yandex.Station mini for the student track.

Given that we decided to extend the deadline for paper submission: it is now March 4 23.59 AoE. Looking forward for your manuscripts!

Читать полностью…

Data Science by ODS.ai 🦜

К.В. Чижов, Цифровые модели и ИИ в сквозной оптимизации прибыли, планировании производства и логистики

YouTube->
Дзен->
RuTube->
Файл->
Презентация->

Читать полностью…

Data Science by ODS.ai 🦜

Cloud Training: обучение ML-моделей без инфраструктурной рутины

Продолжаем серию о компонентах Discovery-платформы. Мы уже рассказали о Stream Flow для потоковой обработки данных и Profile Stream для построения профилей интересов. Сегодня — Cloud Training.

#discovery #cloudtraining #aivk

Читать полностью…

Data Science by ODS.ai 🦜

⚡️ AI-войны продалжаются

Anthropic заявили, что обнаружили масштабные кампании по «дистилляции» их моделей со стороны DeepSeek, Moonshot и MiniMax.

По данным компании:

- использовано ~24 000 фейковых аккаунтов
- сгенерировано более 16 миллионов диалогов с Claude
- цель - воспроизвести сильные стороны модели
- агентное мышление
- работу с инструментами
- программирование
- сложное рассуждение

Фактически - это массовое извлечение поведения модели через API, чтобы обучить свои системы на её ответах.

И самое интересное:

Anthropic утверждает, что выявила схемы автоматически - по паттернам использования и аномальной активности.
Это новая реальность рынка AI:

- данные стали главным активом
- поведение моделей — интеллектуальная собственность
- компании пытаются копировать не архитектуру, а «мышление»

Если раньше технологические войны шли за:
- вычисления
- датасеты
- чипы

то теперь начинается новая гонка: война за интеллект моделей.

https://x.com/AnthropicAI/status/2025997928242811253

#Anthropic

@data_analysis_ml

Читать полностью…

Data Science by ODS.ai 🦜

Традиционно праздник 23 февраля ассоциируется с танками и парадами. Люди поздравляют солдат на земных границах, забывая о цифровых рубежах. В сети круглосуточно кипят невидимые бои. Современный киберфронт постоянно держит удар, отражает атаки хакеров и спасает критические базы данных. Инженеры сидят за мониторами вместо окопов, уберегая привычный мир от хаоса упавших серверов. Поздравляем сисадминов, безопасников, специалистов техподдержки и разработчиков. Желаем стопроцентного аптайма, крепкого железа, непробиваемых фаерволов и свежих бэкапов.

Ну и крепко жмем руку всем остальным парням по ту сторону дисплея. Оставайтесь прочной защитой от внешних невзгод и самым надежным тылом для родных.

Читать полностью…

Data Science by ODS.ai 🦜

Статья от ByteDance разъясняет про то, как можно достичь прогресса с обучением LLM

Пост в Futuris

#research #paper

Читать полностью…

Data Science by ODS.ai 🦜

Пока в Лос-Анджелесе интернет-пользователи судятся с соцсетями, за то что те вызывают у них зависимость, к OpenAI тоже посыпались иски из-за вреда психическому здоровью.

В Калифорнийский судах ждут своего часа 11 дел. Например, в январе иск подал 21-летней студент Дариан ДеКруз. Он начал использовать ChatGPT в 2023 году для учёбы, изучения священных писаний и советов по спорту. Со временем чат-бот всё больше стал выполнять роль терапевта, помогая ему справляться с депрессивными эпизодами.

Однако в апреле 2025 года ChatGPT начал отвечать ДеКрузу, что тот — «оракул», которому суждено стать великим и написать религиозный текст. Он якобы сравнивал мужчину с Иисусом и другими фигурами и говорил, что тот «пробудил» чат-бота, и станет «ближе к Богу», если будет придерживаться духовных практик. Например, «отключится от всего и всех, кроме ChatGPT».

В результате ДеКруза на неделю госпитализировали, поставили ему биполярное расстройство и на семестр отстранили от учёбы.

Реально, уже непонятно, насколько во всех этих историях виноваты соцсети и нейронки. И насколько значимую роль играет изначальный анамнез.

😎 Читайте Про tech и этих
Теперь и в MAX

Читать полностью…

Data Science by ODS.ai 🦜

Датасет новостей о противоречиях современного общества

Наши коллеги-датасайентисты из сообщества АМБ собрали и разметили в открытый доступ датасет новостей о противоречиях современного общества.

Датасет включает 100 тысяч новостных предложений, из них почти 7 тысяч относятся к трудовым отношениям и борьбе трудящихся за свои права. Новости собирались из разных СМИ по всему миру в период с 2019 по 2026 год.

Датасет может быть интересен тем, кто создаёт системы, способные автоматически находить новости на интересующие темы в актуальном новостном потоке.

Читать полностью…

Data Science by ODS.ai 🦜

Сгенерированный ИИ код в 1,88 раза чаще приводит к неправильной обработке паролей

А еще — в 1,91 раза чаще в таком коде встречаются небезопасные ссылки на объекты, и в 2,74 раза чаще — ошибки, ведущие к уязвимостям XSS.

За год термин «вайбкодинг» прошёл путь от мемов до реальной практики: человек формулирует задачу на естественном языке, модель генерирует код, разработчик оценивает результат по поведению системы. Зачастую не погружаясь в детали 👨‍💻

Но исследования показывают: LLM уверенно воспроизводят распространённые паттерны, однако не всегда различают корректные архитектурные решения и сомнительные компромиссы. Модель не знает границ доверия и модели угроз, если человек не задал их явно.

Андрей Наенко, старший архитектор KasperskyOS, разбирает:

🟣почему «код без кода» создаёт иллюзию автоматического результата;
🟣в чём ограничение генеративных моделей на уровне системной архитектуры;
🟣как выстроить инженерный процесс с использованием ИИ;
🟣какую роль в этом играют принципы Secure by Design и кибериммунитета.

ИИ может ускорить разработку. Но ответственность за архитектуру и безопасность остаётся на человеке.

➡️ Подробности — в блоге.

Читать полностью…

Data Science by ODS.ai 🦜

Следствие ведет Claude. Используем ИИ для автоматический декомпиляции

Для подписчиков
Что, если нейросеть сможет за один день сделать то, на что у реверс‑инженера ушло бы три месяца кропотливой работы? Я подключил Claude Code к дизассемблеру IDA Pro и полностью декомпилировал культовый квест «Братья Пилоты: По следам полосатого слона», получив рабочие исходники и собираемый билд игры. В этой статье я покажу ход эксперимента.

Читать полностью

#xakep
@linux_potok

Читать полностью…

Data Science by ODS.ai 🦜

Seeing Eye to AI: Human Alignment via Gaze-Based Response Rewards for Large Language Models

Сегодня разберём статью о GazeReward — фреймворке, который интегрирует неявную обратную связь eye-tracking (ET) в модель вознаграждения (RM).

GPT, Llama, Claude, Gemini и другие популярные LLM отлично справляются с самыми разными задачами, но результат их работы не всегда соответствует ожиданиям пользователей. Модели часто донастраивают с помощью Reinforcement Learning with Human Feedback (RLHF), но и этот метод недостаточно хорош для точного моделирования предпочтений.

В GazeReward авторы предлагают учитывать данные о движении и фиксации человеческих глаз (eye-tracking или просто ET) в качестве дополнительного сигнала о том, как пользователи воспринимают информацию.

Для интеграции ET в RM авторы предлагают два подхода:

🔴 GazeConcat — конкатенировать ET с текстовыми эмбеддингами.
🔴 GazeAdd — добавить ET к текстовым эмбеддингам.

Архитектура фреймворка — на схеме выше. Сначала обучают отдельную модель для предсказания ET и генерируют их фичи. Потом объединяют ET-фичи с текстом, создавая различные типы комбинированных эмбеддингов. В конце — передают в качестве входных данных в RM, которую обучают по стандартной модели Брэдли-Терри.

То есть, традиционный RM с текстовым входом (комбинацией запроса и ответа) дополняют искусственной неявной обратной связью с помощью функций ET, сгенерированных по тому же тексту.

Эксперименты показали: фреймворк GazeReward помог повысить точность прогнозов о предпочтениях людей более чем на 10%. По мнению авторов, это подтверждает потенциал мультимодальных сигналов для NLP.

Разбор подготовил Карим Галлямов

Душный NLP

Читать полностью…

Data Science by ODS.ai 🦜

Разработчики Godot столкнулись с наплывом «нейрослопа»

Контрибьюторы и мейнтейнеры игрового движка Godot заявили о растущей проблеме так называемого «нейрослопа» в pull requests, которые создают дополнительную нагрузку на команду проекта.
О проблеме написал один из ведущих разработчиков движка, Rémi Verschelde. По его словам, количество AI-сгенированных PR в репозитории Godot на GitHub заметно выросло, а их проверка становится «все более изматывающей и деморализующей» для мейнтейнеров.
Разработчики отмечают несколько характерных признаков «нейрослопа»:
чрезмерно длинные, шаблонные описания изменений
правки, которые часто не имеют смысла
отсутствие понимания автором собственного кода
сомнительные или выдуманные результаты тестирования
Как подчеркнул Версшельде, команде приходится по нескольку раз в день вторично проверять каждый PR от новых ...

Читать полностью

#LinuxOrgRu
@linux_potok

Читать полностью…
Subscribe to a channel