data_analysis_ml | Unsorted

Telegram-канал data_analysis_ml - Анализ данных (Data analysis)

48228

Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚

Subscribe to a channel

Анализ данных (Data analysis)

🇧🇷 Мэрия Рио-де-Жанейро (через свою муниципальную ит-компанию IplanRIO) только что выпустила модель под названием Rio 3.5 Open 397B

Модель с 397 миллиардами параметров (MoE), основанная на Qwen 3.5, с полностью открытой лицензией MIT, которая превосходит свою базовую модель и конкурирует с лучшими frontier в задачах программирования и агентного кодирования.

https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B

Читать полностью…

Анализ данных (Data analysis)

Китай может решить главную проблему зелёной энергетики уже к 2030 году

Главная слабость возобновляемой энергетики, то что энергия появляется не тогда, когда она нужна, а когда есть солнце или ветер.

Китай сейчас старается решить это проблему этот разрыв с помощью grid storage -накопителей энергии, подключённых прямо к электросети.

Они работают как огромный буфер: забирают электричество, когда генерации много и цена низкая, а потом возвращают его в сеть вечером, ночью или в часы пикового спроса.

И темпы у Китая уже почти неприличные.

Только за декабрь 2025 года Китай установил 65,4 ГВт·ч сетевых батарей. Это больше, чем США установили за весь 2025 год - 46,5 ГВт·ч.

При этом США остаются вторым крупнейшим рынком накопителей после Китая.

Батареи превращают солнечную и ветровую энергетику из «нестабильной» в управляемую. Сеть получает возможность сохранять избыток дешёвой энергии и отдавать её тогда, когда она реально нужна.

Китай одновременно делает три вещи:

- строит огромный избыток солнечной и ветровой генерации;
- рекордными темпами наращивает накопители;
- быстро переводит транспорт, промышленность и города на электричество.

Если такая динамика сохранится, уже к 2030 году Китай может приблизиться к энергосистеме, где потребности в электричестве всё чаще закрываются связкой renewables + storage, а не углём и газом.

https://reneweconomy.com.au/graph-of-the-day-batteries-are-beating-solar-to-deliver-the-fastest-energy-transition-in-human-history/

Читать полностью…

Анализ данных (Data analysis)

✔️ OpenAI купила стартап Ona

Сделка по приобретению стартапа облачной оркестрации Ona позволит агентам OpenAI выполнять долгие задачи автономно, без привязки к локальным устройствам и активным сессиям пользователя.

Интеграция решений Ona даст изолированную среду для многочасовой работы с кодом, с возможностью удаленно подключаться к фоновым процессам для корректировки действий, проверки промежуточных результатов и утверждения решений.

Команда стартапа перейдет в OpenAI после одобрения сделки регуляторами.
openai.com

✔️ AI Alliance коллективно обучит открытую модель

Консорциум представил платформу Project Tapestry для федеративного обучения открытых моделей. Участники будут тренировать её на локальных данных с использованием собственных вычислительных мощностей. В общую систему попадут только обновленные веса.

Ян Лекун, консультант проекта, пообещал, что контрибьюторы получат доступ к итоговой базовой модели. На ее основе компании смогут создавать независимые версии под свои бизнес-задачи.

Сейчас инженеры проекта тестируют архитектуру платформы и формируют каталог данных. Релиз инфраструктуры запланирован на сентябрь 2026 года.

До конца года AI Alliance планирует обучить первую компактную модель, а к лету 2027 выпустить вариант уровня проприетарных SOTA-решений.
thealliance.ai

✔️ Сооснователь xAI запустил стартап персонализированных агентов

Игорь Бабушкин, стоявший у истоков xAI и ранее работавший в OpenAI и Google DeepMind, объявил о создании компании River AI, которая будет заниматься созданием адаптивных ИИ-агентов.

Идеология проекта строится на расширении человеческих возможностей через персонализацию и полном контроле ИИ. В перспективе стартап планирует заняться разработкой аппаратных решений и физической инфраструктуры.

Костяк команды сформировали выходцы из xAI. К Бабушкину присоединились руководитель продуктовой безопасности Винсент Старк, юрисконсульт Лили Лим, а также инженеры братья Соболевы.
bloomberg.com

✔️ Агенты в ChatGPT получили возможность оплачивать покупки через Visa

Visa интегрировала платежную сеть в ChatGPT. ИИ-агенты получили возможность самостоятельно проводить транзакции от лица пользователя у любого продавца с поддержкой карт сервиса. Для работы функции достаточно привязать карту к чат-боту.

OpenAI обеспечивает логику автономных агентов, Visa отвечает за авторизацию платежей и фрод-мониторинг. Пользователям доступны инструменты контроля: лимиты трат, белые списки магазинов и опция обязательного подтверждения операций.

Оспаривание платежей проходит по стандартным правилам Visa. Регламент планируют адаптировать для случаев, когда продавец действовал корректно, а ошибочный заказ произошел из-за сбоя в логике ИИ.
visa.com

✔️ Deezer запустил детектор ИИ-музыки

Стриминговый сервис создал инструмент, который ищет и определяет ИИ-треки. Алгоритм анализирует медиатеки пользователей и выявляет синтетический контент на 20 стриминговых платформах. Инструмент поддерживает 27 языков.

По словам директора компании Алексиса Лантернье, ежедневно на Deezer загружается около 75 тысяч ИИ-композиций, это более 44% от всех новых релизов, а почти у половины пользователей, переходящих от конкурентов, в сохраненных подборках уже есть сгенерированная музыка.

Исследование Deezer и Ipsos показало, что 97% слушателей не отличают ИИ-музыку от реальной, но 80% требуют обязательной маркировки. Платформа уже начала пессимизировать сгенерированный контент, исключая его из рекомендаций и подборок.
deezer.com

@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Анализ данных (Data analysis)

Moonshot AI выпустила и открыла Kimi-K2.7-Code - новую модель для кодинга и агентных задач.

По сравнению с K2.6 модель стала заметно сильнее в задачах разработки:

* +21.8% на Kimi Code Bench v2
* +11.0% на Program Bench
* +31.5% на MLS Bench Lite

Отдельно улучшили эффективность рассуждений. Kimi-K2.7-Code меньше «думает вслух» и тратит примерно на 30% меньше reasoning-токенов, чем K2.6. Для кодинг-агентов это важно: меньше лишнего перебора, быстрее выполнение, ниже стоимость.

Ещё один акцент - long-horizon coding. Модель лучше держит длинные инструкции и чаще доводит end-to-end задачи до рабочего результата, а не ломается где-то посередине.

Скоро обещают 6x High-Speed Mode.

Доступна через Kimi API и Kimi Code:

Kimi Code: https://kimi.com/code
API: https://platform.moonshot.ai

Читать полностью…

Анализ данных (Data analysis)

NVIDIA показала CPO-switch, сделанный вместе с Lambda.

CPO, или co-packaged optics, переносит оптическую связь ближе к главному сетевому чипу. Путь сигнала становится короче, потерь меньше, энергопотребление ниже, а потенциальных точек отказа меньше.

NVIDIA объясняет это через экономику токенов: сеть сама токены не генерирует, но без неё GPU простаивают. Чем больше энергии и сбоев в сети, тем дороже каждый токен.

Для масштаба: дата-центр на 128 000 GPU с обычными оптическими модулями требует около 655 000 трансиверов. Каждый из них может сломаться. CPO убирает этот класс компонентов.

Читать полностью…

Анализ данных (Data analysis)

CUDA 13.3 - это не просто очередной апдейт тулкита NVIDIA, а шаг к более высокоуровневому GPU-программированию.

Главное изменение - CUDA Tile теперь доступен в C++. Это модель, где разработчик описывает вычисления через тайлы, а низкоуровневые детали вроде параллелизма, перемещения данных, асинхронности и работы с памятью берёт на себя компилятор. Для C++-команд это важно: можно встраивать tile-подход в существующие CUDA-кодовые базы, не переписывая всё вокруг нового DSL.

Что ещё добавили:

- CUDA Tile C++ для более компактных и переносимых GPU-кернелов
- поддержку Hopper с Compute Capability 9.0
- CompileIQ - автонастройку компилятора под конкретные кернелы
- CUDA Python 1.0 как стабильную версию Python-интерфейса к CUDA
- обновления для checkpointing, IPC и работы с контекстами
- улучшения для tensor interoperability

Самое интересное здесь не «ещё немного быстрее», а смена уровня абстракции. NVIDIA постепенно двигает CUDA от ручного управления потоками, памятью и синхронизацией к модели, где разработчик описывает вычисления, а компилятор сам ищет эффективный путь к железу.

Для AI-инфраструктуры это особенно важно. Кастомные кернелы для attention, GEMM и инференса остаются узким местом, но писать их руками дорого и сложно. CUDA 13.3 делает этот слой доступнее для C++, Python и production-команд, которые хотят выжимать производительность без полного погружения в низкоуровневую CUDA-магию.

NVIDIA явно строит не просто GPU, а полный стек: язык, компилятор, runtime, Python-интерфейсы и инструменты автооптимизации.

https://developer.nvidia.com/blog/nvidia-cuda-13-3-enhances-gpu-development-with-tile-programming-in-c-compiler-autotuning-and-python-updates

Читать полностью…

Анализ данных (Data analysis)

Claude 5 Fable - кратко:

- почти на всех проверенных бенчмарках модель показывает уровень SOTA
- особенно сильна в разработке, работе со знаниями, vision-задачах и научных исследованиях
- чем длиннее и сложнее задача, тем сильнее Fable 5 отрывается от других моделей Claude
- модель эффективнее расходует токены, чем прошлые версии Claude
- Fable 5 удерживает фокус на задачах длиной в миллионы токенов и улучшает результат, используя собственные заметки

Fable 5 - это не просто «лучше бенчмарки». Она эффективнее, дольше работает без потери контекста, лучше управляет длинными задачами и даёт больше возможностей для сложных агентных сценариев.

GPT-5.6 уже близко.

Интересно, выпустит ли OpenAI свой аналог Mythos.

Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.

https://www.anthropic.com/news/claude-fable-5-mythos-5

Читать полностью…

Анализ данных (Data analysis)

Что сегодня определяет сильную BI-платформу? Уже не только красивые дашборды.

CNewsMarket опубликовал рейтинг российских BI-систем 2026 года. Аналитики сравнили решения более чем по 130 параметрам: от интеграции с источниками данных и возможностей визуализации до поддержки пользователей, партнерской экосистемы и инструментов self-service аналитики.

Главный вывод исследования — рынок BI продолжает смещаться от отчетности к принятию решений. Компаниям важно не просто собирать данные, а быстро находить инсайты, проверять гипотезы, выявлять аномалии и делать аналитику доступной для бизнес-пользователей без постоянного участия ИТ-команд.

Отдельное внимание в рейтинге уделено ИИ-функциям, работе с разнородными источниками данных и возможностям самостоятельного создания аналитики. По итогам исследования первое место занял DataLens, за ним расположились PIX BI и Luxms BI.

Похоже, что в 2026 году конкуренция между BI-платформами идет уже не столько за количество функций, сколько за скорость получения ответа на бизнес-вопрос.

Читать полностью…

Анализ данных (Data analysis)

Google, похоже, даёт Intel Foundry самый важный шанс за последние годы.

По данным The Information, Google выбрала Intel для производства 3 млн+ TPU в 2028 году. Для Intel это не просто крупный заказ, а редкий вход в цепочку поставок одного из главных конкурентов Nvidia в ИИ-железе:

- Intel становится потенциальной второй фабрикой для топовых ИИ-чипов
- Google снижает зависимость от TSMC
- рынок получает ещё одного крупного производителя advanced-node чипов
- Nvidia, Apple, Tesla и другие тоже ищут способы не упереться в один производственный узел

Сейчас TSMC фактически держит горлышко бутылки для ИИ-инфраструктуры. Спрос на ускорители растёт быстрее, чем доступные мощности, поэтому даже гигантам приходится искать запасные маршруты.

Для Google это способ масштабировать TPU и меньше зависеть от Nvidia. Для Intel - проверка, сможет ли её foundry-бизнес наконец стать не презентацией для инвесторов, а реальной альтернативой TSMC.

theinformation.com/articles/google-nvidia-consider-intel-backup-chip-manufacturer

Читать полностью…

Анализ данных (Data analysis)

Google Research показали Agentic RAG для Gemini Enterprise Agent Platform - RAG, который не сдаётся после первого поиска.

Обычный RAG часто ломается на корпоративных вопросах, где ответ лежит не в одном документе, а размазан по нескольким базам. Нашёл кусок про проект, увидел только ID сервера, но не пошёл дальше искать характеристики этого сервера в другой системе - и выдал неполный ответ.

У Google идея такая: превратить RAG в многоагентный процесс.

Что внутри:

- Orchestrator понимает, что запрос не решается за один шаг
- Planner разбивает задачу на маршруты поиска
- Query Rewriter переписывает вопрос в несколько точных запросов
- Search Fanout ищет по разным источникам
- Sufficient Context Agent проверяет, хватает ли данных для ответа

Модель проверяет: закрыты ли все части вопроса. Если данных не хватает, она явно пишет, чего именно не хватает, и отправляет систему искать дальше.

На FramesQA такой подход дал до 34% прироста точности по сравнению со стандартным RAG. В cross-corpus сценарии, где нужно выбрать правильный источник из нескольких, система ответила правильно на 90.1% вопросов.

По сути, Google двигает RAG от «поиска + генерации» к маленькому исследовательскому пайплайну, где есть планирование, маршрутизация, проверка контекста и повторный поиск.

Для enterprise это важнее красивых демо: меньше галлюцинаций, больше трассируемости и понятнее, почему система дала именно такой ответ.

research.google/blog/unlocking-dependable-responses-with-gemini-enterprise-agent-platforms-agentic-rag/

Читать полностью…

Анализ данных (Data analysis)

«Claude-Mythos-5» ненадолго засветился в API. Похоже, скоро релиз.

Интересно, пойдут ли они с ценами из поста про Glasswing: $25 за миллион входных токенов и $125 за миллион выходных.

Если да, это сделает Mythos примерно в 5 раз дороже Opus 4.8.

https://x.com/Machinelearrn/status/2063246572914160053

Читать полностью…

Анализ данных (Data analysis)

📌ИИ уже ускоряет разработку новых моделей

Anthropic опубликовала аналитический материал, в котором утверждает, что системы искусственного интеллекта всё активнее участвуют в создании следующих поколений ИИ.

Материал подготовлен исследовательским подразделением Anthropic Institute. Его авторы - Марина Фаваро и сооснователь компании, глава отдела политики Джек Кларк.


Отрасль приближается к рекурсивному самоулучшению

Это состояние, когда ИИ способен самостоятельно проектировать и совершенствовать собственного преемника быстрее, чем к этому будут готовы правительства и институты.


При этом Anthropic оговаривается, что до полностью автономной разработки ещё далеко и что такой сценарий не является неизбежным, люди по-прежнему нужны. Они ставят цели, оценивают результаты и решают, какие направления важны.

🟡Внутренние данные

На май 2026 года Claude написал более 80% кода, добавляемого в кодовую базу Anthropic.

До запуска Claude Code этот показатель измерялся единицами процентов.


Во втором квартале 2026 года типичный инженер вносил в проекты примерно в 8 раз больше кода в день, чем в 2024-м.

🟡Публичные тесты

Время выполнения задач, которые модели способны надёжно решать без участия человека, удваивается примерно каждые 4 месяца.

В начале 2024 года Opus 3 справлялся с задачами длиной в несколько минут, годом позже Sonnet 3.7 примерно за полтора часа, а Opus 4.6 - до 12 часов.


На SWE-bench, проверяющем исправление реальных ошибок в коде, передовые модели за два года прошли путь от низких результатов до почти предельных.

Джек Кларк говорит, что компания хочет, чтобы законодатели и институты понимали, что может произойти дальше.

По его словам, цель Anthropic - "заранее обозначить концепцию и дать людям представление о том, что приближается".


Прогресс ИИ, по его оценке, скорее ускоряется, чем замедляется, и может принести значительные результаты в медицине и науке, но требует инструментов для проверки и подтверждения работы, выполненной ИИ.

Anthropic выступает за то, чтобы у мира оставалась возможность при необходимости замедлить или временно приостановить разработку передовых моделей, но понимает, что это потребует согласованных всех игроков индустрии в разных странах и механизмов взаимной проверки.

В ближайшие месяцы компания обсудит эти вопросы с законодателями, исследователями и другими участниками отрасли.


@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Анализ данных (Data analysis)

Глобальной паузы в развитии ИИ не будет — и причина простая.

США открыто называют ИИ стратегической технологией, от которой зависит их мировое лидерство.

Остановиться - значит дать Китаю шанс обогнать, тем более что китайские open-source модели отстают всего на 4–6 месяцев.

Поэтому призывы к паузе - это скорее PR, жест доброй воли, а не реальная стратегия.

Ставки слишком высоки, и никто добровольно не отдаст преимущество сопернику.

Читать полностью…

Анализ данных (Data analysis)

Tencent Hunyuan вместе с Gaoling School of Artificial Intelligence при Renmin University of China открыли PlanningBench - фреймворк для оценки и обучения навыков планирования у LLM.

Внутри:

- 30+ задач планирования из реальных сценариев
- автоматическая проверка решений
- поддержка не только оценки, но и обучения моделей

Ресурсы:

arXiv: https://arxiv.org/abs/2605.20873
GitHub: https://github.com/Tencent-Hunyuan/PlanningBench
Hugging Face: https://huggingface.co/datasets/tencent/PlanningBench

Читать полностью…

Анализ данных (Data analysis)

NVIDIA выкатила Nemotron 3 Ultra - открытую frontier-модель для агентов, которые работают долго, а не просто отвечают на один промпт и забывают контекст.

Ставка здесь не на красивые бенчмарки общего рассуждения, а на длинные агентные цепочки: планирование, вызов инструментов, работа с кодом, исследование документов и enterprise-сценарии, где задача тянется через десятки шагов.

Именно там обычно ломается экономика агентов. Каждый шаг - новый инференс. Чем длиннее траектория, тем выше задержка и итоговая стоимость. В демо это почти не видно, а в проде быстро превращается в главный счёт.

Поэтому самые интересные цифры у Nemotron 3 Ultra связаны с эффективностью:

- до 5x быстрее инференс
- до 30% дешевле на агентных задачах
- фокус на длинных рабочих сессиях
- открытая модель для команд, которым важен контроль над весами

Для продакшен-агентов это бьёт в больное место. Важен не только красивый ответ на одном запросе, а цена завершённой задачи: сколько стоила вся цепочка, сколько времени заняла и сколько раз агенту пришлось дергать модель.

Открытость тоже важна. Команды с собственной инфраструктурой получают больше контроля: можно дообучать под домен, гонять модель внутри периметра и не держать критичный агентный пайплайн полностью на чужом API.

«До 5x» и «до 30%» почти всегда означают лучший сценарий на удобном профиле нагрузки. Реальный прирост зависит от ваших трасс, инструментов, длины контекста и количества шагов.

Проверять такую модель нужно не по latency одного запроса, а по cost-per-completed-task: сколько стоит агенту реально закрыть задачу от начала до конца.

https://blogs.nvidia.com/blog/nvidia-gtc-taipei-computex-2026-news/

Читать полностью…

Анализ данных (Data analysis)

OpenRouter запустил Fusion - систему, где на один запрос отвечает не одна модель, а сразу несколько

Суть в том, что Fusion отправляет ваш промпт параллельно в разные модели. Каждая модель пытается решить задачу по-своему, при необходимости использует web search и bash-инструменты, а затем отдельный judge сравнивает ответы. После этого synthesizer собирает финальный вариант.

Получается не просто «выбор лучшей модели», а полноценная серверная схема коллективного мышления:

* несколько моделей работают одновременно;
* инструменты помогают проверять факты и считать;
* judge отбрасывает слабые ответы;
* synthesizer собирает итоговый результат в один связный ответ.

OpenRouter утверждает, что Fusion уже обходит frontier-модели на DRACO, deep research benchmark от Perplexity.

https://openrouter.ai/fusion

@machinelearning_ru

Читать полностью…

Анализ данных (Data analysis)

Правительство США, ссылаясь на полномочия в сфере национальной безопасности, выпустило директиву экспортного контроля, требующую приостановить любой доступ к Fable 5 и Mythos 5 для иностранных граждан — независимо от того, находятся они в США или за их пределами. Это касается в том числе иностранных сотрудников Anthropic.

Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.

Доступ ко всем остальным моделям Claude не затронут.

Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.

https://www.anthropic.com/news/fable-mythos-access

Читать полностью…

Анализ данных (Data analysis)

Быстрый старт в AI-аналитику с DataLens

Обзор AI в DataLens: агентский режим, новые сценарии и on-premises

16 июня в 12:00 мск проведём вебинар о том, как AI-возможности меняют работу с аналитикой в DataLens.

Покажем агентский режим Нейроаналитика, новые сценарии в дашбордах, виджетах, рассылках и встройках, а также разберём, как использовать DataLens в облаке и on-premises.

О чём поговорим:

* большое обновление Нейроаналитика и как устроен агентский режим под капотом
* новые сценарии: виджеты дашборда, рассылки, встройки и публикации
* как подключать внешние AI-инструменты и ускорять работу с DataLens
* доступность AI-возможностей в облаке и on-premises
* планы развития встроенного AI в DataLens и инфраструктуры для внешних AI- инструментов

Вебинар будет полезен аналитикам, BI-специалистам, дата-командам и всем, кто хочет быстрее получать инсайты из данных без лишней ручной работы.

Читать полностью…

Анализ данных (Data analysis)

NVIDIA представила Vera CPU как процессор для новой волны AI-фабрик

Раньше масштабирование ИИ в основном крутилось вокруг обучения, инференса и test-time compute. Теперь растёт другой тип нагрузки: агентные системы и reinforcement learning.

Такие модели планируют, вызывают инструменты, запускают проверки, работают с окружениями, делают больше шагов и постоянно гоняют данные между CPU, GPU, памятью и сетью.

По данным NVIDIA, Vera должна ускорять выполнение агентных задач до 1,8 раза по сравнению с x86 CPU, сокращать CPU-время и повышать общий throughput AI-фабрики. Идея простая: если CPU медленно готовит данные и обслуживает окружение, дорогие GPU ждут и не генерируют токены.

Vera делает ставку на высокую пропускную способность памяти, быструю связку CPU-GPU через NVLink-C2C и более предсказуемое перемещение данных. Для агентных workloads это важно, потому что там стоимость считается не только в FLOPS, а в том, сколько задач система успевает завершить за единицу времени.

NVIDIA усердно двигает идею продажи AI-фабрики целиком: GPU, CPU, сеть, память и софт как одну систему.

https://developer.nvidia.com/blog/nvidia-vera-cpu-sets-a-new-standard-for-agentic-workloads-in-ai-factories/

Читать полностью…

Анализ данных (Data analysis)

Отличные новости из нового исследования, опубликованного в Nature. Слово «историческое» тут действительно уместно.

Пациент впервые получил генную терапию, которая должна заставить повреждённые нейроны глаза снова вести себя как молодые клетки.

Важно, что речь не об обычных клетках глаза. Мишень терапии — нейроны центральной нервной системы, похожие на клетки мозга. Обычно после повреждения они почти не восстанавливаются.

Если подход сработает, это станет ранним признаком того, что медицина может научиться чинить нервную ткань, которую раньше считали необратимо повреждённой.

https://www.nature.com/articles/d41586-026-01836-7

Читать полностью…

Анализ данных (Data analysis)

Готов к космическому разгону AI‑продукта? 
Приходи на One Day Offer для Product Analysts! 🚀

20 июня команда GigaChat планирует найти будущего коллегу — продуктового аналитика, который поможет вывести LLM‑платформу на новую орбиту.

Ты будешь:

✔️ анализировать поведение пользователей;  
✔️ проводить A/B‑тесты; 
✔️ создавать дашборды; 
✔️ работать с метриками. 

А ещё ты станешь частью крупнейшего IT‑комьюнити.

Хочешь влиять на продукт для миллионов? Регистрируйся на One Day Offer прямо сейчас!

Читать полностью…

Анализ данных (Data analysis)

TOXI$, Utopia Show, Тима ищет свет на фесте Яндекса!

Приходи на фест Яндекса 25 июня, получи эксклюзивнный мерч Young Con и узнай, какие технологии реально нужны рынку прямо сейчас. В программе: баттл вузов, воркшопы от действующих разработчиков и выступления от Utopia Show, TRITIA, TOXI$, Ильи Куруча, Александра Пушного, Тимы ищет свет и Сергея Мезенцева.

Зарядись нетворкингом и промокодами от Яндекса.

Место: Москва, ул. Западная, 45, LIVE ARENA
Дата: 25 июня

Вход бесплатный, но нужна регистрация!

Зарегистрироваться

#реклама 16+
yandex.ru

О рекламодателе

Читать полностью…

Анализ данных (Data analysis)

Tencent Hunyuan выкатили UniRL - инфраструктуру для RL-посттрейнинга мультимодальных моделей.

Это попытка собрать один общий RL-цикл для разных семейств моделей: LLM, VLM, diffusion, flow matching и unified multimodal.

Обычный пайплайн выглядит знакомо:

- generate
- score
- advantage
- update
- sync

UniRL пытается сделать этот цикл универсальным. Модель и алгоритм разведены как две независимые оси, поэтому можно комбинировать разные model families и RL-алгоритмы без жёстко зашитого сценария.

Покрытие широкое: text-to-image, text/image-to-video, vision-language, text-only LLM, VLM, LLM-to-diffusion prompt enhancer, а также смешанная autoregressive + diffusion генерация вроде Hunyuan-Image 3 и Bagel.

Есть pluggable rollout engines через единый typed contract: train-side, SGLang, vLLM-Omni. Для масштабирования заявлены FSDP2 sharding и несколько deployment-режимов, которые переключаются из одного конфига.

Отдельно Tencent добавили два своих алгоритма:

- Flow-DPPO - policy optimization для flow/diffusion моделей с trust-region masks на основе exact divergence
- DRPO - RL для LLM со сглаженным advantage-weighted quadratic regularizer

UniRL выглядит как шаг к нормальному post-training стеку для моделей, которые одновременно пишут, видят, генерируют и используют разные типы rollout-движков.

Код: http://github.com/Tencent-Hunyuan/UniRL

Статья: arxiv.org/abs/2606.09821

Читать полностью…

Анализ данных (Data analysis)

Китайская UBTECH Robotics показала тизеры humanoid-роботов серии U1 для массового рынка.

В линейке две бионические модели:

- старшая версия - 183 см и 42 кг
- младшая версия - 168 см и 35,2 кг
- 88 степеней свободы
- поддержка Wi-Fi
- встроенный ИИ для обучения и взаимодействия с окружением
- автономность до 4 часов

Полная презентация запланирована на 30 июня, но предзаказы уже открыты. По данным компании, зарезервировано 1 943 устройства.

Читать полностью…

Анализ данных (Data analysis)

В Юте жители подали в суд из-за гигантского ИИ-дата-центра Stratos, который продвигает Кевин О’Лири.

Проект изначально планировали как кампус на 40 000 акров в Box Elder County. Местные опасаются нагрузки на воду, энергию, экологию и фактически обхода нормального общественного обсуждения. Иск подали пять жителей и Alliance for a Better Utah: они оспаривают роль Military Installation Development Authority, структуры, которая получила слишком широкие полномочия по земле, налогам, безопасности и развитию территории.

На фоне давления О’Лири уже согласился урезать проект почти вдвое и вывести часть земли из застройки, включая участки рядом с Locomotive Springs Waterfowl Management Area. Но даже после сокращения речь всё равно идёт примерно о 20 000 акров - это больше Манхэттена.

История показательная:

- дата-центры продают как вопрос национальной безопасности
- местным обещают рабочие места и налоги
- жители получают риски по воде, земле, шуму, энергии и экологии
- решения часто двигаются быстрее, чем общество успевает понять масштаб

https://www.nbcnews.com/tech/tech-news/utah-residents-sue-officials-kevin-oleary-data-center-plan-rcna348720

Читать полностью…

Анализ данных (Data analysis)

Claude догнал профессиональный химический софт в анализе ЯМР - без дообучения под химию.

Anthropic проверили Claude на ЯМР-спектрах - это метод, по которому химики понимают, какую молекулу они синтезировали. Взяли 20 соединений из свежих препринтов, вышедших уже после даты обучения моделей, и сравнили Claude с ChemDraw и MestReNova.

Что получилось:

- в задаче «предсказать спектр по структуре» Opus 4.7 оказался точнее всех по водороду
- по углероду вышел примерно на уровень специализированного софта
- по форме пиков заметно обошёл классические инструменты
- расщепление пиков угадывал примерно в 80% случаев против 26–35% у обычных тулов

Обратная задача ещё интереснее: восстановить структуру молекулы по спектру.

Специализированный софт такое умеет, но обычно требует 2D-ЯМР, лицензий и человека, который понимает, как с этим работать. Claude же справляется по обычному списку пиков и масс-спектру - по сути, по данным, которые химик мог бы просто скинуть в чат.

Результат:

- 8 из 8 простых молекул восстановлены правильно
- 4 из 7 сложных молекул восстановлены идеально

Выборка пока маленькая, и авторы честно подают это как ориентир, а не финальный приговор химикам.


🔗 anthropic.com/research/making-claude-a-chemist

Читать полностью…

Анализ данных (Data analysis)

TRITIA, TOXI$, Илья Куруч и другие на Young Con 25 июня

Приходи на фест Яндекса 25 июня, получи эксклюзивнный мерч Young Con и узнай, какие технологии реально нужны рынку прямо сейчас. В программе: баттл вузов, воркшопы от действующих разработчиков и выступления от Utopia Show, TRITIA, TOXI$, Ильи Куруча, Александра Пушного, Тимы ищет свет и Сергея Мезенцева.

Зарядись нетворкингом и промокодами от Яндекса.

Место: Москва, ул. Западная, 45, LIVE ARENA
Дата: 25 июня

Вход бесплатный, но нужна регистрация!

Зарегистрироваться

#реклама 16+
yandex.ru

О рекламодателе

Читать полностью…

Анализ данных (Data analysis)

🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ.

Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект.

Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике.

Внутри:

- Python с нуля
- много практики без сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современная разработка с ИИ
- отдельный блок по вайбкодингу

Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния.

48 часов скидка 60%: https://stepik.org/course/288218/

Читать полностью…

Анализ данных (Data analysis)

DeepSeek всё чаще появляется в статьях расходах американских компаний.

По данным Ramp, DeepSeek занял первое место в июньском списке trending software vendors. Компании реально начинают платить за более дешёвые альтернативы OpenAI и Anthropic.

Когда ИИ переходит из пилотов в ежедневные процессы, цена токена внезапно становится не мелочью, а строкой бюджета.

Особенно в агентных задачах, где один пользовательский запрос превращается в десятки вызовов модели, поиск, инструменты, повторные проверки и длинный контекст.

С одной стороны, есть привычные OpenAI и Anthropic с сильным брендом, экосистемой и комплаенсом. С другой - DeepSeek и похожие игроки, которые давят ценой и заставляют пересчитывать экономику внедрения.

Самое смешное, что рынок снова ведёт себя без идеологии. Если модель достаточно хороша, API доступен, а счёт в конце месяца заметно ниже, часть компаний начнёт тестировать её независимо от того, кто что говорит про геополитику.

Nothing to see here.

Читать полностью…

Анализ данных (Data analysis)

Как сделать ранжирование с нуля 💫

В Авито совсем недавно появился новый продукт — Подработка. Здесь исполнители ищут удобную работу на пару часов с быстрыми выплатами, а заказчики — толковых работников. В отличие от классической задачи что-то продать тут мы решали проблему мэтчинга: важно, чтобы и исполнителю, и заказчику понравилось работать друг с другом.

Задача большая и интересная, поэтому мы сняли новый выпуск «Диванной аналитики» с Владиславом Урихом, архитектором системы алгоритмов мэтчинга для GIG-платформы.
Вот что он рассказал:

➡️ Как начинали строить мэтчинг и почему вначале не использовали ML.
➡️ Почему первый ML-подход не сработал и какую альтернативу придумали.
➡️ Какие инсайты и уроки вынесли, чтобы построить эффективную алгоритмическую систему.

Видео о том, как разрабатывали новые подходы к мэтчингу, смотрите где удобно:
📱 YouTube
📱 VK Видео

Читать полностью…
Subscribe to a channel