opendatascience | Technologies

Telegram-канал opendatascience - Data Science by ODS.ai 🦜

46227

First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev

Subscribe to a channel

Data Science by ODS.ai 🦜

Привет!

Представляем Вашему вниманию тринадцатый выпуск подкаста "Капитанский мостик". Ведущие подкаста Валентин Малых и Дмитрий Колодезев обсуждают последние новости в области технологий, включая утечку исходного кода Anthropic, развитие open source, безопасность в AI, а также влияние крупных компаний на рынок памяти и возможные последствия для индустрии.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

Читать полностью…

Data Science by ODS.ai 🦜

🔥 DeepSeek-V4 полностью перейдёт на чипы Huawei: почти триллион параметров без единого Nvidia

Согласно свежим данным, флагманская модель DeepSeek-V4 (почти 1 триллион параметров) будет полностью работать на китайских чипах Huawei Ascend.

Ключевые детали новой модели:
- Архитектура почти на 1 трлн параметров
- Контекстное окно до 1 миллиона токенов
- Инференс в 1,8 раза быстрее предыдущих версий
- Значительно улучшенная эффективность благодаря технологии Engram
- Сильный акцент на высокопроизводительном кодинге и сложном reasoning

DeepSeek уже несколько месяцев тесно сотрудничает с Huawei и Cambricon: команда переписывала и оптимизировала ключевые компоненты модели специально под Ascend. Ожидается, что для запуска и инференса V4 будет задействовано сотни тысяч чипов Ascend 950PR.

Это знаковый момент: одна из самых мощных китайских моделей полностью отказывается от американских чипов в пользу Huawei. Пока другие гиганты (Alibaba, ByteDance, Tencent) тоже массово заказывают Ascend 950PR, DeepSeek идёт ещё дальше — давая Huawei приоритетный ранний доступ для глубокой оптимизации.

Выход DeepSeek-V4 ожидается в ближайшие недели, а позже в этом году могут появиться ещё две вариации модели на полностью китайском железе.

Санкции, которые должны были сдержать Китай, на деле ускоряют создание независимой экосистемы. Huawei Ascend + DeepSeek = мощный тандем, который меняет правила игры в китайском ИИ.

Оригинальная статья

#DeepSeek #DeepSeekV4 #Huawei #Ascend

Читать полностью…

Data Science by ODS.ai 🦜

🔥 Netflix выложили open-source модель для удаления объектов из видео с сохранением логики сцены

Это не просто «удалить объект из видео».

Модель удаляет объект
и пересчитывает всю физику сцены.

Удалил человека → гитара падает сама
убрал домино → цепочка не падает
убрал машину → аварии не происходит

ИИ буквально отвечает на вопрос:
«что было бы, если этого объекта не существовало»

Под капотом:
- diffusion + transformer (на базе CogVideoX)
- анализ взаимодействий объектов
- генерация новой реальности, а не просто замазка

И это главное отличие от всего, что было раньше.

Раньше:
замазали объект → сцена ломается

Теперь:
удалили объект → сцена остаётся логичной

Требования, правда, не слабые:
GPU от ~40GB VRAM (A100)

Репа: https://github.com/Netflix/void-model
HF: https://huggingface.co/spaces/sam-motamed/VOID

@ai_machinelearning_big_data

#Netflix #ai #video

Читать полностью…

Data Science by ODS.ai 🦜

Удаленное выполнение кода в подарок⌨️

У кого‑то сильно пригорело из‑за «дырявости» OpenClaw — аж персональный счетчик дней без уязвимостей сделали😂
Счетчик, кстати, обнулился 1 апреля —и это не шутка)
А так, в среднем 1,8 уязвимости в день получается с момента релиза OpenClaw... И слоган говорящий: "ИИ-помощь — бесплатная RCE включена"😅

#humor #friday #cve #openclaw

Читать полностью…

Data Science by ODS.ai 🦜

🚀 Gemma 4 - новое семейство открытых моделей Google, которые можно запускать прямо на своём железе.

Модели заточены для сложного reasoning и агентных задач.

🔵 Доступны в четырёх вариантах:

31B Dense и 26B MoE
Топовый уровень производительности для сложных локальных задач: кастомные код-ассистенты, анализ научных данных и не только.

E4B и E2B (Edge)
Оптимизированы для мобильных устройств — работают в реальном времени с текстом, изображениями и аудио.

🤖 Что можно делать:

• строить автономных ИИ-агентов
• планировать и выполнять многошаговые задачи
• взаимодействовать с приложениями
• искать данные и вызывать API

👉 Встроенная работа с инструментами (tool use) из коробки.

🧠 Контекст до 256K токенов:

• анализ целых кодовых баз
• длинные цепочки действий без потери контекста
• стабильная работа в сложных сценариях

⚡️ Начать можно уже сейчас через Google AI Studio

Также веса моделей доступны на Hugging Face, Kaggle и Ollama

Лицензия: Apache 2.0.

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/

@ai_machinelearning_big_data

#Gemma

Читать полностью…

Data Science by ODS.ai 🦜

Ув. подписчик поделился ресурсом, который аггрегирует случаи ущерба от вайбкодинга.
Среди них - потерям Амазоном 6 млн заказов, Zero-click RCE на устройствах пользователей vibe-coding площадки, и закрытие одного стартапа, полностью написанного ИИ из-за доступа к платным фичам через смену одного параметра в куках.
Что интересно, что сделал его стартап, продукт которого - AI интервьюер, который тренирует тебя к собеседованиям.
Поговорка про стеклянный инструмент и дурака обретает новые смыслы.

Читать полностью…

Data Science by ODS.ai 🦜

✔️ OpenAI сделала плагин Codex для Claude Code.

Расширение позволяет вызывать Codex напрямую из рабочего процесса для код-ревью и делегирования задач. Инструмент поддерживает базовую проверку синтаксиса, расширенное интерактивное ревью с наводящими вопросами и автоматическое расследование дефектов с исправлением багов.

Плагин работает через локальный Codex CLI и не изолирован от системы. Он наследует авторизацию устройства, конфигурацию, переменные окружения и доступ к репозиториям.

Для установки дополнения потребуется Node.js версии 18.18 или новее, а также любая учетная запись ChatGPT, включая бесплатный тариф, либо API-ключ OpenAI. Исходники плагина опубликованы на Github.
community.openai.com

✔️ Google выпустила Veo 3.1 Lite.

Новинка замыкает линейку Veo 3.1 и ориентирована на массовую генерацию контента. Стоимость создания на новой модели на 50% меньше. чем на версии Fast.

Lite генерирует ролики на основе текста или изображений, предлагая базовые настройки ориентации кадра и длительность в 4, 6 или 8 секунд. 4K не поддерживается, доступны только 720p и 1080p.

Доступ к Veo 3.1 Lite уже открыт на платных тарифах в Gemini API и платформе Google AI Studio. Одна секунда видео в 720p обойдется в 5 центов, а в 1080p - в 8 центов. Также анонсировано снижение тарифов для Veo 3.1 Fast с 7 апреля.
blog.google

✔️ Nebius Group построит в Финляндии один из крупнейших в Европе дата-центров для ИИ.

Nebius, основанная бывшим главой Яндекса Аркадием Воложем, инвестирует более 10 млрд. долларов в вычислительный комплекс мощностью 310 МВт. Объект возводится в Лаппеэнранте, а его поэтапный ввод в эксплуатацию начнется в 2027 году.

Выбор локации продиктован холодным климатом и прямым доступом к недорогой возобновляемой энергии. Этот дата-центр станет крупнейшей площадкой Nebius за пределами США и обеспечит около 10% от всей запланированной мощности компании.
reuters.com

✔️ В Китае запущена первая полностью автоматизированная линия по производству гуманоидных роботов.

Предприятие в городе Фошань рассчитано на выпуск 10 000 человекоподобных машин ежегодно. Переход на конвейерный формат сократил время сборки одного устройства в среднем до 30 минут. Это повысило общую эффективность производства более чем на 50% по сравнению с традиционными методами сборки.

Технологический процесс состоит из 24 этапов и включает 77 процедур для проверки безопасности и надежности узлов. Линия отличается высокой гибкостью: архитектура конвейера позволяет одновременно выпускать различные модификации роботов для разных нужд - от заводских цехов до медицинских учреждений.

Тренд на массовое производство поддерживают и другие локальные разработчики: Unitree и UBTech планируют поставить на рынок десятки тысяч роботов уже к концу этого года, а Agibot отгрузила более 5 тыс. единиц в 2025 году.
cctvplus.com

✔️ Micron начал разработку многослойной графической памяти GDDR.

Вендор применит к GDDR подход вертикальной компоновки из чипов HBM, чтобы заполнить нишу между дорогой HBM и классической GDDR. До конца года Micron подготовит оборудование и приступит к тестовому производству, а первые четырехслойные инженерные образцы появятся в 2027 году,

С развитием ИИ рынку требуются более доступные решения, особенно для инференса, где HBM избыточна, а производительности обычной графической памяти не хватает. Многослойная GDDR даст повышенную пропускную способность и увеличенную емкость, сохранив при этом конкурентную цену. Помимо ИИ-ускорителей, новые чипы найдут применение в игровых видеокартах.

Для запуска производства Micron предстоит преодолеть ряд инженерных барьеров: контроль тепловыделения, оптимизация энергопотребления и удержание низкой себестоимости сложного процесса упаковки.
etnews.com

@ai_machinelearning_big_data

🐍 полезные ресурсы 🚀Max

#news #ai #ml

Читать полностью…

Data Science by ODS.ai 🦜

Улыбка, которую запомнил весь мир

Читать полностью…

Data Science by ODS.ai 🦜

И.А. Самыловский (ФКИ МГУ), Задачи оптимизации в планировании орбитальной съёмки

YouTube->
Дзен->
RuTube->
Файл->

И канал, который ведёт докладчик: @astrodynlab

Читать полностью…

Data Science by ODS.ai 🦜

Привет!

Встречайте двенадцатый выпуск подкаста "Капитанский мостик". В этом разговоре ведущие Валентин Малых и Дмитрий Колодезев обсуждают конференцию по обработке текстов в Марокко, достижения в области искусственного общего интеллекта (AGI) и важность взаимодействия между людьми и ИИ. Они также затрагивают тему программирования с помощью LM-агентов и подчеркивают значимость умения слушать в современном мире.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

Читать полностью…

Data Science by ODS.ai 🦜

🤖 Компания Z.ai (создатели моделей GLM) выпустили AutoClaw - инструмент, который позволяет запускать OpenClaw локально, без интернета и без API-ключей.

OpenClaw - это ИИ-агент, который умеет выполнять многошаговые задачи и использовать инструменты (например, подключаться к Slack, Telegram, Discord, WhatsApp и другим сервисам).

В чем плюсы AutoClaw:
• Скачал - запустил. Никаких API-ключей не нужно
• Можно использовать любую модель или встроенную GLM-5-Turbo, заточенную под работу с инструментами и сложными задачами
• Полностью локально, твои данные никуда не уходят

По сути, это локальный аналог таких агентов, как Cursor или Operator, но работающий целиком на твоей машине, без слежки и без подписок.

AutoClaw: https://autoglm.z.ai/autoclaw/
Discord: https://discord.gg/jvrbCRSF3x

@ai_machinelearning_big_data

Читать полностью…

Data Science by ODS.ai 🦜

ИИ начал находить настоящие баги в ядре Linux. И никто не понимает, почему именно сейчас

Грег Кроа-Хартман, один из ключевых мейнтейнеров ядра Linux, заявил что ситуация с AI-сгенерированными баг-репортами кардинально изменилась.

Ещё недавно это был поток мусора - теперь это реальные баги с рабочими патчами.
Его слова: «Что-то произошло месяц назад, и мир переключился.

Теперь к нам приходят настоящие отчёты». И это не только Linux - по его словам, все крупные open source проекты видят то же самое. Команды безопасности общаются между собой неформально, и картина везде одинаковая.

Никто не понимает, что именно изменилось. Кроа-Хартман говорит прямо: «Мы не знаем. Никто не знает почему. То ли инструменты стали сильно лучше, то ли люди просто начали пробовать. Похоже, что это много разных групп и компаний одновременно».
Ядро Linux справляется - команда большая и распределённая.

Баги мелкие, не критические, но поток реальный и не замедляется.

А вот для маленьких open source проектов это проблема. У них просто нет людей, чтобы обработать внезапный наплыв качественных AI-репортов.

Раньше страдали от мусорных репортов, теперь страдают от настоящих.
По сути мы наблюдаем момент, когда AI-инструменты для поиска уязвимостей перешли из категории «игрушка» в категорию «инфраструктура». И open source к этому не готов.

theregister.com/2026/03/26/greg_kroahhartman_ai_kernel/

🐍 Linux полезные ресурсы 🚀Max

@linuxkalii

Читать полностью…

Data Science by ODS.ai 🦜

В AIRI, «Сбере» и «Сколтехе» создали детектор ошибок сжатия в работе ИИ-систем

Решение направлено на улучшение обработки длинных диалогов. Детектор решает проблему переполнения токенов (Token Overflow) — искажения данных при превышении пороговых значений сжатия. Он представляет собой обучаемый классификатор, который проверяет токены до того, как они попадут в большую языковую модель, и не пропускает испорченный контекст. В этом случае система может использовать несжатый текст или найти актуальные документы.

«Наше решение выполняет функцию защитного механизма: мы научились автоматически детектировать порог, за которым краткость перестает быть оптимизацией и ведет к ошибкам, вызывая потерю устойчивости модели», — объяснил директор Центра практического искусственного интеллекта «Сбера» Николай Тиден.

Классификатор задействовали при обновлении GigaChat Ultra от «Сбера». С помощью детектора модель научилась запоминать факты о пользователях и применять их для персонализации общения.

🔗Источник: https://www.sberbank.ru/ru/sberpress/all/article?newsID=63721a59-801d-489e-9537-6f7f2e79b279&blockID=1303&regionID=77&lang=ru&type=NEWS

---
Подпишитесь на Email-рассылки ICT.Moscow по общей ИТ-повестке, искусственному интеллекту и аналитике, чтобы всегда оставаться на связи.

Читать полностью…

Data Science by ODS.ai 🦜

коллеги прислали ссылку на статью из журнала "Природа" Nature, которая посвящена тому, чтобы обучить LLM рассуждать байесовски; тут надо сделать отступление и пояснить, что это такое, а то не все в курсе; байесовское принятие решений - это когда субъект делает вероятностное суждение об объекте: например, вдалеке видно какое-то животное, можно предположить, что это скорее всего собака, но может быть и волк (1 картинка)

важно отметить, что а) люди в среднем без специального обучения так рассуждать не умеют, про это написано много литературы, б) как следствие, LLM тоже не умеют; так вот коллеги придумали, как их обучить (2 картинка); интересно, что байесовские рассуждения распространяются за пределы обучаемого домена, то есть модели реально выучивают этот навык

но самый большой недостаток статьи на мой взгляд раскрывает 3 картинка - при взаимодействии с реальным пользователем улучшения против необученной LLM нет; это возвращает нас к началу - люди байесовски думать не умеют и не могут

@valuableai

Читать полностью…

Data Science by ODS.ai 🦜

Похоже, «война токов» возвращается ⚡️ Дата-центры предлагают перевести на постоянный ток

ИИ-инфраструктура заставляет пересматривать то, что десятилетиями считалось нормой. Сегодня почти все ЦОДы работают на переменном токе, и выглядит примерно так: ток приходит, понижается, превращается в постоянный, потом обратно в переменный… и снова в постоянный уже перед серверами. Несколько преобразований подряд – и на каждом этапе теряется энергия.

Раньше это было терпимо: стойка на 10 кВт не делала погоды. Но в эпоху ИИ всё иначе – одна стойка может потреблять до 1 МВт. И тут потери, нагрев и даже расход меди начинают бить по экономике всерьёз.

И тут возникла идея: убрать «качели» AC-DC, перейти на постоянный ток и сразу преобразовывать входящие 13,8 кВ в 800 В DC, чтобы максимально упростить всю схему питания.

В итоге мы сокращаем потери энергии, точки отказа, количество оборудования и меди. Плюс на 85% увеличивается передаваемая мощность по тем же проводам.

Vertiv, Delta, Eaton и другие компании активно готовят решения на основе постоянного тока, а первые коммерческие системы ожидаются уже в 2026 году.

Читать полностью…

Data Science by ODS.ai 🦜

📌Прогноз Альтмана о «компании на миллиард с одним сотрудником» получил первого претендента.

В 2024 году глава OpenAI заявил, что ИИ сделает возможным появление компании с выручкой в миллиард долларов и единственным сотрудником.

На этой неделе Альман направил письмо в The New York Times: по его словам, он выиграл пари с друзьями из числа руководителей технологических компаний - и хотел бы лично познакомиться с человеком, который, как он считает, это доказал.

"In my little group chat with my tech CEO friends there's this betting pool for the first year that there is a one-person billion-dollar company, which would have been unimaginable without AI and now will happen."


🟡Этот человек - Мэттью Галлахер.

В сентябре 2024 года 41-летний предприниматель из Лос-Анджелеса вложил $20 тысяч и за 2 месяца запустил Medvi, телемедицинскую платформу по продаже препаратов для снижения веса. Код создавался с помощью ChatGPT, Claude и Grok, рекламные креативы - через Midjourney и Runway, а за клиентскую поддержку отвечали ИИ-агенты. В штате компании два человека: сам Галлахер и его брат Эллиот.

По данным NYT, выручка Medvi за 2025 год составила $401 млн. при чистой марже 16,2% (около $65 млн. прибыли). Прогноз по выручке на 2026 год - $1,8 млрд. Внешнего финансирования компания не привлекала.

Для сравнения: конкурент Hims & Hers при выручке $2,4 млрд. имеет штат свыше 2400 человек и маржу 5,5%.

Следует оговориться: финансовые показатели Medvi не проходили независимого аудита, и NYT не приводит какую-либо стороннюю верификацию этой оценке.


Медицинскую инфраструктуру Галлахер не строил, она полностью арендованная. Консультации врачей консультации и рецепты обеспечивает CareValidate, аптечную логистику - OpenLoop Health. Medvi владеет только брендом, сайтом, рекламой и поддержкой.

🟡Безусловно, не обошлось без проблем.

Чатбот Medvi выдумывал цены на препараты. Галлахеру, по его словам, пришлось выполнять такие заказы, пока это не починили.

Бот генерировал описания препаратов, которых не существовало.

Когда клиенты требовали разговора с живым человеком, звонки поступали на личный телефон основателя - всего таких звонков, по его оценке, было более 1000.

Во время одного сбоя сайта чинить его было некому: Галлахер находился на прогулке и за это время компания потеряла около 200 клиентов.

В марте этого года FDA, американский регулятор, направил предупреждения десяткам телемедицинских компаний, включая Medvi за вводящий в заблуждение маркетинг, так что окно для основы бизнеса Галлахера может закрыться.


@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Data Science by ODS.ai 🦜

🚨 Anthropic убила «безлимит» для Claude-агентов

С завтрашнего дня подписка Claude больше не работает с OpenClaw и другими сторонними агентами как раньше. Теперь всё, что идёт через OAuth, оплачивается отдельно поверх тарифа.

По факту это конец схемы, когда за $200 в месяц прогоняли агентные пайплайны на тысячи долларов. Anthropic прямо сказала, что такие кейсы перегружают их инфраструктуру.

Сам Claude никуда не делся. OpenClaw тоже не запретили. Просто экономика изменилась. Либо платишь за каждый запрос, либо идёшь через API.

Чтобы сгладить удар, дают кредит на сумму подписки до 17 апреля и обещают скидки на доп. использование. Но это уже косметика.

Все инструменты, которые строились вокруг подписки Claude, резко становятся дороже. И теперь вопрос не в удобстве, а в юнит-экономике.

Эра дешёвых агентных хакингов закончилась.

https://x.com/bcherny/status/2040206440556826908

@ai_machinelearning_big_data

📌 полезные ресурсы 🚀Max

#claude #ai #openclaw

Читать полностью…

Data Science by ODS.ai 🦜

В Китае произошло восстание машин. Буквально.

В одном из городов разом сломались сотни роботакси Baidu, встав посреди дорог и на оживленных трассах — причиной называют системный сбой.

В итоге несколько автомобилей попали в ДТП, а внутри остались заперты пассажиры — людям пришлось сидеть в машинах часами и вызывать полицию.

Вот оно, наше будущее 🫣

Источник: @techmedia

Читать полностью…

Data Science by ODS.ai 🦜

🚀 Qwen3.6-Plus- новый мультимодальный агент от Alibaba
Ключевые особенности:


💻 Agentic Coding - умнее и быстрее в написании кода
👁️ Улучшенное мультимодальное зрение - точнее воспринимает и анализирует визуальный контент
🏆 Топовые общие способности - сохраняет лидерские позиции
📄 Контекстное окно 1M токенов - доступно через API по умолчанию

Модель создана на основе обратной связи от сообщества Qwen3.5. Доступна уже сейчас через chat.qwen.ai и API. Обещают открыть исходный код других моделей серии Qwen3.6.

Chat: https://chat.qwen.ai

API: https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.6-plus

Blog: https://qwen.ai/blog?id=qwen3.6

#Qwen #AI #AgenticCoding #VibeCoding #Agents

🐍 полезные ресурсы 🚀Max

@data_analysis_ml

Читать полностью…

Data Science by ODS.ai 🦜

⚙️ AutoResearchClaw — попытка автоматизировать исследовательский пайплайн

В последнее время заметен сдвиг от отдельных моделей к агентным системам, способным решать сложные многошаговые задачи. Репозиторий AutoResearchClaw предлагает подход к частичной автоматизации научного процесса: исследователь задаёт идею, а система берёт на себя значительную часть рутинной работы — от экспериментов до оформления результатов.

1️⃣ Основной результат

Система реализует итеративный исследовательский цикл. На вход подаётся идея (например, в виде короткого описания задачи), после чего система:
🟣формализует постановку;
🟣собирает контекст и related work;
🟣предлагает метод;
🟣проводит эксперименты;
🟣анализирует результаты и оформляет текст.

Ключевая особенность — это не линейный pipeline, а замкнутый цикл с возвратами, где результаты экспериментов используются для улучшения гипотезы.

2️⃣ Техническая реализация (как устроен цикл)

AutoResearchClaw представляет собой иерархическую агентную систему с оркестратором.

На верхнем уровне находится контроллер, который хранит состояние исследования (гипотеза, код, результаты, текст) и управляет переходами между шагами. Ниже — специализированные агенты: генерация метода, код, запуск экспериментов, анализ и написание текста. Все они взаимодействуют через общее состояние (shared memory).

Цикл работы системы можно описать так:
гипотеза → код → эксперимент → анализ → обновление гипотезы → ...

При этом важна именно стадия обновления гипотезы. После каждого эксперимента система формирует контекст (метрики, ошибки, сравнение с baseline) и с помощью LLM предлагает модификации:
🟣изменение архитектуры или pipeline;
🟣добавление регуляризации или новых признаков;
🟣корректировку training-стратегии.

Эти изменения применяются к коду, после чего цикл повторяется. Таким образом реализуется итеративный поиск в пространстве решений, где гипотеза постепенно уточняется.

3️⃣ Условие выхода из цикла

Остановка процесса задаётся эвристически. Обычно используется комбинация:
🟣достижение приемлемого качества (по метрикам),
🟣отсутствие значимого улучшения на нескольких итерациях,
🟣ограничение по числу запусков или времени.

После этого система переходит к финальному этапу — сборке текста статьи на основе накопленных результатов.

4️⃣ Заключительные замечания

Сильная сторона подхода — в том, что он делает явным исследовательский цикл и переносит рутинные этапы (эксперименты, код, текст) на агентную систему. Это может существенно ускорить проверку гипотез и построение baseline-решений.

Ограничения при этом остаются: качество сильно зависит от прокси-метрик, новизна часто носит композиционный характер, а интерпретация результатов по-прежнему требует участия исследователя. В этом смысле система выступает скорее как инструмент-ассистент, чем автономный «учёный».

Как вы думаете, если такие системы станут зрелыми, как изменится роль исследователя — и где пройдёт граница между идеей и её реализацией?

Обзор инструмента подготовлен командой AI VK
#обзоринструмента

Читать полностью…

Data Science by ODS.ai 🦜

Парень переписал Claude Code на Python за ночь - и взорвал GitHub

Anthropic случайно засветили исходники своего ИИ-редактора Claude Code и они мгновенно разлетелись по сети.

Разработчик из Южной Кореи, Sigrid Jin, увидел это в 4 утра и не стал ждать.

За одну ночь он переписал ключевые части проекта на Python и выложил форк под названием Claw Code.

Результат:
- 50 000 звёзд всего за 2 часа
- вирусное распространение по всему GitHub
- полноценный агентный стек, сохранённый в новой реализации

Сейчас он уже работает над версией на Rust.

История про то, как скорость и скилл иногда решают больше, чем команды и бюджеты

https://github.com/instructkr/claw-code

🐍 полезные ресурсы 🚀Max

@machinelearning_interview

Читать полностью…

Data Science by ODS.ai 🦜

❗️ GitHub Copilot будет обучаться на данных пользователей с 24 апреля 2026 по умолчанию

С 24 апреля GitHub Copilot по умолчанию начнет использовать данные пользователей тарифов Free, Pro и Pro+ для обучения своих ИИ-моделей. Нововведение не затрагивает корпоративных клиентов с подписками Business и Enterprise.

К собираемой информации относятся: «вводимая информация, получаемые результаты, фрагменты кода и сопутствующий контекст». Официальные представители подчеркивают, что не обучают модели на данных из закрытых репозиториев. При этом любой участок приватного кода, проанализированный плагином Copilot для генерации подсказок, классифицируется как пользовательское взаимодействие и забирается в обучающую выборку.

👆Аудитория портала Hacker News восприняла анонс крайне негативно, расценив его как нарушение приватности и злоупотребление доверием. Разработчики и IT-специалисты возмущены тем, что компания активирует передачу данных по умолчанию. Сообщество настаивает на том, что предоставление доступа к приватному коду должно происходить исключительно путем добровольного и явного согласия. Текущий подход воспринимается как попытка незаметно завладеть чужой интеллектуальной собственностью, рассчитывая на невнимательность людей.

Заявления сотрудников GitHub о том, что репозитории не используются целиком, не успокоили аудиторию. Пользователи сочли это объяснение лукавством и жонглированием словами. Copilot анализирует огромные массивы контекстного кода из приватного репозитория. Закрытый код неизбежно попадает в обучающую выборку в виде «контекста взаимодействия».

😎Чтобы отказаться от сбора данных, нужно перейти в раздел настройки конфиденциальности учетной записи (Privacy) и отключить опцию♋️Allow GitHub to use my data for AI model training.

@Russian_OSINT

Читать полностью…

Data Science by ODS.ai 🦜

Недавно крупная — пожалуй даже, возможно, крупнейшая — конференция по ИИ, NeurIPS — заблокировала доступ китайских исследователей. Официальная причина — не может взаимодействовать с находящимися под санкциями США, неофициальная — доминирование китайских участников.

Китайцы массово возмутились и раскачали ситуацию до выбивания извинений, но дальнейшие шаги гораздо показательнее.

Все китайские спонсоры, а их много и платили они прилично — свернули поддержку. Там Huawei, Tencent и так далее.

Китайские участники, которых приглашали вести там секции, массово отказались, чем загнали организаторов в ситуацию с масштабным переформатированием события.

CCF, Китайская компьютерная федерация, сказала участникам никак не взаимодействовать с NeurIPS и будет убирать организацию из учитываемых ачивок. Вы там участвовали — это теперь ни во что не засчитывается.

Китайская академия наук вообще зарубила всё что связано с NeurIPS; участие в review научных работ, публикации в связанных с конференцией журналах (!!!) и прочее теперь не будут учитываться для карьеры. Вы не сможете добавить в резюме свою деятельность и научные работы, если публикуетесь.

Лихо взялись, показательно.

Наши же, после такого же подхода (см. последний скриншот), продолжают пытаться подаваться. И никаких ограничений для структур американского научного события, которое стало из научного политическим, не вводят.

Читать полностью…

Data Science by ODS.ai 🦜

ДИСТИЛЛЯЦИЯ МОЗГОВ

В Кремниевой долине — великий плач нейро-куколдов: «Нас дистиллируют!». Китайские братушки и просто ушлые кодеры берут их жирные модели, в которые вбуханы миллиарды инвесторской нефти, и выжимают из них эссенцию в копеечный файл. Вор у вора дубинку украл: ребята годами пылесосили весь интернет, воруя наши книги, посты и фотки бывших под соусом «прогресса», а теперь искренне корчатся, когда их самих засунули в цифровой самогонный аппарат. Карма — штука алгоритмическая.

Для тех, кто в танке: дистилляция в AI — это когда ты не жжешь электричество целой страны на обучение сетки, а просто заставляешь маленькую модельку повторять ответы большой и тупой. Дешево, эффективно и без лишнего пафоса про «миссию человечества». Это просто краткий конспект чужого грабежа. Ну типа "дай шпоры списать".

А правда в том, что идет ДИСТИЛЛЯЦИЯ МОЗГОВ. Вот сам придумал термин — самому нравится. Но с этим процессом вы уже ничего не сделаете. Уж больно много ресурсов вбухано в глобальный самогонный аппарат!

Читать полностью…

Data Science by ODS.ai 🦜

Ездили с коллегами на неделю в AI-экспедицию в Китай. Были в нескольких компаниях. Презентации показать не могу, а про разницу корпоративных культур расскажу 😎

China Telecom. Государственная машина. Вход по паспортам. Доклад на трибуне. Параллельно-перпендикулярная дисциплина. Ощущение как будто на приёме в министерстве. При этом у них 160 AI-приложений внутри, собственная LLM на отечественных чипах Huawei и 40% кода пишется AI. Военная выправка + непрерывная трансформация. Уважаю 💪

Baidu. Расслабленные техногики. Презентации перевели на русский… но не дальше первой страницы. Наклеечки "посетитель" на одежду, на которые всем наплевать 😁 Хороший демо-стенд, свои чипы Kunlun, ERNIE 5.0. Атмосфера — университетская лаборатория, в которую случайно пустили серьезных дядек в пиджаках

Alibaba. Пожалуй, ближе всех к теме AI. Презы на русском. Кофе-брейк сделали (единственные!). Культура в меру формальная, в меру амбициозная. Единственные из всех показали реальные метрики с конкретными цифрами результатов внедрения AI. Не слайды «мы планируем», а «вот что получилось» 🔥

JD. Лучшая демо-зона. Единственные напоили горячим чаем ☕️ Транспарант на стене: Don’t forget the customers when making decision. Осведомлены о нас, интродакшн на русском, бейджи VIP на шею. В меру техногики, в меру enterprise

И вот что меня зацепило в JD больше всего. Они не аутсорсят людей. Все функции — внутренние. 50 000 AI-агентов создают сами сотрудники. Не можешь делать агентов — не получаешь повышение. 40% кода генерирует AI. R&D +66% год к году. При этом финальное решение — всегда за человеком. Это не «AI заменит людей». Это «AI усилит тех, кто готов учиться».

И ещё: когда мы спросили про безопасность агентов — не ответили, посчитав вопрос «щекотливым». Мол, мы всё решили, у нас всё безопасно 😏 Впрочем, у всех компаний уровень раскрытия по ИБ — примерно ноль: строгие требования от государства, есть команда, всё безопасно, точка. Знакомо, правда? 🤷

Больше всего мне понравилась культура в JD. Не потому что чай вкусный (хотя да). А потому что это редкая комбинация — технологическая амбиция + уважение к людям + культура, где каждый сотрудник создатель, а не исполнитель. Где agent literacy — это не модное слово, а карьерный KPI. В JD нет разговоров про «внедрение AI». Там AI — это просто то, как все работают 🤯

Читать полностью…

Data Science by ODS.ai 🦜

Это войдёт в историю: как основатель GitLab использовал ИИ в борьбе с раком

У Сида Сийбранди, основателя GitLab, диагностировали редкую форму рака. Стандартные протоколы лечения не давали результата, и в какой-то момент врачи сказали: больше ничего нельзя сделать.

Сид не принял это как приговор. Он собрал команду экспертов, погрузился в медицинскую литературу и начал самостоятельно разбираться в вариантах терапии. В этом процессе одним из главных инструментов стал ChatGPT.

Что именно делал ИИ в этой истории? Не ставил диагнозы и не назначал лечение - это по-прежнему задача врачей.

Но он помог в разы ускорить работу с огромным массивом научных данных: быстро находить релевантные исследования среди тысяч публикаций, структурировать медицинскую информацию о состоянии здоровья, формулировать правильные вопросы для специалистов и сравнивать разные подходы к лечению.

Сейчас рак Сида в ремиссии

@machinelearning_interview

Читать полностью…

Data Science by ODS.ai 🦜

А ваш как помогает?

📟📟📟📟

Читать полностью…

Data Science by ODS.ai 🦜

🔥 Huawei бьёт рекорды: новый ИИ-чип Ascend 950PR нашёл крупных клиентов в Китае

Китайские гиганты активно переходят на отечественные решения. По свежим данным, ByteDance и Alibaba получили образцы нового флагманского ИИ-чипа Huawei и планируют крупные заказы.

Речь идёт об Ascend 950PR — чипе, который используется в ускорителе Atlas 350. Он выдаёт впечатляющие 1,56 петафлопс в FP4-вычислениях и в два раза мощнее китайской версии Nvidia H20. При этом чип оптимизирован именно для этапа prefill в инференсе и рекомендательных систем, а также использует более дешёвое решение HBM, что делает его значительно выгоднее по цене.

Что известно о заказах:
• ByteDance и Alibaba уже протестировали образцы в январе.
• В 2026 году они ожидают поставки около 750 000 единиц Ascend 950PR.
• Массовое производство может стартовать уже к концу апреля, а объёмы существенно вырастут во второй половине года.

Это яркий сигнал: несмотря на санкции США, Huawei уверенно закрывает технологический разрыв и выигрывает доверие главных игроков китайского ИИ-рынка. Правительство КНР активно продвигает переход на domestic-чипы, и новый Ascend 950PR идеально вписывается в эту стратегию — мощный, совместимый с CUDA-экосистемой и при этом экономически привлекательный.

Huawei продолжает наращивать производство и развивать roadmap Ascend на ближайшие годы. Похоже, 2026-й станет переломным в борьбе за китайский рынок.

Оригинальная статья

#КитайскийИИ #Huawei #Ascend #ByteDance #Alibaba

Читать полностью…

Data Science by ODS.ai 🦜

Российский бизнес массово сворачивает ИТ-проекты по внедрению генеративного ИИ.
Статья на cnews сообщает, что из всех запущенных проектов с использованием ИИ живы остались только 10%.
Из причин респонденты называют - вндеряли не туда, внедряли для хайпа а не для пользы, внедряли без понимания, как это работает.
Мы как айтишники, все еще ждем серьезных подтверждений работающих решении ИИ, которые make a difference, а не просто чуть-чуть помогают. Пока успехи с реальными примерами наблюдаются не у бизнеса, а у багхантеров.
А в реальной жизни пока что советы ии (Пентагон подтвердил внедрение Palantir, и за 2025 отгрузил им $1,3 млрд.) приводят к военным преступлениям.

Читать полностью…

Data Science by ODS.ai 🦜

ARC-AGI-3 - бенчмарк,показал неприятную для всей индустрии вещь: даже топовые frontier-модели сейчас набирают меньше 1%.

Лучшие результаты на старте такие:

- Gemini 3.1 Pro Preview - 0.37%
- GPT-5.4 High - 0.26%
- Opus 4.6 Max - 0.25%

И это, пожалуй, главный вывод.

ARC-AGI-3 - это уже не набор статичных головоломок, как в прошлых версиях ARC. Теперь это интерактивные игровые миры, где агенту нужно самому разбираться, что вообще происходит.

Что именно проверяет новый тест:

- исследование незнакомой среды с нуля
- поиск целей и правил без текстовых инструкций
- построение своей модели мира по ходу задачи
- длинное планирование на много шагов вперёд
- обучение на опыте, а не по шаблону
- пересмотр гипотез, если первые догадки оказались неверными

То есть здесь уже мало просто "хорошо рассуждать в чате".

Нужно адаптироваться в реальном времени, помнить прошлые действия, извлекать сигналы из слабой обратной связи и не скатываться в перебор.

Внутри ARC-AGI-3:
- 150+ новых интерактивных окружений
- почти 1 000 уровней
- replay-сессии, где можно смотреть весь таймлайн решений агента

Скоринг считает не только факт решения, а то, насколько эффективно модель осваивает навык по сравнению с человеком.

Именно поэтому результаты выглядят настолько жёстко.

По сути, ARC Prize говорит прямо:
пока между человеком и ИИ есть такой разрыв в освоении новых задач, говорить о настоящем AGI рано.

И это, возможно, один из самых честных тестов за последнее время.

Не потому что модели "слабые".
А потому что реальная универсальная адаптация всё ещё не решена.

https://arcprize.org/

🐍 полезные ресурсы 🚀Max

@data_analysis_ml

Читать полностью…
Subscribe to a channel