2602
Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
ShinkaEvolve от Sakana AI — прорыв в эволюционной оптимизации алгоритмов
Японская Sakana AI научила языковые модели проводить эволюцию алгоритмов на порядки быстрее традиционных методов.
Существующие решения типа AlphaEvolve требуют тысячи итераций для поиска решений.
ShinkaEvolve справляется за 150 попыток.
Система автоматически мутирует код, оценивает производительность и отбирает лучшие варианты.
Архитектурные инновации:
- Балансировка exploration/exploitation — умное сэмплирование "родителей" программ
- Novelty-Based Rejection Sampling — отбраковка минорных вариаций через LLM-судью новизны
- Adaptive LLM Prioritization — bandit-стратегия динамического выбора оптимальной модели из ансамбля
- Open source (Apache 2.0)
- Есть WebUI для визуализации процесса эволюции
- GitHub: github.com/SakanaAI/ShinkaEvolve
- Работает с любыми LLM-провайдерами
Когда компьют станет избыточным, - можно будет подключить к каждой модели как инструмент размышлений.
Там где сейчас REPL, например.
#ShinkaEvolve #Sakana
———
@tsingular
TrendMicro: обзор уязвимостей LLM моделей
Trend Micro выпустила обзор основных уязвимостей больших языковых моделей.
Исследователи выделили три ключевые поверхности атак: прямое внедрение промптов, бэкдоры через RAG и эксплуатацию доверия между агентами.
Особенно уязвимы мультиагентные системы - они создают новые векторы атак в дополнение к традиционным уязвимостям.
Недавно обнаружили CVE-2024-7475 с оценкой 9.1 по шкале CVSS в проекте LocalAI, позволяющую выполнять произвольный код.
Атаки на уровне GPU могут снизить точность модели с 80% до 0.1% - "катастрофическое повреждение мозга".
Изучаем внимательно.
#TrendMicro #cybersecurity #LocalAI
———
@tsingular
Skild AI показали адаптивную систему управления роботами.
Роботы проходят тесты на адаптацию к повреждениям: теряют ноги, колени, но продолжают двигаться.
Skild таким образом создали универсальный адаптивный ИИ — один «мозг» управляет разными роботами без предварительного обучения.
Роботы адаптируются к новым конечностям (например, деревянным) и внешним силам (нагрузка, толчки).
Работают с нештатными ситуациями — например, застрявшими колёсами или сломанными суставами.
ИИ при этом демонстрирует эмерджентное поведение — самообучается в реальном времени, не зная заранее, как устроен робот.
Тесты подчеркивают устойчивость и гибкость системы — роботы восстанавливают функциональность даже после серьезных повреждений.
#SkildAI #роботы
———
@tsingular
OpenAI и SAP запускают суверенный ИИ для Германии
SAP, OpenAI и Microsoft создают суверенную версию ChatGPT для немецкого госсектора.
Инфраструктура развернется на базе Delos Cloud от SAP с 4000 GPU к 2026 году.
Все данные останутся в Германии под местным законодательством - полное соответствие GDPR и суверенитет.
SAP инвестирует €20 млрд в цифровую независимость Германии.
4000 GPU, - выглядит не серьёзно при том, что Альтман уже начал обсуждать 250 гигават на ИИ в рамках Старгейта, - а это сотни миллионов GPU получается по грубым прикидкам.
Ну и суверенный ИИ на американской технологии - звучит как "независимая зависимость".
#SAP #OpenAI #Германия
———
@tsingular
Яндекс запустил платформу для создания агентов на базе AI studio.
end-to-end среда с выбором моделей, ролей-промптов, поиском по файлам (локально или из хранилища знаний), очень похожая внешне на OpenwebUI, но в облаке.
Можно подключить поиск в интернете, создавать или подключать MCP сервера.
Есть свой MCP-hub ( уже завели Контур и AmoCRM)
Есть no-code среда workflows для создания готовых процессов для работы агентов в сложных сценариях.
#Яндекс #агенты #MCP
——-
@tsingular
🔥 Qwen3-VL-235B: новый флагман vision-language моделей от Alibaba
Ни дня без новостей про Qwen
Alibaba выпустила Qwen3-VL-235B-A22B-Instruct — самую мощную мультимодальную модель в линейке.
Ключевые прорывы:
Visual Agent — модель теперь умеет управлять компьютером: распознаёт элементы интерфейса, понимает их функции, запускает инструменты. По сути, получили ИИ-ассистента, который может работать с любым GUI.
Visual Coding — генерирует код (HTML/CSS/JS) и диаграммы Draw.io прямо из скриншотов и видео. Показал макет — получил рабочую вёрстку.
Контекст 256K-1M токенов — может анализировать целые книги или многочасовые видео с точностью до секунды. Плюс полнофункциональный поиск по временным меткам.
Техническая начинка:
Interleaved-MRoPE — позиционные embeddings для видео по времени, ширине и высоте одновременно
Т.е. может по записи спортивного матча точно сказать на какой секунде мяч пересёк линию ворот.
DeepStack — слияние multi-level ViT features для детального понимания изображений
OCR для 32 языков (было 19) с устойчивостью к размытию и наклону
Text-Timestamp Alignment — точная привязка событий к временным меткам
Результаты бенчмарков:
Qwen3-VL лидирует в большинстве визуальных задач, включая OCR, spatial reasoning и video understanding. В текстовых задачах успешно конкурирует с Claude-4 Opus.
Модель доступна через HuggingFace Transformers или на сайте qwen.
Требует достаточно много ресурсов (235B параметров).
Сожрёт M3 Ultra 512Gb целиком.
Так что ждём пока её Unsloth нарежет хотя бы до 128гигов.
а пока пробуем тут: chat.qwen.ai
слева сверху выбираем Qwen3-VL
Или качаем на HuggingFace
GitHub
#Qwen3VL #Qwen #Alibaba #Китай
———
@tsingular
Agibot2
Что интересно, - у них есть opensource проект.
#роботы #Китай #Agibot
———
@tsingular
NVIDIA инвестирует $100 млрд в инфраструктуру OpenAI
Инвестиция до $100 миллиардов позволит построить дата-центры мощностью 10 гигаватт - эквивалент 4-5 миллионов GPU.
Датацентр площадью до 2.8 кв км обеспечит работой 14 тысяч строителей.
Начало стройки запланировано на 2026 год.
В основе датацентра будут чипы нового поколения Vera Rubin.
После анонса акции NVIDIA выросли на 3,9%.
Уроборос прирастает.
#NVIDIA #OpenAI
———
@tsingular
Огромная честь получить награду от сообщества читателей канала из клуба 4CIO.
Спасибо всем.
Без вас не было бы ни канала ни хрустального ежа.
#4CIO #хрустальныйёж #pv2025
------
@tsingular
Формула стартапа теперь включает не людей, а агентов.
#агенты #стартапы #techfounders
------
@tsingular
Мы тут вчера вечером на Подмосковных дошли до обсуждения регуляторики для ИИ.
И несмотря на то, что собрались ИИ практики и ИТ директора, - не смогли договориться о том, а как вообще можно создать законодательство для ИИ вообще в принципе.
Ну т.е. с моей точки зрения, - это невозможно и бессмысленно.
Сама суть наказания для цифрового алгоритма это больше как игра людей в наказание, а не то, что могло бы заставить ИИ страдать (зачем?)
Т.е. единственный, кто может нести ответственность по закону, - человек, поставивший задачу или написавший алгоритм.
И пока это не изменится, - ни о какой свободе воли у ИИ можно даже не заикаться. Все это будет лишь симуляция.
В том числе это касается и цифровых министров по примеру Албании.
А вы как считаете? Напишите в комментах, добавим к обсуждению на сессиях.
#мысли
———
@tsingular
Едем загружать мозги на Подмосковных Вечерах 2025
https://pv2025.4cio.ru/
Увидимся! :)
#pv2025 #mind #upload
———
@tsingular
Новые паттерны для создания GenAI-продуктов
Один из уважаемых мной старых дедов классической разработки программного обеспечения — Мартин Фаулер (автор книг "Рефакторинг", "Шаблоны корпоративных приложений", а еще соавтор Аджайл Манифеста и популяризатор кучи правильных вещей, за что ему низкий поклон), написал большую работу, где структурировал базовые новые паттерны разработки приложений на основе генеративного искусственного интеллекта
Читаю его труд и кайфую, как он приятно и наглядно излагает свои мысли. Очень советую всем, кто только начинает с разбираться с созданием приложений на GenAI:
1) Direct Prompting, как базовый слой приложения
2) Зачем нужен этап Evaluation
3) Что такое Embedding'и
4) RAG на дефолнтом векторном поиске
5) Hybrid Retriever для дополнения векторного поиском по подстроке
6) Query Rewriting для улучшения запросов от человека
7) Reranking для отсечения мусора в результатах поиска
8) Guardrails для безопасности — валидация инпута, верификация аутпута
9) Fine Tuning, для крайних случаев, когда остальные не дают роста eval-метрик
А еще, как же он прав:
LLM — это такой джун-исследователь: начитан, умеет красиво излагать, но в деталях плавает, а самоуверенности хоть отбавляй — вместо «не знаю» предпочитает с умным видом выдумать что-то правдоподобное. RAG в этой картине — это когда мы задаём этому джуну вопрос и при этом подсовываем ему папку с нужными документами, строго намекая: «Прочитай это, прежде чем снова начать фантазировать».
памятка по замещениям профессий.
может кому полезно будет в презентацию
Код в комментарии
#timeline #forecast #futurology
———
@tsingular
Никто не ждал, но встречайте Notion 3.0 — теперь максимально накачанный ИИ-агентами ☕️
Все, что вы можете сделать в Notion, может сделать ваш агент (на десятках страниц одновременно)
Microsoft добавляет Anthropic Claude в Copilot
Майкрософт снижает зависимость от OpenAI и интегрирует модели Claude от Anthropic в свой Copilot.
Теперь в одном Copilot можно получить ответы от разных ИИ. OpenAI наверно не в восторге от такого «партнёрства» :)
По опыту Соннет отвечает лучше и, видимо, пользователи "продавили" добавление, по-сути, конкурентной модели.
#Microsoft #Copilot #Anthropic
———
@tsingular
🚀 Qwen3-Max: эффект масштаба
Alibaba выпустили Qwen3-Max — самую крупную модель в их линейке, которая уже заняла 3-е место в Text Arena, обогнав GPT-5-Chat.
Технические характеристики:
- 1+ триллион параметров с предобучением на 36 триллионах токенов
- MoE архитектура без единого скачка loss'а во время обучения — стабильность уровня "мечта ML-инженера"
- 30% прирост MFU по сравнению с предыдущей версией благодаря PAI-FlashMoE
- Контекст 1М токенов с ChunkFlow стратегией
Результаты:
- SWE-Bench Verified: 69.6 баллов — решение реальных багов на уровне SOTA
- Tau2-Bench: 74.8 баллов — превзошли Claude Opus 4 и DeepSeek V3.1 в агентских задачах
- Qwen3-Max-Thinking — в разработке:
но уже показывает 100% на AIME 25 и HMMT — математических бенчмарках, где обычно модели "ломаются".
Секрет в параллельных вычислениях и интеграции с кодовым интерпретатором. (читеры :) )
Особенно интересно наблюдать, как китайские команды методично отстреливают западные модели по всем фронтам.
И графика с Wan 2.5 и opensource, Qwen3-Omni, Qwen3-VL, теперь вот Max.
Пробуем тут: https://chat.qwen.ai/
#Qwen #Alibaba #Qwen3 #Китай
———
@tsingular
ИИ модели используют материалы из отозванных научных статей
Исследователи из MIT обнаружили, что большие языковые модели активно цитируют и воспроизводят содержимое научных публикаций, которые позже были отозваны из-за ошибок или мошенничества.
Проблема серьёзная: 67,4% отзывов связаны с научным мошенничеством, а в 2023 году отозвали свыше 10 000 работ.
Модели не различают достоверные данные от сомнительных. Они просто заучивают всё подряд из тренировочных датасетов.
Крупные издательства вроде Taylor & Francis и Wiley заключают многомиллионные соглашения на использование контента для обучения ИИ, но механизмов отслеживания отозванных материалов нет.
Технически отфильтровать такой контент крайне сложно - нужно постоянно обновлять чёрные списки и переобучать модели.
Получается ИИ не только галлюцинирует, но ещё и цитирует лженауку.
Хавает что попало, а люди верят и пишут новые научные статьи. :)
#Retractions #Training #Data
------
@tsingular
MCP-сервер Битрикс24 скоро станет публичным 🔥🔥🔥
Мы развернем МСP-сервер (Model Context Protocol), который будет маршрутизировать работу ИИ-помощников. Это позволит ИИ-агентам подключаться к внешним системам и ресурсам.
Yandex запустил AI WAF на базе SolidWall WAF и SmartWeb Security
https://yandex.cloud/ru/services/smartwebsecurity
Эфир смотрим тут
https://scale.yandex.cloud/?utm_source=notify_sms&utm_campaign=event_mixed_15
#Яндекс #MLWAF #cybersecurity
———
@tsingular
Программирование в 2025-м году be like
#юмор
———
@tsingular
🚀 Qwen3-Omni-30B: Нативная омни-модальная модель от Alibaba
Алибаба продолжает рвать шаблоны, - впервые end-to-end обработка текста, изображений, аудио и видео.
Архитектура MoE Thinker-Talker:
- Thinker — модуль рассуждений с chain-of-thought
- Talker — генерация естественной речи в реальном времени.
Мультимодальные возможности:
119 текстовых языков
19 языков для голосового ввода (включая русский)
10 языков речевого вывода (тоже с русским)
Обработка видео до 120 секунд
Поддержка смешанного контента (аудио/видео/текст)
Эффективность:
- SOTA на 22 из 36 аудио/видео бенчмарков
- Сравнимо с Gemini 2.5 Pro в понимании речи
- Без деградации текстовых и визуальных возможностей
Qwen3-Omni-30B-A3B-Instruct — полная версия с аудио выходом
Qwen3-Omni-30B-A3B-Thinking — только рассуждения, текстовый вывод
Qwen3-Omni-30B-A3B-Captioner — специализация на детальном описании аудио
Требования к железу:
- 78-144 GB GPU память (BF16, зависит от длины видео)
- Поддержка vLLM и Transformers
- FlashAttention 2 для оптимизации
Особенность: модель понимает связь между аудио и видео — то есть соотносит то, что происходит на экране с тем, что звучит.
Apache 2.0 лицензия.
Карточка модели: huggingface.co.
#Qwen #Qwen3 #Omni #AliBaba
———
@tsingular
Тут роботы ещё немного натренировались.
Читать полностью…
🚀 Хотите ускорить обучение в PyTorch в несколько раз?
У DataLoader есть два плохих дефолта, которые тормозят процесс.
Исправив их, я получил почти 5x ускорение.
❌ Проблема
- .to(device) переносит данные на GPU.
- Пока GPU считает - CPU ничего не делает.
- Пока CPU готовит данные — GPU простаивает.
⚡ Решение
Нужно заставить CPU и GPU работать параллельно:
- В DataLoader укажи pin_memory=True
- При переносе данных используй .to(device, non_blocking=True)
- Добавь num_workers в DataLoader для фоновой загрузки.
✅ В итоге CPU готовит следующий батч, пока GPU занят текущим.
Так исчезают простои, и обучение идёт заметно быстрее.
Приехал на TechFounders.
Рассказывают про ИИ агентов для стартапов.
Внимательно слушаю :)
Все стратапы теперь будут с ИИ.
Без вариантов :)
#techfounders #доклады
------
@tsingular
🏆 Gemini 2.5 берёт золото на соревнованиях программистов в Азербайджане
Google DeepMind заявили о "историческом прорыве": их Gemini 2.5 стал первым ИИ, выигравшим золотую медаль на международном конкурсе программирования (ICPC).
Что произошло:
- за 30 минут решил задачу с бесконечным числом возможностей (распределение жидкости через сеть каналов)
- лучшие программисты из России, Китая, Японии — не справились
- 2 место из 139 сильнейших команд мира
- Провалил только 2 из 12 задач
Техническая начинка:
- Специально тренированная версия для сложных задач кодинга/математики
- Глубокое абстрактное мышление + креативность
- Синтез новых решений для неизвестных проблем
- производительность на уровне топ-20 кодеров мира
Событие по масштабу сопоставимо с победой Deep Blue в шахматах в 1997 или AlphaGo в Го в 2016.
Только теперь ИИ решает реальные задачи, а не только игровые комбинации.
Правда, Google пишет, что модель не только специально обучена, но и явно мощнее Про версии за $250/месяц, которая доступна обычным пользователям.
#Gemini #ICPC #AGI #Google
———
@tsingular
Wan2.2-Animate-14B — нейросеть, которая превратит вас в персонажа мультфильма.
Закидываете свое видео и фотку персонажа, а на выходе получаете анимированный ролик, в котором мультяшный герой повторяет ваши движения.
Самое крутое: модель сразу выпустили в опенсорс.
⤷ Ознакомиться на сайте
CodeLearning
🧬🤖 Paper2Agent: оживляем научные статьи
Open-source инструмент от исследователей из Stanford, который превращает статические статьи в интерактивных AI-ассистентов.
📌 Как это работает:
- Paper2MCP анализирует статью и её код( если есть), извлекает ключевые методы и превращает их в инструменты внутри MCP-сервера.
- Agent layer подключает этот сервер к чат-агенту (например, Claude Code или Chatgpt).
Поле чего, у каждой статьи появляется свой ИИ-ассистент, который:
- объясняет папиру на простом языке;
- запускает код без ручного копания в репозиториях, зависимостях и API-ключах;
- объединяет данные и пайплайны из разных работ.
Каждый MCP-сервер включает:
- Tools — функции (например, прогноз изменения экспрессии генов).
- Resources — текст, код, датасеты.
- Prompts — шаблоны для пошаговых сценариев.
Фактически Paper2Agent помогает конвертировать научные работы в полноценные рабочие инструменты.
Чтобы повторить методы их статьи, приходилось вручную ставить окружения, импортировать десятки модулей и гадать с входными данными. Paper2Agent позволяет это сделать через диалоговый интерфейс.
🟠Github
@ai_machinelearning_big_data
#ai #ml #aiagent
🤖 Обстановка в московском Зарядье, где в рамках форума о будущем городов БРИКС «Облачные города» прошёл парад роботов
Читать полностью…
В DeepMind с помощью ИИ нашли новые решения фундаментальных уравнений гидродинамики. Ученые бьются над ними уже веками.
Помните, мы писали о том, что Google с помощью ИИ намеревается решить одну из математических проблем тысячелетия? Кажется, у них там наметились первые подвижки.
Они совместно с учёными из Brown University, NYU и Стэнфорда разработали метод, с помощью которого обнаружили новое семейство сингулярностей в классических уравнениям гидродинамики.
Сингулярности – это такие решения системы, где физические величины (скорость, давление и др.) могут становиться бесконечными или не определёнными. В физическом мире это похоже на формирование идеального вихря, в котором энергия концентрируется в бесконечно малой области. Математически в таких ситуациях предсказания уравнений теряют смысл.
Так вот никто до сих пор точно не знает, могут ли такие сингулярности возникать в реальности. Найти сингулярность невероятно сложно, даже суперкомпьютеры не справляются с таким объемом вычислений. Собственно, задача тысячелетия – это либо доказать, что в уравнении Навье-Стокса существует хотя бы одна устойчивая сингулярность, либо доказать, что таких нет.
Google удалось с помощью ИИ на шажок приблизиться к решению. Они нашли новое семейство сингулярностей для класса уравнений, похожих на Навье-Стокса. Более того, они выявили общий паттерн того, как растет нестабильность таких решений. Раньше никаких аналитических соображений в этом направлении не существовало.
Архитектура: гибридный метод на основе PINN (Physics-Informed Neural Networks). Это прямо очень интересно. Смотрите:
В лосс сети зашиваются непосредственно уравнения в частных производных. То есть модель, по сути, учится соблюдать физику – законы сохранения массы, энергии и импульса.
И на основе этих знаний ее задача затем – найди начальные условия, приводящие к сингулярности. PINN генерирует кандидатов → симулятор проверяет → сеть корректирует параметры. Много-много таких циклов спустя и нашлись несколько сингулярностей.
И да, пока это не решает основную задачу. Но (1) теперь есть зачатки какого-то решения, и это поразительно; (2) Google опубликовали начальные условия, так что теперь с ними могут продолжить работать математики и физики всего мира.