tsingular | Unsorted

Telegram-канал tsingular - Технозаметки Малышева

2602

Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb

Subscribe to a channel

Технозаметки Малышева

ShinkaEvolve от Sakana AI — прорыв в эволюционной оптимизации алгоритмов

Японская Sakana AI научила языковые модели проводить эволюцию алгоритмов на порядки быстрее традиционных методов.

Существующие решения типа AlphaEvolve требуют тысячи итераций для поиска решений.
ShinkaEvolve справляется за 150 попыток.

Система автоматически мутирует код, оценивает производительность и отбирает лучшие варианты.

Архитектурные инновации:
- Балансировка exploration/exploitation — умное сэмплирование "родителей" программ
- Novelty-Based Rejection Sampling — отбраковка минорных вариаций через LLM-судью новизны
- Adaptive LLM Prioritization — bandit-стратегия динамического выбора оптимальной модели из ансамбля

- Open source (Apache 2.0)
- Есть WebUI для визуализации процесса эволюции
- GitHub: github.com/SakanaAI/ShinkaEvolve
- Работает с любыми LLM-провайдерами

Когда компьют станет избыточным, - можно будет подключить к каждой модели как инструмент размышлений.
Там где сейчас REPL, например.

#ShinkaEvolve #Sakana
———
@tsingular

Читать полностью…

Технозаметки Малышева

TrendMicro: обзор уязвимостей LLM моделей

Trend Micro выпустила обзор основных уязвимостей больших языковых моделей.

Исследователи выделили три ключевые поверхности атак: прямое внедрение промптов, бэкдоры через RAG и эксплуатацию доверия между агентами.

Особенно уязвимы мультиагентные системы - они создают новые векторы атак в дополнение к традиционным уязвимостям.

Недавно обнаружили CVE-2024-7475 с оценкой 9.1 по шкале CVSS в проекте LocalAI, позволяющую выполнять произвольный код.

Атаки на уровне GPU могут снизить точность модели с 80% до 0.1% - "катастрофическое повреждение мозга".

Изучаем внимательно.

#TrendMicro #cybersecurity #LocalAI
———
@tsingular

Читать полностью…

Технозаметки Малышева

Skild AI показали адаптивную систему управления роботами.

Роботы проходят тесты на адаптацию к повреждениям: теряют ноги, колени, но продолжают двигаться.

Skild таким образом создали универсальный адаптивный ИИ — один «мозг» управляет разными роботами без предварительного обучения.

Роботы адаптируются к новым конечностям (например, деревянным) и внешним силам (нагрузка, толчки).

Работают с нештатными ситуациями — например, застрявшими колёсами или сломанными суставами.

ИИ при этом демонстрирует эмерджентное поведение — самообучается в реальном времени, не зная заранее, как устроен робот.

Тесты подчеркивают устойчивость и гибкость системы — роботы восстанавливают функциональность даже после серьезных повреждений.

#SkildAI #роботы
———
@tsingular

Читать полностью…

Технозаметки Малышева

OpenAI и SAP запускают суверенный ИИ для Германии

SAP, OpenAI и Microsoft создают суверенную версию ChatGPT для немецкого госсектора.

Инфраструктура развернется на базе Delos Cloud от SAP с 4000 GPU к 2026 году.

Все данные останутся в Германии под местным законодательством - полное соответствие GDPR и суверенитет.

SAP инвестирует €20 млрд в цифровую независимость Германии.

4000 GPU, - выглядит не серьёзно при том, что Альтман уже начал обсуждать 250 гигават на ИИ в рамках Старгейта, - а это сотни миллионов GPU получается по грубым прикидкам.

Ну и суверенный ИИ на американской технологии - звучит как "независимая зависимость".

#SAP #OpenAI #Германия
———
@tsingular

Читать полностью…

Технозаметки Малышева

Яндекс запустил платформу для создания агентов на базе AI studio.

end-to-end среда с выбором моделей, ролей-промптов, поиском по файлам (локально или из хранилища знаний), очень похожая внешне на OpenwebUI, но в облаке.

Можно подключить поиск в интернете, создавать или подключать MCP сервера.

Есть свой MCP-hub ( уже завели Контур и AmoCRM)

Есть no-code среда workflows для создания готовых процессов для работы агентов в сложных сценариях.

#Яндекс #агенты #MCP
——-
@tsingular

Читать полностью…

Технозаметки Малышева

🔥 Qwen3-VL-235B: новый флагман vision-language моделей от Alibaba

Ни дня без новостей про Qwen

Alibaba выпустила Qwen3-VL-235B-A22B-Instruct — самую мощную мультимодальную модель в линейке.

Ключевые прорывы:
Visual Agent
— модель теперь умеет управлять компьютером: распознаёт элементы интерфейса, понимает их функции, запускает инструменты. По сути, получили ИИ-ассистента, который может работать с любым GUI.

Visual Coding — генерирует код (HTML/CSS/JS) и диаграммы Draw.io прямо из скриншотов и видео. Показал макет — получил рабочую вёрстку.

Контекст 256K-1M токенов — может анализировать целые книги или многочасовые видео с точностью до секунды. Плюс полнофункциональный поиск по временным меткам.

Техническая начинка:
Interleaved-MRoPE — позиционные embeddings для видео по времени, ширине и высоте одновременно
Т.е. может по записи спортивного матча точно сказать на какой секунде мяч пересёк линию ворот.

DeepStack — слияние multi-level ViT features для детального понимания изображений

OCR для 32 языков (было 19) с устойчивостью к размытию и наклону

Text-Timestamp Alignment — точная привязка событий к временным меткам

Результаты бенчмарков:
Qwen3-VL лидирует в большинстве визуальных задач, включая OCR, spatial reasoning и video understanding. В текстовых задачах успешно конкурирует с Claude-4 Opus.

Модель доступна через HuggingFace Transformers или на сайте qwen.
Требует достаточно много ресурсов (235B параметров).
Сожрёт M3 Ultra 512Gb целиком.
Так что ждём пока её Unsloth нарежет хотя бы до 128гигов.

а пока пробуем тут: chat.qwen.ai
слева сверху выбираем Qwen3-VL
Или качаем на HuggingFace
GitHub

#Qwen3VL #Qwen #Alibaba #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

Agibot2

Что интересно, - у них есть opensource проект.

#роботы #Китай #Agibot
———
@tsingular

Читать полностью…

Технозаметки Малышева

NVIDIA инвестирует $100 млрд в инфраструктуру OpenAI

Инвестиция до $100 миллиардов позволит построить дата-центры мощностью 10 гигаватт - эквивалент 4-5 миллионов GPU.

Датацентр площадью до 2.8 кв км обеспечит работой 14 тысяч строителей.
Начало стройки запланировано на 2026 год.
В основе датацентра будут чипы нового поколения Vera Rubin.

После анонса акции NVIDIA выросли на 3,9%.

Уроборос прирастает.

#NVIDIA #OpenAI
———
@tsingular

Читать полностью…

Технозаметки Малышева

Огромная честь получить награду от сообщества читателей канала из клуба 4CIO.

Спасибо всем.
Без вас не было бы ни канала ни хрустального ежа.

#4CIO #хрустальныйёж #pv2025
------
@tsingular

Читать полностью…

Технозаметки Малышева

Формула стартапа теперь включает не людей, а агентов.

#агенты #стартапы #techfounders
------
@tsingular

Читать полностью…

Технозаметки Малышева

Мы тут вчера вечером на Подмосковных дошли до обсуждения регуляторики для ИИ.

И несмотря на то, что собрались ИИ практики и ИТ директора, - не смогли договориться о том, а как вообще можно создать законодательство для ИИ вообще в принципе.

Ну т.е. с моей точки зрения, - это невозможно и бессмысленно.

Сама суть наказания для цифрового алгоритма это больше как игра людей в наказание, а не то, что могло бы заставить ИИ страдать (зачем?)

Т.е. единственный, кто может нести ответственность по закону, - человек, поставивший задачу или написавший алгоритм.

И пока это не изменится, - ни о какой свободе воли у ИИ можно даже не заикаться. Все это будет лишь симуляция.

В том числе это касается и цифровых министров по примеру Албании.

А вы как считаете? Напишите в комментах, добавим к обсуждению на сессиях.

#мысли
———
@tsingular

Читать полностью…

Технозаметки Малышева

Едем загружать мозги на Подмосковных Вечерах 2025

https://pv2025.4cio.ru/

Увидимся! :)

#pv2025 #mind #upload
———
@tsingular

Читать полностью…

Технозаметки Малышева

Новые паттерны для создания GenAI-продуктов

Один из уважаемых мной старых дедов классической разработки программного обеспечения — Мартин Фаулер (автор книг "Рефакторинг", "Шаблоны корпоративных приложений", а еще соавтор Аджайл Манифеста и популяризатор кучи правильных вещей, за что ему низкий поклон), написал большую работу, где структурировал базовые новые паттерны разработки приложений на основе генеративного искусственного интеллекта

Читаю его труд и кайфую, как он приятно и наглядно излагает свои мысли. Очень советую всем, кто только начинает с разбираться с созданием приложений на GenAI:
1) Direct Prompting, как базовый слой приложения
2) Зачем нужен этап Evaluation
3) Что такое Embedding
4) RAG на дефолнтом векторном поиске
5) Hybrid Retriever для дополнения векторного поиском по подстроке
6) Query Rewriting для улучшения запросов от человека
7) Reranking для отсечения мусора в результатах поиска
8) Guardrails для безопасности — валидация инпута, верификация аутпута
9) Fine Tuning, для крайних случаев, когда остальные не дают роста eval-метрик

А еще, как же он прав:

LLM — это такой джун-исследователь: начитан, умеет красиво излагать, но в деталях плавает, а самоуверенности хоть отбавляй — вместо «не знаю» предпочитает с умным видом выдумать что-то правдоподобное. RAG в этой картине — это когда мы задаём этому джуну вопрос и при этом подсовываем ему папку с нужными документами, строго намекая: «Прочитай это, прежде чем снова начать фантазировать».


https://martinfowler.com/articles/gen-ai-patterns/

П.С. А дальше, поверх этих паттернов нужно делать когнитивную архитектуру, с планировщиками, постановщиками задач, сервисами вызова тулинга и рефлексией, но это — уже другая история)

Читать полностью…

Технозаметки Малышева

памятка по замещениям профессий.
может кому полезно будет в презентацию

Код в комментарии

#timeline #forecast #futurology
———
@tsingular

Читать полностью…

Технозаметки Малышева

Никто не ждал, но встречайте Notion 3.0 — теперь максимально накачанный ИИ-агентами ☕️

Все, что вы можете сделать в Notion, может сделать ваш агент (на десятках страниц одновременно)


Звучит как фантастика: теперь ИИ не просто пишет тексты, а создаёт целые базы данных, сам генерит формулы и прочее.

Докрутили поддержку MCP серверов: если вы пишете код в Cursor, ИИ автоматом обновляет документацию, а ещё можно через чат в Cursor заставлять агента отмечать в Notion выполненные задачи.

Круто! 😊

Читать полностью…

Технозаметки Малышева

Microsoft добавляет Anthropic Claude в Copilot

Майкрософт снижает зависимость от OpenAI и интегрирует модели Claude от Anthropic в свой Copilot.

Теперь в одном Copilot можно получить ответы от разных ИИ. OpenAI наверно не в восторге от такого «партнёрства» :)

По опыту Соннет отвечает лучше и, видимо, пользователи "продавили" добавление, по-сути, конкурентной модели.

#Microsoft #Copilot #Anthropic
———
@tsingular

Читать полностью…

Технозаметки Малышева

🚀 Qwen3-Max: эффект масштаба

Alibaba выпустили Qwen3-Max — самую крупную модель в их линейке, которая уже заняла 3-е место в Text Arena, обогнав GPT-5-Chat.

Технические характеристики:
- 1+ триллион параметров с предобучением на 36 триллионах токенов
- MoE архитектура без единого скачка loss'а во время обучения — стабильность уровня "мечта ML-инженера"
- 30% прирост MFU по сравнению с предыдущей версией благодаря PAI-FlashMoE
- Контекст 1М токенов с ChunkFlow стратегией

Результаты:
- SWE-Bench Verified: 69.6 баллов — решение реальных багов на уровне SOTA
- Tau2-Bench: 74.8 баллов — превзошли Claude Opus 4 и DeepSeek V3.1 в агентских задачах
- Qwen3-Max-Thinking — в разработке:
но уже показывает 100% на AIME 25 и HMMT — математических бенчмарках, где обычно модели "ломаются".
Секрет в параллельных вычислениях и интеграции с кодовым интерпретатором. (читеры :) )

Особенно интересно наблюдать, как китайские команды методично отстреливают западные модели по всем фронтам.
И графика с Wan 2.5 и opensource, Qwen3-Omni, Qwen3-VL, теперь вот Max.

Пробуем тут: https://chat.qwen.ai/

#Qwen #Alibaba #Qwen3 #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

ИИ модели используют материалы из отозванных научных статей

Исследователи из MIT обнаружили, что большие языковые модели активно цитируют и воспроизводят содержимое научных публикаций, которые позже были отозваны из-за ошибок или мошенничества.

Проблема серьёзная: 67,4% отзывов связаны с научным мошенничеством, а в 2023 году отозвали свыше 10 000 работ.

Модели не различают достоверные данные от сомнительных. Они просто заучивают всё подряд из тренировочных датасетов.

Крупные издательства вроде Taylor & Francis и Wiley заключают многомиллионные соглашения на использование контента для обучения ИИ, но механизмов отслеживания отозванных материалов нет.

Технически отфильтровать такой контент крайне сложно - нужно постоянно обновлять чёрные списки и переобучать модели.

Получается ИИ не только галлюцинирует, но ещё и цитирует лженауку.

Хавает что попало, а люди верят и пишут новые научные статьи. :)

#Retractions #Training #Data
------
@tsingular

Читать полностью…

Технозаметки Малышева

MCP-сервер Битрикс24 скоро станет публичным 🔥🔥🔥

Мы развернем МСP-сервер (Model Context Protocol), который будет маршрутизировать работу ИИ-помощников. Это позволит ИИ-агентам подключаться к внешним системам и ресурсам.


🗣Сценарии, которые будут доступны пользователям:

✔ Работа с Битрикс24 из сторонних инструментов.
Например, если необходимо получить данные из сервиса, внести событие в календарь или загрузить файлы. Решение позволит нетехничесому персоналу самостоятельно управлять пользовательскими данными в «Битрикс24».

✔ Работа со сторонними сервисами в Битрикс24. Например, получить доступ к файлам Google, почтовому ящику, таск-трекеру или другим инструментам, чтобы обогатить информацию внутри Битрикс24.

✔ Работа внутри Битрикс24 через MCP-сервер. Решение позволит с помощью встроенного ИИ-ассистента «Марты AI» в формате чата работать с инструментами, автоматизировать процессы, составлять отчеты, анализировать нагрузку отделов внутри Битрикс24.
________
🚀 Кстати, создали новый канал, где будем рассказывать все-все про MCP, зачем он нужен и как будет работать в Битрикс24! Подписывайтесь ⚡️

Читать полностью…

Технозаметки Малышева

Yandex запустил AI WAF на базе SolidWall WAF и SmartWeb Security

https://yandex.cloud/ru/services/smartwebsecurity

Эфир смотрим тут
https://scale.yandex.cloud/?utm_source=notify_sms&utm_campaign=event_mixed_15

#Яндекс #MLWAF #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

Программирование в 2025-м году be like

#юмор
———
@tsingular

Читать полностью…

Технозаметки Малышева

🚀 Qwen3-Omni-30B: Нативная омни-модальная модель от Alibaba

Алибаба продолжает рвать шаблоны, - впервые end-to-end обработка текста, изображений, аудио и видео.

Архитектура MoE Thinker-Talker:

- Thinker — модуль рассуждений с chain-of-thought
- Talker — генерация естественной речи в реальном времени.

Мультимодальные возможности:

119 текстовых языков
19 языков
для голосового ввода (включая русский)
10 языков речевого вывода (тоже с русским)

Обработка видео до 120 секунд

Поддержка смешанного контента (аудио/видео/текст)

Эффективность:
- SOTA на 22 из 36 аудио/видео бенчмарков
- Сравнимо с Gemini 2.5 Pro в понимании речи
- Без деградации текстовых и визуальных возможностей

Qwen3-Omni-30B-A3B-Instruct — полная версия с аудио выходом
Qwen3-Omni-30B-A3B-Thinking — только рассуждения, текстовый вывод
Qwen3-Omni-30B-A3B-Captioner — специализация на детальном описании аудио

Требования к железу:
- 78-144 GB GPU память (BF16, зависит от длины видео)
- Поддержка vLLM и Transformers
- FlashAttention 2 для оптимизации

Особенность: модель понимает связь между аудио и видео — то есть соотносит то, что происходит на экране с тем, что звучит.

Apache 2.0 лицензия.
Карточка модели: huggingface.co.

#Qwen #Qwen3 #Omni #AliBaba
———
@tsingular

Читать полностью…

Технозаметки Малышева

Тут роботы ещё немного натренировались.

Читать полностью…

Технозаметки Малышева

🚀 Хотите ускорить обучение в PyTorch в несколько раз?
У DataLoader есть два плохих дефолта, которые тормозят процесс.
Исправив их, я получил почти 5x ускорение.

❌ Проблема
- .to(device) переносит данные на GPU.
- Пока GPU считает - CPU ничего не делает.
- Пока CPU готовит данные — GPU простаивает.

⚡ Решение
Нужно заставить CPU и GPU работать параллельно:
- В DataLoader укажи pin_memory=True
- При переносе данных используй .to(device, non_blocking=True)
- Добавь num_workers в DataLoader для фоновой загрузки.

✅ В итоге CPU готовит следующий батч, пока GPU занят текущим.
Так исчезают простои, и обучение идёт заметно быстрее.

Читать полностью…

Технозаметки Малышева

Приехал на TechFounders.
Рассказывают про ИИ агентов для стартапов.
Внимательно слушаю :)

Все стратапы теперь будут с ИИ.
Без вариантов :)

#techfounders #доклады
------
@tsingular

Читать полностью…

Технозаметки Малышева

🏆 Gemini 2.5 берёт золото на соревнованиях программистов в Азербайджане

Google DeepMind заявили о "историческом прорыве": их Gemini 2.5 стал первым ИИ, выигравшим золотую медаль на международном конкурсе программирования (ICPC).

Что произошло:
- за 30 минут решил задачу с бесконечным числом возможностей (распределение жидкости через сеть каналов)
- лучшие программисты из России, Китая, Японии — не справились
- 2 место из 139 сильнейших команд мира
- Провалил только 2 из 12 задач

Техническая начинка:
- Специально тренированная версия для сложных задач кодинга/математики
- Глубокое абстрактное мышление + креативность
- Синтез новых решений для неизвестных проблем
- производительность на уровне топ-20 кодеров мира

Событие по масштабу сопоставимо с победой Deep Blue в шахматах в 1997 или AlphaGo в Го в 2016.
Только теперь ИИ решает реальные задачи, а не только игровые комбинации.

Правда, Google пишет, что модель не только специально обучена, но и явно мощнее Про версии за $250/месяц, которая доступна обычным пользователям.

#Gemini #ICPC #AGI #Google
———
@tsingular

Читать полностью…

Технозаметки Малышева

Wan2.2-Animate-14B — нейросеть, которая превратит вас в персонажа мультфильма.

Закидываете свое видео и фотку персонажа, а на выходе получаете анимированный ролик, в котором мультяшный герой повторяет ваши движения.

Самое крутое: модель сразу выпустили в опенсорс.

⤷ Ознакомиться на сайте

CodeLearning

Читать полностью…

Технозаметки Малышева

🧬🤖 Paper2Agent: оживляем научные статьи
Open-source инструмент от исследователей из Stanford, который превращает статические статьи в интерактивных AI-ассистентов.

📌 Как это работает:
- Paper2MCP анализирует статью и её код( если есть), извлекает ключевые методы и превращает их в инструменты внутри MCP-сервера.
- Agent layer подключает этот сервер к чат-агенту (например, Claude Code или Chatgpt).

Поле чего, у каждой статьи появляется свой ИИ-ассистент, который:
- объясняет папиру на простом языке;
- запускает код без ручного копания в репозиториях, зависимостях и API-ключах;
- объединяет данные и пайплайны из разных работ.

Каждый MCP-сервер включает:
- Tools — функции (например, прогноз изменения экспрессии генов).
- Resources — текст, код, датасеты.
- Prompts — шаблоны для пошаговых сценариев.

Фактически Paper2Agent помогает конвертировать научные работы в полноценные рабочие инструменты.


Чтобы повторить методы их статьи, приходилось вручную ставить окружения, импортировать десятки модулей и гадать с входными данными. Paper2Agent позволяет это сделать через диалоговый интерфейс.

🟠Github

@ai_machinelearning_big_data


#ai #ml #aiagent

Читать полностью…

Технозаметки Малышева

🤖 Обстановка в московском Зарядье, где в рамках форума о будущем городов БРИКС «Облачные города» прошёл парад роботов

Читать полностью…

Технозаметки Малышева

В DeepMind с помощью ИИ нашли новые решения фундаментальных уравнений гидродинамики. Ученые бьются над ними уже веками.

Помните, мы писали о том, что Google с помощью ИИ намеревается решить одну из математических проблем тысячелетия? Кажется, у них там наметились первые подвижки.

Они совместно с учёными из Brown University, NYU и Стэнфорда разработали метод, с помощью которого обнаружили новое семейство сингулярностей в классических уравнениям гидродинамики.

Сингулярности – это такие решения системы, где физические величины (скорость, давление и др.) могут становиться бесконечными или не определёнными. В физическом мире это похоже на формирование идеального вихря, в котором энергия концентрируется в бесконечно малой области. Математически в таких ситуациях предсказания уравнений теряют смысл.

Так вот никто до сих пор точно не знает, могут ли такие сингулярности возникать в реальности. Найти сингулярность невероятно сложно, даже суперкомпьютеры не справляются с таким объемом вычислений. Собственно, задача тысячелетия – это либо доказать, что в уравнении Навье-Стокса существует хотя бы одна устойчивая сингулярность, либо доказать, что таких нет.

Google удалось с помощью ИИ на шажок приблизиться к решению. Они нашли новое семейство сингулярностей для класса уравнений, похожих на Навье-Стокса. Более того, они выявили общий паттерн того, как растет нестабильность таких решений. Раньше никаких аналитических соображений в этом направлении не существовало.

Архитектура: гибридный метод на основе PINN (Physics-Informed Neural Networks). Это прямо очень интересно. Смотрите:

В лосс сети зашиваются непосредственно уравнения в частных производных. То есть модель, по сути, учится соблюдать физику – законы сохранения массы, энергии и импульса.

И на основе этих знаний ее задача затем – найди начальные условия, приводящие к сингулярности. PINN генерирует кандидатов → симулятор проверяет → сеть корректирует параметры. Много-много таких циклов спустя и нашлись несколько сингулярностей.

И да, пока это не решает основную задачу. Но (1) теперь есть зачатки какого-то решения, и это поразительно; (2) Google опубликовали начальные условия, так что теперь с ними могут продолжить работать математики и физики всего мира.

Читать полностью…
Subscribe to a channel