tsingular | Неотсортированное

Telegram-канал tsingular - Технозаметки Малышева

2602

Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb

Подписаться на канал

Технозаметки Малышева

Microsoft: ИИ создает биологические угрозы нулевого дня

Microsoft заявляет, что современные ИИ-системы могут генерировать новые биологические угрозы, неизвестные науке ранее.

Исследователи тестировали способность больших языковых моделей предлагать опасные биологические модификации, которые нельзя обнаружить существующими методами защиты.

Проблема в том, что такие "zero-day" атаки в биологии могут обойти все текущие системы безопасности — от скрининга ДНК до контроля доступа к лабораторному оборудованию.

Это создает новый класс рисков на пересечении ИИ и биотехнологий, где традиционные подходы к кибербезопасности не работают.

Получается, теперь не только хакеры могут создавать zero-day эксплойты, но и биологи с доступом к ИИ. Весело живем.

#Microsoft #Biology #ZeroDay
------
@tsingular

Читать полностью…

Технозаметки Малышева

OpenCode.ai - бесплатный открытый аналог СlaudeСode

- Нативный TUI. Гибкий, типовой интерфейс терминала с возможностью настройки тем.

- LSP включен. Автоматическая загрузка правильных LSP для LLM.

- Многосеансовый запуск нескольких агентов параллельно в одном проекте.

- Обмен ссылками. Поделитесь ссылкой на любой сеанс для получения справки или отладки.

- Claude Pro. Можно авторизоваться в Anthropic, чтобы использовать свою учетную запись Claude Pro или Max.

- Любые поставщики LLM моделей: 75+ через Models.dev, включая локальные модели.

- Совместим с любым IDE, так как работает в командной строке

#OpenCode #dev
———
@tsingular

Читать полностью…

Технозаметки Малышева

OmniRetarget - платформа для комплексного обучения роботов.

Очень много примеров и сценариев, которые они обкатывают на примере UniTree

Основное:
- Превращает записи движений человека в движения для робота-гуманоида
- Сохраняет взаимодействия с предметами и поверхностями (если человек берет коробку, робот тоже правильно её возьмёт)
- Не создаёт физических ошибок (ноги не скользят, части тела не проходят сквозь предметы)

Из одной записи создаёт много вариантов:
- Предмет в другом месте или повёрнут
- Предмет другого размера
- Платформы разной высоты
- Подходит для роботов разных моделей

paper

не, ну хорошо, в принципе, что они пока на привязи...

#роботы #OmniRetarget #UniTree
———
@tsingular

Читать полностью…

Технозаметки Малышева

n8n готовит релиз, в котором ИИ ассистент будет встроен и сам будет создавать для вас сценарии.

noCode => vibeNoCode

#n8n #dev
———
@tsingular

Читать полностью…

Технозаметки Малышева

😂😂😂

#юмор
------
@tsingular

Читать полностью…

Технозаметки Малышева

🔥ИНВАЙТЫ ТУТ

Если вы вдруг каким то чудом (не обсуждаем каким) можете оказаться в США или Канаде, - и зайдете на сайт
https://openai.com/index/sora-2/
Вам может пригодиться этот инвайт
CF5R4G

пригодится он только первым 4-м.
не знаю уж кому повезёт.

Одно условие, - каждый, кто зарегается публикует свой следующий инвайт в комментариях под этим постом.

они все активируются по 4 раза.
поэтому если забрали - ставьте эмоджи или звёздочку на инвайте :)

Генерации идут очень медленно :) Сервера там, похоже, еле вывозят.

Ну и делитесь креативами, чего уж :)

#Sora #invite
———
@tsingular

Читать полностью…

Технозаметки Малышева

Мода на файловую память, теперь и код-агенты anthropic.

Вышло agentic SDK от антропика и там нашлось несколько интересных вещей про контекст и память.

Это уже практичное и модное решение, которое в разной форме мы наблюдали у manus и memagent.

Основные позиции – не засоряем контекст и кладем все в файловую систему ОС. Также для поиска НЕ используем без нужды семантику или даже bm25, оставаясь на grep/tail и прочих способах поиска встроенными инструментами вашей ОС. Да это не исключает проблемы больших файлов, где grep может быть не эффективен, но скорее всего, подобно идее с чанкованием, для памяти создается иерархическая память на "малых" файлах.

В итоге, центре всего стоит тезис: зачем нам семантика, когда можно взять поиск в ОС и агента для чтения и записи? Но, думаю, без семантики не обойтись, особенно, когда у нас много зависит от контекста, да еще и синонимов до кучи. Однако, быстренько найти нужный нейм файла, пойдет, а если не вышло (пустой поиск), уже можно полнотекстом и семантикой искать имя, тем самым балансировать между скоростью и надежностью/сложностью поиска. Особенно для файлов сотни мб или гб. Тут кстати и может помочь аналог чанкования, в виде иерархии файлов, на которые заранее бьём большие. Далее, берем файлик и читаем агентом, переносим из файла релевантное в контекст.
В любом случае, такое решение в итоге завязывает вас на эффективный контекст и конечно свойство роутинга, ризонинга и поиска по контексту. Крч хорошая llm вам нужна, которая у антропика есть. Но есть ли она у вас?)

Читать полностью…

Технозаметки Малышева

Бывшие исследователи OpenAI и DeepMind привлекли $300M на автоматизацию науки

Команда экс-сотрудников OpenAI и DeepMind получила $300 миллионов посевных инвестиций на создание ИИ-системы для автономных научных исследований.

Стартап планирует полностью автоматизировать цикл: гипотеза → эксперимент → валидация. Без участия человека.

Типичное распределение таких инвестиций: 40-50% на вычислительную инфраструктуру, 25-30% на таланты, 15-20% на лабораторное оборудование.

Основная проблема - как обеспечить воспроизводимость результатов и стандартизацию данных между разными лабораториями. Плюс вопросы безопасности при работе с потенциально опасными исследованиями.

По прогнозам Gartner, к 2028 году 75% корпораций будут использовать ИИ-исследователей.

Майнинг нобелевских премий :)

#OpenAI #DeepMind #Science
------
@tsingular

Читать полностью…

Технозаметки Малышева

Историческая запись. Сохраним.

Уильям Гибсон, отец мирового киберпанка, пишет, что на его творчество значительно повлиял Виктор Цой.

Т.е. знаменитый Нейромансер, а затем и Бегущий по лезвию бритвы, Матрица, Призрак в Доспехах, Чужие, которые все начитались и насмотрелись и бросились разрабатывать ИИ,- это все немножко Цой и алюминиевые огурцы.

#Гибсон #Цой #жив
------
@tsingular

Читать полностью…

Технозаметки Малышева

FuzzForge AI: платформа для автоматизации поиска уязвимостей

Интересная платформа с ИБ инструментами.

🤖 AI Agents for Security — специализированные агенты для AppSec, реверсинга и фаззинга

🛠 Автоматизация рабочих процессов — определение и выполнение рабочих процессов AppSec в виде кода

📈 Масштабируемое исследование уязвимостей - автоматизированная перепроверка уязвимостей 1-day и обнаружение уязвимостей 0-day

🔗 Интеграция с фаззерами — AFL, Honggfuzz, AFLnet, StateAFL и другие

🌐 Маркетплейс сообщества - обмен рабочими процессами, корпусами, PoC и модулями

🔒 Корпоративная версия - облачные решения для команд/корпораций для масштабирования активной безопасности

Полезный фреймворк для внутренней команды по пентестам.

#FuzzForge #Fuzzing #AppSec #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

🎬 Kandinsky 5.0 Video Lite — новая open source модель генерации видео 🎬

Мы выпускаем Kandinsky 5.0 Video Lite — первую модель новой линейки Kandinsky-5. Модель работает в разрешении 768×512 и при небольшом размере всего в 2B параметров демонстрирует качество, превосходящее предыдущие версии Kandinsky и большую часть актуальных открытых open source решений

Генерация видео до сих пор остаётся одной из самых сложных инженерных задач в Generative AI. Причём и как с точки зрения подготовки данных для обучения и распределённого обучения моделей, а затем масштабирования, так и с точки зрения инференса такого рода архитектур. Если картинки уже можно делать фотореалистичными даже на «бытовом» железе, то качественные видео в высоких разрешениях до сих пор можно сгенерировать только большими моделями, которые запускаются на топовых GPU

Мы решили это изменить и при разработке сделать ключевой акцент на эффективности: модель Lite компактна, требует меньше ресурсов и генерирует быстрее. Такой результат стал возможен благодаря комплексной работе — от сбора и подготовки данных до инженерных оптимизаций pre-train и сбора качественных данных для SFT. Мы исследовали современные методы оптимизации архитектур и применили собственные наработки для балансировки качества и скорости

⚡️В открытый доступ мы выкладываем следующие чекпоинты (для генерации 5 сек и 10 сек видео):
💡 SFT: максимальное качество (она же основная Kandinsky 5.0 Video Lite)
💡 CFG-distilled: x2 быстрее
💡 Diffusion-distilled: x6 быстрее при минимальной потере качества
💡 Pretrain: для исследований и дообучения

⚡️Некоторые технические детали:
💡Архитектура основана на Diffusion Transformer (DiT) с flow matching (подробнее см. Хабр)
💡Pre-train модели осуществлялся примерно на 520 млн изображений и 125 млн видео-сцен
💡Делали упор на Alignment (в частности, SFT) на качественных визуальных данных, предварительно отобранных большой командой профессиональных художников и дизайнеров. Этот этап дал самый большой прирост по визуальному качеству
💡Для 10-секундной генерации используется разработанный нами метод разреженного внимания NABLA

⚡️По внутренним замерам SFT версия (5 сек) превосходит по общему качеству (которое включает в себя оценку качества следования промпту, визуала и динамики) гораздо более громоздкие модели, такие как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B, которая больше Kandinsky в 13-14 раз. При этом генерации 10 сек версий также демонстрируют высокое качество и стабильность

⚡️Где и как можно потестить:
💡Моделями можно воспользоваться, записавшись в вайтлист бота (к сожалению, только для ограниченного количества пользователей)
💡Все материалы есть на HuggingFace, GitHub и GitVerse, также есть ComfyUI
💡Модели распространяются по открытой лицензии с поддержкой коммерческого использования

И ещё раз все полезные ссылки в одном месте:

👉 Хабр (технические подробности)
👉 Project Page (демо)
👉 Github (код)
👉 Hugging Face (чекпоинты)
👉 GitVerse (код)
👉 NABLA (paper)
👉 Бот для записи в вайтлист

Читать полностью…

Технозаметки Малышева

TLDR с сайта:
— все утечки подтвердились, будет отдельное приложение / социальная сеть с лентой рекомендаций
— можно «загрузить» свой образ для использования вами и друзьями, и использовать чужие образы. Это главная фича, за счёт которой достигается интерес и социализация
— также есть система приглашений, можно позвать 4 людей с собой
— сейчас есть приложение только для iOS (ссылка), доступно сначала в США и Канаде, но обещают быстро добавлять новые страны
— доступно БЕСПЛАТНО с щедрыми лимитами (сколько точно не уточняется, но вот у Codex Cloud, где тоже написано «щедрые лимиты», я ни разу в них не упирался вообще)
— Pro-пользователи получают доступ к веб-версии на сайте sora.com , плюс, у них есть отдельная модель Sora 2 Pro, пока не вижу сравнений по качеству
— для подростков время скролла ленты ограничено по умолчанию, чтобы дети не зависали в приложении навсегда
— в модели сделали существенный упор на реалистичность физики (см. приложенные видео)
— API запустится скоро
— отмечаем похороны Snapchat 😀

Читать полностью…

Технозаметки Малышева

По следам конферениции, как обещал делюсь презентацией.

ИИ для бизнеса

#презентация #Сколково
———
@tsingular

Читать полностью…

Технозаметки Малышева

- то, что Россия в клубе разработчиков фундаментальных ИИ моделей,- круто!

- возможно в какой-то момент разработку регламентов работы ИИ придётся поручить ИИ.

- я тоже использую модели ИИ.

- ИИ пока не способен предсказывать политические события.люди справляются лучше.

- мы должны как страна в области ИИ достичь больших успехов.

- пока мы способны контролировать ИИ, но только пока.

#aiday #Сколково #Медведев
------
@tsingular

Читать полностью…

Технозаметки Малышева

Сегодня в Сколково День ИИ.

https://aiday.sk.ru/

Если кто тут - пишите

#Сколково
------
@tsingular

Читать полностью…

Технозаметки Малышева

Comet Browser от Perplexity.ai теперь бесплатный для всех.

- понимает контекст страниц
- может ответить на почту
- может управлять страницами как оператор
- может даже создавать сайты
- организует вкладки по запросу
- может покупать на сайтах что скажете

Есть коллекция промптов, если закончились идеи как использовать браузер.
Или даже видеопримеры.

Качать тут:
https://www.perplexity.ai/comet

#Comet #Perplexity
———
@tsingular

Читать полностью…

Технозаметки Малышева

MCP benchmark, как способ атомарного измерения качества работы агентов и интеграции с FC/TC.

Сегодня расскажу о статье "MCPMark: A Benchmark for Stress-Testing Realistic and Comprehensive MCP Use". Это исследование представляет собой новый эталонный тест для оценки работы LLM с внешними системами через MCP. Статья интересна тем, что подобно атомарным измерениям RAG систем (поиск, реранкинг, ответ LLM), показывает как можно измерить качество агентов с вызовом тулов. Как мы знаем, зачастую агенты с тулами ввиду своей нелинейности и недетерминированности сложно измеряются на качество в каждом действии, тк на одну и ту же задачу в разном контексте может быть разное количество действий. А таких бенчей нам и не хватало.

🎯 Постановка задачи

Авторы статьи отмечают, что существующие тесты для MCP остаются ограниченными: они фокусируются на задачах, связанных в основном с чтением информации, либо на задачах с небольшой глубиной взаимодействия. В результате, они не отражают комплексность и реалистичность рабочих процессов из реального мира. Это создает трудности в оценке истинной производительности современных моделей и агентов, а также их способностей к ризонигу, планированию, обработке длинного контекста и использованию инструментов. Цель состоит в том, чтобы получить такой комплексный бенчмарк.

💡 Идея подхода

В качестве решения предлагается бенчмарк MCPMark, который оценивает использование MCP более реалистично и комплексно. Его ключевые особенности:

Реалистичные задачи: 127 высококачественных задач, созданных совместно экспертами и AI-агентами. Если уже не реалистичные, ну хотя бы приближенные к реальным.

Сложные взаимодействия. Задачи требуют разнообразных операций Create, Read, Update, Delete (CRUD) в пяти различных средах: Notion, GitHub, Filesystem, PostgreSQL и Playwright.
Программная проверка подобно награде в GRPO с компиляцией кода. Каждая задача включает скрипт программы для автоматической верификации результата, что делает оценку более объективной.
Создание контекста разработки. Каждая задача начинается с тщательно подобранного начального состояния (например, шаблон базы данных или репозиторий GitHub с историей) и создается в рамках pipeline, сочетающего исследование, усложнение задачи, верификацию и действие.

🧪 Дизайн метрик

Для оценки моделей был создан MCPMark-Agent – минималистичный и универсальный фреймворк, который выполняет модели в стандартном tool-calling loop. Это обеспечивает честное и последовательное сравнение различных LLM.

Основные метрики, использованные в исследовании:

pass@1процент задач, успешно решенных моделью с первой попытки.
pass^4 более строгая метрика, отражающая процент задач, которые модель стабильно решает по крайней мере в одном из четырех запусков. Авторы подчеркивают, что эта метрика лучше отражает реальные условия, где надежность критически важна.
Среднее количество ходов и вызовов инструментов на задачу. Эти метрики показывают сложность задач и эффективность модели.

🔢 Результаты оценки моделей

Ниже приведены примеры результатов оценки современных LLM, которые демонстрируют сложность бенчмарка:

•gpt-5-medium (OpenAI) имеет 52.56%, 33.86% метрики pass@1 и pass^4 соответственно.

•claude-sonnet-4 (Anthropic) <30%, <15% соответственно

•o3 (OpenAI) < 30%, < 15% соответственно.

В среднем, для решения одной задачи LLM требовалось 16.2 шагов выполнения и 17.4 вызова инструментов, что существенно превышает показатели в предыдущих бенчмарках.

🤔 Почему это важно

Исследование имеет несколько важных следствий для области AI-агентов:
1. Создание более реалистичной и надежной оценки. MCPMark предлагает гораздо более строгий и приближенный к реальности тест для агентов, чем предыдущие усилия.
2. Выявление слабых мест в работе систем агентов с тулами. Результаты ясно показывают, что даже самые передовые модели сегодня с трудом справляются со сложными, многошаговыми рабочими процессами. Большой разрыв между pass@1 и pass^4 указывает на это.

Надеюсь такой бенчмарк покажет пример как можно измерять агентов не только e2e и мы увидим еще больше атомарных бенчей.

Читать полностью…

Технозаметки Малышева

Антропик опять испортил нам планы на выходные.

Выкатили гайд по контекст инжинирингу

Это вам не просто написать "представь, что ты вайбкодер с 30ти летним стажем".
Тут архитектура! Технолоджия!

В общем откладываем развлечения, открываем тетрадки, записываем ...

Сам гайд не очень большой, но в нем еще коллекция полезных ссылок с детализациями и разъяснениями, так что есть что поизучать.

#Anthropic #обучение
———
@tsingular

Читать полностью…

Технозаметки Малышева

LLM Intercept

Вайбкодер нашаманил проксю для ЛЛМ, которая пишет все вызовы и превращает их в датасеты для файнтюна малых моделей :)

Очень удобно, но для большинства проприетарных моделей не разрешено лицензией.

Качаем, пробуем, пока не прикрыли :)

https://github.com/mlech26l/llm_intercept

#LLMproxy #proxy #dev #llmintercept
———
@tsingular

Читать полностью…

Технозаметки Малышева

Такое, конечно, Sora пока не сумеет.

Трилобит:

a=(x,y,o=2-mag(k=x/8-12.5,e=y/8-12)/3,d=-5*abs(sin(k/2)*cos(e*.6)))=>point((x+e*cos(t)+d*k*sin(d+t))*.7+k*o+130,(y-d*o*9+y*e/19+d*e*cos(d+t))*.7+e*o+150)
t=0,draw=$=>{t||createCanvas(w=400,w);background(6,96).stroke(w,46);for(t+=PI/90,i=4e4;i--;)a(i%200,i/200)}

Файл html в комментарии

#трилобит #dev
------
@tsingular

Читать полностью…

Технозаметки Малышева

Сэм Альтман ворует видеокарту.

Новая сора прям хороша. Кто-то уже успел затестить? Делитесь в комментах чо нагенерировать успели

видео отсюда

Читать полностью…

Технозаметки Малышева

Мы все дальше от бога.

Такими темпами часть людей сами встанут на защиту роботов :)

Но нельзя не восхититься как он, несмотря на удары, сохраняет равновесие на этой куче мусора, продолжая танцевать.

#роботы #Unitree
------
@tsingular

Читать полностью…

Технозаметки Малышева

Claude Code: курс от DeepLearning.AI по работе с агентом-разработчиком

Anthropic и DeepLearning.AI запустили бесплатный курс по Claude Code - агентному ассистенту для разработки.

Курс покрывает практики работы с RAG-чатботом, рефакторинг Jupyter ноутбуков в дашборды, создание веб-приложений из Figma макетов.

Рассмотрена интеграция с MCP серверами, git worktrees для параллельных сессий, автоматизация через Playwright.

Если вы еще не погрузились в разработку с Claude Code, - рекомендую найти 2 часа на прохождения курса хотя бы для общего понимания как именно он работает.

#Claude #обучение #Anthropic #DeepLearning
———
@tsingular

Читать полностью…

Технозаметки Малышева

HexStrike AI: коллекция 150+ инструментов с MCP для пентеста с ИИ

Новый MCP-сервер позволяет Claude, GPT и другим ИИ автономно запускать 150+ инструментов кибербезопасности для пентеста и поиска уязвимостей.

🔍 Сетевая разведка и сканирование (более 25 инструментов)
🌐 Тестирование безопасности веб-приложений (более 40 инструментов)
🔐 Аутентификация и защита паролей (более 12 инструментов)
🔬 Двоичный анализ и реверс инжиниринг (более 25 инструментов)
☁️ Безопасность облаков и контейнеров (более 20 инструментов)
🏆 Инструменты для CTF и криминалистики (более 20 инструментов)
🔥 Bug Bounty и OSINT Arsenal (более 20 инструментов)

Система интегрирует языковые модели с утилитами для автоматизации багбаунти и исследований безопасности.

Рекомендуется использовать только в исследовательских целях.

#HexStrike #cybersecurity #Pentesting
———
@tsingular

Читать полностью…

Технозаметки Малышева

NVIDIA выпустила открытый физический движок Newton для роботов

NVIDIA запустила Newton Physics Engine - открытый движок для симуляции физического мира для роботов, разработанный совместно с Google DeepMind и Disney Research. Основан на NVIDIA Warp и работает как на GPU так и на CPU.

Движок интегрирован в Isaac Lab и позволяет симулировать сложные движения роботов - ходьбу по снегу, гравию, манипуляции с объектами.

Вместе с Newton выходит Isaac GR00T N1.6 - модель для роботов с интеграцией Cosmos Reason для пошагового планирования действий с учётом физики мира.
Превращает расплывчатые инструкции в пошаговый план через "здравый смысл" и знание физики

Cosmos WFMs - генерация синтетических данных для обучения:
Predict 2.5: видео до 30 сек, мультикамерный вывод
Transfer 2.5: в 3.5x компактнее, фотореалистичная синтетика из 3D-сцен

Тут кстати уместно вспомнить про избыточность.
Когда роботы локально смогут быстро генерить хотя бы 30 секундные физически достоверные симуляции будущего, - мы получим то самое "воображение", которое сделает их действия безошибочными.
Нужны мощные маленькие мини-пк, как, например, NVidia Thor.

#Newton #Robotics #NVIDIA
———
@tsingular

Читать полностью…

Технозаметки Малышева

В 2025м сдалась музыка, к новому году рилсы
в 2026м фильмы.
в 2027м сериалы.
в 2028м стримы.
#future
———
@tsingular

Читать полностью…

Технозаметки Малышева

Через пол часа покажут новую версию Sora

Смотрим тут

#Sora #OpenAI
———
@tsingular

Читать полностью…

Технозаметки Малышева

OpenAI запускает покупки прямо в ChatGPT через Instant Checkout

ChatGPT теперь позволяет покупать товары без выхода из чата.

Пользователи в США могут покупать у продавцов Etsy, скоро подключатся миллион магазинов Shopify включая Glossier, SKIMS, Spanx.

Основа системы — Agentic Commerce Protocol, разработанный с Stripe. Протокол открытый, что позволяет другим разработчикам создавать интеграции.

Ранжирование товаров остается органическим, но среди одинаковых продуктов учитывается поддержка Instant Checkout.

Данные пользователей передаются минимально, только для завершения заказа. Платежи проходят через существующие системы продавцов.

Комиссия с продавцов составляет около 2% против 15% у Amazon плюс затраты на рекламу.

Теперь ИИ не только найдет товар, но и купит его за вас.

Интересно когда GigaChat к Сбермаркету прикрутят?
Засекаем :) время пошло.

#ChatGPT #Stripe #Commerce
------
@tsingular

Читать полностью…

Технозаметки Малышева

Aiday - открытая панельная дискуссиия началась.

Смотреть на сайте.
http://aiday.sk.ru/

#сколково #aiday
------
@tsingular

Читать полностью…

Технозаметки Малышева

Эпоха вайбкодинга прекрасна.
Нашел какие-то формулы в Х

a=(y,d=mag(k=(y<11?6+sin(y^8)*6:y/5+cos(y/2))*cos(i-t/4),e=y/7-13)+sin(e/4+t)/2)=>point((q=y*k/d*(3+sin(d*2+y/2-t*4)))+60*cos(c=d/2+1-t/2)+200,q*sin(c)+d*29-170)
t=0,draw=$=>{t||createCanvas(w=400,w);background(9).stroke(w,96);for(t+=PI/120,i=1e4;i--;)a(i/345)}


Sonnet их тут же оживил

Код в комментарии

#Sonnet #vibecoding #squid
———
@tsingular

Читать полностью…
Подписаться на канал