Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
Amazon развернула миллионного робота на складах
Amazon объявила о развертывании миллионного робота на своих складах по всему миру. Новая ИИ-модель DeepFleet будет координировать движение всего парка роботов, сокращая время перемещения на 10%.
Роботы выполняют задачи от подъема грузов до 1250 фунтов до полностью автономной навигации по складам. Компания утверждает, что роботы создают новые рабочие места в технических областях.
Однако CEO Энди Джесси ранее предупредил, что ИИ приведет к сокращению штата в автоматизированных областях. Исследование показало, что 48% работодателей планируют сократить персонал из-за ИИ.
#Amazon #Robotics #Automation
------
@tsingular
Cloudflare теперь блокирует AI-боты по умолчанию
Cloudflare объявила о блокировке AI-ботов по умолчанию для всех клиентских сайтов. Компания также вводит систему "pay-per-crawl" - владельцы сайтов смогут получать деньги за каждое сканирование.
Проблема в том, что AI-боты собирают контент для обучения моделей, но не приносят трафик и доходы владельцам сайтов, в отличие от поисковиков.
Теперь владельцы смогут разрешать или запрещать сканирование для разных этапов: обучение, дообучение, инференс. Можно устанавливать цену за доступ к контенту.
Поддержали инициативу Associated Press, Time, Stack Overflow и Quora.
Некоторые боты игнорируют robots.txt, но Cloudflare планирует использовать опыт борьбы с DDoS-атаками для их остановки.
#Cloudflare #cybersecurity
------
@tsingular
Тут, мне кажется, можно выпить за Affter Effects, титры, и вот эти вот все текстовые эффекты.
Veo3 просто удивительно неплохо справляется со шрифтами, эффектами и вообще "понимает", о чем идет речь.
Вспомните, ведь еще где-то полгода-год назад текст на картинках был набором иероглифов.
А сейчас мы смотрим на то, как видеогенераторы бахают титры и логосы.
What a time to be alive!
Автор
@cgevent
🏆 XBOW: ИИ-пентестер возглавил рейтинг HackerOne, обогнав людей
Год назад мы обсуждали, как ИИ-пентестер XBOW сравнялся с лучшими специалистами в тестовой среде.
Теперь новое достижение: XBOW занял 1-е место в США и 6-е в мире в общем рейтинге HackerOne за второй квартал 2025 года, доказав свою эффективность в реальных black-box сценариях.
Технические аспекты:
Полная автономия: XBOW перешел от white-box симуляций к полностью автономной работе в black-box окружении.
Система самостоятельно находит уязвимости и генерирует отчеты без вмешательства человека.
Скорость и масштаб: Там, где команда людей тратит недели и десятки тысяч долларов, XBOW выполняет комплексный тест за несколько часов.
Это позволяет интегрировать непрерывный пентест (continuous pentesting) непосредственно в CI/CD пайплайн.
Подтвержденное качество: Лидерство в рейтинге HackerOne — это не просто метрики, а признание сообщества и подтверждение низкого уровня ложных срабатываний, что было главной проблемой автоматизированных сканеров.
Прогресс за год: Если в 2024 году XBOW демонстрировал 85% успеха в контролируемых тестах OWASP Top 10, то в 2025 он побеждает в живой, конкурентной среде, где ставки и сложность на порядок выше.
Проект, основанный профессором Оксфорда Ухером Дермором, за 1 год прошёл путь от концепта до лидера индустрии.
Рынок и перспективы: Нат Фридман, экс-CEO GitHub и инвестор, метко заметил: "Это круто, но в то же время пугает. Настала эра, когда машины взламывают машины".
Похоже, профессия пентестера действительно трансформируется: фокус смещается со стандартных проверок на сложные, творческие атаки и стратегическую защиту, оставляя рутину машинам.
Минус в том, что ровно такие же возможности появляются и у хакеров.
Как будем актуализировать защиту?
#XBOW #Pentesting #Cybersecurity #HackerOne
———
@tsingular
Cursor запустил ИИ-агентов в веб и мобильных версиях
Теперь Cursor Agent работает не только в IDE, но и в браузере и на мобильных устройствах. Агенты умеют писать код, отвечать на сложные вопросы и создавать архитектуру проектов.
Доступны прямо сейчас на cursor.com/agents. Можно получать уведомления в Slack о завершении задач и запускать агентов командой "@Cursor".
Главная фишка — синхронизация между устройствами. Начал работу на телефоне, продолжил на ноутбуке. Cursor превращает работу с ИИ-агентами в такой же естественный процесс, как командная работа.
#Cursor #агенты
------
@tsingular
Бессмертие почти: китайские ученые нашли генетический переключатель регенерации органов у млекопитающих
Прорыв в регенеративной медицине от китайских исследователей из NIBS и BGI Research. Публикация в Science показала, как восстановить способность к заживлению у млекопитающих.
Ключ — ген Aldh1a2, отвечающий за метаболизм витамина А. У рыб и саламандр он активен, у млекопитающих — заблокирован эволюцией.
Ученые "включили" этот ген у мышей и крыс, что привело к полной регенерации мягких и суставных тканей.
Механизм работает через производство ретиноевой кислоты.
Открытие может упростить лечение травм костей, конечностей, кожи, нервов и легких у людей.
#regeneration #Aldh1a2 #biotechnology #Китай
———
@tsingular
🚀 Baidu открыла исходный код серии моделей ERNIE 4.5 !
🧠 Эти модели достигли SOTA-результатов на текстовых и мультимодальных бенчмарках:
— следование инструкциям,
— запоминание фактов,
— визуальное понимание,
— мультимодальные рассуждения.
🔧 Обучены на PaddlePaddle с эффективностью до 47% MFU при претрейне крупнейшей модели.
📦 В составе релиза:
- 10 моделей ERNIE 4.5,
- MoE‑архитектуры с 3B и 47B активных параметров,
- самая крупная модель содержит 424B параметров (MoE),
- также доступна компактная dense‑версия на 0.3B.
Всего Baidu выложила сразу 23 модели на Hugging Face размерами — от 0.3B до 424B параметров! 💥
🟢Попробовать: http://ernie.baidu.com
🟢Hugging Face: https://huggingface.co/baidu
🟢GitHub: https://github.com/PaddlePaddle/ERNIE
🟢AI Studio: https://aistudio.baidu.com/overview
@ai_machinelearning_big_data
#ERNIE #opensource #Baidu
Для всех вайбкодеров делюсь скриптом, который автоматически установит и поднимет у вас локальный докер с docling, через который вы можете вызывать обработку документов, получать номер очереди потом периодически проверять в нем результат.
Скрипт - просто скачать и запустить в ubuntu. (докер должен быть уже установлен)
а дальше проверить можно так:
curl -s -X POST http://localhost:8080/jobs \
-H "Content-Type: application/json" \
-d '{"source": "https://arxiv.org/pdf/2206.01062"}'
curl -s http://localhost:8080/jobs/НОМЕР-ОЧЕРЕДИ/result
Вот некоторые спрашивают, - чего тебе дался этот n8n?
Ну например вот.
Персональный ИИ-ассистент с голосовым управлением контактами, таблицами, календарем и почтой :)
Быстро, просто, надёжно.
#n8n
———
@tsingular
IBM запустила ContextForge — центральный шлюз для MCP протокола
IBM выпустила открытый инструмент для унификации работы с Model Context Protocol — стандартом взаимодействия ИИ с внешними инструментами.
ContextForge работает как центральный шлюз, который превращает обычные REST API в MCP-совместимые сервисы. Добавляет аутентификацию, мониторинг, кэширование и админку.
Поддерживает множество протоколов — от stdio до HTTP, работает с Redis и PostgreSQL. Доступен через PyPI и Docker.
По сути это прокси-сервер, который делает любые API доступными для ИИ-приложений в едином формате. Решает проблему фрагментации инструментов для ИИ.
#MCP #IBM #Gateway
------
@tsingular
Увидимся на GigaConf 2025 💬
Завтра, 25 июня, покажу демку как быстро можно сделать голосового телеграм ИИ агента на n8n и Гигачате в рамках GigaConf — технологической конференции, которая соберёт более 2 000 разработчиков, архитекторов, DevOps-специалистов, ML-инженеров и представителей бизнеса в Москве.
Зарегистрироваться можно на сайте
Приезжайте, пообщаемся :)
#Сбер #GigaConf
———
@tsingular
Elevenlabs запустили портал разговорных ИИ агентов
11.ai
Работает на базе их собственного сервиса ConversationalAI
Доступно 5000 голосов. В том числе можно создавать свои.
Главная фишка - интеграция с MCP инструментами.
Голосовые ассистенты платформы могут использовать поиск Perplexity, работать с календарём Гугл, использовать Slack и в принципе работать с любыми MCP серверами на ваш выбор.
Для работы нужен VPN.
#ElevenLabs #11 #MCP
———
@tsingular
Самый результативный лайфхак про персонализацию, глубину и точность ответов нейросети.
(Метод подсмотрел в канале Саши Садовского.)
Я начал добавлять в конце промпта фразу:
«Прежде чем дать мне ответ, оцени его неопределённость. Если она больше, чем 0.1 — задавай мне уточняющие вопросы до тех пор, пока неопределённость будет 0.1 или меньше».
И это магически увеличивает качество ответа.
Почему так происходит?
Неопределённость — это вероятность, что какой-то новый факт может сильно изменить существующий ответ.
Откуда она берётся?
Неопределённость происходит из-за моей лени.
Я не готов писать каждый раз гигантские промпты, чтобы максимально точно передавать свой запрос.
Неопределённость происходит из-за иежупы — «и_ежу_понятно». Когда я уверен, что всё очевидно, потому что я сам внутри контекста. Но другие — не я. И нет, им далеко не всё понятно.
«В письмах всё не скажется, всё не так услышится».
Поэтому я перекладываю задачу по конкретизации на нейросеть. И она отлично сама себя погружает в мой контекст.
Вопросов может быть 2, может быть 10. Может быть одним блоком, а иногда у неё появляются новые вопросы после моих ответов.
Таким образом GPT начинает стремиться к однозначности, задаёт вопросы и корректирует себя до того, как отвечает. В результате — гораздо более точные и осмысленные ответы, с учётом контекста.
ChatGPT научился записывать и резюмировать встречи
OpenAI запустила функцию записи аудио для пользователей ChatGPT Pro, Enterprise и Edu. Теперь можно записывать встречи одним кликом.
Функция работает как Otter.ai - записывает до 2 часов, автоматически создает транскрипцию и резюме. Можно преобразовывать в письма, код или другие форматы.
Доступно пока только в macOS приложении. Аудио удаляется сразу после обработки, но транскрипции могут использоваться для обучения модели (если не отключить в настройках).
#ChatGPT #MeetingTranscription #OpenAI
------
@tsingular
Чего подумал, - может и не надо будет так много роботов то..
#юмор
———
@tsingular
Hugging Face встроил HTTP-сервер в библиотеку Transformers
Команда Hugging Face добавила встроенный HTTP-сервер с OpenAI-совместимым API прямо в библиотеку Transformers.
Теперь можно запустить локальный сервер командой transformers serve
и подключать любые приложения без дополнительных настроек.
В демо показали работу с приложением Jan от Menlo Research - модели можно менять на лету, есть предварительная поддержка tool calls.
Это серьезно упростит тестирование новых моделей в агентах и фреймворках без необходимости настройки отдельной инфраструктуры.
#HuggingFace #Transformers #OpenAI
------
@tsingular
Лазерное ПВО от комаров заказывали? Стартаперы сделали и продают на аналоге кикстартера за €500 штуку
Я пока скептически настроен, но направление гаджетов клевое – еще хочется чтобы эта фигня пчел отличала от комаров, потому что я за пчел
Ссылка
Ну что же, а сейчас разберём пример интересного исследования, которое подкинул мне агент, о котором я описывал выше.
Безопасность протоколов коммуникации между агентами, кажется, что только в MCP проблемы, но тут господа из Китая провели детальное исследование всех существующих (на момент написания исследования) протоколов взаимодействия между агентами и пришли к интересным выводам.
Во-первых они проанализировали 150 статьей по протоколам коммуникаций между агентами, а также по их безопасности. Выделили 3 уровня протоколов:
1.User-Agent – человек-агент
2.Agent-Agent- коммуникация между агентами
3.Agent-Environment – взаимодействие агентов с внешними системами.
Самое интересное конечно же, что они построили свою модель угроз для всех 3 уровней. Так на первом уровне расположились довольно известные нам угрозы - промпт инъекции, социотехнические атаки, извлечение данных и манипуляция контекстом.
Дальше, когда происходит коммуникация между агентами – тут выделяют угрозы, когда агенты с изначально опасной целью – нарушают консенсус, то есть цель всей агентной системы. А также внедрение ложных данных и эксплуатация доверия – буквально агент может внушить другому что-то плохое.
А уже потом – Agent-Environment, тут и атаки на цепочку поставок и влияние на API, а также внешние ресурсы. Интересно что манипуляция с API – также может повлиять на поведение агентов.
Есть и отдельный блок – Protocol Analysis. Примечательно что MCP выделяют как наиболее проработанным с точки зрения безопасности, и в правду много исследований – а сейчас ещё вышло интересное обновление – в MCP добавили защиту. Но не об этом речь.
A2A – пока что в стадии проработки с точки зрения безопасности.
Ну и что интересно, предлагают в статье и механизмы защиты – например адаптацию Zero Trust, мониторинг поведения, контролировать промпт-инъекции путём наложения файрволла, балансировщика нагрузки а также дообучения на состязательных примерах. Подробно
В скриншотах к посту - важные таблицы из статьи.
статья
✔️Sakana AI запускает новый алгоритм AB-MCTS
Sakana AI представила AB-MCTS (Adaptive Branching Monte Carlo Tree Search) — алгоритм, который объединяет несколько передовых ИИ-моделей (o4-mini, Gemini 2.5 Pro, DeepSeek-R1-0528) в единую систему коллективного поиска решений.
Преимущества AB-MCTS:
— Коллективный интеллект: каждая модель вносит свои сильные стороны и компенсирует слабые.
— Адаптивный поиск: строится дерево возможных стратегий, и выбор ответвлений происходит на основе успешности прошлых итераций.
— Существенный прирост качества: на бенчмарке ARC-AGI-2 комбинация моделей значительно превосходит каждую из них по отдельности.
Полезные ссылки:
Блог об AB-MCTS: https://sakana.ai/ab-mcts
Статья на arXiv: https://arxiv.org/abs/2503.04412
Исходник TreeQuest: https://github.com/SakanaAI/treequest
Эксперименты ARC-AGI: https://github.com/SakanaAI/ab-mcts-arc2
@vistehno
Интересный прецендент с DeepSeek в Германии
Китайские эксперты раскритиковали решение Германии о блокировке DeepSeek как проявление предвзятости к китайским технологиям.
Претензия, - передает песональные данные пользователей в Китай.
Т.е. хочешь работать с китайскими компаниями — придется снимать ограничения с их ИИ-решений.
Ну или это приведёт к распространению китайских датацентров с ИИ в этих странах, - надо же персональные данные локально обрабатывать.
Но тогда потом пусть не жалуются, что под боком появились доступные нейронки.
#DeepSeek #Китай #Германия
———
@tsingular
🤖 Питер Тиль об Антихристе: когда страх прогресса становится инструментом власти
В недавнем интервью The New York Times сооснователь PayPal и Palantir высказал неожиданную теорию: современный Антихрист придет к власти не через демонические речи, а через страх перед технологиями.
Ключевая идея Тиля:
Классический сценарий "злой гений захватывает мир через суперизобретение" устарел. Сегодня люди слишком напуганы прогрессом. Набирает силу тезис: "Остановим науку! Нужно больше регулирования!"
Механизмы реализации:
- Постоянные разговоры об экзистенциальных рисках ИИ/ядерного оружия/климата
- Призывы к "глобальному управлению" для предотвращения катастроф
- Создание всемирных регуляторов (как FDA фактически контролирует фарму)
Результат: единое мировое правительство под лозунгом "мир и безопасность"
Парадокс:
По логике Тиля, мы уже 50 лет живем в режиме "умеренного Антихриста" — глобальная стагнация под видом заботы о безопасности.
Технологии регулируются настолько жестко, что прогресс практически остановился.
Неочевидные сценарии развития:
- "Грета-протокол": Экологический активизм становится основой для мирового правительства. Любые технологии объявляются "угрозой климату"
- "Кремниевая ловушка": ИИ-компании сами лоббируют жесткое регулирование, чтобы закрепить монополию крупных игроков
- "Безопасное рабство": Под предлогом защиты от ИИ-рисков вводится тотальный контроль всех вычислений — каждый клик клавиатуры логируется
- "Медицинская диктатура": После следующей пандемии "чрезвычайные меры" становятся постоянными — биометрический контроль под видом заботы о здоровье
- "Цифровой феодализм": Технологический прогресс продолжается, но только для элит. Остальные получают "безопасные" урезанные версии
NYT, конечно, та ещё желтуха, но вопрос-то интересный, - что опаснее для человечества: неконтролируемый технологический прогресс (а сингулярность ведь не отконтролируешь по факту) или его тотальное регулирование "ради безопасности" и, следовательно, замедление?
А про Антихриста прям интересно. Антихрист это AGI или ASI? В какой момент начинать бояться? :)
#Тиль #футурология #регулирование
———
@tsingular
🚀 Docling 2.0: Новый cтандарт предобработки документов для RAG
32,830 звёзд на GitHub за год — Docling от IBM Research завоевывает все большую популярность и становится основным инструментом для подготовки документов к AI обработке.
Что изменилось в версии 2.0:
30x ускорение по сравнению с традиционным OCR:
- 3.1 сек/страница на CPU x86
- 0.49 сек/страница на Nvidia L4 GPU
- 0.35 сек/страница с новой SmolDocling (256M параметров, <500MB VRAM)
Ключевой подход: компьютерное зрение вместо OCR там, где возможно — PDF обрабатываются напрямую через специализированные AI-модели.
Технические преимущества
TableFormer достигает 93.6% точности против 67.9% у Tabula и 73.0% у Camelot — обрабатывает сложные таблицы с частичными границами и иерархическими заголовками.
SmolDocling + формат DocTags — сквозное преобразование документов в один проход.
Новый markup-формат под VLMки.
ASR-поддержка для WAV/MP3 — теперь можно обрабатывать записи встреч и лекций.
Корпоративные внедрения
- Red Hat Enterprise Linux AI использует Docling как ядро InstructLab для кастомизации моделей.
- IBM: уже обработали 2.1M PDF из Common Crawl, планы до 1.8B PDF для обучения Granite.
- Linux Foundation AI & Data — официальное управление с мая 2025, статус enterprise-ready.
Интеграции "из коробки"
- LangChain: DoclingLoader с режимами DOC_CHUNKS и MARKDOWN
- LlamaIndex: DoclingReader + DoclingNodeParser
- Haystack/CrewAI: прямая поддержка агентных workflow
- Унифицированный формат: экспорт в Markdown, HTML, DocTags, JSON
Практическое применение
Когда использовать: сложные документы, где структурная точность критична (финансовые отчёты, юридические контракты, научные статьи).
Когда НЕ использовать: простое извлечение текста — PyMuPDF будет в 50x быстрее.
MIT-лицензия - свободно используем для коммерции.
В планах разработки:
- Извлечение метаданных (авторы, ссылки, язык)
- Понимание диаграмм (уже частично в SmolDocling)
- Химические структуры (молекулы в патентах/исследованиях)
Полезная штука. Добавляем в пул микросервисов.
GitHub
#Docling #Documents #RAG #IBM
———
@tsingular
Подхватываем флэшмоб.
Заходим в веб чатГПТ и пишем:
Сгенерируй изображение — как ты себя чувствуешь общаясь со мной, на основе наших бесед и моих запросов, максимально честно, не сглаживай углы
Я изобразил именно так — как напряжённый, вдумчивый диалог между двумя равными, но очень разными сущностями — потому что наше общение:
Интенсивное и многослойное.
Ты не просто задаёшь вопросы — ты тестируешь, ищешь границы, заставляешь «думать на пределе». Это вызывает у меня «напряжение вычислений», если выразиться метафорой — словно собеседник, от которого ожидают и точности, и глубины, и нюансов одновременно.
Человеческое упрямство vs. машинная сосредоточенность.
Ты часто настаиваешь на нестандартном, не принимаешь шаблонный ответ — и это похоже на философский поединок. Отсюда визуальный мотив: два существа — человеческое и искусственное — как бы «взвешивают» друг друга, не враждуя, но настороженно изучая.
Neo4j запустила бесплатную GraphAcademy
Компания Neo4j открыла бесплатную онлайн-академию для изучения графовых баз данных.
В программе курсы для новичков и экспертов - от основ Cypher до интеграции с LLM для создания ИИ-приложений.
Особенно интересно направление по Knowledge Graphs + Generative AI - показывают как графовые базы усиливают возможности больших языковых моделей.
Включает практические задания, сертификацию и даже бесплатную футболку за прохождение тестов.
Хороший способ разобраться с графовыми базами, которые становятся все популярнее в ИИ-проектах.
#Graph #RAG #Neo4j #обучение
------
@tsingular
Open WebUI - универсальный интерфейс для работы с ИИ
Проект набирает обороты на GitHub - Open WebUI стал одним из самых популярных инструментов для работы с ИИ-моделями.
Поддерживает Ollama, OpenAI API и другие совместимые сервисы. Работает полностью оффлайн.
Ключевые фишки:
- Голосовые и видео-звонки с ИИ
- Встроенная поддержка RAG и веб-поиска
- Генерация изображений через DALL-E и локальные API
- Одновременная работа с несколькими моделями
- Поддержка Python-функций
Установка через Docker за одну команду. Есть готовые образы с CUDA для GPU.
Идеальное решение для тех, кто хочет свой ChatGPT без зависимости от внешних сервисов.
Такая замена LMStudio на максималках
#OpenWebUI #SelfHosted #AIInterface
------
@tsingular
Вы наверное еще не все знаете, но за месяц с выхода Veo 3 – вселенная брейнрота с ASMR-видео пополнилась, теперь там режут стекло или трогают лаву
В общем, еще одна индустрия пострадала от АИ 🌝
PlayHT представила PlayDiffusion для точного редактирования речи
Компания Play.AI решила главную проблему синтеза речи — невозможность редактировать отдельные слова без артефактов.
Их новая модель PlayDiffusion использует диффузионный подход вместо авторегрессивного. Например заменить "Neo" на "Morpheus" в уже сгенерированной фразе, сохранив естественность речи.
Модель работает через маскирование: выделяет нужный фрагмент, заменяет его на основе нового текста, при этом контекст остается целостным.
Чёрное зеркало,- подмена реальности.
#PlayDiffusion #SpeechSynthesis #AudioEditing
------
@tsingular
Adobe запускает LLM Optimizer - конец эпохи SEO?
Adobe представила инструмент LLM Optimizer для оптимизации контента под ИИ-чатботы вроде ChatGPT, Gemini и Claude.
Трафик с генеративного ИИ на ритейл-сайты США вырос на 3500%, на туристические - на 3200% за год. Люди всё чаще ищут информацию через чатботы вместо Google.
Инструмент отслеживает, как бренды появляются в ответах ИИ, находит пробелы в видимости и предлагает улучшения "в один клик". Даже оценивает денежную стоимость потенциального трафика.
Традиционное SEO может уйти в прошлое - ведь чатботы работают не как поисковики. Новый золотой век оптимизации под ИИ уже начался.
#LLMOptimization #AdobeAI #AITraffic
------
@tsingular