tsingular | Неотсортированное

Telegram-канал tsingular - Технозаметки Малышева

2602

Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb

Подписаться на канал

Технозаметки Малышева

Гугл выпускает новые очки на базе Android XR
На демо одна из возможностей - перевод с разных языков в реальном времени.

Есть вопросы по скрытой видеосъемке, конечно, но выглядит перспективно.

https://www.youtube.com/live/o8NiE3XMPrM?si=iHgR_eH85c8xXzLK&t=10404

#Google #androidXR
———
@tsingular

Читать полностью…

Технозаметки Малышева

⚡️ Google дропнула РЕВОЛЮЦИЮ — Veo 3 не просто генерирует видео в 4К, а добавляет ЛЮБЫЕ звуки, реплики персонажей и целые диалоги.

Доступ уже открыли — тут.

🙂 Не баг, а фича

Читать полностью…

Технозаметки Малышева

🚀 Серверы MCP для Dynamics 365: автономное предприятие здесь и сейчас

Microsoft объявила о выпуске серверов Model Context Protocol (MCP) для Dynamics 365 ERP и CRM на конференции Build 2025.
Это серьезный шаг к созданию "автономного предприятия", где для каждой задачи будет "агент", а не просто "приложение".

⚡️ Ключевые возможности Серверов с MCP:
- Устраняют разрозненность данных и приложений, позволяя агентам беспрепятственно работать в разных процессах
- Стандартизируют способ предоставления контекста языковым моделям
- Значительно сокращают сложность разработки агентов для партнеров и клиентов
- Автоматически синхронизируют действия и знания, обеспечивая обновления в реальном времени
- Значительно упрощают поддержку агентов и минимизируют затраты на обслуживание

🛡 Встроенная безопасность:
- Требуют аутентификации пользователя Dynamics 365 (с защитой Entra ID)
- Предотвращают эскалацию привилегий — агент выполняет только авторизованные действия
- Поддерживают корпоративные стандарты безопасности — DLP и разнообразные методы аутентификации
- Доступны через инфраструктуру коннекторов Microsoft Copilot Studio

ноябрь 2024 - MCP протокол запущен Антропиком.
май 2025 - MCP сервера от Майкрософт.
Невероятная скорость развития технологии на наших глазах.
Теперь осталось все API в мире переписать на MCP

#Microsoft #Build2025 #Dynamics365 #MCP #Агенты
———
@tsingular

Читать полностью…

Технозаметки Малышева

Письмо от CEO Duolingo о переходе к AI-first подходу (как когда-то был mobile-first подход)

Мой текущий страйк 13 🔥 поэтому вот вам интересная новость про Дуолинго

Разделяю каждое слово в этом письме. Ждать нельзя, иначе останешься далеко позади.

Перевод письма:

Я говорил это на Q&A и многих встречах, но хочу сказать официально: Duolingo становится AI-first.

ИИ уже меняет то, как мы работаем. Вопрос не в том, случится ли это — это уже происходит. Когда изменения такого масштаба — самое худшее, что можно сделать, это ждать. В 2012 мы сделали ставку на мобильные. Пока другие делали сопутствующие приложения к сайтам, мы решили строить всё с нуля под мобильные — потому что верили, что за этим будущее. Это решение принесло нам звание «Приложение года» в App Store и дало старт нашему органическому росту.

Тогда ставка на мобильные всё изменила. Сейчас мы делаем похожую ставку, и новая платформа — это ИИ.

ИИ — это не просто рост продуктивности. Он помогает нам приблизиться к нашей миссии. Чтобы хорошо обучать, нужно создавать огромное количество контента — и вручную это не масштабируется. Одно из лучших решений, которое мы приняли недавно, — заменить наш медленный процесс создания контента на такой, где ключевую роль играет ИИ. Без него нам потребовались бы десятилетия, чтобы масштабировать контент для большего числа учеников. Мы обязаны нашим ученикам доставить им контент как можно быстрее.

ИИ также помогает нам строить такие функции, как видеозвонки, которые раньше было невозможно реализовать. Впервые в истории обучение, сравнимое с лучшими репетиторами, стало достижимо.

Быть AI-first — значит переосмыслить, как мы работаем. Маленькие изменения в системах, изначально созданных для людей, не приведут нас к цели. Во многих случаях нам придётся начать с нуля. Мы не будем перестраивать всё за ночь, и некоторые вещи — вроде обучения ИИ понимать наш код — займут время. Но мы не можем ждать, пока технологии станут идеальными. Мы предпочитаем двигаться с чувством срочности и допускать небольшие потери в качестве, чем идти медленно и упустить момент.

Мы внедрим несколько полезных ограничений, чтобы направить этот переход:
• Постепенно откажемся от подрядчиков для задач, которые может выполнять ИИ
• ИИ будет критерием при найме новых сотрудников
• ИИ будет учитывать при оценке эффективности работы
• Новые сотрудники появятся только если команда не может автоматизировать свою работу
• Большинство функций получат инициативы для фундаментального изменения рабочих процессов

При всём этом, Duolingo остаётся компанией, которая заботится о своих сотрудниках. Речь не идёт о замене Duos ИИ. Речь о снятии узких мест, чтобы наши выдающиеся Duos могли делать больше. Мы хотим, чтобы вы фокусировались на творческих задачах и решении реальных проблем, а не на рутинной работе. Мы обеспечим вас обучением, менторством и инструментами для работы с ИИ.


🎚️ Перемены могут пугать, но я уверен — для Duolingo это будет сильный шаг вперёд. Это поможет нам лучше выполнять свою миссию. А для Duos это означает — оставаться впереди и использовать технологии, чтобы добиваться результатов.

Читать полностью…

Технозаметки Малышева

Mochi видео генератор, которому пару недель назад нужно было 4 H100 для запуска, поднялся у меня на локальном серваке на 2х4090.
И теперь, не выходя в интернет, можно уверенно вот такие ролики по 120 кадров создавать 24х7.

Это текст2видео, но, наверное, через клипвижн можно и картинку2видео сделать. Ip-адаптеров пока нет только, так что точного переноса формы пока не сделать, но, думаю, скоро подтянутся.

Вообще фантастика, как за год мы от облачных Уилл Смитов с макаронами перешли к вполне консистентному видеоряду на локальных ПК.

#видео #ComfyUI #mochi #нейрорендер
———
@tsingular

Читать полностью…

Технозаметки Малышева

Microsoft представила Magentic-One: мульти-агентную систему следующего поколения

Microsoft Research анонсировала передовую мульти-агентную систему на базе AutoGen framework.
Ключевая особенность - пять специализированных агентов под управлением главного оркестратора.
Система демонстрирует state-of-the-art результаты в тестах GAIA, AssistantBench и WebArena.
Архитектура включает работу с файлами, веб-навигацию, программирование и выполнение кода.

Оркестратор: главный агент, который разбивает задачи на части, планирует работу, руководит остальными агентами и следит, чтобы всё шло по плану. Если что-то идёт не так - вносит исправления.
WebSurfer: агент на базе LLM, который умеет управлять браузером на основе Chromium. Когда получает запрос - выполняет действие в браузере и докладывает, что изменилось на странице. Что умеет делать:
- переходить по ссылкам и искать в интернете
- кликать и печатать на страницах
- читать контент (делать краткие выжимки, отвечать на вопросы)
Для работы использует дерево доступности браузера и специальные промпты с метками.
FileSurfer: агент на базе LLM, который работает с программой просмотра файлов в формате markdown. Может читать почти любые локальные файлы. Умеет просматривать содержимое папок и перемещаться между ними.
Coder: агент на базе LLM, заточенный на написание кода. Анализирует информацию от других агентов и создаёт новые файлы/программы.
ComputerTerminal: дает команде доступ к консоли, где можно запускать программы от Coder'а и ставить новые библиотеки.

Task Ledger и Progress Ledger обеспечивают отслеживание задач и прогресса.
Поддерживает различные LLM модели, включая GPT-4o и OpenAI o1-preview.
Особое внимание уделено безопасности - система работает в изолированных контейнерах с проверкой.

Выглядит очень интересно. Пробуем.

#Microsoft #MagenticOne #AutoGen
-------
@tsingular

Читать полностью…

Технозаметки Малышева

OpenAI приобрала chat.com

Разработчик ChatGPT приобрёл домен chat.com у основателя HubSpot Дармеша Шаха.
Стоимость транзакции превысила $15.5 млн, оплата произведена ценными бумагами.
Сделка является частью масштабного ребрендинга продуктов OpenAI.
Сэм Альтман официально подтвердил покупку в социальной сети X разместив короткий пост со ссылкой на домен.

ИМХО Дамреш выиграл. 15 лямов акциями очень быстро подрастут.

#OpenAI #HubSpot #Domain
-------
@tsingular

Читать полностью…

Технозаметки Малышева

Пример от NVidia по интеграции локального ИИ в Obsidian

NVIDIA представила инструкцию по внедрению генеративного ИИ в популярный редактор заметок Obsidian.
Система функционирует через локальные LLM-модели с применением llama.cpp и серверов LM Studio или Ollama.
Разобраны примеры генерации текста и Smart Connections для интеллектуального поиска по заметкам.
Решение не требует подключения к внешним API и использует локальные вычисления на графических процессорах RTX.

В копилку примеров по работе с локальными моделями! 🔒✍️

#Obsidian #NVIDIA #LLM
-------
@tsingular

Читать полностью…

Технозаметки Малышева

Project Zero: LLM теперь ищет уязвимости в коде вместо людей

Google DeepMind и Project Zero создали систему Big Sleep для автоматического обнаружения уязвимостей в программном коде.

В ходе тестирования удалось найти реальную уязвимость переполнения буфера стека в SQLite, которую не смог обнаружить классический фаззинг за 150 часов работы.

Система использует GPT-4 Turbo и Gemini 1.5 Pro для анализа кода, коммитов и создания тестовых сценариев.

Эффективность поиска уязвимостей выросла в 20 раз по сравнению с традиционными методами в тестах CyberSecEval2.

Это первый публичный случай, когда ИИ самостоятельно нашел критическую уязвимость в популярном ПО.

Можно перед деплоем прогонять весь код через ИИ! 🤖🔍

#ProjectZero #DeepMind #SQLite #ИБ
———
@tsingular

Читать полностью…

Технозаметки Малышева

https://www.perplexity.ai/elections/2024-11-05/us/president

Ух-ты. на Perplexity в реальном времени можно посмотреть за гонкой в Штатах.

#выборы #perplexity
———
@tsingular

Читать полностью…

Технозаметки Малышева

Anthropic призывает к срочному регулированию ИИ в ближайшие 18 месяцев

Необходимо оперативное внедрение превентивного контроля над развитием искусственного интеллекта.
Особую тревогу вызывает стремительный рост возможностей нейросетей в программировании и кибербезопасности.
Предложена Политика ответственного масштабирования с пороговыми значениями и регулярной оценкой моделей.
Регулирование должно быть гибким и адаптивным, направленным на предотвращение катастрофических рисков.
Подчеркивается важность международной координации и стандартизации требований безопасности.

Антропик дурного не посоветует. 18 месяцев это прям очень скоро.

#Anthropic #Regulation #Safety
-------
@tsingular

Читать полностью…

Технозаметки Малышева

В HeyGen новая фича - Photo Avatar

И да, она тоже связана с тренировкой своих аватаров на пачке входных изображений.

Почитайте полный пайплайн тут:

Если вкратце: Flux, Magnific, Heygen, Elevent Labs, chatGPT, Topaz

Ну, за дикторов и блоггеров..

@cgevent

Читать полностью…

Технозаметки Малышева

Claude 3.5 Haiku: самая быстрая модель Anthropic обошла Opus 3.0 и стала в 3 раза дороже

Anthropic выпустила анонсированную ранее обновленную версию Claude 3.5 Haiku.
Основные изменения: улучшенное написание кода, работа с функциями, логические рассуждения, классификация и обработка данных.
Функционал будет полезен при создании агентов для разработки ПО, чат-ботов и модерации контента.
Планируется добавление поддержки изображений и расширенной обработки больших массивов информации.

Все вот сравнивают с 4o-mini и Gemini Flash, так как модель реально в этой нише играет, но ведь по-сути это Opus в 15 раз дешевле!

#Anthropic #Claude35 #Haiku
-------
@tsingular

Читать полностью…

Технозаметки Малышева

Standard Intelligence представляет Hertz-dev: голосовой ИИ с рекордной скоростью генерации

Hertz-dev - публичная аудио-модель с 8.5B параметров для двустороннего общения.

Трансформер обеспечивает задержку всего 65мс в теории и 120мс на практике через RTX 4090.

Разработка вдвое быстрее существующих аналогов при обработке аудиопотока.

Система поддерживает одно- и двухканальное аудио, и требует всего 9 секунд записи для анализа и тренировки.

Запускается на Ubuntu или MacOS, необходимы Python 3.10 и CUDA 12.1.

Жаль, что эта версия, похоже, только на английском, но думаю уже очень скоро можно будет локально поднять полноценного голосового ассистента, неотличимого от живого оператора.
60мс на генерацию ответа, - это очень сильно. 🎙🤖

Github

#StandardIntelligence #HertzDev #RealTimeAudio
———
@tsinuglar

Читать полностью…

Технозаметки Малышева

MIT разработал революционные 3D-нанотранзисторы

Учёные MIT создали уникальные трёхмерные транзисторы размером всего 6 нанометров.
Устройства базируются на вертикальных нанопроводах из антимонида галлия и арсенида индия.
Вместо классического преодоления барьера применяется квантовое туннелирование.
Производительность в 20 раз превышает существующие аналоги при меньшем энергопотреблении.
Технология преодолевает 'тиранию Больцмана' - фундаментальное ограничение минимального напряжения.

Похоже, закон Мура ещё поживёт. Квантовая физика спешит на помощь! 🔬

#MIT #nanotechnology #quantum
-------
@tsingular

Читать полностью…

Технозаметки Малышева

На Google I/O 2025 показали Veo 3 для видео с аудио, Imagen 4 для чётких картинок и Music AI Sandbox для создания музыки.

Все модели вместе объединяет сервис Flow, который позволяет создать ролик по своему запросу, начиная от кадров, заканчивая музыкой.

rozetked.me/news/39323

Читать полностью…

Технозаметки Малышева

Google показал живой перевод речи в Google Meet

В компании обещают, что сгенерированный перевод сохранит звучание и тон голоса.

На данный момент Meet переводит только с английского на испанский и наоборот. Скоро появится поддержка итальянского, немецкого и португальского языков.

Функция перевода уже доступна платным подписчикам, а в конце этого года Google откроет ее для компаний.

https://www.theverge.com/news/670322/google-meet-gemini-translation-ai-english-spanish

Читать полностью…

Технозаметки Малышева

🤖 Китайский центр тренировки роботов: промышленный подход к будущему автоматизации

Пока западные стартапы собирают прототипы гуманоидных роботов в гаражах и лабораториях, Китай запустил полномасштабный центр тренировки роботов промышленного уровня.

Этот центр под руководством Дженка Инфанга представляет собой настоящую "школу" для роботов с реальными тренировочными средами.

Ключевая идея центра — генерация высококачественных наборов данных для тренировки ИИ-моделей, управляющих роботами.

📊 Масштаб проекта:
- Обучаются около 100 гуманоидных роботов
- Создано 10 реалистичных тренировочных сред
- Каждый робот генерирует 100-200 записей данных ежедневно
- Уже подключено около 10 экосистемных партнёров

🏫 Структура центра:
Зона общих навыков — аналог 9-летней интегрированной системы образования
Зона профессионального обучения — специализированные сценарии для конкретных ролей

🏠 Тренировочные среды включают:
- Симуляции домашнего пространства для деликатных операций (сбор фруктов, яиц)
- Спальня и балкон для операций с мягкими материалами (складывание полотенец, застилание кроватей)
- Сельскохозяйственные окружения для сбора урожая

💡 Практическое применение:
- Роботы-домработники для повседневных задач
- Складские роботы для супермаркетов
- Специализированные роботы для уникальных задач

Центр специализируется на создании роботов с пропорциями, близкими к человеческим — это позволяет им работать в тех же пространствах и выполнять те же задачи, что и люди.

Вместо людей.
Скоро в каждой гостинице, а затем и в доме.

source

#роботы #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

Первая в мире нейроинтеграция ИИ с мозгом живого существа

Отечественные нейробиологи достигли исторического прорыва в области прямого подключения искусственного интеллекта к биологическому мозгу.
Эксперимент включал разработку специального импланта для интеграции нейронных сетей с живой нервной тканью.
Подопытная особь демонстрирует стабильный отклик на нейроинтерфейс, что подтверждает успешность технологии.
Достижение открывает перспективы развития биокибернетических систем и нейропротезирования.

Похоже, киборги уже не фантастика. Главное, чтобы крысы не захватили мир через нейросеть! 🐀🤖

Крыса с нейроимплантом выбирает правильные ответы. Идеально для голосований 😀

#neuroscience #biotech #implant
-------
@tsingular

Читать полностью…

Технозаметки Малышева

небольшой оффтопик, - а ведь сейчас за 4 года можно было бы двинуть отличную тему,- ИИ в президенты 2028.
У Маска сейчас карт-бланш, технологии готовы, в принципе. why not?

#выборы #США
———
@tsingular

Читать полностью…

Технозаметки Малышева

Microsoft добавляет в Блокнот функцию AI-редактирования текста

Функция Rewrite появится в базовом Блокноте Windows.
Утилита позволяет перефразировать предложения, настраивать тональность и изменять размер текста.
Нововведение на данный момент доступно пользователям Windows Insiders в США, Великобритании, Франции, Канаде, Италии и Германии.
Работа системы требует облачной авторизации через учетную запись. В России только через смену страны привязки профиля и VPN.
Функционал дополняет недавно внедренную проверку орфографии и автокоррекцию.
Параллельно компания тестирует ИИ-инструменты для редактирования изображений в Paint.

ИИ становится базовой функцией офисных ПК.

#Microsoft #Notepad #Rewrite
-------
@tsingular

Читать полностью…

Технозаметки Малышева

Доброго утра всем :)

#юмор
———
@tsingular

Читать полностью…

Технозаметки Малышева

Вдогонку.

IBM выложила полный датасет Гранита:
https://github.com/ibm-granite/granite-3.0-language-models

#IBM #Granite #dataset
———
@tsingualr

Читать полностью…

Технозаметки Малышева

Perplexity предложил помощь New York Times в разгар забастовки

Технические сотрудники NYT устроили забастовку, требуя повышения зарплаты и гибридный формат работы.
CEO Perplexity Аравинд Шринивас предложил поддержку изданию через Twitter, что спровоцировало общественный резонанс.
Между организациями существует напряженность из-за предыдущих претензий NYT по использованию контента для обучения нейросетей.
Руководитель позже уточнил, что речь шла только об инфраструктурной поддержке, а не о замене персонала.

Отличный заход по продаже ИИ решений в компании, где персонал против :)

#Perplexity #NYTimes #WorkersRights
-------
@tsingular

Читать полностью…

Технозаметки Малышева

Tencent выпускает самую мощную открытую MoE модель в мире

Hunyuan-Large устанавливает новый стандарт производительности языковых моделей с 389 млрд параметров.
Архитектура Mixture of Experts, контекстное окно в 256K токенов.
Система превосходит LLama3.1-405B на 2.6% в MMLU и на 3.6% в математических тестах.
Модель демонстрирует выдающиеся результаты в задачах на китайском языке, программировании и научных вычислениях.

HuggingFace
GitHub

Китайские модели умеют в оптимизацию, получается. При меньшем объеме показывают лучший результат. 😎

#Tencent #Hunyuan #MoE #Китай
-------
@tsingular

Читать полностью…

Технозаметки Малышева

🖥 LibreChat — это полностью открытая платформа для развертывания собственного чат-бота, аналогичного ChatGPT.

🌟 Приложение поддерживает интеграцию с различными AI-моделями (OpenAI, Anthropic и др.) и функции, такие как переключение моделей, поиск сообщений, многопользовательский доступ и мультимодальные данные (текст, файлы, изображения). Проект предназначен для гибкой настройки и развертывания как локально, так и в облаке.

🔐 Лицензия: MIT

🖥 Github

@data_analysis_ml

Читать полностью…

Технозаметки Малышева

Meta* разрешила военное применение Llama моделей в США

Корпорация Meta* радикально изменила политику использования своих ИИ-моделей, открыв доступ оборонному сектору США.
К проекту присоединились AWS, Microsoft, IBM, Lockheed Martin, Oracle, Palantir и другие федеральные подрядчики.
Технологии планируется задействовать для диагностики военной техники, планирования операций, кибербезопасности и борьбы с терроризмом.
Стратегическая цель - укрепление технологического превосходства США в сфере ИИ-разработок.

Документация приводится к соответствию с реалиями. Вполне предсказуемо.

Meta* - запрещенная на территории Российской Федерации организация.

#Meta #Llama #Military
-------
@tsingular

Читать полностью…

Технозаметки Малышева

Daily Dose of Datascience выложили полную подборку материалов в 1 PDF.
Рекомендую, - очень просто, понятно и интересно пишут про DS методы.

530+ страниц с 150+ ключевыми уроками .

файл в комментарии.

#dailydoseofdatascience #обучение
———
@tsingular

Читать полностью…

Технозаметки Малышева

Kling "Custom Models" - это вообще-то прорыв.

Это вам не image2video.
Это не face swap и метадипфейки.
Это не LivePortrait и метамокап.
По смыслу это ближе всего к Hedra - но это все равно из прошлого поколения, где на входе одна картинка, которая натягивается на порождения латентного разума.

Здесь на входе - видео. Еще одно измерение. Из которого Клинг тащит информацию о консистентности и ворлдмоделистости. На входе Лор для картинок - картинки. На входе Лор для Клинга - видосы.

Как они за 15 минут тренят Лоры - ума не приложу. Подозреваю, что у них есть и более медленные, но качественные настройки.
Также подозреваю, что остальные товарищи также сейчас расчехлятся с Лорами.

Но самое интересное, что народ уже делает постметаЛоры - берет картинку из Midjourney(wherever), делает из нее видосы Клингом же. Кормит эти видосы Клингу же, как материал для обучения. И получает Лору, для генерации консистентнейшего видео с этим самым персонажем из Midjourney.

Тут за кадром вопрос, что на реальных видосах (для обучения лор) динамика движения кожаного лица натуральная, скажем так. А на сгенеренных по Midjourney-картинке видосах - динамика клинго-изобретенная. По которой он выдаст Лору. Иимбридинг, так сказать. Но это мелочи.

В общем, стоп-кран сорван. Видео-лоры в городе. И щас пойдет борьба за юзера и тарифы.

@cgevent

Читать полностью…

Технозаметки Малышева

NVIDIA представили универсальную платформу автоматизации видеоанализа

NVIDIA представила решение AI Blueprint - для комплексного анализа видеопотока.

Система объединяет передовые VLM и LLM модели с Graph-RAG технологиями для обработки визуальных данных.

Функционал включает анализ длительных видео, live-трансляций, построение графов знаний и интерактивный Q&A.

Dell, Lenovo и K2K уже интегрируют технологию в свои решения для умных городов и промышленности.

Теперь камеры видеонаблюдения не просто смотрят, но и понимают происходящее! 🤖
Интеллектуальные, осмысленные уведомление о происходящем в видеокадре.
Прототипы были уже около года назад, теперь вот промышленные решения подтянулись.

#NVIDIA #Blueprint #видеоаналитика
———
@tsingular

Читать полностью…
Подписаться на канал