$100млн! Крупнейшая сделка по внедрению ИИ в телекоме: T-Mobile заплатит OpenAI в течение 3 лет
OpenAI займется разработкой нового чат-бота для обслуживания клиентов телеком-оператора, который будет сосредоточен на запоминании данных, специфичных для клиентов, и использовании генеративного ИИ для ответа на большую часть их вопросов без участия человека.
T-Mobile заявили, что планируют выпустить инструмент в следующем году.
Сделка станет одной из крупных, которые OpenAI заключила с корпоративным клиентом на данный момент.
На мировом рынке появляются регулируемые DeFi, а общая стоимость средств превышает $100 млрд
Об этом говорится в отчете "DeFi's Next Frontier".
Доля DEX в общем TVL(сумма криптоактивов, которые пользователи разместили в DeFi-протоколах) снизилась с пикового значения 28% ($75 млрд) в 2020-2022 годах.
Крупнейший провайдер ликвидного стейкинга Lido контролирует около 60% рынка LST. Фонд Blackrock's BUIDL за менее чем год привлек более $500 млн
Основные тренды:
1. Рост институционального участия:
- Появление регулируемых DeFi-продуктов для институциональных инвесторов
- Интеграция традиционных финансовых активов (RWA) в DeFi
- Развитие гибридных финансовых моделей
- Развитие yield AMM протоколов
- Внедрение ИИ для оптимизации торговых стратегий
- Использование zero-knowledge proofs для обеспечения приватности
- Развитие кросс-чейн инфраструктуры
2. Новые финансовые продукты:
- Токенизация реальных активов
- Фракционализация интеллектуальной собственности
- Развитие протоколов кредитования на основе on-chain данных
- Торговое и дебиторское финансирование
Ожидается:
- дальнейшая интеграция TradFi и DeFi через гибридные модели.
- Увеличение роли ИИ в управлении протоколами
- Расширение использования real-world активов в DeFi.
Ну, что, робототехника от ex-Google рвёт всех. Джефф Безос, Thrive Capital и Lux Capital вложили $400 млн в Physical Intelligence, разрабатывающий программное обеспечение для роботов
О продукте (GPT для роботов) этого стартапа мы писали на прошлой неделе тут.
А старте стартапа писали здесь.
Их новая модель Vision-Language-Action Flow устраняет разрыв между предварительным обучением в масштабе Интернета и ловкостью робота.
10 лет назад некоторые думали, что для автоматизации, например, прачечной нужно создать новую инфраструктуру, но, похоже, роботы будут настолько хороши, что смогут использовать инфраструктуру, разработанную для людей.
50 компаний, создающих ИИ-агентов. Огромные изменения в сфере ПО: от SaaS к системе ИИ-агентов
Мы стоим на пороге фундаментальных изменений в том, как работает ПО. Происходит революционный переход от традиционных SaaS-решений к ИИ-системам, которые действуют как самостоятельные работники.
Масштаб изменений:
- Ожидаемый объем рынка: $4.6 триллиона в ближайшие 5 лет
- Затрагивает все сферы: от продаж до здравоохранения
- Особенно важно для отраслей с низкой цифровизацией (страхование, юриспруденция)
Три фазы эволюции:
1️⃣ Традиционные системы (Фаза 1):
- Ручной ввод данных
- Работа только со структурированной информацией
- Ограниченная эффективность из-за человеческого фактора
- Пример: Salesforce
2️⃣ Появление ИИ (Фаза 2):
- Автоматический сбор всех типов данных
- Работа с неструктурированной информацией
- Активное участие в рабочих процессах
- Анализ реальных сигналов вместо субъективных оценок
3️⃣ Система Агентов (Фаза 3):
- ИИ-агенты работают как команда
- Каждый агент специализируется на конкретных задачах
- Постоянное обучение и улучшение
- Автономное принятие решений
Ключевые преимущества нового подхода:
- Круглосуточная работа без перерывов
- Решение проблемы нехватки кадров
- Выполнение задач, на которые у людей никогда не хватало времени
- Более точное и эффективное принятие решений
- Автоматическая обработка огромных объемов данных
Новая модель монетизации:
- Переход от оплаты за пользователя к оплате за результат
- Доступ к бюджетам на персонал вместо ИТ-бюджетов
- Более гибкое ценообразование, основанное на реальной ценности
Мы находимся на пороге новой эры, где ПО перестает быть просто инструментом и становится активным участником бизнес-процессов. Компаниям важно уже сейчас начать подготовку к этой трансформации, чтобы остаться конкурентоспособными в новых условиях.
Итоги уходящей недели в России и мире, что имеет значение
Текст недели: основатель Y Combinator о том, что ближайшие 20 лет писать смогут единицы. Думать – тоже.
1. Российская компания Neiry впервые покажет крыс с нейрочипами 5 ноября.
2. Выходцы из Google Brain оцифровали запах.
3. Китай может создать AGI на 6-12 месяцев раньше США. Каким образом, читайте тут.
4. В 2030г. Минпромторг хочет начать разработку ПО для проектирования процессоров 16 нм, которая еще не освоена в РФ.
5. Билл Гейтс задаёт тон главной теме: в чем конкурентоспособность человека в эпоху ИИ?
6. Экс-сотрудники Google создали первый "GPT для роботов".
7. Ключевые инсайты со OpenAI DevDay в Лондоне и Q&A с Сэмом Альтманом.
8. Свежий отчет BCG о том, где искать ценность в ИИ.
9. Минцифры РФ планирует создать собственное Linux-сообщество из-за отстранения российских разработчиков от мирового IT-сообщества.
10. Создана 1-ая базовая ИИ-модель человеческого познания.
11. Прогноз McKinsey по 18 перспективным рынкам будущего до 2040 года.
12. BCG: к 2030г. объем токенизированных фондов достигнет $600 млрд.
13. GitHub добавил поддержку Gemini, Claude и o1 в Copilot.
14. OpenAI создает свой чип с Broadcom, который будет производиться на TSMC.
15. Baidu представила ТОП-10 инноваций 2024 года.
16. NVIDIA разработала нейронную сеть для управления телом робота.
17. Anthropic представил обновленного ИИ-агента на базе модели Claude 3.5 Sonnet.
18. Борьба за ИИ-поиск в разгаре: OpenAI запустили веб-поиск в ChatGPT. Конкуренция с Perplexity растет.
19. Опубликована дорожная карта по интеграции ИИ-агентов в научные исследования.
20. Anthropic готовится к появлению сознательного ИИ и наняла 1-го сотрудника, который будет заниматься правами ИИ.
21. Команда Цукерберга создала с ИИ карту эмбрионального развития. От первой клетки до целого организма.
22. Как взломать робота, управляемого LLM.
23. Насколько эффективно сотрудничество человека и ИИ? Ответ здесь.
24. Цукерберг создает свой поисковик.
⚡️Команда Цукерберга создала с ИИ карту эмбрионального развития. От первой клетки до целого организма
Команда ученых из Chan Zuckerberg Biohub в Сан-Франциско создали революционный научный проект Zebrahub - новый цифровой атлас, который отслеживает развитие эмбрионов рыбки данио с беспрецедентной детализацией.
Zebrahub будет служить основой для будущих исследований развития организмов, включая человека, так как у этой рыбки данио 70% генов похожи с человеческими.
Специально для проекта была разработана программа Ultrack, которая использует ИИ для:
- Автоматического распознавания клеточных ядер.
- Отслеживания их движения в трехмерном пространстве.
- Анализа перемещений клеток во времени.
Zebrahub - это инструмент, который позволяет:
1. Наблюдать, как из одной клетки формируется целый организм.
2. Отслеживать, как клетки перемещаются и "принимают решения" о том, какую роль они будут играть в организме.
3. Видеть, какие гены активируются или деактивируются в процессе развития.
Эта информация является ключевой для понимания:
1. как возникают заболевания?
2. как можно использовать механизмы развития для регенерации?
Проект разрабатывался 5 лет и потребовал сотрудничества специалистов из разных областей: биологии, инженерии, оптики, физики и науки о данных.
Это значительный шаг вперед в понимании того, как формируются живые организмы.
Ранее, эта же организация создала виртуальную клетку человека.
Nebius Аркадия Воложа открыла свой ЦОД для ИИ в США
До этого компания открыла GPU кластер в Париже, а также у нее есть цоды в других городах Европы.
Борьба за ИИ-поиск в разгаре: OpenAI запустили веб-поиск в ChatGPT. Конкуренция с Perplexity растет.
Разбираем, что это значит для рынка.
OpenAI вчера, на Halloween, объявила о полномасштабном запуске веб-поиска в ChatGPT. Доступно пока только для Plus и Team пользователей.
Теперь ChatGPT можно использовать похожим образом, как и Perplexity - для поиска информации, проверки источников и создания отчетов на основе найденных данных. Пока неясно, насколько это создаст конкуренцию Google Search, но это сильный удар по Perplexity, так как теперь похожий функционал доступен на гораздо более популятной платформе.
Вот, что из себя представляет новый поиск:
• Интегрирован в ChatGPT поиск по актуальным данным
• у OpenAI есть партнерства с ведущими СМИ мира (AP, Reuters, FT и др.)
• Автоматическое определение необходимости поиска
• Сохранение контекста беседы при поиске
• Визуально обогащенные ответы для погоды, спорта, акций
Ключевые преимущества:
1. Огромная существующая база пользователей ChatGPT
2. Мощная языковая модель GPT-4 в основе
3. Интеграция с экосистемой OpenAI
4. Прямые партнерства с издателями
5. Возможность верификации источников
Что есть у конкурентов?
Perplexity AI:
+ Первопроходец в AI-поиске
+ Специализированный фокус
+ Более структурированные ответы
- Меньшая пользовательская база
- Ограниченные ресурсы
Google:
+ Огромная поисковая база
+ Развитая инфраструктура
+ Доверие пользователей
- Медленное внедрение AI
- Консервативный подход
Bing + ChatGPT:
+ Интеграция с Microsoft
+ Ранний выход на рынок
- Ограниченное проникновение
- Менее популярный, чем Google
Что это значит для рынка:
1. Краткосрочно:
• Передел рынка ИИ-поиска
• Давление на специализированные сервисы
• Ускорение внедрения ИИ у конкурентов
2. Долгосрочно:
• Изменение привычек поиска информации
• Новый стандарт поисковых интерфейсов
• Рост значимости прямых партнерств с издателями
Перспективы OpenAI:
• Интеграция с Advanced Voice и Canvas
• Расширение возможностей для шоппинга и путешествий
• Углубление исследовательских возможностей
• Развитие специализированных вертикалей
Все это в очередной раз нам показывает инновационный цикл развития: сначала небольшие стартапы проверяют и подтверждают потребность рынка в определенных функциях, а затем крупные компании с большими языковыми моделями входят на этот рынок и захватывают значительную долю пользователей.
❗️Билл Гейтс задаёт тон главной теме: в чем конкурентоспособность человека в эпоху ИИ?
Гейтс говорит, что ИИ станет настолько хорош в решении проблем и создании интересных занятий для людей, что нам понадобится новая религия или философия, чтобы оставаться на связи друг с другом.
В 2030г. Минпромторг хочет начать разработку ПО для проектирования процессоров 16 нм, которая еще не освоена в РФ.
На данный момент в РФ доступно производство процессоров с топологией 180 нм и 90 нм, обе линии освоены фабрикой «Микрон». Отечественные дизайн-центры сейчас используют софт зарубежных Synopsys и Cadence для проектирования чипов.
Общие затраты на научно-исследовательские и опытно-конструкторские работы по планам Минпромторга должны составить 54,6 млрд руб. до 2030 года, а ожидаемая выручка достичь 7,2 млрд руб., из них 3,6 млрд руб. от программ для разработки микросхем.
❗️Baidu представила ТОП-10 инноваций 2024 года
За последние 10 лет компания вложила $23.4 млрд в исследования ИИ и лидирует в Китае по патентам (19,000+ заявок).
1. ИИ-агенты нового поколения
- Снижает затраты на разработку
- Применяется на платформе ERNIE Agent и в Baidu Comate
2. Эволюция мультимодельного обучения
- Увеличение скорости обучения ERNIE в 4.1 раза за год
3. Система создания контента
- Лидерство на рынке создания презентаций (80% доля)
- Платформа Baidu Wenku
4. Автономное вождение
- Снижение затрат на картографирование на 95%
- Покрытие 3.6 млн км дорог
- Охват 41,000 городских и сельских районов
- Уменьшение размера карт на 97.5%
5. ИИ с "человеческой" памятью
- Имитация работы гиппокампа
- Используется в ИИ-ассистентах
6. Цифровые аватары
- Качество визуализации на уровне кино
- Применение в стримах
- Реалистичное 3D-клонирование
7. Генеративный коммерческий поиск
- Повышение эффективности таргетинга на 120%
- Прямое кодирование коммерческой информации
- Новая парадигма "Model as Index"
8. Data Flywheel
- Автоматическое определение недостатков модели
- Синтез тренировочных данных
- Снижение затрат на данные
9. Высокоэффективный вывод
- Экономия 50% затрат на развертывание
- Увеличение производительности в 3-5 раз
- Технологии: PrefixCaching, Lookahead, PagedAttention
10. Система поиска на основе пользовательских данных
- Охват 18% поискового трафика Baidu
- Быстрая самоадаптация
- Применение в поиске текста, видео и изображений
BCG: к 2030г. объем токенизированных фондов достигнет $600 млрд (1% от глобальных взаимных фондов и ETF)
Токенизированные фонды-фонды, где права собственности на доли представлены в виде цифровых токенов на блокчейне.
Они работают аналогично тому, как сегодня трансфер-агенты учитывают акции фондов.
Успешные примеры уже есть: Franklin Templeton запустил свой первый зарегистрированный в США фонд на блокчейне в 2021 году, а BlackRock в 2024 году запустил фонд BUIDL, который быстро достиг капитализации более $500 млн.
Токенизированные фонды имеют преимущества как взаимных фондов, так и ETF:
- предлагают высокую прозрачность цен
- обеспечивают лучшую ликвидность
- упрощают управление обеспечением по сравнению с взаимными фондами.
На конец 2024 года объем токенизированных активов под управлением составляет более $2 млрд.
Существует потенциальный спрос на $290 млрд со стороны владельцев цифровых активов.
При разрешении конвертации существующих фондов в токенизированные, объем может достичь триллионов $.
Ожидается переломный момент в течение следующих 12-18 месяцев. Рост будет связан с развитием регулируемых ончейн-денег (стейблкоины, токенизированные депозиты, CBDC).
OpenAI создает свой чип с Broadcom, который будет производиться на TSMC
OpenAI больше не хочет строить собственные заводы по производству чипов из-за затрат и времени, необходимых для создания сети.
А какие были планы по захвату мира чипов….
OpenAI также будет покупать чипы AMD в дополнение к GPU Nvidia для своих серверов ИИ. Специальный чип OpenAI не является GPU.
GitHub добавил поддержку Gemini, Claude и o1 в Copilot
Разработчики смогут выбирать удобную для себя модель, а
компании получат контроль над тем, какие модели доступны их командам.
Функция мультимодельности будет распространена на различные аспекты Copilot:
рабочее пространство, редактирование файлов, проверку кода, автоматическое исправление безопасности и CLI
- OpenAI o1-preview и o1-mini уже доступны.
- Claude 3.5 Sonnet будет развернут в течение следующей недели.
- Gemini 1.5 Pro появится в ближайшие недели
❗️ Открытые модели ИИ отстают от закрытых ~ на 5-22 месяца по производительности - исследование Epoch AI.
В среднем разрыв составляет около 1 года. Meta* со своими открытыми моделями Llama сокращает этот разрыв.
Что значит "открытая" ИИ-модель?
Открытые ИИ-модели - те, чьи веса можно скачать.
Закрытые модели доступны только через API или вообще не выпущены.
Существуют разные степени открытости (различные лицензии и ограничения).
Тенденции:
- С 2019 по 2023 год большинство заметных моделей ИИ были открытыми.
- Наблюдается рост "промежуточных" моделей (с ограниченным доступом).
- Крупные компании по-разному подходят к открытости (например, OpenAI стала более закрытой).
Будущие перспективы:
1. Meta* планирует выпустить Llama 4, которая может сократить разрыв с закрытыми моделями.
2. Экономическая целесообразность открытых моделей остается под вопросом.
3. Открытые модели могут отстать еще больше, если затраты на обучение продолжат расти.
Значение для индустрии:
❗️Годовая задержка дает время для оценки возможностей ИИ перед широким распространением.
❗️Открытые модели способствуют инновациям и исследованиям безопасности ИИ.
Но они также могут сделать потенциально опасные возможности ИИ более доступными.
Влияние на регулирование:
1. Задержка в один год - это короткий период для законодательного процесса.
2. Необходима проактивная оценка возможностей ИИ.
3. Сложнее регулировать открытые модели, так как они могут модифицироваться без надзора.
*Запрещенная в РФ организация.
Бюро 1440 Алексея Шелобкова занялось электроракетными двигателями для космоса
Компания объявила о сотрудничестве с передовой инженерной школой Бауманки по разработке комплексной образовательной программы для студентов «Проектирование электроракетных двигателей».
ЭРД (электроракетные двигатели) - это не двигатели для ракет-носителей, а для спутников.
Общая стоимость создания российского Starlink: ₽445 млрд.
Собственные инвестиции компании: ₽329,06 млрд
Минцифры РФ направит: ₽116 млрд, из которых:
• 78,5 млрд руб. — на запуски и выведение спутников
• 37,5 млрд руб. — льготные кредиты на создание спутников
Почему важна программа с Бауманкой?
- Электроракетные двигатели — критически важная технология для управления спутниками
- Для будущей группировки из 292 спутников (такие планы у компании по запуску к 2027 году) потребуются передовые решения и кадры.
Исходя из этого, мы точно понимаем, что у компании планы по собственной разработке спутников. И видимо, они будут использовать существующие ракеты-носители для запуска (от Роскосмоса).
А есть ли в планах у Бюро 1440 создание своих ракет?
xAI Маска объявил, что с сегодняшнего дня на основе их базовых моделей Grok можно создавать приложения
До конца 2024 года идет публичное бета-тестирование.
Каждый пользователь получает $25 бесплатных кредитов ежемесячно.
Те, кто уже купил предоплаченные кредиты, получат эквивалентную сумму бесплатных кредитов ежемесячно до конца года
API совместим с OpenAI и Anthropic для упрощения миграции.
❗️OASIS - 1-я в мире игра, где ИИ создаёт миры по нажатию клавиш
Представьте, каждое ваше движение, каждый прыжок и каждый удар по блоку заставляют ИИ мгновенно генерировать новую часть мира. Именно это реализовала команда Etched в своём проекте OASIS.
За 3 дня и 7 часов с момента запуска количество уникальных пользователей превысило 1 млн. Сообщают авторы проекта.
Технические особенности:
Oasis работает на специальном ИИ-чипе под названием Sohu, который включает:
1. DiT backbone (архитектура нейронной сети)
2. ViT автоэнкодер
Возможность обработки 4K видео
3. Поддержку моделей с более чем 100 млрд. параметров
Игра была обучена на открытых данных:
- Датасет VPT
- Minecraft датасет от OpenAI (под лицензией MIT).
NotebookLM от Google - это новый CRM
Смотрите, у вас скопилось на протяжении многих лет тысячи имейлов с информацией о сделках, встречах, решениях и тд. И всё это — полностью в неструктурированном виде.
Раньше было два пути:
1. Убивать время на ручное заполнение CRM (как делают все)
2. Оставить всё в почте и смириться.
Но появился третий путь — NotebookLM.
Что можно сделать с ним, спросите вы.
1. Выгружайте весь архив писем
2. Загрузите его в NotebookLM, система всё сама поймёт и сделает.
Теперь вместо:
- Заполнения сотни полей
- Категоризации каждого контакта
- Ручной актуализации данных
Мы просто общаемся с системой на человеческом языке. Хотите узнать историю взаимодействия с компанией за 5 лет? Или найти все встречи с конкретным человеком? Просто спросите ИИ.
Ключевой момент - мы переходим от "люди обслуживают машины" к "машины понимают людей".
Это не просто удобнее. Это сдвиг парадигмы.
Будущее за естественным общением с ИИ.
P.S. Особенно забавно, что раньше для такой обработки данных нужно было писать сложные скрипты. Сейчас даже это делает ИИ.
❗️Опубликована дорожная карта по интеграции ИИ-агентов в научные исследования
Исследователи опубликовали в Cell концепцию ИИ-ученых - систем ИИ, которые могут помогать в биомедицинских исследованиях.
Суть концепции:
Предлагается создание систем ИИ, которые могут скептически мыслить и рассуждать. Эти системы должны не заменять людей-исследователей, а усиливать их возможности. Они сочетают человеческую креативность с возможностями ИИ анализировать большие наборы данных.
Представлены уровни автономности ИИ-агентов (от простого к сложному):
❗️Уровень 0: Нет ИИ-агентов, только инструменты ML
❗️Уровень 1: ИИ как ассистент
❗️Уровень 2: ИИ как соавтор
❗️Уровень 3: ИИ как ученый
Потенциальные области применения:
1. Виртуальное моделирование клеток
2. Программируемый контроль фенотипов
3. Разработка клеточных схем
4. Создание новых терапевтических подходов.
⚡️ Anthropic готовится к появлению сознательного ИИ и наняла 1-го сотрудника, который будет заниматься правами ИИ
Лидеры ИИ начинают задумываться о том, могут ли ИИ-системы в будущем стать чем-то большим, чем просто инструментами, то есть обрести некую форму сознания или способность испытывать что-то похожее на эмоции или страдания.
Кайл Фиш присоединился к команде Anthropic и будет исследовать вопросы "благополучия моделей" и то, как компании должны подходить к этой теме.
Его работа включает изучение сложных философских и технических вопросов:
1. Какие способности нужны системе, чтобы она заслуживала морального отношения
2. Как распознать такие способности в ИИ
3. Какие практические шаги могут предпринять компании для защиты интересов AI-систем
Недавно был опубликован важный отчет, в котором утверждается, что существует "реальная возможность" того, что в ближайшем будущем некоторые ИИ-системы могут стать сознательными или обладать устойчивой агентностью.
Google DeepMind тоже ищут исследователя для работы над вопросами машинного сознания, также OpenAI участвуют в исследованиях по этой теме.
⚡️Экс-сотрудники Google создали первый "GPT для роботов" - теперь они могут понимать человеческие команды и ловко выполнять бытовые задачи.
Экс-сотрудники Google, создавшие компанию Physical Intelligence (π.com!) сделали большой прорыв в области робототехники и ИИ - модель π0 (пи-ноль).
Несмотря на впечатляющие достижения ИИ в таких областях как игра в шахматы или генерация изображений, роботы до сих пор значительно уступают людям в выполнении простых физических задач:
- Сложно научить робота складывать одежду или убирать со стола - это требует решения сложнейших инженерных задач
- Современные роботы узкоспециализированы и могут выполнять только заранее запрограммированные повторяющиеся действия
Что такое π0?
- Это универсальная базовая модель для роботов
- Может управлять различными типами роботов
- Понимает текстовые инструкции
- Работает с изображениями, текстом и физическими действиями
- Обучена на разнообразном наборе данных от 8 различных роботов
Ключевые возможности:
- Модель использует предварительное обучение на основе интернет-данных (как языковые модели)
- Имеет новую архитектуру, позволяющую выдавать команды управления с частотой до 50 раз в секунду
- Может быть дообучена для специализированных задач
- Наследует семантическое понимание из предварительного обучения на интернет-данных
Модель успешно справляется со сложными задачами:
- Складывание белья (включая извлечение из сушилки и аккуратное складывание в стопку)
- Уборка со стола (сортировка посуды и мусора)
- Сборка картонных коробок
- Может адаптироваться к неожиданным ситуациям и вмешательству человека
- Превосходит другие модели (OpenVLA и Octo) в тестовых заданиях;
- Показывает в 2 раза лучшие результаты по сравнению с уменьшенной версией модели
- Может выполнять более сложные многоэтапные задачи, в то время как предыдущие модели ограничивались простыми одноэтапными действиями
Это только первый шаг к созданию по-настоящему универсальных роботов.
Эта работа важна тем, что может привести к появлению роботов, которые смогут выполнять разнообразные задачи в реальном мире, просто получая инструкции на естественном языке, подобно тому, как сейчас работают языковые модели.
Anthropic представил обновленного ИИ-агента на базе модели Claude 3.5 Sonnet
Система достигла результата в 49% на сложном бенчмарке SWE-bench Verified, превзойдя предыдущий рекорд в 45%. Но что особенно интересно – это не просто тест модели, а оценка целой системы искусственного интеллекта.
"Агент" в контексте ИИ – это нечто большее, чем просто языковая модель. Это комплексная система, состоящая из двух ключевых компонентов:
- Сама модель ИИ (в данном случае Claude 3.5 Sonnet)
- Программная обвязка, которая позволяет модели взаимодействовать с окружением.
Представьте это как разницу между мозгом (модель) и всем телом с органами чувств и способностью действовать (агент). Именно такой подход позволяет ИИ не просто генерировать текст, а реально решать практические задачи.
Как устроен агент Claude?
Команда Anthropic дала агенту два основных "органа чувств и действия":
1. Bash Tool – это своего рода "руки" агента, позволяющие ему выполнять команды в системе
2. Edit Tool – "глаза и пальцы" агента для работы с кодом: просмотр и редактирование файлов.
Обновленный агент на базе Claude 3.5 Sonnet демонстрирует ряд уникальных способностей:
- Самостоятельное планирование действий
- Способность к самокоррекции
- Умение находить альтернативные решения при неудачах
- Возможность длительной работы над задачей с сохранением контекста
- Адаптация стратегии на основе результатов предыдущих действий
Несмотря на впечатляющие результаты, остаются определенные сложности:
1. Ресурсоемкость – некоторые задачи требуют сотен итераций взаимодействия между компонентами агента
2. Технические сложности – проблемы с настройкой окружения могут влиять на работу всей системы
3. Ограничения восприятия – текущая реализация агента не может работать с визуальными файлами, несмотря на такие способности базовой модели
4. "Слепое" тестирование– агент не видит тесты, на которых проверяется решение
Anthropic уже анонсировала новую версию бенчмарка, фокусирующуюся на мультимодальных задачах. Это указывает на следующий этап эволюции ИИ-агентов – расширение их способностей восприятия и взаимодействия с различными типами данных.
Уже сейчас очевидно, что будущее ИИ за комплексными агентными системами, а не отдельными моделями.
Ключевые инсайты со вчерашнего OpenAI DevDay в Лондоне и Q&A с Сэмом Альтманом
Основной вывод - OpenAI движется к созданию более интегрированных, мощных и автономных систем, фокусируясь на долгосрочной трансформации, а не быстрых победах.
Самое важное о будущем AI от CEO OpenAI:
1. О развитии и инвестициях:
• Фокус не на единичных моделях, а на комплексном улучшении LLM
• Триллионные инвестиции оправданы потенциалом в образовании и здравоохранении
• "Не создавайте костыли для текущих ограничений – стройте на будущие возможности"
2. Об ИИ-агентах:
• Определение: "Система для долгосрочных задач с минимальным контролем"
• Killer-features: параллельная обработка (300 звонков одновременно) и длительная автономная работа
• ИИ-Агент = умный старший коллега, которому можно доверить недельный проект.
Новый O1 (анонс функций):
• Function calling
• Developer messages
• Streaming
• Structured outputs
• Image understanding
💡 Советы стартапам:
• Фокус на вертикальных решениях (AI-юрист, AI-инженер)
• Строить с учетом будущих улучшений AI
• Создавать то, что усиливает, а не компенсирует возможности LLM
О найме и лидерстве:
• "Был старше 30, когда основал OpenAI"
• Важен баланс молодых и опытных
• Единственный критерий – исключительный талант
🔮 Прогноз на 5 лет:
• Технологии будут развиваться с невероятной скоростью.
• Общество изменится медленнее, чем кажется, но глубже, чем ожидается.
• Параллель с транзистором, а не интернетом: фундаментальное изменение физики вычислений.
Ну, и в конце философская нота от Сэма Альтмана:
"Я не молюсь, чтобы Бог был на моей стороне, я молюсь, чтобы быть на стороне Бога. Работа над этими моделями определенно ощущается как работа на стороне ангелов".
NVIDIA разработала нейронную сеть для управления телом робота
Нам, людям, требуется огромное количество обработки информации, чтобы просто ходить, держать равновесие и двигать руками и ногами в нужных направлениях.
Nvidia упаковали это в HOVER - единую модель, которая учится координировать моторы гуманоидного робота для передвижения и манипуляций.
HOVER состоит всего из 1,5 млн параметров. Обучение HOVER проходило в NVIDIA Isaac - симуляторе на базе GPU, который ускоряет физические процессы в 10 000 раз быстрее реального времени. Год интенсивных тренировок робота сжимается до 50 минут реального времени. Обучение происходит в виртуальном "додзё".
Режимы управления:
HOVER поддерживает различные способы управления роботом через так называемые "режимы контроля".
Интеграция с XR-устройствами
Поддержка Apple Vision Pro.
Точное отслеживание движений.
Совместимость с экзоскелетами.
Прецизионный контроль положения каждого сустава.
Интуитивное управление движением.
Что даёт HOVER:
- Единый интерфейс для управления роботом через любые удобные устройства ввода
- Более простой способ собирать данные телеуправления всем телом для обучения
- Возможность использовать модель Vision-Language-Action для создания инструкций движения, которые HOVER преобразует в сигналы моторов на высокой частоте
HOVER работает с любым гуманоидом, которого можно симулировать в Isaac.
Дайте нам обнять этого человека: $9трлн инвестиций в ИИ-это очень мало, считает Масаёси Сон, CEO SoftBank
«$9 трлн капитальных затрат на ИИ это очень разумно и может быть слишком мало», - заявил Сон 😁
Он подчеркнул, что, несмотря на предположения критиков о том, что только 5% прогресса в AGI и ASI в течение следующего десятилетия будут иметь существенную ценность, наблюдается значительная переоценка текущего понимания генеративного ИИ, что может указывать на пузырь на рынке.
Сон предсказал, что если ИИ сможет заменить 5% мирового ВВП в следующем десятилетии, то это будет ~ $9 трлн в год.
Мы любим этого оптимиста - инвестора.
Это бомба! Выходцы из Google Brain оцифровали запах! Это не статья, это продукт! /channel/alwebbci/2705
Читать полностью…Эксперты отмечают, что Китай может создать AGI на 6-12 месяцев раньше США
Такое преимущество может стать решающим из-за экспоненциального характера развития ИИ.
У Китая это может получится, если они :
1. Совершат прорыв в научных исследованиях и разработках
2. Получат превосходство в военных технологиях
3. Радикально оптимизируют промышленное производство
4. Создадут принципиально новые материалы и технологии.
Несмотря на текущее технологическое отставание Китая (~ 5 лет), существуют серьезные риски изменения баланса сил.
В то время как рост крупнейших ИИ-кластеров в США (около 100,000 GPU) ограничен регуляторной средой и промышленными возможностями, Китай демонстрирует впечатляющую гибкость:
- Может конвертировать алюминиевые заводы в дата-центры за 6 месяцев
- Не имеет ограничений по инфраструктуре электропитания
- Способен быстро наращивать вычислительные мощности.
Китай разработал многоуровневую систему обхода американских ограничений:
Например, сеть фабрик Huawei - масштабный государственный проект. Охватывает всю производственную цепочку. Использует сложную систему дочерних компаний. Бюджет только на оборудование - $7.3 млрд в 2024 году.
Китайский SMIC производит десятки тысяч пластин с чипами для Huawei, используя передовые техпроцессы 7нм и 6нм.
Китай уже имеет достаточно чипов для создания крупнейшего в мире кластера для обучения ИИ. Хотя сейчас китайские кластеры примерно в 3 раза меньше американских. В основном, мощности ИИ в Китае децентрализованы, с крупнейшими известными кластерами размером в 1/3 от американских, но концентрация усилий может привести к созданию кластеров, затмевающих американские менее чем за год.
SemiAnalysis оценивает, что Huawei потратит $7,3 млрд на оборудование для производства пластин в 2024 году, став 4-м крупнейшим покупателем в мире. Если добавить партнёров Huawei - SMIC и производителя чипов памяти, группа станет вторым по величине покупателем в мире после TSMC.
Основатель Y Combinator: в ближайшие 20 лет писать смогут единицы. Думать – тоже
Пол Грэхам пишет: «Хотя обычно неохотно берусь предсказывать развитие технологий. Но в этом случае я достаточно уверен: через пару десятилетий будет очень мало людей, умеющих писать».
Причина, по которой многим сложно писать, фундаментальна: писать действительно трудно. Чтобы писать хорошо, нужно ясно мыслить, а ясное мышление – непростая задача.
При этом написание текстов пронизывает многие профессии, и чем престижнее работа, тем больше она требует умения писать.
Эти 2 противоборствующие силы – повсеместное требование писать и неустранимая сложность этого процесса – создают огромное давление.
Именно поэтому даже именитые профессора иногда прибегают к плагиату.
Теперь всё изменилось. ИИ открыл новый мир. Почти всё давление писать исчезло. ИИ может делать это за вас – и в школе, и на работе.
Результатом станет мир, разделённый на пишущих и непишущих. Будут люди, которые умеют писать. Некоторым из нас это нравится. Среднее звено между хорошими писателями и теми, кто не может писать вовсе, исчезнет.
Это плохо? Разве не обычное дело, когда навыки исчезают из-за развития технологий? Ведь нет больше кузнецов, и это не кажется проблемой.
Да, это плохо. Причина в том, о чём я упоминал ранее: письмо – это мышление. Фактически это вид мышления, которому можно научиться только через письмо.
Это будет мир мыслящих и немыслящих.
Эта ситуация не беспрецедентна. В доиндустриальные времена работа большинства людей делала сильными. Сейчас, если вы хотите быть сильным, вы идете в спортзал. Так что сильные люди всё ещё есть, но только те, кто сам решил таким стать.
То же самое будет с письмом. Умные люди останутся, но только те, кто сам решит быть таковым.