50 компаний, создающих ИИ-агентов. Огромные изменения в сфере ПО: от SaaS к системе ИИ-агентов
Мы стоим на пороге фундаментальных изменений в том, как работает ПО. Происходит революционный переход от традиционных SaaS-решений к ИИ-системам, которые действуют как самостоятельные работники.
Масштаб изменений:
- Ожидаемый объем рынка: $4.6 триллиона в ближайшие 5 лет
- Затрагивает все сферы: от продаж до здравоохранения
- Особенно важно для отраслей с низкой цифровизацией (страхование, юриспруденция)
Три фазы эволюции:
1️⃣ Традиционные системы (Фаза 1):
- Ручной ввод данных
- Работа только со структурированной информацией
- Ограниченная эффективность из-за человеческого фактора
- Пример: Salesforce
2️⃣ Появление ИИ (Фаза 2):
- Автоматический сбор всех типов данных
- Работа с неструктурированной информацией
- Активное участие в рабочих процессах
- Анализ реальных сигналов вместо субъективных оценок
3️⃣ Система Агентов (Фаза 3):
- ИИ-агенты работают как команда
- Каждый агент специализируется на конкретных задачах
- Постоянное обучение и улучшение
- Автономное принятие решений
Ключевые преимущества нового подхода:
- Круглосуточная работа без перерывов
- Решение проблемы нехватки кадров
- Выполнение задач, на которые у людей никогда не хватало времени
- Более точное и эффективное принятие решений
- Автоматическая обработка огромных объемов данных
Новая модель монетизации:
- Переход от оплаты за пользователя к оплате за результат
- Доступ к бюджетам на персонал вместо ИТ-бюджетов
- Более гибкое ценообразование, основанное на реальной ценности
Мы находимся на пороге новой эры, где ПО перестает быть просто инструментом и становится активным участником бизнес-процессов. Компаниям важно уже сейчас начать подготовку к этой трансформации, чтобы остаться конкурентоспособными в новых условиях.
Итоги уходящей недели в России и мире, что имеет значение
Текст недели: основатель Y Combinator о том, что ближайшие 20 лет писать смогут единицы. Думать – тоже.
1. Российская компания Neiry впервые покажет крыс с нейрочипами 5 ноября.
2. Выходцы из Google Brain оцифровали запах.
3. Китай может создать AGI на 6-12 месяцев раньше США. Каким образом, читайте тут.
4. В 2030г. Минпромторг хочет начать разработку ПО для проектирования процессоров 16 нм, которая еще не освоена в РФ.
5. Билл Гейтс задаёт тон главной теме: в чем конкурентоспособность человека в эпоху ИИ?
6. Экс-сотрудники Google создали первый "GPT для роботов".
7. Ключевые инсайты со OpenAI DevDay в Лондоне и Q&A с Сэмом Альтманом.
8. Свежий отчет BCG о том, где искать ценность в ИИ.
9. Минцифры РФ планирует создать собственное Linux-сообщество из-за отстранения российских разработчиков от мирового IT-сообщества.
10. Создана 1-ая базовая ИИ-модель человеческого познания.
11. Прогноз McKinsey по 18 перспективным рынкам будущего до 2040 года.
12. BCG: к 2030г. объем токенизированных фондов достигнет $600 млрд.
13. GitHub добавил поддержку Gemini, Claude и o1 в Copilot.
14. OpenAI создает свой чип с Broadcom, который будет производиться на TSMC.
15. Baidu представила ТОП-10 инноваций 2024 года.
16. NVIDIA разработала нейронную сеть для управления телом робота.
17. Anthropic представил обновленного ИИ-агента на базе модели Claude 3.5 Sonnet.
18. Борьба за ИИ-поиск в разгаре: OpenAI запустили веб-поиск в ChatGPT. Конкуренция с Perplexity растет.
19. Опубликована дорожная карта по интеграции ИИ-агентов в научные исследования.
20. Anthropic готовится к появлению сознательного ИИ и наняла 1-го сотрудника, который будет заниматься правами ИИ.
21. Команда Цукерберга создала с ИИ карту эмбрионального развития. От первой клетки до целого организма.
22. Как взломать робота, управляемого LLM.
23. Насколько эффективно сотрудничество человека и ИИ? Ответ здесь.
24. Цукерберг создает свой поисковик.
⚡️Команда Цукерберга создала с ИИ карту эмбрионального развития. От первой клетки до целого организма
Команда ученых из Chan Zuckerberg Biohub в Сан-Франциско создали революционный научный проект Zebrahub - новый цифровой атлас, который отслеживает развитие эмбрионов рыбки данио с беспрецедентной детализацией.
Zebrahub будет служить основой для будущих исследований развития организмов, включая человека, так как у этой рыбки данио 70% генов похожи с человеческими.
Специально для проекта была разработана программа Ultrack, которая использует ИИ для:
- Автоматического распознавания клеточных ядер.
- Отслеживания их движения в трехмерном пространстве.
- Анализа перемещений клеток во времени.
Zebrahub - это инструмент, который позволяет:
1. Наблюдать, как из одной клетки формируется целый организм.
2. Отслеживать, как клетки перемещаются и "принимают решения" о том, какую роль они будут играть в организме.
3. Видеть, какие гены активируются или деактивируются в процессе развития.
Эта информация является ключевой для понимания:
1. как возникают заболевания?
2. как можно использовать механизмы развития для регенерации?
Проект разрабатывался 5 лет и потребовал сотрудничества специалистов из разных областей: биологии, инженерии, оптики, физики и науки о данных.
Это значительный шаг вперед в понимании того, как формируются живые организмы.
Ранее, эта же организация создала виртуальную клетку человека.
Nebius Аркадия Воложа открыла свой ЦОД для ИИ в США
До этого компания открыла GPU кластер в Париже, а также у нее есть цоды в других городах Европы.
Борьба за ИИ-поиск в разгаре: OpenAI запустили веб-поиск в ChatGPT. Конкуренция с Perplexity растет.
Разбираем, что это значит для рынка.
OpenAI вчера, на Halloween, объявила о полномасштабном запуске веб-поиска в ChatGPT. Доступно пока только для Plus и Team пользователей.
Теперь ChatGPT можно использовать похожим образом, как и Perplexity - для поиска информации, проверки источников и создания отчетов на основе найденных данных. Пока неясно, насколько это создаст конкуренцию Google Search, но это сильный удар по Perplexity, так как теперь похожий функционал доступен на гораздо более популятной платформе.
Вот, что из себя представляет новый поиск:
• Интегрирован в ChatGPT поиск по актуальным данным
• у OpenAI есть партнерства с ведущими СМИ мира (AP, Reuters, FT и др.)
• Автоматическое определение необходимости поиска
• Сохранение контекста беседы при поиске
• Визуально обогащенные ответы для погоды, спорта, акций
Ключевые преимущества:
1. Огромная существующая база пользователей ChatGPT
2. Мощная языковая модель GPT-4 в основе
3. Интеграция с экосистемой OpenAI
4. Прямые партнерства с издателями
5. Возможность верификации источников
Что есть у конкурентов?
Perplexity AI:
+ Первопроходец в AI-поиске
+ Специализированный фокус
+ Более структурированные ответы
- Меньшая пользовательская база
- Ограниченные ресурсы
Google:
+ Огромная поисковая база
+ Развитая инфраструктура
+ Доверие пользователей
- Медленное внедрение AI
- Консервативный подход
Bing + ChatGPT:
+ Интеграция с Microsoft
+ Ранний выход на рынок
- Ограниченное проникновение
- Менее популярный, чем Google
Что это значит для рынка:
1. Краткосрочно:
• Передел рынка ИИ-поиска
• Давление на специализированные сервисы
• Ускорение внедрения ИИ у конкурентов
2. Долгосрочно:
• Изменение привычек поиска информации
• Новый стандарт поисковых интерфейсов
• Рост значимости прямых партнерств с издателями
Перспективы OpenAI:
• Интеграция с Advanced Voice и Canvas
• Расширение возможностей для шоппинга и путешествий
• Углубление исследовательских возможностей
• Развитие специализированных вертикалей
Все это в очередной раз нам показывает инновационный цикл развития: сначала небольшие стартапы проверяют и подтверждают потребность рынка в определенных функциях, а затем крупные компании с большими языковыми моделями входят на этот рынок и захватывают значительную долю пользователей.
❗️Билл Гейтс задаёт тон главной теме: в чем конкурентоспособность человека в эпоху ИИ?
Гейтс говорит, что ИИ станет настолько хорош в решении проблем и создании интересных занятий для людей, что нам понадобится новая религия или философия, чтобы оставаться на связи друг с другом.
В 2030г. Минпромторг хочет начать разработку ПО для проектирования процессоров 16 нм, которая еще не освоена в РФ.
На данный момент в РФ доступно производство процессоров с топологией 180 нм и 90 нм, обе линии освоены фабрикой «Микрон». Отечественные дизайн-центры сейчас используют софт зарубежных Synopsys и Cadence для проектирования чипов.
Общие затраты на научно-исследовательские и опытно-конструкторские работы по планам Минпромторга должны составить 54,6 млрд руб. до 2030 года, а ожидаемая выручка достичь 7,2 млрд руб., из них 3,6 млрд руб. от программ для разработки микросхем.
❗️Baidu представила ТОП-10 инноваций 2024 года
За последние 10 лет компания вложила $23.4 млрд в исследования ИИ и лидирует в Китае по патентам (19,000+ заявок).
1. ИИ-агенты нового поколения
- Снижает затраты на разработку
- Применяется на платформе ERNIE Agent и в Baidu Comate
2. Эволюция мультимодельного обучения
- Увеличение скорости обучения ERNIE в 4.1 раза за год
3. Система создания контента
- Лидерство на рынке создания презентаций (80% доля)
- Платформа Baidu Wenku
4. Автономное вождение
- Снижение затрат на картографирование на 95%
- Покрытие 3.6 млн км дорог
- Охват 41,000 городских и сельских районов
- Уменьшение размера карт на 97.5%
5. ИИ с "человеческой" памятью
- Имитация работы гиппокампа
- Используется в ИИ-ассистентах
6. Цифровые аватары
- Качество визуализации на уровне кино
- Применение в стримах
- Реалистичное 3D-клонирование
7. Генеративный коммерческий поиск
- Повышение эффективности таргетинга на 120%
- Прямое кодирование коммерческой информации
- Новая парадигма "Model as Index"
8. Data Flywheel
- Автоматическое определение недостатков модели
- Синтез тренировочных данных
- Снижение затрат на данные
9. Высокоэффективный вывод
- Экономия 50% затрат на развертывание
- Увеличение производительности в 3-5 раз
- Технологии: PrefixCaching, Lookahead, PagedAttention
10. Система поиска на основе пользовательских данных
- Охват 18% поискового трафика Baidu
- Быстрая самоадаптация
- Применение в поиске текста, видео и изображений
BCG: к 2030г. объем токенизированных фондов достигнет $600 млрд (1% от глобальных взаимных фондов и ETF)
Токенизированные фонды-фонды, где права собственности на доли представлены в виде цифровых токенов на блокчейне.
Они работают аналогично тому, как сегодня трансфер-агенты учитывают акции фондов.
Успешные примеры уже есть: Franklin Templeton запустил свой первый зарегистрированный в США фонд на блокчейне в 2021 году, а BlackRock в 2024 году запустил фонд BUIDL, который быстро достиг капитализации более $500 млн.
Токенизированные фонды имеют преимущества как взаимных фондов, так и ETF:
- предлагают высокую прозрачность цен
- обеспечивают лучшую ликвидность
- упрощают управление обеспечением по сравнению с взаимными фондами.
На конец 2024 года объем токенизированных активов под управлением составляет более $2 млрд.
Существует потенциальный спрос на $290 млрд со стороны владельцев цифровых активов.
При разрешении конвертации существующих фондов в токенизированные, объем может достичь триллионов $.
Ожидается переломный момент в течение следующих 12-18 месяцев. Рост будет связан с развитием регулируемых ончейн-денег (стейблкоины, токенизированные депозиты, CBDC).
OpenAI создает свой чип с Broadcom, который будет производиться на TSMC
OpenAI больше не хочет строить собственные заводы по производству чипов из-за затрат и времени, необходимых для создания сети.
А какие были планы по захвату мира чипов….
OpenAI также будет покупать чипы AMD в дополнение к GPU Nvidia для своих серверов ИИ. Специальный чип OpenAI не является GPU.
GitHub добавил поддержку Gemini, Claude и o1 в Copilot
Разработчики смогут выбирать удобную для себя модель, а
компании получат контроль над тем, какие модели доступны их командам.
Функция мультимодельности будет распространена на различные аспекты Copilot:
рабочее пространство, редактирование файлов, проверку кода, автоматическое исправление безопасности и CLI
- OpenAI o1-preview и o1-mini уже доступны.
- Claude 3.5 Sonnet будет развернут в течение следующей недели.
- Gemini 1.5 Pro появится в ближайшие недели
❗️Meta* разрабатывает свою поисковую систему на основе ИИ
Чтобы дать людям, использующим чат-бот Meta AI, ответы в формате разговора о текущих событиях
Таким образом Meta надеется снизить свою зависимость от Google Search и Microsoft Bing, которые в настоящее время предоставляют людям, использующим Meta AI, информацию о новостях, спорте и акциях.
Напомним, что OpenAI уже тестирует свой поисковик.
*Запрещенная организация в РФ.
ИИ-агенты против экосистем
Сейчас лидеры ИИ-рынка: Anthropic, OpenAI и Google делают ставку на развитие ИИ-агентов, способных управлять компьютером пользователя и автоматизировать работу с приложениями и браузерами.
Это может привести к тому, что актуальность самих приложений снизится, поскольку роботу не важен удобный интерфейс или красивый дизайн.
Однако разработчики крупных приложений с этим не согласны.
Например, Notion (компания стоимостью $10 млрд) уже активно интегрирует языковые модели от OpenAI и Anthropic в свой продукт. Их клиенты используют ИИ для автоматического заполнения таблиц и суммирования документов.
CEO Notion Иван Жао считает, что автоматизация управления курсором не так эффективна для продуктивности, как может показаться. Причина в том, что ИИ приходится работать с разными приложениями, сталкиваясь с паролями и другими барьерами. По его мнению, ИИ Notion эффективнее, так как может одновременно работать с разными источниками данных внутри своей экосистемы.
Интересный факт: Жао пытался купить ИИ-поисковик Perplexity в прошлом году, что могло бы расширить доступ Notion к данным.
Эта ситуация показывает, как интересы OpenAI и их крупных клиентов не всегда совпадают, несмотря на взаимовыгодное сотрудничество.
Другие компании, такие как Salesforce и ServiceNow тоже размышляют о влиянии ИИ-агентов на их бизнес.
CEO Klarna открыто говорит о планах использовать ИИ для сокращения расходов на программное обеспечение вроде Workday или Salesforce, хотя детали этих планов пока не ясны.
Современные ИИ-агенты, управляющие экраном, пока работают медленно и дороги в эксплуатации. Однако технология может значительно улучшиться в ближайшие год-два. У компаний вроде Notion есть время подготовиться к этим изменениям и разработать свой ответ на новый вызов.
OpenAI и другие компании продолжают развивать инструменты для программистов, что может еще больше упростить создание приложений.
❗️OASIS - 1-я в мире игра, где ИИ создаёт миры по нажатию клавиш
Представьте, каждое ваше движение, каждый прыжок и каждый удар по блоку заставляют ИИ мгновенно генерировать новую часть мира. Именно это реализовала команда Etched в своём проекте OASIS.
За 3 дня и 7 часов с момента запуска количество уникальных пользователей превысило 1 млн. Сообщают авторы проекта.
Технические особенности:
Oasis работает на специальном ИИ-чипе под названием Sohu, который включает:
1. DiT backbone (архитектура нейронной сети)
2. ViT автоэнкодер
Возможность обработки 4K видео
3. Поддержку моделей с более чем 100 млрд. параметров
Игра была обучена на открытых данных:
- Датасет VPT
- Minecraft датасет от OpenAI (под лицензией MIT).
NotebookLM от Google - это новый CRM
Смотрите, у вас скопилось на протяжении многих лет тысячи имейлов с информацией о сделках, встречах, решениях и тд. И всё это — полностью в неструктурированном виде.
Раньше было два пути:
1. Убивать время на ручное заполнение CRM (как делают все)
2. Оставить всё в почте и смириться.
Но появился третий путь — NotebookLM.
Что можно сделать с ним, спросите вы.
1. Выгружайте весь архив писем
2. Загрузите его в NotebookLM, система всё сама поймёт и сделает.
Теперь вместо:
- Заполнения сотни полей
- Категоризации каждого контакта
- Ручной актуализации данных
Мы просто общаемся с системой на человеческом языке. Хотите узнать историю взаимодействия с компанией за 5 лет? Или найти все встречи с конкретным человеком? Просто спросите ИИ.
Ключевой момент - мы переходим от "люди обслуживают машины" к "машины понимают людей".
Это не просто удобнее. Это сдвиг парадигмы.
Будущее за естественным общением с ИИ.
P.S. Особенно забавно, что раньше для такой обработки данных нужно было писать сложные скрипты. Сейчас даже это делает ИИ.
❗️Опубликована дорожная карта по интеграции ИИ-агентов в научные исследования
Исследователи опубликовали в Cell концепцию ИИ-ученых - систем ИИ, которые могут помогать в биомедицинских исследованиях.
Суть концепции:
Предлагается создание систем ИИ, которые могут скептически мыслить и рассуждать. Эти системы должны не заменять людей-исследователей, а усиливать их возможности. Они сочетают человеческую креативность с возможностями ИИ анализировать большие наборы данных.
Представлены уровни автономности ИИ-агентов (от простого к сложному):
❗️Уровень 0: Нет ИИ-агентов, только инструменты ML
❗️Уровень 1: ИИ как ассистент
❗️Уровень 2: ИИ как соавтор
❗️Уровень 3: ИИ как ученый
Потенциальные области применения:
1. Виртуальное моделирование клеток
2. Программируемый контроль фенотипов
3. Разработка клеточных схем
4. Создание новых терапевтических подходов.
⚡️ Anthropic готовится к появлению сознательного ИИ и наняла 1-го сотрудника, который будет заниматься правами ИИ
Лидеры ИИ начинают задумываться о том, могут ли ИИ-системы в будущем стать чем-то большим, чем просто инструментами, то есть обрести некую форму сознания или способность испытывать что-то похожее на эмоции или страдания.
Кайл Фиш присоединился к команде Anthropic и будет исследовать вопросы "благополучия моделей" и то, как компании должны подходить к этой теме.
Его работа включает изучение сложных философских и технических вопросов:
1. Какие способности нужны системе, чтобы она заслуживала морального отношения
2. Как распознать такие способности в ИИ
3. Какие практические шаги могут предпринять компании для защиты интересов AI-систем
Недавно был опубликован важный отчет, в котором утверждается, что существует "реальная возможность" того, что в ближайшем будущем некоторые ИИ-системы могут стать сознательными или обладать устойчивой агентностью.
Google DeepMind тоже ищут исследователя для работы над вопросами машинного сознания, также OpenAI участвуют в исследованиях по этой теме.
⚡️Экс-сотрудники Google создали первый "GPT для роботов" - теперь они могут понимать человеческие команды и ловко выполнять бытовые задачи.
Экс-сотрудники Google, создавшие компанию Physical Intelligence (π.com!) сделали большой прорыв в области робототехники и ИИ - модель π0 (пи-ноль).
Несмотря на впечатляющие достижения ИИ в таких областях как игра в шахматы или генерация изображений, роботы до сих пор значительно уступают людям в выполнении простых физических задач:
- Сложно научить робота складывать одежду или убирать со стола - это требует решения сложнейших инженерных задач
- Современные роботы узкоспециализированы и могут выполнять только заранее запрограммированные повторяющиеся действия
Что такое π0?
- Это универсальная базовая модель для роботов
- Может управлять различными типами роботов
- Понимает текстовые инструкции
- Работает с изображениями, текстом и физическими действиями
- Обучена на разнообразном наборе данных от 8 различных роботов
Ключевые возможности:
- Модель использует предварительное обучение на основе интернет-данных (как языковые модели)
- Имеет новую архитектуру, позволяющую выдавать команды управления с частотой до 50 раз в секунду
- Может быть дообучена для специализированных задач
- Наследует семантическое понимание из предварительного обучения на интернет-данных
Модель успешно справляется со сложными задачами:
- Складывание белья (включая извлечение из сушилки и аккуратное складывание в стопку)
- Уборка со стола (сортировка посуды и мусора)
- Сборка картонных коробок
- Может адаптироваться к неожиданным ситуациям и вмешательству человека
- Превосходит другие модели (OpenVLA и Octo) в тестовых заданиях;
- Показывает в 2 раза лучшие результаты по сравнению с уменьшенной версией модели
- Может выполнять более сложные многоэтапные задачи, в то время как предыдущие модели ограничивались простыми одноэтапными действиями
Это только первый шаг к созданию по-настоящему универсальных роботов.
Эта работа важна тем, что может привести к появлению роботов, которые смогут выполнять разнообразные задачи в реальном мире, просто получая инструкции на естественном языке, подобно тому, как сейчас работают языковые модели.
Anthropic представил обновленного ИИ-агента на базе модели Claude 3.5 Sonnet
Система достигла результата в 49% на сложном бенчмарке SWE-bench Verified, превзойдя предыдущий рекорд в 45%. Но что особенно интересно – это не просто тест модели, а оценка целой системы искусственного интеллекта.
"Агент" в контексте ИИ – это нечто большее, чем просто языковая модель. Это комплексная система, состоящая из двух ключевых компонентов:
- Сама модель ИИ (в данном случае Claude 3.5 Sonnet)
- Программная обвязка, которая позволяет модели взаимодействовать с окружением.
Представьте это как разницу между мозгом (модель) и всем телом с органами чувств и способностью действовать (агент). Именно такой подход позволяет ИИ не просто генерировать текст, а реально решать практические задачи.
Как устроен агент Claude?
Команда Anthropic дала агенту два основных "органа чувств и действия":
1. Bash Tool – это своего рода "руки" агента, позволяющие ему выполнять команды в системе
2. Edit Tool – "глаза и пальцы" агента для работы с кодом: просмотр и редактирование файлов.
Обновленный агент на базе Claude 3.5 Sonnet демонстрирует ряд уникальных способностей:
- Самостоятельное планирование действий
- Способность к самокоррекции
- Умение находить альтернативные решения при неудачах
- Возможность длительной работы над задачей с сохранением контекста
- Адаптация стратегии на основе результатов предыдущих действий
Несмотря на впечатляющие результаты, остаются определенные сложности:
1. Ресурсоемкость – некоторые задачи требуют сотен итераций взаимодействия между компонентами агента
2. Технические сложности – проблемы с настройкой окружения могут влиять на работу всей системы
3. Ограничения восприятия – текущая реализация агента не может работать с визуальными файлами, несмотря на такие способности базовой модели
4. "Слепое" тестирование– агент не видит тесты, на которых проверяется решение
Anthropic уже анонсировала новую версию бенчмарка, фокусирующуюся на мультимодальных задачах. Это указывает на следующий этап эволюции ИИ-агентов – расширение их способностей восприятия и взаимодействия с различными типами данных.
Уже сейчас очевидно, что будущее ИИ за комплексными агентными системами, а не отдельными моделями.
Ключевые инсайты со вчерашнего OpenAI DevDay в Лондоне и Q&A с Сэмом Альтманом
Основной вывод - OpenAI движется к созданию более интегрированных, мощных и автономных систем, фокусируясь на долгосрочной трансформации, а не быстрых победах.
Самое важное о будущем AI от CEO OpenAI:
1. О развитии и инвестициях:
• Фокус не на единичных моделях, а на комплексном улучшении LLM
• Триллионные инвестиции оправданы потенциалом в образовании и здравоохранении
• "Не создавайте костыли для текущих ограничений – стройте на будущие возможности"
2. Об ИИ-агентах:
• Определение: "Система для долгосрочных задач с минимальным контролем"
• Killer-features: параллельная обработка (300 звонков одновременно) и длительная автономная работа
• ИИ-Агент = умный старший коллега, которому можно доверить недельный проект.
Новый O1 (анонс функций):
• Function calling
• Developer messages
• Streaming
• Structured outputs
• Image understanding
💡 Советы стартапам:
• Фокус на вертикальных решениях (AI-юрист, AI-инженер)
• Строить с учетом будущих улучшений AI
• Создавать то, что усиливает, а не компенсирует возможности LLM
О найме и лидерстве:
• "Был старше 30, когда основал OpenAI"
• Важен баланс молодых и опытных
• Единственный критерий – исключительный талант
🔮 Прогноз на 5 лет:
• Технологии будут развиваться с невероятной скоростью.
• Общество изменится медленнее, чем кажется, но глубже, чем ожидается.
• Параллель с транзистором, а не интернетом: фундаментальное изменение физики вычислений.
Ну, и в конце философская нота от Сэма Альтмана:
"Я не молюсь, чтобы Бог был на моей стороне, я молюсь, чтобы быть на стороне Бога. Работа над этими моделями определенно ощущается как работа на стороне ангелов".
NVIDIA разработала нейронную сеть для управления телом робота
Нам, людям, требуется огромное количество обработки информации, чтобы просто ходить, держать равновесие и двигать руками и ногами в нужных направлениях.
Nvidia упаковали это в HOVER - единую модель, которая учится координировать моторы гуманоидного робота для передвижения и манипуляций.
HOVER состоит всего из 1,5 млн параметров. Обучение HOVER проходило в NVIDIA Isaac - симуляторе на базе GPU, который ускоряет физические процессы в 10 000 раз быстрее реального времени. Год интенсивных тренировок робота сжимается до 50 минут реального времени. Обучение происходит в виртуальном "додзё".
Режимы управления:
HOVER поддерживает различные способы управления роботом через так называемые "режимы контроля".
Интеграция с XR-устройствами
Поддержка Apple Vision Pro.
Точное отслеживание движений.
Совместимость с экзоскелетами.
Прецизионный контроль положения каждого сустава.
Интуитивное управление движением.
Что даёт HOVER:
- Единый интерфейс для управления роботом через любые удобные устройства ввода
- Более простой способ собирать данные телеуправления всем телом для обучения
- Возможность использовать модель Vision-Language-Action для создания инструкций движения, которые HOVER преобразует в сигналы моторов на высокой частоте
HOVER работает с любым гуманоидом, которого можно симулировать в Isaac.
Дайте нам обнять этого человека: $9трлн инвестиций в ИИ-это очень мало, считает Масаёси Сон, CEO SoftBank
«$9 трлн капитальных затрат на ИИ это очень разумно и может быть слишком мало», - заявил Сон 😁
Он подчеркнул, что, несмотря на предположения критиков о том, что только 5% прогресса в AGI и ASI в течение следующего десятилетия будут иметь существенную ценность, наблюдается значительная переоценка текущего понимания генеративного ИИ, что может указывать на пузырь на рынке.
Сон предсказал, что если ИИ сможет заменить 5% мирового ВВП в следующем десятилетии, то это будет ~ $9 трлн в год.
Мы любим этого оптимиста - инвестора.
Это бомба! Выходцы из Google Brain оцифровали запах! Это не статья, это продукт! /channel/alwebbci/2705
Читать полностью…Эксперты отмечают, что Китай может создать AGI на 6-12 месяцев раньше США
Такое преимущество может стать решающим из-за экспоненциального характера развития ИИ.
У Китая это может получится, если они :
1. Совершат прорыв в научных исследованиях и разработках
2. Получат превосходство в военных технологиях
3. Радикально оптимизируют промышленное производство
4. Создадут принципиально новые материалы и технологии.
Несмотря на текущее технологическое отставание Китая (~ 5 лет), существуют серьезные риски изменения баланса сил.
В то время как рост крупнейших ИИ-кластеров в США (около 100,000 GPU) ограничен регуляторной средой и промышленными возможностями, Китай демонстрирует впечатляющую гибкость:
- Может конвертировать алюминиевые заводы в дата-центры за 6 месяцев
- Не имеет ограничений по инфраструктуре электропитания
- Способен быстро наращивать вычислительные мощности.
Китай разработал многоуровневую систему обхода американских ограничений:
Например, сеть фабрик Huawei - масштабный государственный проект. Охватывает всю производственную цепочку. Использует сложную систему дочерних компаний. Бюджет только на оборудование - $7.3 млрд в 2024 году.
Китайский SMIC производит десятки тысяч пластин с чипами для Huawei, используя передовые техпроцессы 7нм и 6нм.
Китай уже имеет достаточно чипов для создания крупнейшего в мире кластера для обучения ИИ. Хотя сейчас китайские кластеры примерно в 3 раза меньше американских. В основном, мощности ИИ в Китае децентрализованы, с крупнейшими известными кластерами размером в 1/3 от американских, но концентрация усилий может привести к созданию кластеров, затмевающих американские менее чем за год.
SemiAnalysis оценивает, что Huawei потратит $7,3 млрд на оборудование для производства пластин в 2024 году, став 4-м крупнейшим покупателем в мире. Если добавить партнёров Huawei - SMIC и производителя чипов памяти, группа станет вторым по величине покупателем в мире после TSMC.
Основатель Y Combinator: в ближайшие 20 лет писать смогут единицы. Думать – тоже
Пол Грэхам пишет: «Хотя обычно неохотно берусь предсказывать развитие технологий. Но в этом случае я достаточно уверен: через пару десятилетий будет очень мало людей, умеющих писать».
Причина, по которой многим сложно писать, фундаментальна: писать действительно трудно. Чтобы писать хорошо, нужно ясно мыслить, а ясное мышление – непростая задача.
При этом написание текстов пронизывает многие профессии, и чем престижнее работа, тем больше она требует умения писать.
Эти 2 противоборствующие силы – повсеместное требование писать и неустранимая сложность этого процесса – создают огромное давление.
Именно поэтому даже именитые профессора иногда прибегают к плагиату.
Теперь всё изменилось. ИИ открыл новый мир. Почти всё давление писать исчезло. ИИ может делать это за вас – и в школе, и на работе.
Результатом станет мир, разделённый на пишущих и непишущих. Будут люди, которые умеют писать. Некоторым из нас это нравится. Среднее звено между хорошими писателями и теми, кто не может писать вовсе, исчезнет.
Это плохо? Разве не обычное дело, когда навыки исчезают из-за развития технологий? Ведь нет больше кузнецов, и это не кажется проблемой.
Да, это плохо. Причина в том, о чём я упоминал ранее: письмо – это мышление. Фактически это вид мышления, которому можно научиться только через письмо.
Это будет мир мыслящих и немыслящих.
Эта ситуация не беспрецедентна. В доиндустриальные времена работа большинства людей делала сильными. Сейчас, если вы хотите быть сильным, вы идете в спортзал. Так что сильные люди всё ещё есть, но только те, кто сам решил таким стать.
То же самое будет с письмом. Умные люди останутся, но только те, кто сам решит быть таковым.
Прогноз McKinsey по 18 перспективным рынкам будущего до 2040 года.
По данным исследователей, 18 рынков вырастут с $7.25 трлн в 2022 году до $29-48 трлн к 2040 году, с суммарной прибылью $1.9-6.1 трлн. Среднегодовой темп роста составит 8-11%.
Крупнейшие рынки по прогнозу выручки на 2040:
1. E-commerce: $14-20 трлн (сейчас $4 трлн)
2. AI софт и сервисы: $1.5-4.6 трлн (сейчас $85 млрд)
3. Облачные сервисы: $1.6-3.4 трлн (сейчас $220 млрд)
4. Электромобили: $2.5-3.2 трлн (сейчас $450 млрд)
5. Цифровая реклама: $2.1-2.9 трлн (сейчас $520 млрд)
Самые быстрорастущие сектора (по CAGR):
- AI софт и сервисы: 17-25%
- Роботы: 13-23%
- Облачные сервисы: 12-17%
- Батареи: 12-14%
Наиболее прибыльные сектора (по марже):
- Лекарства от ожирения: 25-35%
- Полупроводники: 20-25%
- AI софт и сервисы: 15-20%
- Цифровая реклама: 15-20%
Отчет полностью здесь.
Маск показал самый крупный суперкомпьютер в мире на сегодня
NVIDIA и xAI представили крупнейший в мире суперкомпьютер с ИИ - Colossus, построенный всего за 122 дня и работающий на базе сетевой технологии NVIDIA Spectrum-X Ethernet.
«Colossus — самая мощная система обучения в мире», — сказал Илон Маск.
В системе используется 100,000 графических процессоров NVIDIA Hopper.
Суперкомпьютер предназначен для обучения языковых моделей Grok от xAI.
Технология Spectrum-X обеспечивает 95% пропускную способность данных без задержек, что значительно превосходит возможности традиционного Ethernet.
Google в декабре представит ИИ-агента, который управляет компьютером пользователя
Это будет конкурент продукта Anthropic, тут подробнее.
Новый ИИ-агент называется Jarvis, его запуск планируется в декабре, когда и будет новый Gemini.
В отличие от конкурентов, которые фокусируются на помощи в работе программистам и офисным сотрудникам, Jarvis больше ориентирован на обычных пользователей и их повседневные задачи в интернете.
Вот основные возможности Jarvis, которые он сможет сделать без участия человека:
1. Сбор информации и исследования
2. Покупка товаров
3. Бронирование авиабилетов
4. Другие повседневные задачи в интернете
Особенности Jarvis:
- Работает только в веб-браузере (в основном оптимизирован для Chrome)
- Использует скриншоты экрана для понимания контекста
- Может самостоятельно кликать по кнопкам и заполнять текстовые поля
- Будет работать на основе новой языковой модели Gemini
Google пытается догнать конкурентов в сфере ИИ, несмотря на то, что многие базовые технологии были изобретены именно их исследователями.