Anthropic представил обновленного ИИ-агента на базе модели Claude 3.5 Sonnet
Система достигла результата в 49% на сложном бенчмарке SWE-bench Verified, превзойдя предыдущий рекорд в 45%. Но что особенно интересно – это не просто тест модели, а оценка целой системы искусственного интеллекта.
"Агент" в контексте ИИ – это нечто большее, чем просто языковая модель. Это комплексная система, состоящая из двух ключевых компонентов:
- Сама модель ИИ (в данном случае Claude 3.5 Sonnet)
- Программная обвязка, которая позволяет модели взаимодействовать с окружением.
Представьте это как разницу между мозгом (модель) и всем телом с органами чувств и способностью действовать (агент). Именно такой подход позволяет ИИ не просто генерировать текст, а реально решать практические задачи.
Как устроен агент Claude?
Команда Anthropic дала агенту два основных "органа чувств и действия":
1. Bash Tool – это своего рода "руки" агента, позволяющие ему выполнять команды в системе
2. Edit Tool – "глаза и пальцы" агента для работы с кодом: просмотр и редактирование файлов.
Обновленный агент на базе Claude 3.5 Sonnet демонстрирует ряд уникальных способностей:
- Самостоятельное планирование действий
- Способность к самокоррекции
- Умение находить альтернативные решения при неудачах
- Возможность длительной работы над задачей с сохранением контекста
- Адаптация стратегии на основе результатов предыдущих действий
Несмотря на впечатляющие результаты, остаются определенные сложности:
1. Ресурсоемкость – некоторые задачи требуют сотен итераций взаимодействия между компонентами агента
2. Технические сложности – проблемы с настройкой окружения могут влиять на работу всей системы
3. Ограничения восприятия – текущая реализация агента не может работать с визуальными файлами, несмотря на такие способности базовой модели
4. "Слепое" тестирование– агент не видит тесты, на которых проверяется решение
Anthropic уже анонсировала новую версию бенчмарка, фокусирующуюся на мультимодальных задачах. Это указывает на следующий этап эволюции ИИ-агентов – расширение их способностей восприятия и взаимодействия с различными типами данных.
Уже сейчас очевидно, что будущее ИИ за комплексными агентными системами, а не отдельными моделями.
Ключевые инсайты со вчерашнего OpenAI DevDay в Лондоне и Q&A с Сэмом Альтманом
Основной вывод - OpenAI движется к созданию более интегрированных, мощных и автономных систем, фокусируясь на долгосрочной трансформации, а не быстрых победах.
Самое важное о будущем AI от CEO OpenAI:
1. О развитии и инвестициях:
• Фокус не на единичных моделях, а на комплексном улучшении LLM
• Триллионные инвестиции оправданы потенциалом в образовании и здравоохранении
• "Не создавайте костыли для текущих ограничений – стройте на будущие возможности"
2. Об ИИ-агентах:
• Определение: "Система для долгосрочных задач с минимальным контролем"
• Killer-features: параллельная обработка (300 звонков одновременно) и длительная автономная работа
• ИИ-Агент = умный старший коллега, которому можно доверить недельный проект.
Новый O1 (анонс функций):
• Function calling
• Developer messages
• Streaming
• Structured outputs
• Image understanding
💡 Советы стартапам:
• Фокус на вертикальных решениях (AI-юрист, AI-инженер)
• Строить с учетом будущих улучшений AI
• Создавать то, что усиливает, а не компенсирует возможности LLM
О найме и лидерстве:
• "Был старше 30, когда основал OpenAI"
• Важен баланс молодых и опытных
• Единственный критерий – исключительный талант
🔮 Прогноз на 5 лет:
• Технологии будут развиваться с невероятной скоростью.
• Общество изменится медленнее, чем кажется, но глубже, чем ожидается.
• Параллель с транзистором, а не интернетом: фундаментальное изменение физики вычислений.
Ну, и в конце философская нота от Сэма Альтмана:
"Я не молюсь, чтобы Бог был на моей стороне, я молюсь, чтобы быть на стороне Бога. Работа над этими моделями определенно ощущается как работа на стороне ангелов".
NVIDIA разработала нейронную сеть для управления телом робота
Нам, людям, требуется огромное количество обработки информации, чтобы просто ходить, держать равновесие и двигать руками и ногами в нужных направлениях.
Nvidia упаковали это в HOVER - единую модель, которая учится координировать моторы гуманоидного робота для передвижения и манипуляций.
HOVER состоит всего из 1,5 млн параметров. Обучение HOVER проходило в NVIDIA Isaac - симуляторе на базе GPU, который ускоряет физические процессы в 10 000 раз быстрее реального времени. Год интенсивных тренировок робота сжимается до 50 минут реального времени. Обучение происходит в виртуальном "додзё".
Режимы управления:
HOVER поддерживает различные способы управления роботом через так называемые "режимы контроля".
Интеграция с XR-устройствами
Поддержка Apple Vision Pro.
Точное отслеживание движений.
Совместимость с экзоскелетами.
Прецизионный контроль положения каждого сустава.
Интуитивное управление движением.
Что даёт HOVER:
- Единый интерфейс для управления роботом через любые удобные устройства ввода
- Более простой способ собирать данные телеуправления всем телом для обучения
- Возможность использовать модель Vision-Language-Action для создания инструкций движения, которые HOVER преобразует в сигналы моторов на высокой частоте
HOVER работает с любым гуманоидом, которого можно симулировать в Isaac.
Дайте нам обнять этого человека: $9трлн инвестиций в ИИ-это очень мало, считает Масаёси Сон, CEO SoftBank
«$9 трлн капитальных затрат на ИИ это очень разумно и может быть слишком мало», - заявил Сон 😁
Он подчеркнул, что, несмотря на предположения критиков о том, что только 5% прогресса в AGI и ASI в течение следующего десятилетия будут иметь существенную ценность, наблюдается значительная переоценка текущего понимания генеративного ИИ, что может указывать на пузырь на рынке.
Сон предсказал, что если ИИ сможет заменить 5% мирового ВВП в следующем десятилетии, то это будет ~ $9 трлн в год.
Мы любим этого оптимиста - инвестора.
Это бомба! Выходцы из Google Brain оцифровали запах! Это не статья, это продукт! /channel/alwebbci/2705
Читать полностью…Эксперты отмечают, что Китай может создать AGI на 6-12 месяцев раньше США
Такое преимущество может стать решающим из-за экспоненциального характера развития ИИ.
У Китая это может получится, если они :
1. Совершат прорыв в научных исследованиях и разработках
2. Получат превосходство в военных технологиях
3. Радикально оптимизируют промышленное производство
4. Создадут принципиально новые материалы и технологии.
Несмотря на текущее технологическое отставание Китая (~ 5 лет), существуют серьезные риски изменения баланса сил.
В то время как рост крупнейших ИИ-кластеров в США (около 100,000 GPU) ограничен регуляторной средой и промышленными возможностями, Китай демонстрирует впечатляющую гибкость:
- Может конвертировать алюминиевые заводы в дата-центры за 6 месяцев
- Не имеет ограничений по инфраструктуре электропитания
- Способен быстро наращивать вычислительные мощности.
Китай разработал многоуровневую систему обхода американских ограничений:
Например, сеть фабрик Huawei - масштабный государственный проект. Охватывает всю производственную цепочку. Использует сложную систему дочерних компаний. Бюджет только на оборудование - $7.3 млрд в 2024 году.
Китайский SMIC производит десятки тысяч пластин с чипами для Huawei, используя передовые техпроцессы 7нм и 6нм.
Китай уже имеет достаточно чипов для создания крупнейшего в мире кластера для обучения ИИ. Хотя сейчас китайские кластеры примерно в 3 раза меньше американских. В основном, мощности ИИ в Китае децентрализованы, с крупнейшими известными кластерами размером в 1/3 от американских, но концентрация усилий может привести к созданию кластеров, затмевающих американские менее чем за год.
SemiAnalysis оценивает, что Huawei потратит $7,3 млрд на оборудование для производства пластин в 2024 году, став 4-м крупнейшим покупателем в мире. Если добавить партнёров Huawei - SMIC и производителя чипов памяти, группа станет вторым по величине покупателем в мире после TSMC.
Основатель Y Combinator: в ближайшие 20 лет писать смогут единицы. Думать – тоже
Пол Грэхам пишет: «Хотя обычно неохотно берусь предсказывать развитие технологий. Но в этом случае я достаточно уверен: через пару десятилетий будет очень мало людей, умеющих писать».
Причина, по которой многим сложно писать, фундаментальна: писать действительно трудно. Чтобы писать хорошо, нужно ясно мыслить, а ясное мышление – непростая задача.
При этом написание текстов пронизывает многие профессии, и чем престижнее работа, тем больше она требует умения писать.
Эти 2 противоборствующие силы – повсеместное требование писать и неустранимая сложность этого процесса – создают огромное давление.
Именно поэтому даже именитые профессора иногда прибегают к плагиату.
Теперь всё изменилось. ИИ открыл новый мир. Почти всё давление писать исчезло. ИИ может делать это за вас – и в школе, и на работе.
Результатом станет мир, разделённый на пишущих и непишущих. Будут люди, которые умеют писать. Некоторым из нас это нравится. Среднее звено между хорошими писателями и теми, кто не может писать вовсе, исчезнет.
Это плохо? Разве не обычное дело, когда навыки исчезают из-за развития технологий? Ведь нет больше кузнецов, и это не кажется проблемой.
Да, это плохо. Причина в том, о чём я упоминал ранее: письмо – это мышление. Фактически это вид мышления, которому можно научиться только через письмо.
Это будет мир мыслящих и немыслящих.
Эта ситуация не беспрецедентна. В доиндустриальные времена работа большинства людей делала сильными. Сейчас, если вы хотите быть сильным, вы идете в спортзал. Так что сильные люди всё ещё есть, но только те, кто сам решил таким стать.
То же самое будет с письмом. Умные люди останутся, но только те, кто сам решит быть таковым.
Прогноз McKinsey по 18 перспективным рынкам будущего до 2040 года.
По данным исследователей, 18 рынков вырастут с $7.25 трлн в 2022 году до $29-48 трлн к 2040 году, с суммарной прибылью $1.9-6.1 трлн. Среднегодовой темп роста составит 8-11%.
Крупнейшие рынки по прогнозу выручки на 2040:
1. E-commerce: $14-20 трлн (сейчас $4 трлн)
2. AI софт и сервисы: $1.5-4.6 трлн (сейчас $85 млрд)
3. Облачные сервисы: $1.6-3.4 трлн (сейчас $220 млрд)
4. Электромобили: $2.5-3.2 трлн (сейчас $450 млрд)
5. Цифровая реклама: $2.1-2.9 трлн (сейчас $520 млрд)
Самые быстрорастущие сектора (по CAGR):
- AI софт и сервисы: 17-25%
- Роботы: 13-23%
- Облачные сервисы: 12-17%
- Батареи: 12-14%
Наиболее прибыльные сектора (по марже):
- Лекарства от ожирения: 25-35%
- Полупроводники: 20-25%
- AI софт и сервисы: 15-20%
- Цифровая реклама: 15-20%
Отчет полностью здесь.
Маск показал самый крупный суперкомпьютер в мире на сегодня
NVIDIA и xAI представили крупнейший в мире суперкомпьютер с ИИ - Colossus, построенный всего за 122 дня и работающий на базе сетевой технологии NVIDIA Spectrum-X Ethernet.
«Colossus — самая мощная система обучения в мире», — сказал Илон Маск.
В системе используется 100,000 графических процессоров NVIDIA Hopper.
Суперкомпьютер предназначен для обучения языковых моделей Grok от xAI.
Технология Spectrum-X обеспечивает 95% пропускную способность данных без задержек, что значительно превосходит возможности традиционного Ethernet.
Google в декабре представит ИИ-агента, который управляет компьютером пользователя
Это будет конкурент продукта Anthropic, тут подробнее.
Новый ИИ-агент называется Jarvis, его запуск планируется в декабре, когда и будет новый Gemini.
В отличие от конкурентов, которые фокусируются на помощи в работе программистам и офисным сотрудникам, Jarvis больше ориентирован на обычных пользователей и их повседневные задачи в интернете.
Вот основные возможности Jarvis, которые он сможет сделать без участия человека:
1. Сбор информации и исследования
2. Покупка товаров
3. Бронирование авиабилетов
4. Другие повседневные задачи в интернете
Особенности Jarvis:
- Работает только в веб-браузере (в основном оптимизирован для Chrome)
- Использует скриншоты экрана для понимания контекста
- Может самостоятельно кликать по кнопкам и заполнять текстовые поля
- Будет работать на основе новой языковой модели Gemini
Google пытается догнать конкурентов в сфере ИИ, несмотря на то, что многие базовые технологии были изобретены именно их исследователями.
⚡️Microsoft предложила акционерам инвестировать в биткоин. Это стало известно из документа, поданного в SEC
Microsoft, компания с рыночной капитализацией более $3 трлн, включила пункт "оценка инвестиций в биткоин" в повестку голосования акционеров на ежегодном собрании в декабре 2024 года.
Совет директоров Microsoft рекомендовал голосовать против этого предложения, считая его "излишним", так как руководство компании "уже тщательно рассматривает этот вопрос".
Microsoft пояснила, что уже оценивает широкий спектр активов, включая биткоин, для диверсификации и защиты от инфляции, учитывая при этом волатильность при оценке инвестиций.
Если предложение будет принято, Microsoft станет крупнейшим публичным инвестором в биткоин, обойдя MicroStrategy и Tesla.
Где искать ценность в ИИ? отчет BCG
Разбираем главные инсайты о том, как бизнес извлекает пользу из ИИ в 2024 году.
Текущая ситуация на рынке
• 98% компаний экспериментируют с ИИ
• Только 26% продвинулись дальше пилотов и получают реальную ценность
• Лишь 4% системно развивают и масштабируют ИИ-инновации
Где лидеры получают преимущество?
Компании, эффективно внедряющие ИИ, показывают впечатляющие результаты:
• +50% к росту выручки (за 3 года)
• +60% к акционерной доходности
• +40% к возврату на инвестиции
• В 1.9 раз больше патентов
• В 1.4 раза выше удовлетворенность сотрудников
Где создается основная ценность?
62% ценности генерируется в основных бизнес-функциях:
• Операции (23%)
• Продажи и маркетинг (20%)
• R&D (13%)
38% в поддерживающих функциях:
• Клиентский сервис (12%)
• IT (7%)
• Закупки (7%)
Впечатляющие кейсы
• Финансовая организация → $1 млрд улучшений в производительности к 2030
• Биофармацевтическая компания → $1 млрд потенциальной ценности к 2027
• Автопроизводитель → сокращение себестоимости на 2% и ускорение разработки новых продуктов на 30%
Главные вызовы внедрения
Распределение проблем:
• 70% связаны с людьми и процессами
• 20% с технологиями
• 10% с алгоритмами
Рецепт успеха:
1 Четкие стратегические обязательства топ-менеджмента
2 Сбалансированный портфель инициатив
3 Фокус на нескольких высокоэффективных пилотах
4 Обеспечение базовой инфраструктуры
5 Выявление пробелов в возможностях
6 Акцент на сквозной трансформации
7 Внедрение механизмов контроля
Итоги уходящей недели в России и мире, что имеет значение:
1. Anthropic объявил, что Claude AI теперь может действовать как человек: управлять мышкой, видеть экран, вводить текст с клавиатуры, использовать разные программы и сайты.
2. Греф намекнул на то, что скоро ИИ заменит рутину в Верховном Суде. А также представил состояние рынка генИИ в РФ, Китае и США.
3. ИИ-стартапы могут получить $10 трлн рынок в "Service-as-a-Software".
4. Экс-основатель Neuralink представил глазной имплантат, который впервые в истории медицины смог восстановить зрение.
5. Сатья Наделла, СЕО Microsoft заявил, что ИИ вышел на новый уровень, где сам участвует в создании следующих поколений ИИ
6. От ₽200млн. входной билет для банков,чтобы начать работу с цифровым рублем.
7. Главу ФНС заботит не ИИ, а люди, которые выйдут на рынок труда и будут неконкурентоспособными. Все подробности здесь.
8. Meta* представила набор данных и новую ИИ-модель для открытия новых материалов.
9. Сбер создал ИИ-агента для Минфина на основе GigaChat.
10. Китайские роботы UBTech официально начали обучение на заводах.
11. Сделка года: платёжная система Stripe купила блокчейн-стартап Bridge за $1,1млрд. Как может изменится финансовый рынок, читайте тут.
12. Впервые в РФ представили этическое руководство для нейроинтерфейсов.
13. Microsoft с ноября позволит создавать ИИ-агентов через Copilot Studio.
14. О стратегиях развития OpenAI и Anthropic.
15. Кейс: как ИИ и блокчейн меняют работу с финансовыми активами, читайте здесь.
16. ГД приняла закон о налоговых льготах на российское ПО и ПАК.
17. Карта ИИ-агентов.
18. 1-й крупный пример применения LLM в госсекторе сделал Google. Все подробности тут.
19. Свежий обзор по смарт-контрактам.
20. Буэнос-Айрес стал 1-м городом в мире, который внедрил цифровую идентификацию на блокчейне и технологии zero-knowledge для всех своих граждан.
21. Новые планы и задачи Google DeepMind и Дэмиса Хассабиса.
22. ГД приняла новые поправки к закону о майнинге. Что теперь, читайте тут.
23. OpenAI делает большую ставку на мультиагентные системы.
24. NVIDIA планирует поставить ~ 1 млрд ядер RISC-V в своих чипах в 2024 году.
25. Крупнейшее в истории внедрение ИИ в медицине.
26. Clone разработал человекоподобных роботов с инновационной системой искусственных мышц.
27. Microsoft и Институт Кюри создают ИИ-агента для исследований рака.
28. 85% федеральных трасс в РФ без энергии, а это блокирует развитие ИИ.
29. Исследователи MIT обнаружили способ взлома нейроинтерфейсов.
30. Завод TSMC в США достиг более высоких показателей продукции, чем на Тайване
31. Представлена 1-я языковая модель для Индии.
*запрещенная в России организация.
⚡️Историческое событие. Завод TSMC в США достиг более высоких показателей продукции, чем на Тайване
TSMC, крупнейший в мире производитель микрочипов, построил новый завод в Аризоне. Этот новый завод использует современную 4-нм технологию производства показывает результаты даже лучше, чем старые заводы компании на Тайване.
При производстве чипов важен показатель "выхода годной продукции" - то есть сколько чипов получается рабочими из общего количества произведенных.
В Аризоне этот показатель на 4% выше, чем на Тайване. Это очень хороший результат, особенно для нового завода
Почему это важно? В силу обостренных отношений межу Тайванем и Китаем, когда в любой момент может начаться война, США готовят для себя почву, чтобы не зависеть от Тайваня в части критически значимых продуктов.
Глава Microsoft в письме акционерам говорит, что компьютеры начали понимать нас, а не мы их. Он говорит об этом как о процессе, который уже идет, а не о планах на будущее.
Это часть более широкого видения "агентного ИИ", где искусственный интеллект действует как помощник.
В своем письме Сатья Наделла к акционерам, коллегам, клиентам и партнерам, говорит о 2-х исторических мечтах компьютерной индустрии:
1. Чтобы компьютеры понимали нас, а не мы их. Чтобы компьютеры помогали нам рассуждать, планировать и действовать эффективнее
2. Отмечает, что в этом году произошли прорывы в обоих направлениях
Три ключевые возможности ИИ:
- Новый естественный мультимодальный интерфейс (речь, изображения, видео)
- Память, которая сохраняет важный контекст из личных данных и веба
- Новые возможности рассуждения и планирования
Экосистема ИИ-агентов. Microsoft создала 3 платформы:
1. Copilot - новый пользовательский интерфейс для взаимодействия с ИИ
2. Copilot Stack - инфраструктура, данные и сервисы для создания собственных копилотов
3. Copilot devices - новая категория устройств, оптимизированных для ИИ
Инфраструктура для ИИ:
- Расширение облачных мощностей на 5 континентах
- Предложение разных ИИ-ускорителей (AMD, NVIDIA)
- Собственный чип Azure Maia
- Партнерство с OpenAI для доступа к передовым моделям. Более 60,000 клиентов Azure AI.
В 2030г. Минпромторг хочет начать разработку ПО для проектирования процессоров 16 нм, которая еще не освоена в РФ.
На данный момент в РФ доступно производство процессоров с топологией 180 нм и 90 нм, обе линии освоены фабрикой «Микрон». Отечественные дизайн-центры сейчас используют софт зарубежных Synopsys и Cadence для проектирования чипов.
Общие затраты на научно-исследовательские и опытно-конструкторские работы по планам Минпромторга должны составить 54,6 млрд руб. до 2030 года, а ожидаемая выручка достичь 7,2 млрд руб., из них 3,6 млрд руб. от программ для разработки микросхем.
❗️Baidu представила ТОП-10 инноваций 2024 года
За последние 10 лет компания вложила $23.4 млрд в исследования ИИ и лидирует в Китае по патентам (19,000+ заявок).
1. ИИ-агенты нового поколения
- Снижает затраты на разработку
- Применяется на платформе ERNIE Agent и в Baidu Comate
2. Эволюция мультимодельного обучения
- Увеличение скорости обучения ERNIE в 4.1 раза за год
3. Система создания контента
- Лидерство на рынке создания презентаций (80% доля)
- Платформа Baidu Wenku
4. Автономное вождение
- Снижение затрат на картографирование на 95%
- Покрытие 3.6 млн км дорог
- Охват 41,000 городских и сельских районов
- Уменьшение размера карт на 97.5%
5. ИИ с "человеческой" памятью
- Имитация работы гиппокампа
- Используется в ИИ-ассистентах
6. Цифровые аватары
- Качество визуализации на уровне кино
- Применение в стримах
- Реалистичное 3D-клонирование
7. Генеративный коммерческий поиск
- Повышение эффективности таргетинга на 120%
- Прямое кодирование коммерческой информации
- Новая парадигма "Model as Index"
8. Data Flywheel
- Автоматическое определение недостатков модели
- Синтез тренировочных данных
- Снижение затрат на данные
9. Высокоэффективный вывод
- Экономия 50% затрат на развертывание
- Увеличение производительности в 3-5 раз
- Технологии: PrefixCaching, Lookahead, PagedAttention
10. Система поиска на основе пользовательских данных
- Охват 18% поискового трафика Baidu
- Быстрая самоадаптация
- Применение в поиске текста, видео и изображений
BCG: к 2030г. объем токенизированных фондов достигнет $600 млрд (1% от глобальных взаимных фондов и ETF)
Токенизированные фонды-фонды, где права собственности на доли представлены в виде цифровых токенов на блокчейне.
Они работают аналогично тому, как сегодня трансфер-агенты учитывают акции фондов.
Успешные примеры уже есть: Franklin Templeton запустил свой первый зарегистрированный в США фонд на блокчейне в 2021 году, а BlackRock в 2024 году запустил фонд BUIDL, который быстро достиг капитализации более $500 млн.
Токенизированные фонды имеют преимущества как взаимных фондов, так и ETF:
- предлагают высокую прозрачность цен
- обеспечивают лучшую ликвидность
- упрощают управление обеспечением по сравнению с взаимными фондами.
На конец 2024 года объем токенизированных активов под управлением составляет более $2 млрд.
Существует потенциальный спрос на $290 млрд со стороны владельцев цифровых активов.
При разрешении конвертации существующих фондов в токенизированные, объем может достичь триллионов $.
Ожидается переломный момент в течение следующих 12-18 месяцев. Рост будет связан с развитием регулируемых ончейн-денег (стейблкоины, токенизированные депозиты, CBDC).
OpenAI создает свой чип с Broadcom, который будет производиться на TSMC
OpenAI больше не хочет строить собственные заводы по производству чипов из-за затрат и времени, необходимых для создания сети.
А какие были планы по захвату мира чипов….
OpenAI также будет покупать чипы AMD в дополнение к GPU Nvidia для своих серверов ИИ. Специальный чип OpenAI не является GPU.
GitHub добавил поддержку Gemini, Claude и o1 в Copilot
Разработчики смогут выбирать удобную для себя модель, а
компании получат контроль над тем, какие модели доступны их командам.
Функция мультимодельности будет распространена на различные аспекты Copilot:
рабочее пространство, редактирование файлов, проверку кода, автоматическое исправление безопасности и CLI
- OpenAI o1-preview и o1-mini уже доступны.
- Claude 3.5 Sonnet будет развернут в течение следующей недели.
- Gemini 1.5 Pro появится в ближайшие недели
❗️Meta* разрабатывает свою поисковую систему на основе ИИ
Чтобы дать людям, использующим чат-бот Meta AI, ответы в формате разговора о текущих событиях
Таким образом Meta надеется снизить свою зависимость от Google Search и Microsoft Bing, которые в настоящее время предоставляют людям, использующим Meta AI, информацию о новостях, спорте и акциях.
Напомним, что OpenAI уже тестирует свой поисковик.
*Запрещенная организация в РФ.
ИИ-агенты против экосистем
Сейчас лидеры ИИ-рынка: Anthropic, OpenAI и Google делают ставку на развитие ИИ-агентов, способных управлять компьютером пользователя и автоматизировать работу с приложениями и браузерами.
Это может привести к тому, что актуальность самих приложений снизится, поскольку роботу не важен удобный интерфейс или красивый дизайн.
Однако разработчики крупных приложений с этим не согласны.
Например, Notion (компания стоимостью $10 млрд) уже активно интегрирует языковые модели от OpenAI и Anthropic в свой продукт. Их клиенты используют ИИ для автоматического заполнения таблиц и суммирования документов.
CEO Notion Иван Жао считает, что автоматизация управления курсором не так эффективна для продуктивности, как может показаться. Причина в том, что ИИ приходится работать с разными приложениями, сталкиваясь с паролями и другими барьерами. По его мнению, ИИ Notion эффективнее, так как может одновременно работать с разными источниками данных внутри своей экосистемы.
Интересный факт: Жао пытался купить ИИ-поисковик Perplexity в прошлом году, что могло бы расширить доступ Notion к данным.
Эта ситуация показывает, как интересы OpenAI и их крупных клиентов не всегда совпадают, несмотря на взаимовыгодное сотрудничество.
Другие компании, такие как Salesforce и ServiceNow тоже размышляют о влиянии ИИ-агентов на их бизнес.
CEO Klarna открыто говорит о планах использовать ИИ для сокращения расходов на программное обеспечение вроде Workday или Salesforce, хотя детали этих планов пока не ясны.
Современные ИИ-агенты, управляющие экраном, пока работают медленно и дороги в эксплуатации. Однако технология может значительно улучшиться в ближайшие год-два. У компаний вроде Notion есть время подготовиться к этим изменениям и разработать свой ответ на новый вызов.
OpenAI и другие компании продолжают развивать инструменты для программистов, что может еще больше упростить создание приложений.
❗️Создана 1-ая базовая ИИ-модель человеческого познания.
Среди авторов статьи: DeepMind, Оксфорд и др. лучшие университеты мира.
Centaur способна предсказывать и симулировать поведение человека в любых экспериментах, которые можно описать естественным языком.
Модель создана из масштабного набора данных (Psych-101) из 160 психологических экспериментов:
- данные от 60,092 участников
- Содержит 10,681,650 зафиксированных решений
- В основе лежит языковая модель Llama 3.1 70B, дообученная на этих данных
HuggingFace тут.
Результаты:
- Модель лучше существующих когнитивных моделей предсказывает поведение новых участников
- Успешно обобщает данные на новые эксперименты
- Точно предсказывает поведение людей при изменении условий и в новых областях
- Внутренние представления модели становятся более "человекоподобными", хотя она специально не обучалась на данных о мозговой активности
Авторы считают, что Centaur - это первый реальный кандидат на роль единой модели человеческого познания, о которой мечтал известный когнитивный ученый Алан Ньюэлл.
Минцифры РФ планирует создать собственное Linux-сообщество для разработчиков из стран, готовых сотрудничать с Россией.
Такое решение — реакция на отстранение российских разработчиков от мирового IT-сообщества. Следствием отстранения станет то, что нагрузка на разработчиков ядра в российских продуктах возрастет.
Cообщества без продукта быть не может, поэтому фактически Минцифры предлагает создать форк ядра Linux, отмечают эксперты.
Технически можно создать собственный форк Linux и развивать его усилиями российских специалистов. Для этого, потребуются большие ресурсы и доступ к знаниям, накопленным у разработчиков по всему миру за десятилетия.
Neiry планирует представить крыс с нейрочипами на своей конференции Neiry.RoundB 5 ноября в Москве
Саша Панов, CEO Neiry пишет, что на мероприятии будут презентованы первые результаты инвазивной программы стартапа и продемонстрированы животные с имплантированными нейроинтерфейсами.
Кроме этого компания планирует отчитаться о развитии и капитализации компании и сроках IPO. Также подробнее рассказать о проекте нейроэтика.рф и анонсировать новый раунд.
🔥В ноябре OpenAI запустит ИИ-модель, которая в 100 раз мощнее GPT-4 и отличается от модели рассуждений o1.
Название у модели - Orion, она не будет широко выпускаться через ChatGPT.
OpenAl планирует сначала предоставить доступ к ней компаниям, с которыми тесно сотрудничает, чтобы они могли создавать собственные продукты и функции. На Azure она появится уже в ноябре.
Хотя Orion рассматривается внутри OpenAl как преемник GPT-4, неясно, будет ли компания называть ее GPT-5.
Ранее мы писали, что у предполагаемой модели GPT-5 будет 3,5трлн.параметров.
❗️ 1-й известный случай удаленного взлома устройства ЭЭГ на физическом уровне.
Исследователи MIT обнаружили способ взлома нейроинтерфейсов.
В ходе лабораторных экспериментов исследователи создали систему Brain-Hack, которая продемонстрировала критическую уязвимость в работе нейроинтерфейсов.
Исследователи обнаружили новый способ атаки на устройства ЭЭГ путём дистанционного внедрения ложных сигналов мозговых волн через радиочастотное излучение.
Уязвимость подтвердилась на всех основных типах устройств:
1. Медицинское оборудование (Neuroelectrics)
2. С открытым исходным кодом устройство(OpenBCI)
3. Потребительские нейрогарнитуры (Muse)
Что удалось сделать?
❗️Перехват управления виртуальной клавиатурой: система писала текст, который хотели исследователи, а не пользователь
❗️Контроль над дроном: вызвали принудительную посадку дрона, управляемого через нейроинтерфейс
❗️Обман приложения для медитации: заставили систему показывать ложные данные о состоянии человека
Уязвимость найдена до её возможного использования злоумышленниками.
Потенциальные риски:
- Искажение медицинской диагностики
- Перехват управления устройствами
- Компрометация исследовательских данных
Технические особенности:
- Дальность действия: до 3 метров
- Стоимость необходимого оборудования: около $500
- Не требует физического доступа к устройству
- Работает через стены
- Уровень излучения безопасен для здоровья
Просто сравните развитие генИИ в РФ, Китае и США - слайд Грефа
По данным Сбера, у этих 3 стран свой сценарий развития рынка:
1. КИТАЙ - "Высококонкурентный"
- Большое количество AI-моделей (240+)
- Активное противостояние с США в сфере AI
- Развитие собственных технологий и компаний
2. США - "Олигополистический"
- Доминирование нескольких крупных игроков (Google DeepMind, Microsoft, OpenAI). Греф потом вслух добавил Meta(запрещенная в России).
- Фокус на конкретные ниши и продукты
- Компании нацелены на капитализацию
3. РОССИЯ - 2 крупных игрока: Сбер и Яндекс.
- Их развитие ограничено определёнными барьерами: низкое проникновение облачных сервисов, ограничения на экспорт и аппаратное обеспечение, санкционные ограничения
- Влияние открытых решений (Open Source)
- Адаптация существующих SOTA решений
Главное отличие в том, что в Китае формируется конкурентный рынок с множеством игроков, в США - олигополия с несколькими крупными компаниями, а в России - потенциал для развития двух основных игроков при существующих ограничениях.