Неожиданно, но новость не про новую LLM (их сейчас и так хватает🤓)
Тут ученые из компании Google DeepMind разработали новаторскую виртуальную модель мушки-плодовки🪰, обладающую искусственным интеллектом. Эта модель способна имитировать ходьбу и полет насекомого с высокой степенью реализма, благодаря точному воспроизведению анатомии внешнего скелета мушки, использованию продвинутого физического симулятора и обучению искусственной нейронной сети на основе поведения реальных мух. Виртуальная мушка может выполнить сложные маневры полета и ходьбы, включая повороты, кратковременные остановки и регулировку скорости.
Исследователи особо подчеркивают, что данная модель — это первая итерация их виртуальной мушки, которую в дальнейшем планируется усовершенствовать, добавив дополнительные анатомические и сенсорные особенности, а также использовать реальные нейронные сети. Создание таких моделей открывает новые перспективы для науки, позволяя глубже понять, как нервная система, тело и внешняя среда взаимодействуют для управления поведением, что было труднодостижимо при работе только с живыми организмами в лабораторных условиях.
Уже представляю рои таких мушек-шпионов на вооружении у спец служб🌚
https://www.janelia.org/news/artificial-intelligence-brings-a-virtual-fly-to-life
В ряду ИИ-ассистентов прибыло🤖⚡️
Стартап Cognition представил "Devin" – уникального ИИ-программиста, способного автономно управлять разработкой проектов от начала до конца, включая написание кода и исправление ошибок. Отличаясь от аналогов типа Github Copilot, Devin может самостоятельно выполнять задачи, даже на Upwork, становясь первым в своем роде полноценным ИИ-сотрудником для инженеров.
На тесте SWE-bench, где ИИ-помощники решают задачи с реальными проектами на GitHub, Devin продемонстрировал способность самостоятельно решать 13.86%🤯 задач, в то время как конкуренты, включая Claude 2, SWE-Llama-13b и GPT-4, показали результаты в 4.80%, 3.97% и 1.74% соответственно, при этом требуя внешней помощи. Пока доступ к Devin ограничен только для избранных клиентов, но заявку можно подать на сайте.
Отдельно понравилась реакция dev-сообщества (см скриншот🌚), видимо разработчикам всё больше становится не до шуток при таком стремительном выпуске всё более продвинутых ИИ-моделей.
Подписчики протестировали этого "Умного" чат-бота, оказалось кринж ниже уровня GPT 3.5, вот так бывает, кликбейт в мире LLM 🤷♂️
Читать полностью…Что-то интересное происходит с Claude 3 Opus🌚 За последние сутки много учёных с научными степенями и исследователей делятся впечатлениями о способности алгоритма понимать и оперировать сложными научными темами. Отмечены случаи, когда Claude 3 самостоятельно разработал квантовый алгоритм и продемонстрировал владение языком, на котором ранее его не обучали - речь идёт о черкесском языке. Даже с небольшой выборкой в 5.7 тысяч переводных пар, Claude 3 Opus смог достигнуть высокой точности перевода и глубокого анализа языка, чего не удалось достичь другим моделям, включая GPT-4. Также алгоритм быстро нашел научные решения, над которыми ученые работали месяцами.
Ждём ответа от OpenAI и вообще, похоже, мы на пороге крупного открытия в области ИИ и скачка науки и технологий в целом✨
https://twitter.com/BenBlaiszik/status/1765097390158000541
https://twitter.com/GillVerd/status/1764901418664882327?t=Y1fXXlR-RLsOJ97HwRDrQw
https://twitter.com/hahahahohohe/status/1765088860592394250?t=q5pXoUz_KJo6acMWJ79EyQ&s=19
УХ🔥
Anthropic представили серию AI-моделей Claude 3, превосходящих GPT-4 и Gemini Ultra в тестах. Ключевой моделью линейки является Opus, который, по заявлениям компании, способен выполнять широкий спектр задач лучше любой другой доступной системы AI.
Opus демонстрирует впечатляющие результаты на академических тестах, таких как GSM-8k и MMLU. Серия также включает модели среднего уровня Sonnet и предстоящую модель Haiku, ориентированные на экономичность и скорость для бизнеса. Все модели поддерживают ввод изображений, расширяя возможности применения в различных отраслях. Anthropic также уделяет внимание проблеме предвзятости в AI, стремясь к созданию моделей, ориентированных на широко признанные ценности и подходящих для всех пользователей.
А что там с роботами?🤖
Компания Figure из Сан-Франциско, подтвердила, что привлекла 675 миллионов долларов в рамках раунда финансирования Серии B, что позволило оценить стартап в 2,6 миллиарда долларов. В число инвесторов входят крупные игроки, такие как Microsoft, OpenAI, Nvidia, Amazon Industrial Innovation Fund, Jeff Bezos через Bezos Expeditions, Parkway Venture Capital, Intel Capital, Align Ventures и ARK Invest. Фирма, численность персонала которой составляет всего 80 человек, уже привлекла внушительные средства: основатель Brett Adcock изначально вложил 100 миллионов долларов, а в прошлом мае было добавлено еще 70 миллионов долларов в рамках Серии А. Figure, основанная в 2022 году с амбициозной целью создать ходячего бипедального робота в течение года, уже достигла этой цели.
Стартап активно работает над созданием роботов для промышленного использования и недавно заключил партнерство с OpenAI для разработки новых моделей ИИ для гуманоидных роботов, что должно ускорить коммерческий запуск продукта. Кроме того, Figure уже подписала договор с BMW на развертывание робототехники.
Говоря об оживших фото и портретах.. 🤯 Похоже будущее наступает слишком быстро 🌚
https://humanaigc.github.io/emote-portrait-alive/
Парижский стартап Mistral AI объявил о запуске новой модели искусственного интеллекта под названием Mistral Large и чат-ассистента Le Chat, предназначенных для конкуренции с GPT-4 и ChatGPT соответственно. Mistral AI утверждает, что их модель занимает второе место после GPT-4 по ряду бенчмарков. Mistral Large, ориентированная на высокие способности рассуждения, поддерживает пять языков и предлагается по цене значительно ниже, чем GPT-4. Le Chat, доступный в бета-версии, позволяет пользователям выбирать между разными моделями для общения и планирует внедрение платной версии для корпоративных клиентов. Компания, основанная выпускниками Google’s DeepMind и Meta, собрала значительные суммы средств для разработки своих моделей и теперь сотрудничает с Microsoft для предоставления своих моделей через Azure, расширяя своё присутствие на рынке.
https://techcrunch.com/2024/02/26/mistral-ai-releases-new-model-to-rival-gpt-4-and-its-own-chat-assistant/?guccounter=1
Неожиданно Adobe вступает в AI-race💫
Adobe объявила о запуске встроенного искусственного интеллекта в приложениях Reader и Acrobat, который способен создавать резюме и отвечать на вопросы по документам PDF. Этот помощник, находящийся на стадии бета-тестирования, ускоряет анализ длинных текстов, отличаясь от аналогичных сервисов, таких как ChatGPT, тем, что не требует загрузки документов пользователями. Помимо генерации кратких обзоров и ответов на вопросы, AI может создавать цитаты для проверки источников информации и тексты для различных форматов. Adobe планирует ввести подписку на этот инструмент после завершения бета-тестирования, стремясь демократизировать доступ к триллионам PDF-документов.
https://www.cnbc.com/2024/02/20/adobe-launches-ai-assistant-that-can-search-and-summarize-pdfs.html
Вы не поверите: Не успели спецы из Google представить революционную (нет) модель Gemini Ultra, как уже анонсировали и выкатили в ограниченный доступ через API новую модель Gemini 1.5, которая конечно же будет умнее и сможет обрабатывать до 1 млн токенов. Судя по тому как выглядит распиаренная Gemini Ultra - а она едва дотягивает до уровня GPT-3.5, как-то с трудом верится в эти столь спешные анонсы, но AI-гонка продолжает набирать обороты 🌚
Читать полностью…OpenAI в партнёрстве с Microsoft Threat Intelligence обнаружили и деактивировали аккаунты, принадлежащие 5 группировкам, связанным со злоумышленниками и государствами.
Для чего им потребовались модельки OpenAI?
1️⃣Charcoal Typhoon (Китай 🇨🇳): исследования различных компаний и инструментов кибербезопасности, отладка и написание кода, а также создания контента, который может быть использован в фишинговых кампаниях.
2️⃣Salmon Typhoon (Китай🇨🇳): перевод технических статей, получение общедоступной информации о многочисленных разведывательных агентства, снова программирование, и исследование распространенных способов сокрытия процессов в операционной системе (для создания вирусов).
3️⃣Crimson Sandstorm (Иран 🇮🇷 ): написание веб/мобильных приложений, относящихся к текстовой поддержке, создание фишингового контента, и исследование распространенных способов, с помощью которых вредоносное ПО может избежать обнаружения.
4️⃣Emerald Sleet (Северная Корея 🇰🇵): использовали сервисы OpenAI для выявления экспертов и организаций, занимающихся вопросами обороны в Азиатско-Тихоокеанском регионе, понимания общедоступных уязвимостей, помощи в выполнении основных задач по написанию сценариев и подготовки контента, который можно было бы использовать в фишинговых кампаниях.
И НАКОНЕЦ...специалисты из СБ Сбербанка!
👋Forest Blizzard (Россия, группировка связана с ГРУ 🇷🇺): исследование открытых источников в области протоколов спутниковой связи и технологий радиолокационной визуализации. Ну и программирование до кучи.
А вы говорите в гугле так и так всё есть!
(ну и дежурное напоминание, что модели следующего поколения будут ещё более эффективнее в ассистировании даже таким задачам)
Читать у OpenAI
Читать более подробно в блоге MSFT
Covariant, стартап из Беркли, запустил платформу GPT для роботов, а точнее RFM-1 (Robotics Foundation Model 1), которая использует большие языковые модели для улучшения "мышления" наших железных братьев. Эта разработка позволяет роботам лучше понимать язык и физический мир, облегчая адаптацию к различным задачам без перепрограммирования. RFM-1 ориентирована на использование во многих сферах, включая складское хозяйство и домашнее обслуживание и работает с разными типами роботизированного оборудования🦾
https://techcrunch.com/2024/03/11/covariant-is-building-chatgpt-for-robots/
Компания Inflection выпустила Inflection-2.5, улучшенный ИИ, сопоставимый с GPT-4, но требующий на 40% меньше вычислительных ресурсов. Похоже OpenAI пора делать свой ход, а то GPT-4 становится общепринятой нормой для новых чат-ботов🤓
https://inflection.ai/inflection-2-5
Интересный момент, раскрытый инженером Anthropic Алексом Альбертом, что при тестировании Claude 3 Opus исследователи обнаружили, что она, казалось, осознала, что ее тестируют🌚 В частности, при оценке способности модели фокусироваться на конкретном фрагменте информации в большом массиве данных, а затем вспоминать эту информацию по запросу, модель не только нашла правильный ответ на вопрос о начинках для пиццы из единственного предложения, среди большого количества нерелевантной информации, но и сообщила исследователям, что подозревает, что ее тестируют. Это свидетельствует о новом уровне самосознания и метапознания искусственного интеллекта✨
https://venturebeat.com/ai/anthropics-claude-3-knew-when-researchers-were-testing-it/
Первое минутное видео от Sora, обратите внимание насколько чёткие картины🤯
"fly through tour of a museum with many paintings and sculptures and beautiful works of art in all styles"
С марта владельцы каналов в Telegram начнут получать доход от рекламы, используя блокчейн TON🌚
Читать полностью…Новое видео от OpenAI — оказывается Sora умеет превращать фото в видео 🔥
Похоже нас ждут ожившие фото из Гарри Поттера 🌚
Ну и ещё немного Sora✨ стеклянная черепаха уползает в закат, преломление света, песок, отражения.. 🤯 Интересно, сколько бы заняло времени создать такое же cgi? часы, дни, недели 🤔
Читать полностью…Тут старший научный сотрудник в команде робототехники Google DeepMind тизерит какие-то крутые анонсы в робототехнике и AI в ближайшие недели, чтож будем ждать✨ И это только их команда, а сколько компаний готовят представить свои технологические прорывы 🌚 похоже этот год, станет репетицией будущего, где технологические прорывы станут ежедневной нормой🤓
Читать полностью…Пока все говорят о впечатляющих возможностях Sora, как-то упустили из вида не менее значимые новости про гугловскую модельку Gemini 1.5, а там очень интересно, вот некоторые из последних:
Gemini 1.5 успешно справилась с задачей создания персонажа для сложной ролевой игры по 352-страничному правилу, которое ранее не удавалось другим моделям ИИ. Инструкции были разбросаны по множеству страниц и представляли собой сложную задачу, но Gemini смогла разобраться.
После загрузки полного кода прямо с GitHub и всех сопутствующих проблем, Gemini не только поняла весь код, но и определила наиболее срочную проблему, а затем реализовала решение.
Показав Gemini 1.5 полный код самоорганизующегося компьютера и пример вызова API Gemini 1.5, модель смогла не только идеально объяснить, как работает код, но и интегрировала себя как новую поддерживаемую модель для репозитория, хотя и с небольшими неточностями.
Прогнозируется, что Gemini 1.5 будет примерно в 20 раз дешевле, чем GPT-4🤯 что может создать серьезную конкуренцию для OpenAI. Gemini 1.5 Pro демонстрирует сопоставимые с GPT-4 результаты в тестах, при этом имеет поразительные возможности обучения в контексте и длину контекста до 1 миллиона токенов. Учитывая высокую эффективность вычислений за счет использования архитектуры с мягкими механизмами внимания и специализированными экспертами, стоимость использования Gemini 1.5 Pro может быть сопоставима с GPT-3.5, предлагая при этом качество на уровне GPT-4, что ставит под угрозу доминирование OpenAI на сегодняшнем поле битвы ИИ-моделей, но судя по интенсивности ИИ-новостей, нас ждут очень интересные времена🌚
Примеры симуляции игрового мира Minecraft. Игрок может перемещаться, у него консистентно отображается инвентарь снизу, а окружение вокруг не меняется при изменении угла взгляда.
Разве что свинья пропадает в один момент 🐷
Добавить возможность менять генерацию видео на лету и можно играть в AI-GTA да и вообще любую игру себе заказывать, только управлять голосом🤓 Ох уж это будущее🌚
Читать полностью…Что за день анонсов✨ Ответка гуглу от OpenAI (или просто запланированный релиз🌚)
Text2video модель Sora - модель может генерировать видео длительностью до минуты, сохраняя при этом высокое качество визуализации и точность выполнения пользовательских запросов. Основная цель разработки Sora — обучение ИИ пониманию и моделированию физического мира в движении, чтобы помогать людям решать задачи, связанные с взаимодействием с реальным миром. Пока доступна ограниченному кругу творческих профессионалов.
Ждём обновы ChatGPT🤓
https://openai.com/sora#research
Ого, Nvidia представила раннюю версию Chat with RTX — приложения, позволяющего запускать личного AI-чат-бота на ПК✨
Это приложение может анализировать видео с YouTube и документы пользователя, создавая резюме и предоставляя релевантные ответы на основе локальных данных. Для работы требуется GPU серии RTX 30 или 40 с минимум 8 ГБ видеопамяти. Chat with RTX умеет обрабатывать видео и документы, мгновенно находя в них нужную информацию, что может быть полезно журналистам и исследователям. Несмотря на некоторые недочеты и отсутствие памяти диалога в демо-версии, приложение показывает большой потенциал для анализа данных на локальном ПК без необходимости подписки на облачные сервисы.
Как знал, что мои 8гб видео не только для игрушек и Stable Diffusion пригодятся🌚
Видео преза https://www.youtube.com/watch?v=gdsRJZT3IJw
Качаю тут - https://www.nvidia.com/en-us/ai-on-rtx/chat-with-rtx-generative-ai/