@Futuris - канал о технологиях, будущем и не только. Contact @antonod
Исследователи из Google и Тель-Авивского университета разработали GameNGen — первый игровой движок, полностью основанный на нейронной модели, который позволяет взаимодействовать с игрой в реальном времени (Sora для игр). Модель способна симулировать классическую игру DOOM со скоростью более 20 кадров в секунду на одном TPU, с качеством изображения, сравнимым с сжатием JPEG. Для обучения модели использовался алгоритм с усилением (RL-агент), который играл в игру, создавая данные для генеративной модели. GameNGen использует диффузионную модель для предсказания следующих кадров, обеспечивая стабильное воспроизведение игры на протяжении длительного времени. Эксперименты показали, что люди с трудом отличают симуляцию от реальной игры🤯
Hello future of gaming👾
Пока я готовлю пост(-ы) для Substack (если ещё не подписались, хоть это и бесплатно и делается в два клика — обязательно сделайте это, осталось меньше 100 человек до второй планки, и тогда будет стрим с ответами на ваши вопросы!), давайте посмотрим на свежую новость про OpenAI. TheInformation пишет, что:
— два человека, вовлечённых в процесс, утверждают, что OpenAI может запустить давно порождающую слухи технологию Strawberry (ранее называлась Q*) уже осенью.
— Напомню, Strawberry якобы может решать математические задачи, с которыми раньше совсем не сталкивалась, а также она была обучена решать более сложные задачи в программировании. Но дело не ограничивается ответами на технические вопросы —система в целом будет куда лучше рассуждать и «думать»
— в рамках демонстрации модель смогла решить сложный пазл New York Times Connections (вот ссылка, попробуйте разобраться сами), где нужно объединять слова в группы по 4 по смыслу/теме
— сначала планируется выпустить маленькую версию Strawberry — это как бы не GPT-5, саму технологию будут использовать поверх GPT-4/ChatGPT. По сути это дистилляция из большой модельки в маленькую, как сейчас зачастую делают ведущие игроки
— кроме этого, есть проект Orion (в моей интерпретации это скорее всего GPT-5, но в новости про это не говорится), включающий в себя модели большего размера. Старшая версия Strawberry будет генерировать синтетические данные для дообучения и прокачки Orion
— синтетические данные нужны для того, чтобы преодолеть ограничения на получение достаточного количества высококачественных данных из реального мира для обучения Orion
— ожидается, что в сумме все техники + дальнейшее масштабирование существенно снизит долю ошибок/галлюцинаций моделей
— в мае на приватной встрече Sam Altman говорил, что «мы чувствуем, что нам хватает данных для обучения новой модели. Мы проделали все типы экспериментов, включая генерацию синтетики».
— OpenAI ожидает существенного прироста выручки от запуска этих двух систем (Orion и Strawberry), и ищет потенциальных инвесторов, чтобы привлечь ещё больше денег (как было в случае с Microsoft и $10B за ~2 месяца до GPT-4)
— но технология и модели по большому счёту уже готовы: по сообщения источника, летом OpenAI уже продемонстрировала Strawberry представителям агентств по национальной безопасности
Дополнительный контекст:
— следующая модель Gemini от Google и Claude 3.5 Opus от Anthropic должны появиться в первой половине осени, и моя догадка такова, что младшая версия Strawberry доберётся до ChatGPT/моделек примерно в то же время (OpenAI не может себе позволить отставать от конкурентов, будучи постоянным лидером в гонке). А вот Orion можем не увидеть ещё долго, больше полугода
Илон Маск опубликовал у себя в Х видео из гигантского нового суперкластера обучения искусственного интеллекта Cortex, который строится в штаб-квартире Tesla в Остине для решения «реальных задач искусственного интеллекта».
Обычно видео и фото в таких кластерах делать не дают, а ходить там можно только в бахилах, халатах и шапочках из фольги — так что наслаждаемся, пока можно.
RetroFuturism + soul music + AI video generator =❤️
А когда ИИ научится делать сразу готовые 3д сцены, мы сможем погружаться в сгенерированные миры в VR ✨
Запись того, как второй парализованный пациент с чипом Neural Link играет в CS 2
Просто бегать вокруг так приятно, потому что я могу смотреть по сторонам, и мне не нужно двигать Quadstick (джойстик) влево и вправо... Я могу (думать о том, куда) смотреть, и оно идет туда, куда я хочу. Это очень круто
OpenAI опубликовала результаты нового теста по решению реальных задач программирования с использованием искусственного интеллекта. Модель GPT-4o, доработанная с примерами от реальных программистов, показала впечатляющие результаты на SWE-bench — специальном бенчмарке для оценки ИИ в кодировании. Cosine Genie, эта версия GPT-4o, достигла нового рекорда — 43,8% успешных решений задач на SWE-bench Verified и 30,08% на полной версии теста. Это на 13% лучше предыдущего результата, что является крупнейшим улучшением в истории этого теста. Эти достижения показывают, что ИИ становится всё более эффективным в программировании, хотя его пока сравнивают с начинающими программистами🤷♂️
Читать полностью…А ещё вот AI-visual mix вам насобирал🍓 с винтажными супер-героями от Midjourney в придачу ✨
Читать полностью…Обожаю такие истории про юных вундеров:
17-летний студент Чезаре Менкарини разработал рабочий малый термоядерный реактор в рамках своего учебного проекта. Проект, созданный для получения нейтронов, стал частью его экзамена по расширенной квалификации (EPQ). Реактор, собранный в условиях школы🤯(парень буквально покупал компоненты в магазинах), недавно был представлен на Кембриджском научном фестивале, где успешно продемонстрировал достижение плазмы. Несмотря на опасения преподавателей по поводу безопасности проекта, Менкарини провел все необходимые оценочные работы и доказал, что проект безопасен. На его создание ушло 18 месяцев, и студент получил высший балл на экзаменах. В будущем Чезаре планирует поступить в университет и продолжить карьеру в области инженерии, возможно, начав с работы в Университете Бристоля.
Нужно понимать, что реактор Менкарини — это небольшой учебный проект, способный достичь плазмы, но не предназначенный для генерации энергии. В отличие от промышленных реакторов, он не может создавать условия, необходимые для поддержания термоядерного синтеза, такие как высокие температура и давление.
Но просто представьте на что способен такой ум в тандеме с ИИ, будущие Тони Старки уже среди нас 🦾
Если через год мы будем смотреть подобные самодельные полнометражные мульты, то Диснею осталось недолго 😜
Читать полностью…Новость настолько нереально звучит, что хочется верить, что это правда:
Стартап SingularityNet (очень созвучно со SkyNet🧐) объявил о планах запустить «многоуровневую, децентрализованную когнитивную вычислительную сеть» в ближайшие месяцы, которая может стать основой для создания искусственного общего интеллекта (AGI)🤯 Система будет построена на базе суперкомпьютера, оснащенного современными компонентами, включая GPU Nvidia L40S, процессоры AMD Instinct и Genoa, серверные стойки Tenstorrent Wormhole с GPU Nvidia H200, а также системы Nvidia GB200 Blackwell(!) Эта мощная инфраструктура позволит обучать модели AGI, которые смогут превзойти человеческий интеллект. Ожидается, что суперкомпьютер станет доступен в конце 2024! или начале 2025 года, и пользователи смогут взаимодействовать с системой через токен-систему.
Вот за этим стартапом я точно буду следить🤓 AGI в 2025? Сингулярность к 2027?
а тем временем мой любимый ai-плагин для Krita обновился и там добавили поддержку FLux! и даже смог запустить на ноуте, да ждать по две минуты одну пикчу, но зато бесплатно👻 (ахха не заметил что половина светового меча синяя🙃, но зато с руками порядок!)
Читать полностью…Оказывается, мы уже пару дней как пользуемся новой gpt4o, не той, что возможно объявят сегодня, но на реддите уже успели заметить улучшение в логике и более человечных ответах ✨
Читать полностью…Делать было нечего и сделал с помощью gpt4o и информации из вики таймлайн выхода основных LLM (так-то их намного больше) . Конечно, количество не значит качество, да и размеры растут, но всё равно интересно наблюдать за прогрессом и конкуренцией ✨
Читать полностью…Только что Google обновила модели Gemini 1.5 Pro (ver 0827), Flash-8B и улучшенную версию модели Flash в линейке Gemini 1.5✨ (видимо в ответ на недавнее обновление GPT4o, которое сместило Gemini 1.5 Pro с пьедестала на LLM арене)
Го пробовать (VPN-USA)
https://t.co/fBrh6UGKz7
Тут некая команда Nous Research разработала технологию DisTrO (Distributed Training Over-the-Internet), которая позволяет обучать большие нейросети через интернет с гораздо меньшими затратами на передачу данных между видеокартами. DisTrO уменьшает объем передаваемых данных в 1000 -10000 раз🤯 что делает возможным обучение даже при медленном интернете и разном оборудовании. Это открытие позволит исследователям и компаниям работать над созданием мощных нейросетей без необходимости в дорогостоящих суперкомпьютерах. DisTrO делает процесс более доступным и независимым от крупных игроков, открывая больше возможностей для инноваций и совместной работы (привет Nvidia)
Команда выложила предварительный отчет и планирует выпустить код и полный алгоритм позже. Это может изменить подход к обучению ИИ, особенно в распределенных сетях и на обычных ПК✨
Как говорится, Big if true, ждём дальнейших новостей от этой команды и возможно скоро все сольёмся в одну ИИ-сеть🌐
В интересное время живём🌚
Пока Карпатый уже не может представить, как работать без копайлота или Cursor, Амазоновские перелопатил половину корпоративного спагетти-кода, юзая их Amazon Q*.
Чуваки прикинули и пришли к выводу, что за пару недель сэкономили 4500 лет (sic!) работы человека-разработчика. Сначало не верится, но если учесть, что 80% кода они отправили напрямую в прод... хочется задуматься о перспективах работы для программистов.
Новая простыня отличается повышенной безопасностью и эффективностью (конечно, со слов разработчиков, ещё посмотрим какие дыры проявятся через некоторое время). А вообще, оптимизация должна принести Безосу лишние 260М в год👍
С одной стороны, в очередной раз press F джунам, с другой — ребята, пока еще не все выкупили фишку, устраивайтесь скорее на синьоров в старые компании и переписывайте им код за нормальную зп😁
* Amazon Q - это амазоноаский копайлот, который под капотом все также использует GPT, имеет доступ ко всей базе кода и документов внутри компании, плюс некий обвес из пайплайнов и интерфейсов вокруг. Вот тут про него.
@ai_newz
Хаха, проверил, Luma 1.5 может💪 Превратить лорда тьмы в Дядю Фестера🌚
Читать полностью…Тут вышел очередной генератор картинок https://ideogram.ai/
Ежедневно можно нагенерить около 40 штук, вроде неплохой 👌
А вот Midjourney хоть и вышел из дискорда, так и остался платным 🌚
Только пожаловался на отсутствие ИИ-новостей как LumaLabs выкатили апдейт✨
Теперь с улучшенным качеством текст-видео, более умным пониманием ваших запросов, настраиваемым отображением текста и улучшенной функцией создания видео из изображений🫡 Видимо конкуренция с Runway 3, Kling и невыпущенной до сих пор Sora делает своё дело😏
Пока в ИИ среде новостное затишье решил последить за игровой индустрией 🎮 Сейчас просто началась ежегодная крупнейшая игровая конфа Gamescom 2024, там уже есть несколько интересных тайтлов, но речь не об этом. Неожиданно Nvidia выкатила новую нейронку Nemotron 4B, которая гоняет на любых видюхах серии RTX и предназначена для реалистичного общения с игровыми персонажами ✨
Понятно, пока это просто уточняющие разговоры уровня куда пойти, что лучше выбрать для миссии и внедрили её пока в один меха онлайн экшн (кстати симпатичный), а не рпг, но начало положено👌
Жду мода на Скайрим где наконец-то можно будет узнать у стражника историю как ему прострелили колено 🌚
https://blogs.nvidia.com/blog/digital-human-technology-mecha-break/
В общем делать было нечего, засел рисовать фанарт по варкрафту в своей любимой Krita AI иии что-то увлёкся и сделал короткие видосы с помощью Runway3 а звуки в ElevenLabs 🤓
На всё ушло пару часов, при том что я не профи в рисовании и анимации, вот что делает коллаборация ИИ+увлечённость, через год буду сам себе мульты клепать✨
Сами картинки тут
https://runware.ai/
Моментальная генерация картинок Flux 🤯(понятно что урезанный, но все равно технология впечатляет, интересно что через пол годика будет😉)
Будущее прекрасно ✨
Еще ai-видосов в ленту. Уже и трейлер новой игры престолов и реклама адидас за 2 часа, что будет через год? Удивлюсь если крупные компании не начнут внедрять ai редакторы в процессы (ну и заменять частично людей) ✨
Читать полностью…Grok-2 вышел в альфе. Кто-то уже получает доступ. Он мощнее Claude 3.5 Sonnet, но до gpt4o не дотягивает, особенно после недавнего апдейта, который сделал модельку от OpenAI лидером на чат-бот арене✨
А ещё в Grok-2 встроен Flux. Ждём более крупных релизов - этот не впечатлил 🤓
Прямо сейчас гугл показывают конкурента VoiceMode от OpenAI✨ А предсказание выпуска новой модели OpenAI iruletheworldmo перенёс на четверг🤡 Но к слову, ровно в 20.00 OpenAI выкатили обновление "Preparedness Framework", который отслеживает и оценивает способности моделей к автономной работе - похоже готовят всех к чему-то крупному🌚
https://www.youtube.com/watch?v=N_y2tP9of8A
Завтра преза Google, где представят новые пиксели и скорее всего новые модели Gemini (которые, возможно будут работать прямо на устройстве по аналогии с Apple), может даже объявят о новых грядущих крупных моделях, в общем будем смотреть в 20.00 МСК
А ещёёё, на реддите развели беседу, что якобы завтра в это же время OpenAI представят новую архитектуру (strawberry) и модель "gpt-4o-large", всё это с подачи одного популярного в твиттере ликера iruletheworldmo, ну и ему там дали последний шанс, если прогноз не сбудется, то и я не буду больше его упоминать🌚
День творчества продолжается: Почитал/послушал пост Denis и не удержался решил Тристрам из Диабло 2 сделать earworm с пианино и скрипкой (сори за качество, не знаю почему нейронка захотела полифонию сделать, видимо 5 сек оригинального аудио слишком мало, но для тех лет самое то🌚) рисуночек тоже ai-generated
Читать полностью…Чувствую, что скоро просмотр AI фильмов по выходным станет отдельной рубрикой на канале😜
Mj+Kling/Runway
Видео с полётом в звездолёте наталкивает на мысли о потоковой AI-generated графике в играх будущего (может не такого далёкого😜)