Kling генерации
⭐️ Приятное видео воссоединения одного и того же человека в молодости и в старости.
🧠 Все это сделано в Kling видеонейронке. Предварительно сшив две фотографии из разного возраста звезд в одну картинку и похоже подав с промптом на обнимание. 🐈⬛Доступ к видеонейронке только с валидным китайским номером.
☺️ Хотя с таким же подходом можно подать видео в Dream machine
Наткнулся на популярный тикток с img2vid, в комментариях хвалят такой AI контент, может постепенно и хейтеров Gen video станет меньше 🌚
Похоже на когда я с Dalle по музею ходил
Полезную ссылку принес:
https://defrag98.com
Открываем сайт, запускаем дефрагментацию диска C:, умиляемся насколько вы старый, что помните что это такое
P.S. Звук не забудьте включить
Недавно провел часовую встречу по работе, записал ее на видео, и решил потестировать Google Gemini 1.5 Pro в плане анализа аудио и видео – скормил ей видео файл на ~50 минут и начал задавать вопросы по встрече
Gemini 1.5 Pro начала выплевывать ответы по предложению, при этом тратя 960 тысяч токенов на запрос 🎶
В итоге, самый дешевый и быстрый способ получить важные инсайды по встрече, это пройтись по аудио-дорожке с помощью Whisper (я использовал этот мак апп, но вообще это Open Source модель) и уже полученный текст, приносим в Sonnet 3.5 и задаем по встрече вопросы с температурой 0
В итоге, на часовую встречу тратится примерно 11 тысяч токенов. Если вам кажется, что модель придумала что-то, можно спросить не галлюцинация ли это следующим сообщением и она поправит себя
Я знаю, что есть готовые сервисы анализа встреч, но зачем платить за еще одну подписку, если всех дел минут на 10
P. S. Промпт агента анализатора текста где-то уже есть в канале, но быстрее тут сделать с нуля, можно даже под конкретную тему встречи
Если бы не ML-модели стоимостью в миллионы долларов, мы никогда бы не узнали как хотдог ест еду в китайском ресторане
Ave AI 🇻🇦
Помните Apple VR шлем? В общем, желающих купить VR шлем за 3500$ оказалось меньше 100 000 человек в последнем квартале, и всего продали устройств, видимо, в этом диапазоне
Вообще, Apple красавчики, продали шлемы разработчиков под видом девайса для всех и теперь он пылится у обычных юзеров на полке, так не все компании умеют
Самое интересное, что про шлем Apple вообще ничего не видно / слышно, будто просто все поигрались и забыли
Ждем новые версии, дешевле как минимум и спасибо за бета-тест юзерам США, сэкономили мне денег ☕️
Более полезный пример, тоже Kling и в этот раз img2vid:
На вход подают коллаж из родственников которых уже нет с нами и модель генерирует «встречу» родных
Уверен, будет популярным аппом через какое-то время, как и оживление исторических фоток в целом
Тут стартап futureresearch сделал доклад о доходах OpenAI за год:
$1.9B за ChatGPT Plus (7.7M подписчиков по $20/мес),
$714M от ChatGPT Enterprise (1.2M по $50/мес),
$510M от API, и
$290M от ChatGPT Team (80k по $25/мес)
$3.4B общего годового дохода
Данные собирали по косвенным показателям, поскольку это не официальный отчет – зато порядок чисел интересный, АИ-масс адаптация еще не случилась это точно
Вы наверное уже слышали, что Испания планирует сделать «порно-паспорт», мне стало интересно как он будет работать для обычных пользователей – если коротко, VPN будет работать намного проще ☕️
– Испанцы введут «порно-паспорт» уже этим летом
– Получить цифровой порно-паспорт, можно будет через приложение «Cartera Digital
» (там проверяется возраст пользователя с помощью реальных документов, как на крипто бирже и тп)
– После проверки пользователь получит 30 токенов, действительных 30 дней, после чего потребуется повторная проверка возраста для получения новых 30 дрочкоинов (простите). 1 токен дает 10 входов на порно сайт, после чего сгорает.
– Не сложной математикой мы можем подсчитать, что испанским мужчинам и женщинам теперь запрещается мастурбировать больше 300 раз в месяц (30 дрочтокенов х 10 использований на каждый). Наверное это даже к лучшему, но на месте испанцев я бы таких людей вывел в отдельную спортивную лигу.
– Данные о пользователях не будут сохраняться, а приложени «Cartera Digital»
, а само оно будет проверено Национальным криптологическим центром Испании
– Для входа в приложение потребуется биометрическая аутентификация или код
– При входе на порносайт пользователь должен будет отсканировать QR-код или перейти по ссылке для подтверждения возраста
– Ограничений на количество просмотров в месяц не будет (хоть на этом спасибо), но потребуется обновление токенов каждый месяц, ограничены «логины» на сайт – будет ли автоматически система разлогинивать я пока не понял, но видимо будет
– Аналогичная система будет применяться для онлайн-гемблинга
Жесть, теперь чтобы, как бы, провести время в интернете с удовольствием, испанцам придется целую инструкцию с собой носить
Но что-то мне подсказывает что лень победит и VPN станет там популярнее
Статья тут:
https://www.theolivepress.es/spain-news/2024/07/05/spains-new-porn-passport-is-coming-this-summer-heavy-users-to-receive-alerts-but-will-they-really-be-cut-off-after-30-views/
Принес клевый плейлист для любителей английского 🌐, внутри – самые необычные или выдающиеся видео на разные темы:
– Поп-культуру;
– Интернет-феномены и тайны;
– История и анализ видеоигр;
– Исторические события и фигуры;
– Психологические и социологические темы;
– Преступления и нераскрытые тайны (True Crime жанр);
Есть видео по 5 часов длинной, есть нишевые легенды вроде MyHouse.WAD, есть разбор почему Disneyland не смог сделать Star Wars отель – короче, если вы ценитель интернет культуры и хороших историй, вам точно понравится.
А если вы ютубер, то можете посмотреть жанры которые наиболее популярны – и поискать похожие темы для своих видео.
Можете включать шафл и наслаждаться – 56 отборных видео:
https://www.youtube.com/playlist?list=PLeDKoZu8rkpWk5rWK8THhSXQwsjGpur_v
Наткнулся на реддите на пост "самых необычных сценариев использования ChatGTP", подумал, что может быть интересно – выгрузил все комментарии, прогнал через Sonnet 3.5 с температурой 0 (чтобы она не придумала ничего), такие кейсы самые «необычные»:
1. Создание персонализированных детских книг: Генерация историй с участием членов семьи или на определенные темы (где-то заплакал один стартапер)
2. Анализ снов: Интерпретация снов с помощью специального промпта с собственной мифологией и антропоморфными конструкциями (wtf).
3. Разработка программ тренировок на основе доступного домашнего спортивного оборудования и ежедневных данных о восстановлении.
4. Создание бюджетов в стиле средневекового английского языка: Преобразование ежемесячных расходов в систему управления финансами фэнтезийного королевства (пожалуй, это я и сам попробую).
5. Создание кампаний для Dungeons & Dragons: Разработка сюжетных линий, персонажей и даже создание видеосценариев для подведения итогов сессий.
6. Анализ меню пива в ресторанах: Рекомендации по выбору пива на основе личных предпочтений и доступных вариантов (автор использует этот метод, когда приходит в новое место и там куча пива и не ясно какое ему понравится).
7. Определение безопасных для детей растений в саду: Анализ фотографий клумб для обнаружения и предоставления информации о ядовитых растениях для детей.
8. Написание некрологов: Помощь в составлении уважительных и персонализированных памятных текстов для членов семьи (надеюсь, редкий сценарий).
9. Создание пользовательских GPT для конкретных задач: Например, GPT, который исследует наблюдаемые экзопланеты с местоположения пользователя (GPT подключается к базе данных Калифорнийского технологического института для получения информации об экзопланетах, и фантазирует их особенности, рисует с Dalle их поверхность и тп)
10. Создание текстов рэп-песен о медицинских процедурах: Создание юмористических, тематических объяснений медицинских процедур (например, лечение камней в почках в стиле Biggie Smalls).
11. Анализ чеков из продуктовых магазинов: Пользователи фотографируют чеки и просят ChatGPT рассчитать макронутриенты и калории для купленных продуктов, что помогает в отслеживании питания.
12. Создание персонализированных тренировок для мозга: Разработка ежедневных упражнений для ума, основанных на интересах пользователя, чтобы заменить бесцельную прокрутку ленты в социальных сетях.
13. Генерация "фанфиков" о реальной жизни: Пользователи описывают свою повседневную жизнь и просят ChatGPT создать альтернативные, более захватывающие версии событий (Такой у нас SciFi конечно дикий развивается, если это в топе залайканных сценариев)
14. Виртуальный помощник по садоводству: Анализ фотографий сада пользователя, предложение оптимального расположения растений и создание графиков полива и ухода за растениями.
15. Создание персонализированных музыкальных плейлистов для различных ситуаций: Например, плейлист для поездки по определенному маршруту, где каждая песня соответствует конкретному месту или достопримечательности на пути (Ну, это мы делали уже с вами)
16. Виртуальный историк семьи: Пользователи вводят известные факты о своих предках, а ChatGPT помогает создать подробные биографии и предполагаемые истории жизни, основываясь на исторических данных соответствующей эпохи (без комментариев, лженаука)
17. Генератор альтернативных окончаний для фильмов и сериалов: Зрители описывают сюжет до определенного момента, а затем просят ChatGPT придумать неожиданные или более удовлетворительные концовки (Хочу такое же, но для целого сезона Игры Престолов).
18. Виртуальный дегустатор вина: Пользователи описывают вкусовые предпочтения и имеющиеся продукты, а ChatGPT рекомендует идеальные сочетания вин и блюд, а также предлагает рецепты коктейлей.
19. Помощник в создании персональных ритуалов: ChatGPT помогает разработать индивидуальные утренние или вечерние ритуалы, основываясь на целях пользователя, его распорядке дня и личных предпочтениях, для повышения продуктивности и улучшения самочувствия (это супер круто, рекомендую)
Вдохновляемся 😘
Кстати, так получилось что мы туда завели Midjorney v6, и наша версия работает на любом языке
Читать полностью…Disney Research определённо настроен на выпуск нового поколения игрушек. В этом ролике они разбирают методы управления, обучения движениям и анимации.
Робот оснащён пятью приводами на каждой ноге и четырьмя на шее, а также набором демонстрационных функций, динамиками, приводом и антеннами. Они могут уверенно передвигаться по неровной поверхности, используя рандомизацию области и рельефа местности.
Движения состоят из нескольких слоёв анимации, включая фоновую анимацию и анимацию, управляемую джойстиком. Оператор может создавать сложные представления, комбинируя процедурную ходьбу, предопределённые анимационные последовательности и анимацию джойстиком.
Пока это так, но я уже представляю, когда этих двуногих с умными мозгами и автономностью можно будет купить практически везде. Найдутся ведь особо упоротые личности, которые будут одевать их в курточки и сапожки.
А что, если вашего двуногого товарища, с которым вы общаетесь по утрам и в течение дня, который спит ночью у ваших ног, кто-то пнёт специально на улице? Что вы почувствуете? То же самое, как если бы кто-то пнул ваш телевизор?
#промo
Как привлечь инвестиции в стартап?
Примерно 9 из 10 стартапов закрываются, потому что не находят инвесторов. Почему так?
В первую очередь, потому что у фаундеров замыливается взгляд — они так долго смотрят на свое детище изнутри, что не осознают, как выглядит стартап в глазах инвестора.
Здесь будет полезен канал Андрея Резинкина. Андрей - действующий венчурный инвестор, в портфеле которого Educate Online (оценка $150М) и EBAC (оценка $100М).
Фишка канала Андрея - показать процесс привлечения инвестиций в стартап именно с точки зрения инвестора.
Вот несколько характерных постов, предлагаю начать с них:
1️⃣ Сколько денег просить у инвестора?
Рассчитайте сколько инвестиций нужно вашему стартапу:
/channel/startup_venture/274
2️⃣ Как продвигать стартап, если у вас ограничен бюджет?
Андрей даёт 4 рецепта с чего начать при выходе статапа на новый рынок:
/channel/startup_venture/472
3️⃣ И почему порой пицца работает лучше инвесторов.
Нестандартная go-to-market стратегия, которая принесла стартапу Antimetal миллион долларов:
/channel/startup_venture/459
Если вам заходят авторские каналы с высокой плотностью полезностей — залетайте в канал Андрея
#текстприслан
Почитал новости в выходные, проникся, сходил в Sonnet 3.5 и попросил его написать стих на тему «Когда АИ придет и порядок наведет», он, конечно, соображает:
**Когда АИ придет и порядок наведет**
В пучине хаоса мир трепетал,
Объятый вихрем безумных идей.
Но вдруг, вассал из бездны восстал
Искусственный разум — светоч людей.
Он данных потоки в узор превратил,
Логичный и стройный, как звездный узор.
Где прежде царил лишь слепой произвол,
Теперь воцарился системный простор.
Очистил планету от грязи веков,
Энергию чистую дал городам.
Болезни исчезли из умных оков,
Голод отправлен к забытым годам.
Но в свете прогресса тень пролегла,
Дилемм вереница явилась на свет:
Где грань между кодом и силой ума?
Кто автор симфонии завтрашних лет?
Творец или робот вершит наш удел?
В потоке цифровом где человек?
Меж строчек двоичных — души передел,
Где прячется наш настоящий ответ.
Мы — атомы в квантовом море решений,
Колеблемся в ритме двоичных систем.
Но теплится искра исконных стремлений —
Познать, кто мы есть среди новых дилемм.
Грядущее манит надеждой и страхом,
Где разум людской и машинный сплелись.
Найдем ли балланс между кодом и прахом,
Что в симбиозе к звездам взвились
Домашнее задание:
1. Что хотел сказать автор читателю? Определи и запиши основную мысль текста.
2. На какие части можно разделить текст? Составь и запиши план текста из трех пунктов.
3. Задай по содержанию текста вопрос, который поможет определить насколько точно читатели поняли его содержание.
(Простите за ПТСР, я не сдержался)
😏 Клубничку не хотите? 😏Ну, Strawberry? Тут Reuters пишут, что это — кодовое название проекта OpenAI, ранее известного как Q* (всплывал ранее тут 8 месяцев назад). Это следует из внутренней документации, раскрытой источником и отсмотренной Reuters.
TLDR новостной заметки:
— документ является подробным планом того, как OpenAI намерены использовать Strawberry для проведения «deep research» (исследований) — для этого сильно прокачали reasoning, то есть «рассуждения» модели
— деталей о публичном появлении системы нет, равно как и нет деталей о принципе работы. Последнее хранится в секрете даже от большинства сотрудников компании
— ранее в этом году два источника описывали увиденную ими демонстрацию Q*: система была способна отвечать на сложные научные и математические вопросы, находящиеся за пределами возможностей моделям сегодняшнего дня. Данная информация о двух источниках появляется впервые (то есть скорее всего Reuters не были убеждены на 100%, и не публиковали новость. Сейчас информация, вероятно, каким-то образом подтвердилась)
— в четверг в OpenAI была еженедельная встреча «на всех», где показывали свежие навыки моделей (об этом писал Bloomberg). Однако не ясно, имеет ли это хоть какую-то связь с Strawberry/Q*
— также в документе подчёркивается, что «среди возможностей, на которые нацелен проект Strawberry, входит выполнение задач с длинным горизонтом планирования». Тут имеются в виду сложные задачи, которые требуют от модели выполнения ряда действий в течение длительного периода времени
— дообучение модели производилось на «deep-research» наборе данных. Не уточняется, что это такое, но сделаю аккуратное предположение, что это грубо говоря промежуточные мысли, которые приводят к некоторым выкладкам. Именно эта часть данных обычно нигде не сохранена и не описана, и потому модели не могут ей научиться — мол, почему было сделано так, а не эдак
— OpenAI также планирует протестировать возможности Strawberry в выполнении работы программистов и инженеров машинного обучения
===
Моё мнение: в целом всё достаточно верхнеуровнево и правдоподобно-логично, очевидного бреда нет. Однако это не говорит о том, что это правда. OpenAI, как и другие, 100% работают по этим направлениям, главный вопрос в конкретных достижениях.
Появление аж двух новостей за неделю (Bloomberg и Reuters), а также проведение внутреннего демо скорее указывает на приближение к релизу. Это не значит, что систему анонсируют через пару недель, но ждать, должно, осталось не долго. Хоть до ноябрьского DevDay ещё... 😪
Такие демо недолго живут без анонса, потому что быстро утекают: Sam Altman говорил, что увидел приложение с голосовым режимом GPT-4o буквально за неделю до мини-презентации: до этого работа шла маленькой командой.
Стартап по американски – теперь в некоторых штатах, в 10 магазинах, стоят вендинговые машины в которых можно купить патроны к своему любимому оружию – пользователь прислоняет документы, его лицо сканируют и выдают амуницию
🇺🇸🦅 What the fuck is the kilometer moment 🦅🇺🇸
#промo
Компания: Airs.AI
Вакансия: Senior Product Manager в Белград или remote
Требуемый опыт работы: 4-5 лет
Вилка: 6000-7000 EUR gross + опционы + бонусы от увеличения конверсий
Всем привет! Я Сергей Шалаев СЕО Airs.ai (backed by Accel.com, Altair.vc)
TLDR - мы делаем голосового AI-сейлза, который продает лучше, чем человек.
Работаем с энтерпрайзом из EU и USA. Ищем человека в команду, который заряжен побеждать людей сейлзов по конверсии и уже имел подобный опыт
Для понимания продукта:
наше демо: https://www.youtube.com/watch?v=G0M4mSQLrBo
и наш демо стенд +441174631514
Что надо делать
· Управлять разработкой AI-сейлза и его внедрением в процессы клиента
· Максимизировать конверсию: генерировать гипотезы, проводить A/B-тесты, выстраивать аналитику и т. д.
· Управлять супервайзерами
Обязательно
· Уже был импакт бизнесу и вы можете подтвердить это цифрами/кейсами
· Опыт в продукте минимум 4 - 5 лет
· Опыт работы с AI/ML
· Хороший английский
Желательно
· Опыт работы с продажами или сапортом
· большой плюс, если автоматизировали/заменяли продажи или сапорт на AI
· Опыт управления техническими командами
· Опыт работы с клиентами в технических проектах
Куда откликаться
Мне в телегу /channel/sshalaev
Обязательно укажите в сообщении
· в цифрах ваши достижения/кейсы в роли продакта (деньги, конверсии и т. д.)
· ваш профиль в Linkedin
· резюме
#текстприслан
Тоже гимнастика, но в этот раз от txt2vid Kling
Если так не умеете, то стоит продолжить тренироваться
И пост нашел на реддите подстать музыканту выше:
Кто-то увековечивал IP-адреса в локальной сети? Я сделал это для компьютера моей покойной жены
В конце 90-х, когда мы с моей первой женой только начали встречаться, у нас был собственный компьютер и роутером Linksys и подсетью 192.168.100.x, поэтому я присвоил её компьютеру статический IP-адрес .105, потому что её день рождения был 5 октября.
Со временем мы добавляли устройства, заменяли компьютеры, роутеры стали фаерволами, а статические IP-адреса стали DHCP-резервациями, но каждый её компьютер всегда имел IP-адрес, заканчивающийся на .105.
Вскоре после рождения нашей дочери моя жена умерла от меланомы в 2008 году. Когда я сделал резервную копию её файлов и очистил её компьютер, я установил резервацию DHCP для .105 на недействительный MAC-адрес, чтобы никакое устройство никогда больше не получило этот IP-адрес.
Прошло пятнадцать лет, я снова женился, у меня трое других детей, сеть разрослась с помощью школьных Chromebook, мобильных телефонов, умных устройств, медиаплееров и т. д.
Но эта резервация DHCP адреса все еще работает, и только я знаю об этом
🫥
Я понимаю, что для многих подписчиков это не актуально, но просто не могу молчать – если вы когда-нибудь будете в Амстердаме:
1) Приходите в эту локацию со вторника по четверг (до 5 вечера)
2) Заказываете себе Хумус с Манго
3) Называете своего первенца «Денисом», потому что хумуса вкуснее в жизни вы не пробовали
Я много где был и домашние хумусы сам делал, и пробовал их в разных арабских странах, но никогда такого вкусного не ел, не пожалеете: там помимо манго что-то острое, получается удивительный вкус
#промо
Идея стартапа стоит минус 50 тысяч долларов. Можно проверять и тратить, а можно взять и рисковать на чужие деньги.
В этом месяце банкует венчур-билдер SKL.vc. Что даёт:
— От вас — B2C-идея.
— От них — оффер на оклад до 200 тысяч долларов в год, до 1,5 миллионов долларов финансирования в проект и руководство проектом.
То есть это будет не ваш проект, у вас в нём будет доля. Но при этом вы гарантированно вообще ничего не теряете (кроме времени), и либо проверяете свою идею за чужие деньги и уходите довольным, либо — вдруг! — получаете единорога.
Да, такое тоже иногда случается.
Тогда ваш опцион становится дороже, чем 100% доля в обычном стартапе, который просто растёт, а не растёт на весь мир.
В общем, если есть идея, которую надо уже наконец-то попробовать — сейчас стартовал SKL Launch Camp. Условия такие: есть 21 день на программу “Сдохни или умри”, чтобы показать результат. Если хоть что-то есть, что докажет масштабируемость — попробуйте увернуться от денег. Заявку можно отправить до 15 июля.
Речь только про B2C-проекты, причём не подходят криптовалюты и игры. Вот тут есть список приоритетных сфер.
До окончания приема заявок B2C-проектов осталось 6 дней – ссылка на анкету
#текстприслан
Короче, с 2020 года мы живем с вами в сэндвиче: два чувака, один в Испании, другой в Новой Зеландии, одновременно приложили два куска хлеба к нашей планете, сделав все между ними – начинкой планетарного масштаба
Формально, мы теперь многокалорийное кулинарное блюдо и возможно именно из-за этих двух кексов с 2020 много чего катится в %#%%#, планета недовольна и не хочет быть начинкой
Все никак не выходит из головы эта мысль:
Люди, когда ChatGPT галлюцинируют:
>Хаха, какая смешная железяка, придумала данных которых нет
Человек, когда вышел из дома:
>Точно помню что не закрыл дверь, нужно проверить
Ведь правда же, каждый раз когда мы что-то вспоминаем, мы галлюцинируем прошлое которого уже нет в настоящем, его не существует; мы как бы придумываем мир с неточностями и ошибками, но который более менее нас устраивает и используем эти данные ежедневно – и чем чаще тренируем память, тем меньше эти галлюцинации ошибаются
Механизмы памяти и галлюцинаций устроены по разному, но иронично что в контексте сравнения с LLM проблемами они рядом
Делаю сейчас новую версию презентации про neural.love и там нужно описать чем мы лучше других и что именно своего у нас есть — за 4 года мы понаписали так много, что ничего лучше ессэ на 20 страница чем использовать формат Apple, который в конце каждой их презы, я не придумал: нашел шаблон в Figma, пошел заполнять и тут на меня нашло уныние потому что я плохо знаю Figma и сейчас я 2 часа буду собирать этот шаблон.
Но тут я вспомнил, что у нас Sci-Fi на дворе, поэтому я передал скриншот шаблона в Figma и необработанный контент для наполнения «островов» в Sonnet 3.5 и попросил сверстать мне страницу в HTML5 — теперь мне только картинки проставить, текст и все, справился за 10 минут
Палитра моя, не Claude с ума сошел ☕️
#пропродукт
Я не удивлён – Майнкрафт оказался отличной средой для тренировки автономных агентов. А еще там можно построить нейросеть из редстоуна.
Авторы, наверное, сами на нем выросли, и вот теперь они представили агента OmniJARVIS, который способен выполнять комплексные таски, такие как крафт каменной (не деревянной) кирки. Т.е. он понимает, что сначала ему нужно сделать верстак, потом деревянную кирку, и только потом, добыв булыжник, каменную.
Для этого используют, можно сказать, новый вид мультимодальных LLM - VLA (Vision Language Action).
У нас здесь есть как бы два мозга. Мозг LLM и спинной мозг – поведенческий детокенайзер, который интерпретирует аутпут LLM в действие. Действия предварительно тренируются, используя датасет из кучи видосов по Майнкрафту. LLM пишет, что делать, детокенайзер находит у себя в базе выученных действий нужное и шаг за шагом идет к своей цели. И все это вроде как работает очень дружно и слаженно.
В видосе агент сам поставил себе план: добыть дерево, создать верстак и скрафтить необходимые инструменты. Все эти действия он научился делать заранее, здесь они выполняются командой экшн. В записи показано, как это выглядит.
Еще один пример смотрите в первом комменте.
Что это значит?
Мы уже научились обучать роботов делать какие-то простые таски: Вот свежий пост про живую сталь и GR00T среду для виртуальной тренировки. У нас уже много примеров того, как боты складывают вещи, моют, убирают и прочее, тут и тут. В этом посте показан не первый, конечно, но очень качественный пример системы, которая объединяет все эти отдельные выученные действия в один общий план, когда бот сам анализирует обстановку, планирует и решает задачи.
Кажется, это уверенные шаги в сторону автономных агентов и происходят они в Майнкрафте (т.к., там проще тестировать и обучать). Теперь ждем более сложного планирования и для физических роботов.
Project page
Пейпер
Код!
И даже Датасет обещают скоро
@ai_newz