В тему восприятия ИИ, которая была так важна на недавней презентации OpenAI. Важны интонации голоса ИИ-собеседника, важна его мгновенная реакция на слова человека — но OpenAI демонстрировала нам бесплотный голос из смартфона.
Ребята из компании Synthesia, которая идентифицирует себя как AI video engine, показали очень интересный ролик: они пересняли один из тех роликов, которые демонстрировались на презентации: там мы не видели экран смартфон, с которым разговаривал человек — а теперь нам показали этот экран с синтезированной девушкой, которая произносит реплики GPT-4o с отличной артикуляцией, живой мимикой и вообще совершенно по-человечески.
Интересно, что для меня уже немного утомивший ролик сразу стал смотреться иначе. И, похоже, будущее во многих местах будет именно таким 🙂 Взгляните, познавательно.
О, вот еще про «зловещую долину» :)) Китайцы из Unitree Robotics явно готовы побороться с Boston Dynamics за лидерство в якобы “пугающих” роликах про человекоподобных роботов. Впрочем, у них и человекоподобность своеобразна: тамошние инженеры решили, что общую конструкцию человеческого тела имеет смысл взять за основу — но избавить от ограничений нашей анатомии. Нет технических запретов для суставов крутиться хоть на 360 градусов и складываться под любыми углами.
Итог получается любопытным: стоит посмотреть видео целиком, а не тот фрагмент что в пост поместился. Нечеловеческие движения человекоподобного тела местами завораживают, но совсем не пугают.
Смотреть тем более интересно, что это не демонстрационный образец — эти роботы G1 в текущем году поступят в продажу по цене примерно $16 000 — очень дешево и доступно по современным меркам.
NASA хочет запустить левитирующие беспилотные поезда на Луне. Они смогут перевозить до 100 тонн грузов ежедневно. Такие поезда могут появиться уже в 2030 году, когда на Луне будет работать база NASA.
https://nypost.com/2024/05/10/lifestyle/nasa-plans-high-tech-railway-system-on-the-moon/
Очень мне интересно, как поведет себя Apple: потихоньку разрастается шумиха вокруг их рекламного ролика по поводу нового на днях анонсированного iPad. Ролик вполне стандартный, в нем использована довольно лобовая метафора: мощный пресс сжимает кучу всяких инструментов художников, музыкантов и прочих креаторов — и в итоге получается тоненький айпад.
Но некоторый слой нынешних креаторов сильно на взводе по поводу ИИ: если читать все подряд апокалипсические статьи, немудрено впасть в тревогу. И, понятно, они в этом ролике увидели исключительно угрозу себе и ополчились на Apple: «мы же и есть ваши основные пользователи, зачем нас мочить?»
Но мы видим лишь медиашум, а в Apple несколько больше приборов, демонстрирующих поведение пользователей — потому и интересно, что они решат: не всегда надо всем шумливым уступать.
(ролик минутный, его можно прямо в статье по ссылке посмотреть)
https://www.musicradar.com/news/apple-ad-hugh-grant
Почти с момента появления ChatGPT в публикациях стали высказываться мнения, что новый сервис угрожает поиску — и, в первую очередь, очевидно, Гуглу. Майкрософт даже делал ставку на повышение конкурентоспособности Bing благодаря языковым моделям.
Не сложилось.
Но вот снова волна стартапов и сопутствующих публикаций: Perplexity как новая угроза Гуглу. В заметке приведен разумный анализ интервью Аравинда Сриниваса, сооснователя Perplexity. Он опирается на добрую старую “Дилемму инноватора”, чтобы объяснить, как и почему его стартап сможет свергнуть Google и перехватить его могучую бизнес-модель.
The argument is seductive. But it is off the mark.
Почему — полезно целиком прочитать и интервью, и заметку. И потом самому подумать.
А пока читал, не мог отделаться от воспоминаний про яндексовый Нейро, где как раз возможности LLM встраиваются в пайплайн обработки нечеткого вопроса и поддержания дальнейшего диалога: сильно улучшая пользовательский опыт по целому классу поисковых запросов, исключая возможности галлюцинаций и ничуть не покушаясь на поисковую бизнес-модель:)
Но стартапам неймется, вот и OpenAI рвется на ту же сцену. И это прекрасно: в техногигантов полезно тыкать палочкой, чтоб не дремали:)
🤖😶 Каким люди видят идеальное лицо робота? Несколько лет назад учёные из Вашингтонского университета подробно исследовали этот вопрос. Пересказываем основные выводы.
Подписывайтесь 👉 @techno_yandex
SpaceX изначально относились к промышленному дизайну всех своих продуктов очень серьезно. С точки зрения эстетики лаконичности при сохранении функциональности у них учиться можно, будь то их ракеты, капсулы, терминалы Skylink или скафандры. Вот очередной -- не просто дизайн, а рабочий скафандр, в котором скоро состоится первый выход коммерческого туриста в открытый космос. Хотя он напоминает те скафандры, которыми пользуются на борту миссий Dragon, начинка и функционал сильно отличаются. Тут и дополнительные защиты, и своя информационная система с шлемом в роли дисплея, и большая подвижность. Кроме того, скафандр должен наглядно продемонстрировать инклюзивность космического масштаба, a future in which all kinds of body types can live and work beyond Earth — дизайн и конструкция обеспечивают очень широкий диапазон персональной подгонки снаряжения. В рамках Polaris Program уже в этом году должна состояться первая коммерческая прогулка в открытом космосе — с трансляцией происходящего на Землю с помощью спутников Starlink.
И еще одна модная и мощная технология использовалась при создании скафандра: Polaris Dawn astronauts will also sport 3D-printed polycarbonate helmets
https://www.popsci.com/science/spacex-eva-suits/
Wired: у Китая есть свой план по созданию интерфейса мозг-компьютер
Недавние инициативы Илона Маска по созданию нейрокомпьютерного интерфейса наделали шуму в прессе. Еще бы, в случае успеха миллионы людей с ограниченными возможностями получат шанс на новое качество жизни. Однако не только в США идут подобные разработки. Китай стремительно нагоняет американцев в этой перспективной области технического прогресса.
«В Китае предпринимаются огромные усилия по использованию методов машинного обучения для улучшения анализа сигналов мозга, говорится в отчете CSET».
https://theidealist.ru/braincpu/
#Wired #технологии #мозг #Китай
Пишущие про ИИ эксперты и журналисты — взрослые люди; поэтому, по заветам Маленького Принца, они все время щеголяют большими цифрами — постоянно нарастающие миллиарды параметров кочуют из статьи в статью, словно только в них и суть. Параметры, впрочем, — штука эфемерная:)
А тут журналисты задались задачей отследить другие большие и растущие цифры, причем вполне материальные. Речь о видеокартах: во времена начала ИИ-бума полтора года назад казалось, что десятки тысяч карточек — уже какой-то невообразимо мощный кластер. Но в дело пошли десятки миллиардов долларов, и теперь запрещенная Мета говорит и примерно миллионе карт у себя, 720 000 карт использовались для обучения SORA в OpenAI (а цели на близкое будущее — довести число карт до 10 млн), Microsoft собирается использовать 1,8 млн карт к концу текущего года.
Учитывая цены на видеокарты, получаем, что все эти достижения и планы обходятся в большие десятки миллиардов долларов каждой из компаний. Но это их не останавливает: ставки еще выше:)
https://analyticsindiamag.com/meta-spends-30-billion-on-a-million-nvidia-gpus-to-train-its-ai-models/
Прикольная и несколько непривычная коллаборация: Cisco + Bang & Olufsen: а всё из-за того, что гибридный режим работы в разных своих ипостасях остается массовым (и, похоже, таким и останется). А это, среди прочего, означает два интересных требования к железу:
1 если устройство активно используется для рабочих задач, в частности, требующих конфиденциальности и защиты от потенциальных атак, оно должно быть контролируемым со стороны ИТ-служб и службы безопасности.
2 Если устройство вперемешку используется для личных и корпоративных целей, оно должно удовлетворять тем требованиям к качеству, которые пользователь предъявляет к личным гаджетам.
И наушники (или вкладыши) — яркий пример такого устройства: не очень-то удобно менять их в течение дня только потому, что настал перерыв в рабочих созвонах и хочется под чашку кофе послушать расслабляющую музыку в надлежащем качестве.
Если смотреть на проблему под таким углом, смысл коллаборации проясняется:) Интересно, получится ли задать тренд на новый тип привычных устройств, одинаково приемлемых для безопасников и меломанов (не только акустических) :))
https://www.forbes.com/sites/marksparrow/2024/05/02/cisco-partners-with-bang--olufsen-to-market-true-wireless-earbuds/
Вот и еще один источник профессионально размеченных и высококачественных фотографий обещает стать легально чистым для обучения графических моделей.
Когда-то много лет назад, когда EyeEm был еще гордостью и надеждой европейской стартап-сцены (а не банкротом, которому недавно пришлось продаться испанцам FreePik;)) мне довелось с ними пообщаться. У них изначально внутри был план поживиться на тогда модной БигДате. То, что подавалось пользователям как сообщество фотографов со взаимными оценками, подробным тегированием и социальными механиками, с точки зрения бизнеса было созданием огромной профессионально размеченной базы фотографий. Но тогда модель не сошлась, это и привело к банкротству в итоге.
А сейчас вполне может статься, что 160 млн легальных и размеченных картинок очень даже востребованный актив:) Благо правильное пользовательское соглашение там было изначально.
Самим фотографам, конечно, может быть несколько обидно.
https://techcrunch.com/2024/04/26/photo-sharing-community-eyeem-will-license-users-photos-to-train-ai-if-they-dont-delete-them/
Всего через несколько дней, 27 апреля, нам обещают событие, которое может оказаться стартом нового зрелищного технического вида спорта. В Абу-Даби должны пройти первые гонки автономных автомобилей. Восемь команд будут использовать идентичные машины (в том числе идентичную технологическую начинку), так что по сути это будет соревнование софта, автономных алгоритмов управления болидами. Призовой фонд превышает 2 млн долларов, соревнования будут стримиться в реальном времени.
https://newatlas.com/automotive/autonomous-car-race-streamed-live-free/
(в частности, стрим будет доступен на канале https://www.youtube.com/channel/UCx07pX3iq_-cCk71u1Vtx2Q )
У Теслы заметные проблемы со сбытом — и, соответственно, с капитализацией — но Маск не унывает. В свое время, представляя разработанного в Тесле же человекоподобного робота, он заявлял, что однажды бизнес таких домашних роботов станет дороже бизнеса электромобилей.
А теперь он соглашается с прогнозом, по которому через всего семь лет в каждом американском домохозяйстве будет свой домашний робот, причем по подписной модели: не надо покупать сразу, просто платишь $1 000 в месяц и пользуешься.
Интересно, на сколько лет он ошибся:)) Обычно жизнь оказывается сильно медленнее его прогнозов.
https://www.benzinga.com/news/24/04/38349837/elon-musk-agrees-every-american-household-will-have-a-1-000-per-month-home-robot-in-7-years-time
Упоротые изобретатели прекрасны :)
Внятное название для целого семейства аппаратов, напоминающих то велосипед, то мотоцикл, то вообще ничего не напоминающих, придумать трудно. Объединяет их удивительно устроенное колесо, которое способно катиться в любом направлении — НЕ поворачивая в этом направлении. Не то чтоб очень высокие технологии, но очень прикольные (а в тесных пространствах и очень практичные)
https://newatlas.com/motorcycles/omnidirectional-wheels-motorcycle/
(Если лень читать статью, можно сразу перейти к видео на 20+ минут: столько разных реально ездящих агрегатов на странных винтоколесах я никогда еще не видел — https://youtu.be/nfna15r4EXM )
Прогресс автономного железа на основе ИИ (всяких умных роботов) не ограничивается, конечно, милашками, которые создают фон на сцене для выступлений Хуанга или сотнями уже тысяч трудяг на складах Амазона. Как и в любой другой технологической области, есть огромная военная составляющая, далеко не всегда публичная.
Но кое-что просачивается в открытые источники. Вот почти одновременно появились две публикации — про воздушное пространство и подводный мир.
ВВС США отчитались о начале тренировочных воздушных боев, в которых принимают участие и белковые летчики, и специально модифицированный F-16 (в такой версии он зовется X-62A). Пока речь не о совсем полной автономии: a single human pilot could greatly increase lethality by effectively orchestrating multiple autonomous unmanned platforms from within a manned aircraft. Но и просто привычным словом “второй пилот” назвать такую структуру уже нельзя. В статье есть кое-что объясняющее видео.
И одновременно с другого континента докладывают, что готова и передана для испытаний автономная подлодка с милым названием Ghost Shark Extra-Large Autonomous Undersea Vehicle (XL-AUV). Отмечается, что в отсутствие систем жизнеобеспечения экипажа субмарина стала намного компактней. When deployed, Ghost Shark will allow the Royal Australian Navy to carry out stealthy, long-range autonomous undersea warfare with persistent intelligence, surveillance, reconnaissance and strike capabilities.
А вы думали, ИИ с вами будет только в чатиках трепаться?
Прошедшие встык друг за другом презентации OpenAI и Google породили волну комментариев. Соблюду приличия и присоединюсь;) Спасибо «Собаке», что с утра прислали вопросы, и теперь я могу просто ссылочку дать. Коротко: я совсем не разочарован в Гугле; у них задачка посложнее, чем у OpenAI: они продуктовая компания, а продукты для миллиардов людей невозможно быстро перестраивать. Подробнее внутри материала «Собаки», там и обзор нормальный для пропустивших;)
https://m.sobaka.ru/lifestyle/technology/182214
Два замечания к вчерашнему анонсу OpenAI, представившим свою очередную модель GPT-4o[mni] Про фичи и новации уже настолько все отписались, что читатели этого канала наверняка и без меня в курсе.
Мне же интересно два момента:
1. Сэм Альтман у себя в блоге написал, что компания все больше осознает, что делает не продукты, а технологическую платформу для других: Our initial conception when we started OpenAI was that we’d create AI and use it to create all sorts of benefits for the world. Instead, it now looks like we’ll create AI and then other people will use it to create all sorts of amazing things that we all benefit from.
довольно важный пойнт, а то все ждут почему-то от OpenAI тяжелых продуктов: то поиск, то браузер, то еще что-то подобное.
2. Очень заметно, что в OpenAI не сильно боятся “зловещей долины” — если вообще верят в ее существование. А ведь этим эффектом так любят пугать доморощенные “эксперты” :)
Ответ на мой вчерашний вопрос пришел очень быстро: Apple устами своего вице-президента по маркетингу оперативно извинился и признал, что действительно облажался: “Our goal is to always celebrate the myriad of ways users express themselves and bring their ideas to life through iPad. We missed the mark with this video, and we’re sorry.”
Теперь интересно, где они лажанулись на стадии подготовки и выпуска — но это мы, увы, не узнаем.
https://www.theverge.com/2024/5/9/24153113/apple-ipad-ad-crushing-apology
По интернету гуляет коротенький ролик с китайской фабрики роботов, очередной раз нервирующий технофобов. В ролике нет деталей или ссылки на производителя, но журналисты Newatlas докопались до источника: речь о производстве китайской компании ExRobots, которая давно поставляет свои изделия и на выставки, и в разные сервисные компании. В статье есть и более подробный ролик (снятый аж два года назад!) про EX Future Science and Technology Museum, созданный этой компанией. Название ролика Visiting China's 'Westworld' in reality явно намекает, что в этой компании принципиально не боятся эффектов «зловещей долины» и последовательно добиваются максимальной натуралистичности в своих человекоподобных созданиях. И, видимо, такое решение вполне оправдывается спросом.
Очень бы хотелось в деталях их современные образцы поизучать, за два-то нынешних года прогресс должен быть по-настоящему впечатляющий:)
https://newatlas.com/robotics/chinese-humanoid-robots-realistic/
Я что-то сегодня и так разошелся, но неприлично не написать, что состоялась видеопрезентация новинок Apple, но которой — в полном соответствии с утечками — рассказали про новые айпады и аксессуары к ним. Новый iPad Pro получил и новейший процессор М4; значит, на нем пойдут “ИИ-жадные” приложения и, надеюсь, новые игры.
Поскольку айпады с 2022 года не обновляли, можно будет пощупать прогресс в области планшетостроения, тем более, что обновили и Pencil, и клавиатуру.
Любителям базовых цифр:
Built on a new second-gen 3nm process, Apple's M4 chip features four performance and six efficiency cores along with a 10-core GPU. In terms of general performance, Apple claims the M4's CPU is 50 percent faster compared to M2 with a GPU that's four times more powerful.
https://www.engadget.com/apple-ipad-event-2024-live-updates-as-apple-unveils-the-new-ipad-pro-100037991.html
Как и ожидалось, этот год радует сообщениями (подкрепленными видео) о достижениях самообучающихся роботов. Конечно, на слуху и массово в прессе и блогах Optimus от Теслы: ореол бренда работает. Ну и не может не радовать, что кто-то наконец научился складывать маечки, так что однажды я смогу перестать этим заниматься (лично меня бесит это занятие).
И, что опять же ожидаемо, китайский соперник тоже маечку успешно складывает, а потом еще и разглаживает:) И если сравнить оба видео, то, честно говоря, китаец впечатляет больше. Скорость движений, ловкость, точность Astribot's S1 выглядят человекообразнее. Хотя внизу у него колесики вместо ног — интересное решение, но уже не совсем гуманоидное:)
Но продолжаем следить: почти каждую неделю можно любоваться, как приближается будущее в образе тех самых роботов, которых рисовали фантасты:)
Netflix собираются в Roblox
(Кроме того, что потихоньку пилят свою игровую плафторму)
В этом тизере показали сразу два мира: One Piece и Stranger Things.
Вполне логичный шаг, учитывая непрерывный рост аудитории (и ее количество и ее возраст).
Кстати, Stranger Things вообще на протяжении многих лет регулярно экспериментируют с иммерсивными форматами, – в их промо-кампаниях всегда были одни из самых запоминающихся Lens-фильтров в снепчате и WebAR-экспириенсы. Ну и VR.
Интересно, хотя и печально, наблюдать за изменением риторики, описывающей то, что раньше называлось фрагментацией интернета и технологического мира вообще. Теперь с точки зрения журнала The Economist, вопрос кто контролирует технологии, стал “ethno-civilisational question”, ни больше, ни меньше. Там же приводится оценка цены нарушения торговли высокими технологиями по мнению МВФ: 1.2% of global gdp each year—about $1trn.
И не то, чтоб авторы выражали сожаление: время глобальной кооперации сменилось временем глобальной борьбы за лидерство, и участники за ценой не постоят.
Разборки вокруг ТикТока — это лишь разминка.
The next stage of the tech wars will play out in two major arenas. One is chipmaking, which creates the world’s information-processing infrastructure, including the one that trains and runs artificially intelligent software. The other is green technology, as its components may become the backbone of the entire global economy.
И позиция США формулируется без излишних дипломатических обтекаемостей: Any degree of Chinese control over the production of chips is intolerable to America.
Тут уже не до разговоров о пользе конкуренции; здравствуй, неприятный новый мир.
https://www.economist.com/international/2024/04/25/the-tech-wars-are-about-to-enter-a-fiery-new-phase
В околотехнологическом интернете последнее время все больше слухов о том, какие ИИ-фичи Apple объявит на WWDC летом. Самый свежий — что к внедрению ИИ в IOS 18 привлекают OpenAI; интенсифицировались переговоры между компаниями.
Впрочем, если пока идут переговоры, трудно себе представить, что к лету что-то уже срастется. С другой стороны, все указывает, что начинается интересная гонка между Apple и Google с его Андроидом; и наконец-то очередные версии мобильных ОС будут не только интерфейсные и косметические улучшизмы содержать.
https://readwrite.com/rumors-swirl-that-apple-plan-to-use-chatgpt-to-power-ai-features-in-ios-18/
А вот на эту тему хочется больше технических подробностей, но все статьи, которые пока удается найти, лишь повторяют общие слова: китайцы утверждают, что разработали двигатель для подводной лодки на основе оптоволоконного лазера мощностью 2МВт, который способен создавать тягу до 70 кН. Дальше идут всякие слова про управляемую детонацию, которые не очень просветляют: конечно, создать лазером плазму в воде можно, и такой локальный нагрев породит детонационную волну, но вот как обеспечить при этом тягу в конкретном направлении — бьются уже много лет. Если китайским ученым и инженерам удалось найти решение, гонка подводных вооружений уйдет на новый очень интересный виток
https://hackaday.com/2024/04/24/chinese-subs-may-be-propelled-silently-by-lasers/
Я уже перестал удивляться, что почти все интересные и глубокие разговоры и мысли про ИИ полтора последних года источником имеют людей не из Гугла или OpenAI — а из Microsoft. На слайдах разных моих популярных лекций самым частым портретом рядом с цитатами, которые хочется обсудить, стал Сатья Наделла.
Но вот еще одно имя и прекрасный свежий TED Talk, на сей раз от Мустафы Сулеймана, Microsoft AI CEO. Двадцать минут его рассказа лучше послушать целиком (или почитать транскрипт, или перевод транскрипта — благо это все ИИ уже делает отлично).
Но есть одна мысль, которая очень мне полюбилась, и которая отлично ложится в контекст моей любимой темы про то, что мы создали сложную и богатую цифровую сторону нашего мира и теперь живем в суперпозиции материального и цифрового миров. Мустафа говорит, что хватит обманывать себя и других утверждением «ИИ — это просто инструмент». Эти утешительные слова не передают сути происходящего. ИИ — это цифровые существа (a new digital species), которыми мы начинаем населять цифровую сторону нашего мира. Такая метафора, по его мнению, намного точнее, и тут я с ним совершенно согласен. И прямо вижу, как в этот момент у части моих читателей рука потянулась кинуть какашку в эмодзи под постом:)) Ведь ИИ — это же просто цифры и формулы, что за чушь, правда? Ну да, отвечает Мустафа, так же как жизнь — это просто вода и органические молекулы:)
https://www.ted.com/talks/mustafa_suleyman_ai_is_turning_into_something_totally_new/transcript
Из вчерашних комментаторов новости про открытие операционной системы Horizon для различных производителей VR-железа (Цукерберг упомянул Microsoft, Lenovo, Asus) не все отметили, что это развитие давно сформулированной идеи Цукерберга. Когда появилась VisionOS от Apple и их модная дорогая гарнитура Vision Pro, Цукерберг в разных местах отмечал, что не важно, кто будет «айфоном в виртуальной реальности» — важно, кто займет там место Android со всей его огромной экосистемой и тучей устройств всех ценовых категорий.
Ну, вот он и сделал явную заявку на позицию такого «открытого Андроида для VR». Правда, на настоящий open source пока он не пошел; интересно, дойдет ли до этого дело.
https://www.cnbc.com/2024/04/22/mark-zuckerberg-says-meta-will-offer-its-virtual-reality-os-to-hardware-companies.html
Очередная демонстрация возможностей Sora интересна тем, что это не абстрактное видео, а действительно годный проморолик для либо продвижения TED, либо открытия какого-нибудь его юбилейного заседания. Показательны и детали процесса: опытному видеохудожнику (из числа тех, кому дали доступ к SORA) пришлось сгенерить 330 клипов с разными промптами, выбрать из них 25 — и вручную смонтировать из кусочков клип длиной полторы минуты. Не то чтоб полная автоматизация, но когда я вспоминаю, сколько времени и ресурсов уходит изготовление такого типа продуктов традиционными методами...
https://www.tomsguide.com/ai/ai-image-video/openai-just-dropped-a-new-sora-video-to-promote-ted-talks-and-the-video-is-explosive
Среди разных траекторий на пути от человека к киборгу мне больше всех нравится та, где справляться с вызовами перемещения по природным препятствиям помогают экзоскелеты. И это направление потихоньку мужает и работающие в нем команды всё чаще демонстрируют красивые и эффективные конструкции.
Ну, а теперь они все, конечно, AI-driven outdoor exoskeletons, куда ж без ИИ. Китайский X1 добавляет 900 Вт предположительно умной мощности к встроенной энергетике нашего тела, при всей компактности помогает бегать на скорости до 26 км/час и таскать 38 кг груза. Годы, увы, свое потихонечку берут, и поэтому видео в статье вызывает усиленное слюноотделение; без помощи технологий я так уже не могу.