Подкаст "Трёп Себранта"
-=Выпуск 74=-
Vision Pro + полгода ChatGPT: сопоставления
Исполнилось полгода ChatGPT, а через несколько дней Apple представили миру свои очки Vision Pro. Оба события можно пообсуждать по отдельности, но еще интересней вместе: редкий случай, когда можно заглянуть в будущее с помощью вполне линейной экстраполяции.
Страница выпуска https://sebrant.chat/vision-pro-chatgpt
На Яндекс.Музыке
https://music.yandex.ru/album/6407298
На Apple Podcasts
https://podcasts.apple.com/ru/podcast/sebrant-chatting-%D1%82%D1%80%D1%91%D0%BF-%D1%81%D0%B5%D0%B1%D1%80%D0%B0%D0%BD%D1%82%D0%B0/id1320623324?i=1000616149133
На Google Podcasts
https://podcasts.google.com/feed/aHR0cHM6Ly9hc2VicmFudC5saWJzeW4uY29tL3Jzcw
Ну, и традиционный трек прямо здесь :)
О дивергенции на американском фондовом рынке. Все мы видим как индексы растут, но согласно данным FactSet акции 10 крупнейших компаний S&P 500 в мае выросли на 8.9%, в то время как остальные 490 упали на 4.3%. То есть мы наблюдаем сильнейшие медвежьи настроения и одновременно с этим эйфорию по отношению к большим технологическим компаниях, без которых индекс S&P 500 был бы в минусе. Apple, Microsoft, Google, Amazon и Nvidia буквально тащат за собой рынок.
https://www.wsj.com/amp/articles/bearish-bets-against-s-p-500-are-surging-despite-love-for-big-tech-506cacc
Читая сегодняшние многочисленные реакции на вчерашнюю презентацию Apple, рад был увидеть, что не я один порадовался, как уверенно они игнорируют хайповые слова, которые стараниями прессы и пиарщиков затаскали до неприличия.
Рассказать о новинках, и ни разу не употребить ни ИИ, ни метавселенную — такого даже Гугл себе позволить не может. А Apple смогли, и ничего не потеряла презентация от того, что рассказывая о предикативном алгоритме клавиатуры, например, обошлись без ее искусственного интеллекта — как и при рассказе об алгоритме создания цифрового двойника лица для сеансов видеосвязи.
Ну а слово “метавселенная” там не любили тоже исторически, извращенное ее представление как вездесущего виртуального мира сильно противоречит представлением Apple о том, для чего нам технологии. То ли дело spatial computing, которое звучало не раз:))
А еще сегодня уже появились отчеты тех людей, кто на кампусе Apple смог после презентации живьем потестировать Vision Pro, и они вполне положительные: осваивается быстро (основано на привычных жестах на других устройствах), качество изображения и звука великолепно. Теперь осталось дождаться реакции разработчиков — кто и что сделает под платформу, где еще нет людей и появятся нескоро.
Хорошая иллюстрация различия культур:)
Что Лю Цысинь (автор “Задачи трех тел”), что Мо Янь (лауреат Нобелевской премии по литературе) спокойно сообщают, что когда затык или не хватает времени, им помогает писать, а то и пишет выступления, ChatGPT.
Лю Цысинь, который большой мастер придумывать апокалипсические сценарии (кто всю трилогию читал, тот точно в курсе:)), замечает:
“ChatGPT, of course, will make an impact on human existence and society, but its influence won’t result in AI-ruled humans like what happens in science fiction. At the current stage … it is likely to replace some human work”
При этом в Китае открытого доступа к ChatGPT нет, зато уже есть целых 79 (! -- и тут китайский масштаб…) разных своих языковых моделей с более чем миллиардом параметров, так что вот там будет не просто гонка, а нешуточная борьба за выживание:)
https://www.scmp.com/tech/tech-trends/article/3222986/chinese-science-fiction-writer-liu-cixin-author-three-body-problem-uses-chatgpt-craft-speech-expects
“Электрический танкер» — очередная концепция эры новой электрификации, в которой генерация обеспечивается исключительно чистыми источниками. Электрический в данном случае означает не только электрическую силовую установку, но и тип груза.
По сути, это огромный плавучий самоходный аккумулятор. Зачем? Ну, затем же, зачем нужны обычные некрупные танкеры в условиях генерации за счет сжигания топлива. Сейчас они доставляют дизельное топливо, например, на острова или в отдаленные районы, куда сложно и невыгодно тянуть линии электропередач. В условиях возобновляемых источников в таких местах могут быть периоды, когда солнце и ветер не могут обеспечить нужную мощность, а местная батарея уже истощила свой запас. Вот тогда-то и приплывет плавучий аккумулятор Х емкостью 240 МВтчасов и подзарядит местную батарейку.
Судно планируется спустить на воду в 2025.
https://electrek.co/2023/05/29/electric-tanker-transport-clean-energy-batteries/
Ребята из прекрасного и заслуженного стартапа генеративной музыки Endel не просто нашли, но и реализовали изящное решение, позволившее им осчастливить и крупнейший лейбл UMG, и музыкантов генеративной ИИ-музыкой. И ничьих прав в процессе не нарушили.
Есть такой прекрасный термин soundscapes — звуковое окружение для определенной активности, например, для бега, размышлений или требующей концентрации работы. Так вот теперь Endel будет генерить это самое звуковое окружение для известных исполнителей по мотивам их хитов. У себя в LinkedIn Олег Ставицкий из Endel пишет так:
“We’re going to use the stems from UMG artists to create sleep/relax/focus soundscape versions of their music. So in a few months you’ll be able to sleep, focus, meditate, boost your energy with a scientifically engineered soundscape version of your favorite music.”
В UMG о новом контракте отзываются практически восторженно: “incredible potential of ethical AI as a tool to support and enhance the creativity of our artists, labels and songwriters, something that Endel has harnessed with impressive ingenuity and scientific innovation”
Прекрасная и показательная история вчера взбудоражила некоторую часть близкого к разработкам игр интернета. Но интересна она может быть всем.
Вот прямо сейчас можно зайти, например, на https://ludenio.itch.io/generated-adventure и поиграть в простенькую браузерную игрушку-бродилку. Кто когда-то (как я) играл в Monkey Island -- может почувствовать, что она немножко напоминает. Фокус в том, что игра создана за 72 часа, один человек работал full time, второй на подхвате примерно половину времени.
Но у них были “вторые пилоты”: генеративные сервисы для графики, создания сценария и диалогов, музыки. Как ни странно, как раз с кодом не получилось: для использованного движка требовался язык ink, который ChatGPT не осилил: видимо, не на чем было тренироваться.
А теперь важное. По оценке дизайнеров, только прорисовка всех островов потребовала бы полный месяц работы двух человек.
Про такие кейсы сейчас много пишут, но в общих чертах. Тут же есть полная документация каждого шага, примеры картинок с полными промптами и как их дотюнивали, скриншоты диалогов с ChatGPT и описания решений и действий человека. И чем дольше читаешь этот журнал ( https://ludenio.itch.io/generated-adventure ), тем больше проникаешься, даже будучи далеким от геймдева. Очень достойное чтение на выходные и немножко машина времени:)
Проделали все это энтузиасты из Luden.io, если возникнут вопросы — пишите сразу Олегу @chumakov
Всеобщее немного истеричное внимание к ИИ подогрело и интерес к гуманоидным роботам общего назначения; раньше на слуху были разве что разработки Boston Dynamics да странное изделие от Tesla. Но теперь образ умного человекоподобного робота вдруг стал очень понятен людям, поимевшим опыт общения с разными разговорными моделями.
Вот пример стартапа Sanctuari AI, о котором мало кто знал, а теперь он стал интересен со своим роботом Phoenix под управлением “инновационной ИИ-системы Carbon”. И это, между прочим, не на скорую руку сляпанная новинка, а изделие уже шестого поколения.
“We see a future where general-purpose robots are as ubiquitous as cars, helping people to do work that needs doing, in cases where there simply aren’t enough people to do that work.”
Пресс-релиз самой компании и вполне живенький видеоролик
Никакой сенсации в этой новости нет, и поэтому ее тиражировать будут намного хуже, чем предыдущую. когда школьникам (да и не только им) запрещают пользоваться ChatGPT или другими похожими продуктами, разные технофобы разносят новость как пример правильного поведения и призывают следовать примеру. Когда немного поразмыслив и послушав собственных учителей, запрет снимают, пишут об этом куда меньше.
А позицию руководства школьного округа Нью-Йорка — и, главное, аргументацию, как раз стоило бы популяризовать:)
The knee-jerk fear and risk overlooked the potential of generative AI to support students and teachers, as well as the reality that our students are participating in and will work in a world where understanding generative AI is crucial
Молодцы, не у многих хватает уверенности в себе признать «запаниковали, у страха глаза велики — и ошиблись. Но детям предстоит жить с ИИ, так что мы срочно исправляемся»
https://gizmodo.com/new-york-city-public-schools-lift-ban-chatgpt-ai-1850453424
Ну и сегодняшняя наша яндексовая новость: все желающие поиграть с генеративными языковыми моделями, но без плясок с ботами, VPN и вообще не заморачиваясь, могут поговорить в таком режиме с Алисой:) С сегодняшнего дня в ответ на фразу "Алиса, давай придумаем" запускается простейшая версия YaGPT (пока без памяти контекста, просто однократная генерация) -- и на лету генерится придумка по запросу:) Пока это скорее игрушка, но для первого знакомства широкой публики -- в самый раз. Дальше будет больше, много больше, и очень скоро:))
/channel/yandex/1272
Как все-таки приятно среди хора апокалипсических статей, которыми полна нынче массовая пресса, встретить спокойный и ироничный текст, автор которого обладает памятью подлиннее, чем у золотой рыбки и хорошо помнит, как нам обещали крипту, которая убьет центробанки и вообще монетарную систему мира, беспилотные такси, которые завтра оставят без работы миллионы, или метавселенную, которая покончит с офисами.
The most important thing to remember about tech doomerism in general is that it’s a form of advertising — вот да, как маркетолог подтверждаю:)
Если кому-нибудь из тревожных людей вдруг не хватает новых поводов встревожиться, то вот отличная новинка. Современные методы генетического анализа стали настолько изощренными и настолько чувствительными, что практически везде, где побывали живые существа, они позволяют обнаружить и идентифицировать фрагменты ДНК: достаточно отшелушившейся чешуйки кожи среди песка, высохшей капельки пота на камне, кусочка выпавшего волоса среди травы.
Прекрасно для кучи биологических и экологических исследований, но авторы работы предупреждают, что нынешнее чувствительное общество может быть не готово к такой ситуации: ведь обычно наборы данных в таких исследованиях открыто публикуются — в них может оказаться фрагмент ДНК проходившего там человека. Надо ли тогда получать его согласие на такую публикацию? И как вообще насчет возможности идентификации людей, оставивших следы в данной локации? Полезно, если там произошло преступление — а вот если нет? …people tend to get a little funny about who snoops on their genetic secrets.
Прекрасные перспективы для эпидемиологии и популяционной генетики, кошмар для этики.
Интересно, чем дело кончится: авторы, как нынче принято, требуют очередного госрегулирования.
NYT: Регулятор ЕС согласовал сделку между Microsoft и Activision
– Регулятор ЕС разрешил Microsoft купить Activision за $69 млрд
– Microsoft смог убедить регулятора своим уступками для сделки
– В частности, пообещав, что CoD будет доступна для конкурентов
– При этом регуляторы США и UK пытаются заблокировать сделку
– Регуляторы боятся угрозе конкуренции на рынке облачных игр
– Они верят, что сделка подорвет развитие нового сектора рынка
– ЕС не видит угрозе конкуренции, тем более этот рынок очень мал
– Также регулятор считает, что сделка не навредит рынку консолей
– Microsoft не откажет конкурентам, чтобы не было ущерба прибыли
– Доля Microsoft и Activision на рынке мобильных игр также пока мала
@ftsec
Новость не совсем из мира технологий, но символизм ее красив, приятно поделиться.
Есть такая вполне высокотехнологичная компания Luminar Technologies, известная в мире автопрома и беспилотников своими датчиками и сопутствующим софтом для повышения безопасности и автономности автомобилей. Генерального директора этой компании зовут Остин Рассел.
Так вот он прикупил 82% в столетнем и респектабельном издательском бренде Forbes. Рассел, по его словам, не собирается в Forbes Global Media Holdings наводить свои порядки в стиле Маска в Твиттере. В свое время побывавший героем форбсовского рейтинга молодых миллиардеров “30 до 30” Рассел утверждает, что просто любит этот бренд и его филантропические инициативы:
Russell said he won’t be involved in Forbes news coverage or its day-to-day operations Instead, he plans to focus on continuing its growth and emphasizing philanthropy within the business.
И все-таки приятно:) Может, еще и потому, что сам я в российском Форбсе периодически пишу колонки и тоже люблю это издание:)
Когда ребенок совсем еще маленький, отмечают не только его годовщины: полгода тоже серьезный юбилей. ЧатуGPT шесть месяцев исполнилось недавно, а российский Форбс мою колонку на тему опубликовал неожиданно оперативно, так что можно почитать.
Читать полностью…“Бытие определяет сознание”, говаривал один классик, которого в СССР заставляли подробно учить:) Но что-то в этой мысли есть, действительно окружение формирует восприятие.
Вот архитекторы в Шотландии украсили здание, вдохновленные упругостью распрямляющейся пружинящей металлической ленты… Но когда графически похожую штуку видишь постоянно в разных чатиках и каналах, и совсем не упругую ленту там эта эмоджи означает, то и форма здания считывается не совсем так, как замышлялось. Во всем виноват интернет, конечно.
Apple хорошо отметили, что запускают новую платформу;) Полностью отказаться от контроллеров и превратить очки в полноценный носимый компьютер, не требующий выработки новых моторных навыков даже для простых действий — круто. Ну а когда контроллеры нужны (например, для симуляторов авто) — на то и платформа, чтоб они появились.
Не менее круто, что они хорошо обошли проблему аватаров во время онлайновых созвонов — никто же не хочет видеть собеседника в малопрозрачных очках. Поэтому твою физиономию заранее превратят в цифрового двойника, который и будет участвовать в совещаниях;)
Apple Vision Pro действительно больше похож на представителя новой категории устройств, чем все прочие очечки. Через годик посмотрим, как полетит среди пользователей и разработчиков; тут не мгновенная история в стиле ChatGPT; тут новое дорогое ($3,5K)железо с новой операционкой; история на годы. Наблюдать будет чертовски любопытно! Спасибо, Apple;)
Microsoft вкладывается по-крупному, и не только во всем известный нынче OpenAI. Вот еще один единорог по имени CoreWeave, недавно поднявший очередные 200 млн долларов: ходят слухи, что к этому причастен Microsoft, готовый в дальнейшем вложить и больше.
CoreWeave продает доступ к облачным GPU-ресурсам, при этом утверждает, что у него всё быстрее и лучше, чем у старых и традиционных провайдеров облачных сервисов. Учитывая масштабы сотрудничества Microsoft с Nvidia и масштабы закупок там карт, технологии CoewWeave представляются очень уместными. Да и контроль над облаками для обучения ИИ-моделей нынче бизнес прибыльный и быстрорастущий.
https://www.cnbc.com/2023/06/01/microsoft-inks-deal-with-coreweave-to-meet-openai-cloud-demand.html
ОколоИИшная лихорадка, не ослабевающая уже практически полгода, многих до того не очень известных широкой публике руководителей технологических компаний сделала мировыми звездами. Сэм Альтман — ярчайший пример, но и начальник Nvidia Дженсен Хуанг все больше становится публичной фигурой. (Что, в общем, не удивительно: капитализация Nvidia превышает сейчас 900 млрд и довольно уверенно идет к рубежу в один триллион, всем давно известные лидеры в области производства микропроцессоров AMD и Intel могут похвастаться на этом фоне цифрами 174 и 121 млрд; разрыв впечатляет).
В большом (2 часа) публичном докладе на форуме Computex Хуанг не скромничал.
Геймерам будет счастье от карты GForce RTX 4080 Ti, производимой в массовых масштабах, а разработчикам игр — от Nvidia Avatar Cloud Engine (ACE) for Games, сервиса на основе предобученных моделей: ждите теперь умных и разговорчивых NPC.
Суперчип GH200 Grace Hopper с гигантской памятью Хуанг назвал целым компьютером, на основе которого будут создаваться датацентры. Его уже массово производят, а следующее поколение Hopper GPUs начнут производить в августе 2024.
Для создателей роботов предлагается платформа Isaac ARM со своими специализированными чипами…
Все сказочные цифры из его доклада перечислять не буду, читайте по ссылке:)
Но, конечно, еще пять лет назад такие аппаратные возможности и не снились…
Правильное применение GPT существует
Много куда можно провести интернет в наши дни, но не везде получится организовать хорошие школы и нанять полный штат педагогов. Поэтому запускаем педагогов по оптоволокну и витой паре, с помощью ИИ-наставника из Khan Academy. Нюансы его работы можно посмотреть в видео или попробовать самим.
P.S. Будем надеяться, что эта вещь не будет никем использоваться в качестве способа сэкономить денег на реальных преподавателях в местах, где нет проблем с логистикой и кадрами
Посмотреть:
https://www.youtube.com/watch?v=l-Hf8msz9bY
Попробовать:
https://www.khanacademy.org/khan-labs
#позалипать
Microsoft держит темп: на своей традиционной конференции для разработчиков сделал серию анонсов про ИИ. Ничего сенсационного или неожиданного — но уверенный и мощный натиск тоже впечатляет (прикольно, как быстро все перестроились и приняли как должное лидерство Microsoft на текущем этапе ИИ-гонки).
Концепция универсального интеллектуального напарника (он же второй пилот) последовательно воплощается во все массовые пользовательские продукты. Bing Chat приходит не только в каждое из приложений, но и в сами Винды, там появляется Windows Copilot, an AI assistant that follows you wherever you go within the operating system.
Это еще один шаг, гарантирующий супер-массовость: не надо ничего запускать отдельно, не надо на какой-то сайт идти: запустилась операционка — и в ней ожил второй пилот. Интересно, конечно, на практике поиграться, потому что вездесущность должна быть еще и тактичной, чтоб не бесить пользователя. Но в любом случае окажется, что массовое знакомство с ИИ в 2023 состоялось в таком масштабе, которого год назад никто и близко не ожидал.
Intel последнее время как-то чуть ушел в тень: все увлеклись ИИ и железом для машинного обучения. Но именно на эти темы Intel и сделал только что крутые анонсы.
Собственная генеративная модель на триллион параметров Aurora genAI заточена под нужды научного сообщества, обучаться будет не только на текстах общего назначения, но и на научных (причем не только текстах, но и даных и коде для научных исследований).
Диапазон применений планируется впечатляюще широкий: from the design of molecules and materials to the synthesis of knowledge across millions of sources to suggest new and interesting experiments in systems biology, polymer chemistry and energy materials, climate science, and cosmology.
А железо для всего этого — суперкомпьютер Aurora, на основе интеловских же процессоров: 21 248 шт. Xeon CPU и 63 744 GPU.
https://wccftech.com/intel-aurora-genai-chatgpt-competitor-generative-ai-model-with-1-trillion-parameters/
лучший конспект выступления Сундара Пичаи из всех, что видел. Вот Bard так пока не умеет реферировать, вручную пришлось
Читать полностью…У тех, кто смотрел Wednesday, заголовок статьи вызывает в памяти прекрасную пятерню Thing :)
А сама идея протеза, который имеет свой функционал, обеспеченный алгоритмами машинного обучения в облаке, хороша: раз уж нельзя в протезе обеспечить иннервацию потерянной конечности, нужно дать протезу немного автономного мозга (осьминоги так живут, и у них же хорошо получается)
https://www.thestar.com/news/gta/2023/05/20/mind-blowing-toronto-start-up-creates-ai-powered-bionic-arm-that-can-think-and-see-for-itself.html
У Маска не сильно получилось тормознуть работы конкурентов по разработке ИИ, так что пришлось ускорить свои. Свежий ролик про робота, который, как не раз утверждал Маск, станет бизнесом побольше тесловских электромобилей, демонстрирует нешуточный прогресс. Да, прогресс не только инженерных решений, но и софта — который в таких устройствах весь основан на машинном обучении. Интересный момент — обучение робота с помощью копирования действий человека, стоит обратить внимание:)
Ну и просто красиво!
https://youtu.be/XiQkeWOFwmk
Сэм Альтман, глава OpenAI, очень грамотно и последовательно становится важной фигурой не только в технологическом сообществе, но и среди политиков и законодателей по всему миру: сегодняшнее его выступление в Сенате США — лишь фрагмент месячного глобального тура, масштабу которого позавидует любая знаменитость. (писал уже тут в канале)
И у него хорошо получается: в отчетах о его сегодняшнем почти трехчасовом разговоре с законодателями отмечают, что его почти не критиковали и его почти не атаковали как, например, Цукерберга. Сенаторы интересовались его мнением на тему регулирования ИИ, и ответы Альтмана были взвешены и корректны, как и вопросы. Ничего не запрещать с разбегу, создать специальное агентство для лицензирования больших моделей, разработать стандарты оценки безопасности, ввести аудит. Причем безопасность - это не про “модель может плохого насоветовать”, а проблемы принципиально следующего порядка: модели не должны самореплицироваться или иметь возможность “сбежать”. Четкое ощущение, что отвечая на вопросы про привычные модели AI, Альтман на самом деле имел в виду AGI 🙂 Впрочем, он не раз говорил, что верит в AGI, потому неудивительно, что он закладывает основу для будущего, а не пытается, как большинство, готовиться к уже прошедшей войне и обсуждать проблемы датасетов и авторских прав:)
Про соревнование поисковиков (Google и Bing) в скорости внедрения всяких ИИ-фич пишут много и ежедневно. Но большая часть товарных поисков уже давно не идет через поисковые системы, а сразу начинается на крупнейших торговых платформах; во многих странах это означает — на Амазоне.
Поэтому Амазон не может оставаться в стороне, потерять долю торговых запросов в поисковом графике для него слишком опасно. И вот мы ожидаемо видим, как Амазон начинает у себя форсировать разработку и внедрение ИИ в поиск, создание своего “разговорно диалогового поиска”. Что бы там ни писали про массовые увольнения в Амазоне, в этой конкретной области речь идет исключительно про найм:)
Стало модно говорить про новый навык — умение составлять хорошо работающие запросы к генеративным нейросетям; это занятие получило красивое имя prompt engineering, а быстро расплодившиеся обучающие курсы и просто услуги в этой области отлично продаются.
Но это же тоже работа со словом, почему бы не использовать и здесь языковые модели? Ответ исследователей из Microsoft в том и состоит: промпты часто несовершенны, люди вынуждены их улучшать методом проб и ошибок, на каждом шаге впустую расходуя ресурсы нейросети и свое время. Давайте лучше организуем Automatic Prompt Optimisation (APO) для этой цели. Попутно удалось показать, что в ходе APO нейросеть способна опознать даже утонченные попытки обойти встроенные ограничения и получить нежелательные с точки зрения разработчиков ответы — и заблокировать такие запросы.
Можно ожидать, что скоро такой ненаблюдаемый для пользователей защитный препроцессинг промптов окажется встроен в наиболее массовые продукты и поможет хотя бы частично снизить опасения насчет их использования в недобрых целях.
Stability.ai, создатели достаточно известного опенсорсного генеративного приложения Stable Diffusion (доступного в разных видах и активно используемого и профессиональными дизайнерами, и чайниками вроде меня) упрямо держат слово: регулярно радовать публику новинками.
Вот очередная. Компания выпустила Stable Animation SDK, упрощающий генерацию не одиночных статических картинок, а готовых анимаций.
https://stability.ai/blog/stable-animation-sdk
Короткий видосик все объясняет про Stable Animation 🎞️— не всем понравится, но многим пригодится:)