Мы все ближе к генеративной сингулярности:
Nvidia показала работу алгоритма text2video, и он работает сильно лучше чем все предыдущие примеры.
Смонтировал примеры в одно видео, тут по ссылке технические детали про архитектуру и больше примеров.
Модель, поиграться, кажется, нам не дадут 🥲
В марте я тут давал ссылку на рассказ о суперкомпьютерах Microsoft, используемых для обучения больших языковых моделей, и тот рассказ был во многом о тесном сотрудничестве Microsoft и Nvidia, десятки тысяч видеокарт A100 (а теперь и H100) которой используются в суперкомпьютере.
Но, оказывается, ставки на ИИ уже настолько высоки для Microsoft, что и соответствующие процессоры — это уже core business, который необходимо развивать у себя. Так что несмотря на дружбу с Nvidia возник проект Афина (Athena). Именем богини мудрости названа разработка собственного чипа для задач машинного обучения; уже в следующем году планируется его масштабное производство. Что ж, Microsoft не первый среди техногигантов, кто становится вертикально-интегрированной компанией — от производства чипов до массовых сервисов на этих чипах:) При игре вдолгую все огромные затраты на свои разработку и производство вполне окупаются.
(Мартовский пост для истории /channel/techsparks/3945 )
(Никогда не думал, что буду так много и часто комментировать новости про Microsoft...)
О, SpaceX получила долгожданное разрешение на первый тестовый полет полной сборки Starship и собирается провести запуск уже в понедельник. Посмотреть на управляемый возврат и посадку бустера или самого корабля в этот раз не получится при любом раскладе — пока что тестировать многоразовость не предусмотрено. Но будет интересно посмотреть, как эта махина взлетит (если взлетит) или что еще с ней случится: зрелище при любом исходе обещает быть масштабным.
Но точное время запуска пока не объявлено.
https://www.cbsnews.com/news/faa-approvals-maiden-flight-spacex-super-heavy-starship-rocket/
Выпущена очередная версия Stable Diffusion XL, что само по себе не особо новость, но этот релиз отлично иллюстрирует, насколько быстро решаются те проблемы, которые всякие обозреватели любят подавать как “принципиальные” для генеративных алгоритмов. Нам долго рассказывали, что генеративные сети не справятся с анатомией и числом пальцев — но прошло несколько месяцев, и проблему решили. Потом долго указывали на бессмысленные каракули вместо текстов — теперь разобрались и с ними.
Не вдаваясь в возможности художественного творчества, в этой заметке интересно посмотреть на примеры сгенерированных фотореалистичных изображений, и их реалистичность уже совсем не фигура речи:)
SpaceX рассчитывает получить разрешение и на следующей неделе провести первый тестовый орбитальный полет своего Starship’а. Объявлено, что больше не предполагается никаких репетиций и тестов — только реальный запуск сразу после получения разрешения.
А в ожидании документальной картинки пуска нам предлагают посмотреть 5-минутный мультик про то, как Starship’ы полетят к Марсу и как будет выглядеть тамошняя колония землян.
https://youtu.be/921VbEMAwwY
Очень правильный ответ Сундара Пичаи всей той малограмотной публике (в особенности — журналистам), которые в порыве драматизма задаются вопросами “убьет ли ChatGPT Google?” “Почему Google утратил лидерство?” “Сочтены ли дни поиска?” и пр.
Пичаи пришлось напомнить хорошо известные, но сильно нелюбимые современными стартапами факты: Гугл не был первопроходцем ни поиска, ни карт, ни многих других своих сервисов: Pichai stated that in almost every area that Google operates, the company was not the first mover.
Он специально напомнил, что пресловутое first mover advantage отнюдь не так важно, как нам пытаются внушить. Конкурентное преимущество не в поспешности, а в том, чтобы сделать лучше и для бОльшей аудитории. И вот в этом Гугл — большой мастер:)
Там еще много интересного про подход Гугла к инновациям, состоящий не в генерации идей, а в разработке самых сильных технологий для реализации идей: "We don't launch things until we think they are ready" — и пока что многие годы существования Гугла показывают, что такой подход отлично работает.
Уже девять лет компания Artmatr разрабатывает и изготавливает устройства, которые позволяют художникам, работающим в цифре, материализовать свои работы, перенося их на различные плоские носители. Просто назвать эти устройства плоттерами было бы оскорблением: для реализации художественных замыслов эти рисовальные роботы обладают огромным количеством настроек, позволяющих управлять стилем изображения и использовать любого типа кисти, ручки, фломастеры — что угодно.
Задача дать художникам all the infinite ways that an artist wants to express themselves in translating a flat image into something that has the sensuality and the story that’s embedded in the physical. выполняется успешно, спрос растет: всё чаще цифровым художникам хочется иметь материальные версии своих работ:)
Этот поворот, кажется, мало кто ожидал; Маск очередной раз сумел удивить. Твиттер как компания прекратил свое существование, слившись с некой X Corp. История вроде бы пока чисто юридическая, связанная с иском к компании от некой провокаторши. Комментарии, традиционно, получить невозможно — на все официальные запросы аккаунт пиар-службы (давно несуществующей в Тви) автоматически отвечает какашкой. Поэтому догадки журналистов выглядят примерно так:
So why is X Corp. now a thing, and why is it established in Nevada? Some vintage Musk lore may provide insight here. Elon Musk has long been attached to the letter X
Но в итоге вполне может оказаться, что команда юристов под управлением Маска занимается крутым жонглированием в области корпоративного управления с далеко идущими последствиями. Он же когда-то что-то твитил про суперапп X :))
В общем, можно опять с интересом какое-то время понаблюдать за событиями вокруг Твиттера или как его там нынче звать.
https://slate.com/technology/2023/04/twitter-inc-x-corp-elon-musk-x-nevada.html
Еще одно подтверждение точности и универсальности метафоры «второго пилота», которую Microsoft использует для своих продуктов на основе больших языковых моделей. На этот раз выяснилось, что ChatGPT может работать вторым пилотом и для ученого-математика. Лауреат медали Филдса Теренс Тао не просто написал «GPT-4 has saved me a significant amount of tedious work. I am now looking forward to native integration of AI into the various software tools that I use», но и рассказал, как GPT-4 помогает ему искать разные идеи доказательств, работает с библиографией и вообще разными источниками, умеет заниматься сложным парсингом и т.д.
То есть классика: конечно же, GPT-4 не формулирует и не доказывает за Теренса новые теоремы — зато предоставляет ему больше времени этим заниматься. Почти что работает аспирантом…
https://pandaily.com/mathematician-terence-tao-comments-on-chatgpt/
Как-то мы привыкли, что генная инженерия — это про всякое сельское хозяйство, создание растений, которые потом перерабатываются в еду, кое-где запрещаемую и вообще сильно обсуждаемую. Но — спасибо массовой климатической озабоченности — есть и более внушительные и уже работающие, а не чисто умозрительные проекты: генно-модифицированные деревья, которые растут вдвое быстрее обычных. Поэтому они и углекислый газ из воздуха связывают эффективней, и древесину (которую можно продавать) производят быстрее. Изящное решение и с красивым обоснованием:
We believe in working alongside billions of years of evolution. Trees have a system for absorbing carbon dioxide that is far more efficient and less energy intensive than human-made solutions.
Математика — великая вещь; нелинейные процессы нас окружают, и их исследование иногда делает жизнь понятнее. Иллюстрацией к этому посту служит картинка из серьезной научной работы с несколько неожиданным названием “Sex, ducks, and rock “n” roll: Mathematical model of sexual response” Работа действительно посвящена психологической и физиологической нелинейности процесса достижения мужского оргазма. Не самое простое и довольно долгое чтение, графики оргазмических и аноргазмических траекторий с первого взгляда не просветляют, поэтому в популярном пересказе, опубликованном уже для широкой публики, авторы сообщают, что главный вывод сводится к совету “хочешь получить удовольствие, как можно меньше заморачивайся и размышляй в процессе”.
Совет незамысловатый, так и сам процесс, как утверждают авторы, не слишком сложен. Именно поэтому у них в планах взяться за моделирование женского оргазма, который много сложней и нелинейней.
В общем, нормальное чтение под ласковые весенние выходные:))
Приятная статья про наш Музей, который я очень люблю. Слишком уж часто в музеях разной техники большая часть экспонатов — муляжи или мумии, внешне точные, но давно неживые. А коллеги из Музея Яндекса реально заморочились — фишка музея в том, что вся эта техника в рабочем состоянии, можно увидеть (иногда и услышать) — и это действительно погружение в прошлое, а не просто его созерцание.
Читать полностью…Гугл обновил свою роскошную фичу Google Earth Timelapse, добавив изображения, отснятые в 2021 и 2022 годах (так что теперь доступен интервал 1984-2022). В отдельной библиотеке для 300 локаций собраны более 800 Timelapse videos.
https://blog.google/products/earth/new-imagery-google-earth-timelapse-videos/
Ну наконец-то! Несмотря на поговорку про изобретение велосипеда, люди продолжают велики изобретать и переизобретать с завидным упорством — и это прекрасно. Но вот есть забытые изобретателями объекты. Например, фотоштатив. То, что на него устанавливают, очень сильно отличается от фотоаппаратов, скажем, прошлого века. А сама тренога, по сути, та же самая — ну, разве что материалы посовременнее.
Но у кого-то дошли мозги и руки и до штатива. Куча мелких улучшений — все ради того, чтоб установить штатив можно было максимально быстро, это часто важно. Но для меня, любителя снимать где-нибудь на природе в горах, где ровных площадок не бывает, самая крутая фишка — автоматическое выставление уровня. Одно нажатие кнопки, ноги штатива сами подстроили свою длину — и никаких больше заваленных горизонтов :)
https://www.yankodesign.com/2023/04/03/this-automatic-self-leveling-tripod-is-the-photography-worlds-biggest-game-changing-innovation/
Неспешный и обстоятельный лонгрид про Тима Кука в GQ, ожидаемо для такого журнала, там не про технические или даже управленческие — а больше про человеческие аспекты. Кук не самый типичный лидер технологической компании: он не трудится 24х7 (предпочитает покидать офис вечером с полседьмого до семи), не прячет адрес своей электронной почты, которую просматривает лично, а не в отфильтрованном референтами и помощниками виде. Любит хайкинг, а не какой-нибудь дорогой или экзотический досуг.
Знаменитое «move fast and break things» — абсолютно не его стиль, во многом он полная противоположность Маску; в том числе поэтому про него пишут гораздо меньше, и потому такая обширная статья особенно ценна, очень советую на досуге ознакомиться.
https://www.gq.com/story/tim-cook-global-creativity-awards-cover-2023
Я редко пишу про технологические истории, связанные с изменением климата, хотя это очень большой и хорошо финансируемый сектор технологического предпринимательства. Там, однако, так сильно переплелись политические мотивы, активизм и собственно технологии, что очень непросто отличить действительно прорывные и перспективные разработки от чистого хайпожорства.
Но даже если следить за климатически-технологической повесткой весьма поверхностно, одно наблюдение сильно удивляет (меня, во всяком случае): очень сильный уклон в средства борьбы с причинами (то, что называется mitigation), эффект от которых мы увидим через много лет. И при этом очень мало делается для немедленного снижения вреда от климатических изменений, который нам прямо сейчас обходится в тяжелые потери (от людских до финансовых). Решения для адаптации явно недооценены. Не выдержал, и на эту тему написал очередную свою колонку в российский Forbes 🙂
Старый спор среди любителей домашних кинотеатров — что лучше: большая панель или мощный проектор — выходит на уровень, где раньше безраздельно царили проекторы. В больших, а не домашних, кинозалах проектор считался обязательным оборудованием.
Но теперь Samsung и LG активно продвигают свои панели для кинотеатров любого масштаба; эта технология обеспечивает бОльшую яркость и настоящий HDR. Минусы — более высокая цена и энергопотребление, а ещё возникают проблемы с размещением динамиков позади панели, так что надо переделывать акустические системы в залах.
Кинопрокат прислушивается к мнению Голливуда, поэтому именно там изготовители заняты лоббированием и демонстрацией новых экранов. Процесс явно будет небыстрый, но, похоже, начинается.
https://www.techspot.com/news/98347-samsung-lg-reportedly-promoting-led-screen-adoption-theaters.html
Хоть все и отписались на тему, это нельзя пропустить:))
Сначала Маск яростно борется со скоростью разработки ИИ и возглавляет мутную кампанию с требованиями все затормозить — но получается не очень успешно. Тогда он начинает скупать графические карты в количествах, характерных для нужд тренировки современной масштабной языковой модели, а через несколько дней оказывается, что он уже гендиректор компании с говорящим названием X.AI.
И снова тот же Х, куда недавно отправился Твиттер 🙂
Затейник он, конечно, хотя на этот раз выступил вполне предсказуемо: независимо от успешности попыток тормознуть конкурентов, свои языковые модели развивать надо очень быстро:)
⚡️Amazon мощно заявил о себе в гонке генеративных ИИ ⚡️ предоставив бесплатный доступ к своему AI-ассистенту по программированию CodeWhisperer🤖 (бесплатный аналог Copilot X от Microsoft) - поддерживает множество языков программирования, интегрируется с различными средами разработки (IDE) и фильтрует предложения кода.
Кроме того, Amazon представил Bedrock - инновационный инструмент для создания и масштабирования генеративных ИИ-приложений. Он включает базовые модели от стартапов, таких как AI21 Labs, Anthropic и Stability AI, что позволит разработчикам строить свои приложения на основе передовых ИИ-технологий.
Эти новости подчеркивают амбиции Amazon на рынке искусственного интеллекта, где компания стремится конкурировать с гигантами, такими как Microsoft, Google, OpenAI. Разработчики теперь могут расчитывать на более доступные и продвинутые инструменты, которые помогут ускорить и упростить процесс разработки программного обеспечения🤓
Bloomberg: Didi показала прототип беспилотного автомобиля для такси
– Футуристический концепт называется Didi Neuron
– Длина 4,5 м, снаружи установлено 8 видеокамер
– Там есть роборука для погрузки тяжелого багажа
– Места для водителя внутри Didi Neuron не будет
– Партнером стал производитель EV-автомобилей
– При этом Didi не раскрывает имя своего партнера
– Didi не раскрывает детали про запуск Didi Neuron
– Беспилотные такси Didi есть в Шанхае и Гуанчжоу
– Их следующее поколение Didi запустит уже в 2025
@ftsec
Китайский производитель электромобилей BYD представил живьем топовую модель U9 EV (она будет выпускаться под отдельным люксовым брендом Yangwang). Разгон до сотни за 2 секунды впечатляет, но больше всего компания гордится суперумной и супернастраиваемой системой подвески. Именно она позволила автомобилю на презентации переминаться с колеса на колесо, пританцовывать и даже немножко подпрыгивать. В реальных же условиях подвеска DiSus позволяет увеличивать просвет на 200 мм, динамически менять жесткость раздельно для каждого колеса. Создатели машины утверждают, что такая подвеска является most advanced in the global industry.
Ну а широкой публике эту хищно выглядящую тачку представят вскоре на шанхайском автосалоне.
https://electrek.co/2023/04/10/byd-yangwang-u9-ev-0-60-mph-2-seconds-it-can-ollie-jump-supercar/
Список городов выглядит как план турне хорошей рок-звезды: Toronto, Washington D.C., Rio De Janeiro, Lagos, Madrid, Brussels, Munich, London, Paris, Tel Aviv, Dubai, New Delhi, Singapore, Jakarta, Seoul, Tokyo and Melbourne. Но речь не о концертах, а о переговорах на высоких уровнях, в том числе государственных. И отправляется по такому маршруту Сэм Альтман, глава OpenAI.
Не каждый стартап может надеяться на такое турне своего руководителя:) И мало что так наглядно показывает, насколько влиятельны технологии в современном мире, и, соответственно, насколько они сплетены с политикой. За заявлениями Сэма Альтмана по ходу турне следить будет не менее интересно, чем за высказываниями большинства министров и многих президентов :)
https://venturebeat.com/ai/as-critics-circle-sam-altman-hits-the-road-to-hype-openai-the-ai-beat/
Становится уже настолько сложно следить за потоком ИИ-хайпа и выбирать в нем толковое, что я для разнообразия запощу несколько хороших карикатур из
https://marketoonist.com/2023/04/navigating-ai-hype.html :))
Такие сообщения лучше доказывают быстрое превращение электромобилей в обыденность и мейнстрим, чем победные релизы производителей электрокаров.
Сеть универсамов Walmart объявила, что откроет зарядные станции на тысячах парковок у своих магазинов. Магазины эти размещены по США вполне разумно: компания гордится тем, что 90% населения проживает не больше чем в 10 милях от ближайшего магазина. Поэтому утверждение «мы поможем снизить тревожность людей, опасающихся, что им негде будет подзарядить машину» выглядит вполне серьезным, а не просто пиарным заявлением.
https://gizmodo.com/walmart-just-showed-how-mainstream-evs-are-now-1850318350
В Йокогаме прошла ежегодная выставка производителей фото- и видеокамер CP+ 2023, на которой можно не только посмотреть новинки, но и послушать выступления руководителей типовых брендов в этой области: Sony, Canon, Nikon, Fujifilm и т.д.
И эти руководители вполне оптимистичны: они считают, что после большой перестройки, вызванной появлением смартфонов, рынок вполне стабилизировался, дальше падать не будет и может даже подрасти.
Надежды возлагаются на молодежь и подростков, относящих себя к “креаторам”. Среди них все более популярно использовать для съемок более продвинутую аппаратуру, чем даже топовые смартфоны.
Но есть нюанс — эти съемки все чаще включают видео, поэтому фокус разработки новых фич в камерах смещается в сторону именно возможностей видео. Поэтому для поклонников классических фотокамер есть плохие новости:
camera manufacturers are putting more resources into video, not less; they see video as a growth driver for their individual brands and the industry as a whole.
Ну, а еще замаячил впереди ИИ, и начнется гонка встроенных ИИ-функций работы с изображением, куда ж теперь без этого 🙂
Приятно полюбоваться на полностью собранную на стартовом столе самую мощную в мире ракету — Starship от SpaceX. Изделие высотой 120 метров с 33 движками для подъема и разгона этой махины впечатляет.
Осталось дождаться разрешения регуляторов на запуск; предположительно, оно может быть выдано на следующей неделе. После этого будет интересно вживую посмотреть трансляцию старта, помня слова Маска о том, что вероятность взрыва при первом запуске — около 50% 🙂
Хотя Гугл внешне демонстрирует спокойствие и уверенность, все же там решили использовать тяжелую пиарную артиллерию:) Эту самую уверенность Сундар Пичаи отправился излучать в виде большого интервью в
The Wall Street Journal.
Как и положено, он отметил, что всё происходящее и активность Bing в частности, это не угроза, а новая возможность: “The opportunity space, if anything, is bigger than before”
Он пообещал, без конкретики, что большие языковые модели изменят опыт пользователей поиска: “Will people be able to ask questions to Google and engage with LLMs in the context of search? Absolutely.” Интеграция с интерактивными нейросетями затронет также Gmail и офисные онлайновые инструменты Гугла.
Неторопливость действий Гугла объясняется тем, что он still trying to find the right market — и, в общем, именно Гугл может себе это позволить. Пичаи рассказал, что Google Brain и DeepMind, раньше работавшие довольно автономно, теперь будут тесно кооперироваться — и для экономии ресурсов, и для ускорения процессов:)
Но сроков все равно никаких не назвал:)
Разработчики Гугла опубликовали красивую и сильную работу, в которой отстаивают одно свое не очень видимое снаружи преимущество перед прочими мощными системами машинного обучения.
В отличие от остальных, полагающихся на чипы от Nvidia, Гугл создает собственные чипы серии Tensor Processing Unit (TPU). Более 90% ИИ-вычислений в датацентрах компании ведется именно с помощью этих чипов, и вот представлено и описано четвертое их поколение в статье с вкусным названием TPU v4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings.
Свежие суперкомпьютеры Гугла используют по 4096 таких процессоров. Масштабы ресурсов для обучения языковых моделей выглядят так: Google's PaLM model - its largest publicly disclosed language model to date - was trained by splitting it across two of the 4,000-chip supercomputers over 50 days.
Причем утверждается, что система в эксплуатации с 2020 года, и что MidJourney использовала как раз ее.
В общем, серьезная заявка на еще одно соревнование техногигатов: не только в софте, но и в железе.
https://www.reuters.com/technology/google-says-its-ai-supercomputer-is-faster-greener-than-nvidia-2023-04-05/
Оригинал статьи - https://arxiv.org/pdf/2304.01433.pdf
Я довольно редко делюсь в канале ссылками на проекты на Product Hunt, которые мне регулярно присылают. Но сегодня — редкое и приятное исключение:)
Пишет мне Маша @mchmir:
=-=-=-=-=-
Андрей, привет. Хочу на ваш суд вынести наш новорожденный локализатор видео: his name is Rask AI:)
Мы последние полгода упарываемся за утилизацию, решили нужную штуку сделать для content entrepreneurs.
Что под капотом: перевод и дубляж с синхронизацией с речью спикера (сравниваемся с яндексовским Neurodub — мы круче), распознавание спикеров, мультиязычность и — мое любимое — клонирование голоса при переводе.
Пока не летает, но уже симпатичное.
=-=-=-=-=-
Я б поспорил насчет, кто там лучше:)) Но для такого спора нужно много продуманных тестов, вот на это времени не найду. Что могу сказать — с роликом с несколькими подвохами Rask AI справился отлично. С клонированием голоса — терпимо, но это реально трудная история на коротком отрывке.
Так что предлагаю читателям тестировать, а если понравится — поддерживать:)
https://www.producthunt.com/posts/rask-ai-video-localization-dubbing-app
За ИИ-шумихой прошлой недели пропустил интересную новость из области носимых медицинских (или даже просто мониторящих состояние здоровья) девайсов. В Южной Корее регулятор выдал разрешение на использование умного кольца CART-1 Plus в качестве тонометра. Эта разработка стартапа Sky Labs раньше умела хорошо измерять пульс, добавка измерения давления делает ее очень полезной для мониторинга давления во время сна, что для гипертоников считается весьма важным. Следующий шаг — получить разрешения в США.
Миниатюризация приборов медицинского уровня до масштаба перстня — реально крутой результат. https://www.mobihealthnews.com/news/asia/south-korea-clears-sky-labs-cuffless-blood-pressure-monitoring-feature