techsparks | Технологии

Telegram-канал techsparks - TechSparks

46690

Аннотированные ссылки на интересные, полезные и удивительные новости хайтека. Тем, кто больше любит слушать длинное чем читать короткое — могу посоветовать свой подкаст ;) http://sebrant.chat Вопросы - @asebrant

Подписаться на канал

TechSparks

Нет, я не буду писать про то, как Маcк подал в суд на OpenAI и персонально Сэма Альтмана за то, что компания обещала развивать ИИ на благо человечества, а в итоге развивает его на благо Майкрософта (и до кучи требует признать, что GPT-4 — это уже AGI). Прикольно, но уже отписались буквально все.
А вот про то, как Alibaba нежно потроллила OpenAI, что-то пишут мало, а оно изящно.
Сотрудники Institute for Intelligent Computing опубликовали работу, показывающую, как с помощью их технологии по статической картинке и аудиофайлу с голосом можно сгенерить очень реалистичное видео исполнения этой песни или с зачитыванием текста.
На видеопримере японка из сгенерированного SORA ролика очень артикулированно и с естественной мимикой произносит текст голосом Миры Мурати из OpenAI.
Вот исходная статья (видео для поста взято как раз из нее)
https://humanaigc.github.io/emote-portrait-alive/
А вот заметка про нее
https://mashable.com/article/alibaba-emo-ai-facial-animation

Читать полностью…

TechSparks

Видео в этой статье реально впечатляет: мы много уже видели роликов про человекоподобных роботов, довольно уверенно манипулирующих разными предметами, но на них на всех эти роботы кажутся то ли слегка заторможенными, то ли с похмелья. Здесь не так: скорость и плавность движений соответствуют ловкости нормального человека.
Ответов про программную сторону дела компания Sanctuary AI пока не дала, а вот на аппаратной стороне ответ немного неожиданный по нынешним стандартам: они отказались от электроприводов и перешли на гидравлику, хоть это и сложнее. Разработчики уверены, что it's the only technology that gives us a combination of three factors that are very important: obviously precision, but there's also speed and strength.
Интересно, получит ли этот подход развитие в нашем электрифицированном мире :)
https://newatlas.com/robotics/sanctuary-phoenix-autonomous-speed-hands/

Читать полностью…

TechSparks

Добрый вечер, увидел ваш пост про самокат, российская компания DPLabs сделала подобный почти два года назад (до 100км за 6.5 секунд), стоимость сравнима. Вот видео ссылки: https://www.youtube.com/watch?v=tkxg7iSXFWk, https://www.youtube.com/watch?v=yWnOgk9buCU, https://www.youtube.com/watch?v=an_ihTdAjHA

Читать полностью…

TechSparks

Почти всё можно довести если не до абсурда, то как минимум до опасной черты ;))
Можно, оказывается, купить электросамокат с впечатляющей ценой $10 000, способный разгоняться больше чем до сотни км/час. Выглядит несколько устрашающе, хотя знаю людей, которые способны возбудиться.
Становится понятней, почему все-таки нужны регуляторы: при всей любви к гаджетам, оказаться рядом с этой штукой на трассе мне было бы не очень комфортно:)
https://youtu.be/5PydA6BjaEQ?si=f-aHF2SCKkX--jpf
(для предпочитающих читать восторги и характеристики в текстовом виде, а не слушать их в ролике — вот статья https://cleantechnica.com/2024/02/25/can-an-electric-scooter-be-too-fast-this-one-might-be/ )

Читать полностью…

TechSparks

Кстати, в интервью из предыдущего поста есть один интересный абзац, который рано или поздно возбудит алармистов.
Хуанг говорит про перспективы развития игровой индустрии и отмечает, что ИИ ее сильно изменит с помощью ACE, our Avatar Cloud Engine.
Комбинация легких моделей, дистиллированных из больших, с аватарами, чьи движения генерятся ИИ, позволит создавать в игре персонажей, которые embody the history, the context of the stories, and practically be able to interact with us. They will have vision, they’ll be able to see each other, they’ll be able to see us, and they’ll be able to interact with us.
Логично было бы, чтобы самосознание и прочие личностные характеристики первыми обрели эти виртуальные личности, а не обложенные со всех сторон подушками политкорректности и нейтральности ассистенты и агенты из классических приложений:))
(Картинка, чтоб не повторяться, показывает офис Nvidia, а не её главу)

Читать полностью…

TechSparks

О, сторонники тотальной электрификации добрались до энергоемких промпредприятий, где все еще сжигают углеводородное топливо, чтобы что-нибудь нагреть.
Электромобили уже не очень новинка, хотя и не сказать, чтобы процесс полной электрификации транспорта шел совсем гладко. Он, тем не менее, точно идёт.
А вот электрофабрика — слово, пока непривычное уху, и некоторые крупные компании хотят возглавить новое движение и сделать эту концепцию массовой. Например, консорциум химических компаний во главе с BASF собирается разработать электропечи, которые обеспечат нужную температуру в реакторах, где пока для нагрева используется сжигание газа.
Понятно, что в современной жизни многие правительства готовы в любую электрификацию/декарбонизацию вкладывать большие деньги. Так что скоро мы должны увидеть массу стартапов вокруг электрификации энергоемких производств, там куш побольше, чем с элетромобилями, а на электромобилях стартапы хорошо поживились.
https://www.economist.com/briefing/2024/02/15/first-electric-cars-next-electric-factories

Читать полностью…

TechSparks

По собственному опыту знаю, что Роблокс — не просто игровая платформа, и не только для детишек: это платформа коммуникационная (во времена ковида это было доказано экспериментально). В России, кроме всего прочего, это платформа еще и растущая, поэтому про нее почитать просветительский текст от эксперта очень полезно людям из разных коммуникационных областей — от HR до маркетинга и образования. А в экспертности автора я много раз убеждался лично, Ярик не случайно у меня и в подкасте был когда-то, мы не только по публикациям знакомы:)
https://vc.ru/marketing/1041868-roblox-dlya-brendov

Читать полностью…

TechSparks

На заре раскрутки термина “метавселенная” много было ссылок на Мэтью Болла: он неплохо пытался хоть как-то формализовать суть этого слова и основные параметры, которыми должно обладать нечто, претендующее так называться.
Сейчас он опубликовал эссе, которое полезно почитать ради исторического обзора модных нынче терминов (например, напоминалки, что не Apple придумал Spatial computing, а еще в начале 90-х, во времена до веба, этот термин был запущен в коммерческий оборот (а потом успешно забыт)).
Интересно следить, как менялись значения многих модных слов со временем, а люди, которых зачем-то пытались назначить провидцами, честно писали, что они были заняты making shit up, а не футурологией. (Это выражение - цитата из Нила Стивенсона по поводу его предвидений в Snow Crash.) Собственно, рассказанная в подробностях долгая история цифровых технологий через жизнь слов и концепций интересней ожидаемого от Болла вывода, что мы таки будем однажды жить в метавселенной:) Ради этой истории, а не финала, очень рекомендую эссе к прочтению.

Читать полностью…

TechSparks

Рынок смартфонов, последние годы стагнировавший, надеется на скачок роста, связанный с обновлением моделей на “созданные для ИИ”. Запрос на ИИ-приложения у людей сформировался, но не все функции исполняются на серверах где-то в облаке, всё больше (например, работы с изображениями с камеры) надо выполнять прямо на смартфоне. И тут старое железо уже не тянет, и это хорошо заметно пользователю.
Поэтому воспряли не только Apple с Samsung, но и многие китайские бренды.
The new wave of AI technology, powered by LLMs, is restructuring the future of the mobile phone industry. The impact of AI on the handset industry in the next five years is comparable to when smartphones replaced feature phones.
Oppo, Meizu и прочие обещают принципиальные новинки и ждут рост в 2024. Речь про толковых персональных ассистентов и помощь в создании контента в первую очередь.

Читать полностью…

TechSparks

Видел я подобные полы — иногда размером с футбольное поле — на европейских фестивалях, но вот технология из шоу-бизнеса приходит в большой спорт.
В феврале команды NBA проведут две игры на площадках, привычный паркет которых заменен на огромные светодиодные экраны. Попутно будет тестироваться, что лучше показывать на этих экранах помимо информации про саму игру.

https://www.techspot.com/news/101908-led-glass-basketball-court-make-nba-debut-month.html

Читать полностью…

TechSparks

Очень интересная заметка — немножко про наше будущее — в которой анализируется изменение поведения судей в теннисе с того момента, как их ошибки начала исправлять ИИ-система (причем последнее слово именно за ней).
На большинстве топовых турниров сейчас используется система Hawk-Eye, в которой от 6 до 10 камер, расположенных вокруг корта, позволяют в точности восстановить траекторию мяча и с миллиметровой точностью определять, был ли аут — то есть где относительно линии мяч коснулся площадки.
Оказалось, что, во-первых, после появления этой системы белковые судьи стали реже ошибаться:) Риск публичного осуждения (когда ИИ может продемонстрировать их ошибки) заставил людей стать внимательнее.
Но интересней оказались детали. Оказалось, что до введения ИИ-надзора люди чаще объявляли аут, когда его на самом деле не было, то есть старались перебдеть (в сравнении со случаями, когда аут на самом деле был, но судьи не среагировали).
После появления объективного контроля ситуация поменялась: в спорных случаях люди скорее стали пропускать ауты, то есть предпочитать недобдеть. Психологически объяснимо: ложный крик “аут” останавливает игру и вызывает более сильную эмоциональную реакцию игроков и зрителей — судьи стали минимизировать нападки на себя:)
Учитывая, что потихоньку мнения ИИ-помощников станут значимыми и в других местах, например, в судах или в медицине, там будет интересно: Станут ли судьи помягче, а медики, наоборот, склонны к избыточным диагнозам (в рамках того же психологического механизма минимизации осуждения со стороны).
https://www.economist.com/science-and-technology/2024/02/15/what-tennis-reveals-about-ais-impact-on-human-behaviour

Читать полностью…

TechSparks

OpenAI только что выпустили SORA— text2video модель

Генерация видео по текстовому описанию наступила!

Сегодня обещают статью

Промпт: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

🟣https://openai.com/sora#research

Читать полностью…

TechSparks

Ждем третью серию этого прекрасного сериала про Starship: две первые были зрелищны, эмоциональны — и, в общем, вполне демонстрировали прогресс, так что в этот раз хочется более длинной трансляции и картинок уже с орбиты:)
Обещают в ближайшие недели, если не случится задержек с официальными разрешениями.
https://www.space.com/spacex-rolls-starship-pad-third-test-flight-photos

Читать полностью…

TechSparks

На выходных в новостных лентах много было картинок и видео с полыхающим беспилотником Waymo посреди Сан-Франциско.
Можно было бы рассуждать о луддизме и восстании людей против машин — но, полагаю, всё сильно прозаичнее: это же Сан-Франциско, за последние несколько лет сильно похудевший.
После тех картин, что наблюдал там в 2021 и 2022, уверен, что это просто шпана, причем понимающая, что когда в машине нет людей, куда спокойней ее крушить и жечь; полиция даже и дела может не возбудить. Грустно всё это видеть в городе, который еще в 80-е полюбил с первого визита…

https://www.theverge.com/2024/2/11/24069251/waymo-driverless-taxi-fire-vandalized-video-san-francisco-china-town

Читать полностью…

TechSparks

Очёчки косяком пошли:) Вот еще одни: легонькие, ретро-стильные, от ex-Apple персонажа по фамилии Bobak, которого я упорно читаю как Bobuk :)))
Идея примерно как в Ray-Ban’овских умных очках: встрить интерфейс к умному ИИ-ассистенту, который видит через камеру то же, что ты видишь, и позволить ему мультимодально отвечать поверх наблюдаемой реальности.
Сегодня открыли предзаказ по цене 349 долларов; поставки обещают в апреле. Цена невысокая, поскольку это не самостоятельное устройство, а периферия к смартфону: связь с облачными сервисами типа ChatGPT не предполагает никаких тяжелых вычислений на устройстве.
И, в отличие от Meta Ray-Ban, это просто ассистент, а не клиент для соцсетей: камера в нем чтоб картинку на анализ передать, а не чтоб ролик с нее запостить.
Отлично, поле новых железяк расширяется, к концу года можно будет многое посравнивать и что-то понять про предпочтения людей в мире ИИ-ассистентов, которые всегда с тобой.
https://www.zdnet.com/article/the-most-promising-ai-smart-glasses-are-from-a-brand-youve-never-heard-of/

Читать полностью…

TechSparks

Словно подустав от гонки в областях текстов и картинок (в том числе, движущихся), техногиганты решили побаловать новинками из области генерации музыки. Ведь если текст, речь и иллюстрации уже можно легко нагенерить, то для пущего счастья инфлюенсеров и подкастеров неплохо бы еще иметь и музыкальное сопровождение, за которое не надо платить всяким белковым авторам и исполнителям.
И вот тут практически синхронно выступают с новостями Adobe и Google. Первые сообщают о Project Music GenAI Control — скромно описывая его способности: these new tools … aren’t just about generating audio—they’re taking it to the level of Photoshop by giving creatives the same kind of deep control.
Ну, а гугловый MusicFX DJ является развитием запущенного в прошлом году MusicFX и делает ровно то, что и положено диджею: позволяет микшировать сгенеренные ИИ треки. As you type in multiple prompts, MusicFX DJ will layer them together in a single composition, syncing each track like a DJ.

Читать полностью…

TechSparks

Пока лидеры ИИ-гонки активно разгребают скандалы и тушат пиарные пожары (недавний шедевральный способ от Google внести diversity во всё, включая историю, вызвал редкого масштаба резонанс), Apple традиционно немногословен, но совсем уж молчать на тему ИИ не может себе позволить даже он.
И поэтому Тим Кук начал произносить типично обтекаемые, но нетипично многообещающие слова типа
“the company will break new ground" в области генеративного ИИ в 2024 и даже "We believe it will unlock transformative opportunities for our users"
Остается надеяться, что WWDC, которая традиционна случатся в июне, внесет ясность. Хоть какую-то:)
https://www.macrumors.com/2024/02/28/tim-cook-apple-generative-ai-break-new-ground/

Читать полностью…

TechSparks

Бдительные читатели меня дополняют:))

Читать полностью…

TechSparks

Вот и второй споткнулся. Подряд, причем: за несколько недель до этой посадки японский модуль кувыркнулся на Луне. И тоже сохранил работоспособность.
Но если всерьез, то изложенная в статье хронология событий, последовавших за отказом лазерного высотомера на посадочном модуле Odysseus от компании Intuitive Machines куда круче любых находок сценаристов, пишущих космические сериалы — очень рекомендую почитать подробности.
Жизнь богаче высокооплачиваемых фантазий. А сценаристов в частности и поэтому не жаль на ИИ побыстрей заменить :)
https://www.nytimes.com/2024/02/23/science/moon-lander-intuitive-nasa.html

Читать полностью…

TechSparks

Я здесь, и не только здесь, много раз грустил про нарастающую фрагментацию интернета, но избегал слов про суверенность: многих концепция суверенных государственных интернетов откровенно раздражает, чтоб не сказать бесит.
И вот Дженсен Хуанг, глава Nvidia, уверенно заговорил про суверенный ИИ. Для него, кстати, это не геополитическая теория, а бизнес-план компании, у которой квартальный оборот превышает 22 млрд долларов. И он имеет в виду не Россию, сюда ему карточки всё равно поставлять нельзя. Зато он уверенно говорит про практически весь мир, ибо countries are protecting the data of their users and companies are protecting data of employees through “sovereign AI,” where the large-language models are contained within the borders of the country or the company for safety purposes. Almost every country will do this.
А значит, каждой стране и каждой крупной компании понадобятся свои датацентры: they’re going to build the infrastructure. Of course, the infrastructure is hardware. But they don’t want to export their data using AI.
Это интересный поворот темы: появление ИИ и активизация его использования будет способствовать мощной фрагментации и моделей и датасетов; остальной интернет автоматически подтянется.

Читать полностью…

TechSparks

Непрошеный совет на длинные выходные:
В среду на Apple TV+ выложили три первые эпизода сериала Constellation (“Созвездие”). Такое впечатление, что Apple целенаправленно стремится среди стриминговых сервисов занять лидирующую позицию в области фантастики — и у них уже были неслабые заявки. Вот — очередная. Я сегодня не очень выспался, потому что все три смотрел, и теперь буду какое-то время дожидаться новые каждую среду:)) (в сезоне обещают 8 серий)
Отдельно доставляет микс МКС, Байконура и Звёздного городка с европейскими и штатовскими локациями:)
Рецензии, конечно, разные — от хвалебных до практически разгромных, вот примеры:
the show achieves a seamless blend of hard science fiction, action-based thrills, and psychological horror.
С другой стороны сокрушаются,
how little Constellation accomplishes in eight episodes, and how frustrating it can be to watch.
Лучше судить самим

Читать полностью…

TechSparks

А это просто красиво:)
Как робособачки работают в полиции или со спасателями, мы много раз видели, но вот им нашлось место и на самой сложной и большой экспериментальной установке, созданной земной наукой. Именно в силу сложности и громадности, на установках в CERN есть такие закоулки, куда никакой традиционный робот на колесиках не проберется, да и человеку с его ловкостью непросто (а подчас опасно: радиационный контроль в потенциально опасных зонах лучше вести без риска самому попасть под облучение).
И вот на супертехнологичной научной установке, где и так хватает разных сервисных роботов, появилась и робособачка, очень органично смотрится в этом окружении.

Читать полностью…

TechSparks

Технологический мир (и финансисты) ожидает чего-то феноменального от скорого очередного отчета Nvidia (для многих производимые ими GPU представляются единственной возможной аппаратной платформой для вычислений, используемых в ИИ-продуктах). Но вот, не успели еще все переварить достаточно сенсационные запуск Sora, как стали множиться сообщения о компании Groq (не путать с масковским ИИ, который оканчивается на k).
Эта компания не новичок в области создания специфического железа, но сейчас они заявили о резком ускорении ответа LLM, если для инференса использовать не привычные GPU, а их собственные LPU, Language Processing Units.
Два интересных момента:
1. Кажется, еще один шажок к тому, чтобы ИИ смог хорошо и быстро работать на обычных пользовательских устройствах
2. Эра ИИ порождает интереснейшие стартапы, бросающие вызов гигантам, не только в области софта:)

https://www.tomsguide.com/ai/forget-chatgpt-groq-is-the-new-ai-model-to-beat-with-blistering-computation-speed
(А вот сайт самой компании, там интересно! — https://wow.groq.com/why-groq/ )

Читать полностью…

TechSparks

С лендинга Sora есть ссылочка, по которой, похоже, мало кто из блогеров сходил — а зря. Там обсуждаются не просто красивые видосики, которые не устали обсуждать за три дня, а более сложные возможности и неожиданные эффекты новой модели.
Во-первых, модель не просто про генерацию видео по заданному тексту, а и про не менее впечатляющие эффекты типа переходов — весьма изобретательных, а не просто морфингом — между двумя подаными на вход видео. Впечатляют и статические фоточки (генерация видео длиной в один кадр :)), созданные новой моделью. Это не просто генератор, это еще и заготовка для очень мощного графического и видеоредактора.
Но любопытней всего примеры эмерджентности, проявления свойств, которые никак явно не закладывались в модель на этапе обучения, но явно проявляются (хотя и не слишком стабильно, что отдельно любопытно) в ходе ее работы. К ним, частности, относится сохранение когерентности происходящего на протяжении значительного времени и сохранение “памяти” об объектах, которые временно перекрываются другими в кадре.
These capabilities suggest that continued scaling of video models is a promising path towards the development of highly-capable simulators of the physical and digital world, and the objects, animals and people that live within them.
Собственно, отсюда и надежды разработчиков, что Sora отчасти является симуляцией реальности, хотя этому ее никто не учил:) И что более длительное обучение более мощных моделей подарит еще больше приятных неожиданностей.

Читать полностью…

TechSparks

В тему всеми сегодня обсуждаемой SORA: хорошая подборка комментариев в "Собаке"; я и сам там отметился. Это гораздо больше, чем про видосики, тем и жутко интересно:) Давно не случалось анонсов такого уровня
https://www.sobaka.ru/lifestyle/technology/178279

Читать полностью…

TechSparks

Да да да!
OPEN AI тизернули (так, поглядеть одним глазком) свою предстоящую Text2Video модель под названием SORA.

🤩 из хорошего:
- необыкновенное качество, модель просто бъет всех конкурентов наголову
- как будто вылеченные болячки с глазами, лицами, руками, анатомией в целом и пр.
- получилось соблюсти баланс между качеством / реалистичностью и вариативностью результатов (например, можно сгенерировать видео с плоскими странными необычными рыбами, но в духе документалок от BBC).

😒 из плохого:
- модель непонятно когда выйдет (говорят, впереди еще много тестов, чтобы избежать проблем с генерацией дипфейков и вот этого всего).
- в модели будет аж 2 фильтра цензуры.
- все видео выглядят довольно "глянцевыми" и красивыми - вопрос, не получится ли как с MidJourney, по генерациям из которой когда-то сразу угадывался единый стиль.

Пока что доступ дадут избранным артистам и видеомейкерам, парочка месяцев на тесты, допил и, видимо, ближе к середине года будет открытая beta. Ждёмс!

Читать полностью…

TechSparks

Первого марта состоится мировая премьера второй части “Дюны” Вильнёва, и по этому случаю Microsoft учинил изящную коллаборацию. У Micrjsoft Flight Simulator 2020 появилось расширение с пустынями и каньонами Арракиса. Летательный аппарат тоже соответствует: управлять придется орнитоптером.
Красиво в традиционно реалистичный симулятор вплели фантастическую планету и фантастический же воздушный корабль, для которого любовно создали свои летные характеристики и управление:)
Напрашивается слово "метавселенная" -- но я его замну:))
https://venturebeat.com/games/microsoft-flight-simulator-launches-dune-expansion-so-you-can-fly-an-ornithopter/

Читать полностью…

TechSparks

Чтобы вы не думали что под Apple Vision Pro сейчас выходят только развлекательные и интерьерные приложения

Это приложение для работы с медицинскими данными.

SurgicalAR Vision — использует Vision Pro для расширенной визуализации данных медицинских изображений и других медицинских данных. Приложение включает в себя функции просмотра изображений, работу с ними, измерения и трехмерную визуализацию.

Читать полностью…

TechSparks

Пора забывать слово Bard применительно к гугловскому ИИ. Но за любым переименованием или ребрендингом всегда стоит желание to give your product a name that creates the right vibe.
Вот пост самого Сундара Пичаи с объяснениями, что и почему.
Gemini is evolving to be more than just the models. It supports an entire ecosystem — from the products that billions of people use every day, to the APIs and platforms helping developers and businesses innovate.
Фокус заявлен на Workspace и Cloud: генеративный ИИ все больше про деловые применения, а не возбуждающие креативный класс творческие способности:)
И да, нотки Copilot чувствуются в этой истории:))
(Ну, а комментарии можно вот здесь, например, почитать)

Читать полностью…

TechSparks

Так уж сложилось, что самая дорогая рекламная минута в Штатах — это минута во время трансляции Суперкубка. Компании, покупающие такую рекламу, помимо всего прочего делают громкое публичное заявление: вот в чем наша ставка в этом году, вот что для нас главное, вот с чем мы хотим чтоб пользователь нас ассоциировал.
Microsoft не впервые покупает рекламу, и у него бывали концептуальные высказывания в ней, типа что софт очень важен для человечества. И вот он снова закупил минуту. И прорекламировал Copilot. Ставка сделана.
https://youtu.be/SaCVSUbYpVc

Читать полностью…
Подписаться на канал