techsparks | Технологии

Telegram-канал techsparks - TechSparks

46691

Аннотированные ссылки на интересные, полезные и удивительные новости хайтека. Тем, кто больше любит слушать длинное чем читать короткое — могу посоветовать свой подкаст ;) http://sebrant.chat Вопросы - @asebrant

Подписаться на канал

TechSparks

Еще один заметный игрок образовался в области умных роботов: стартап с говорящим названием Physical Intelligence поднял очередной раунд и его оценка подскочила сразу до $2,4 млрд, внеся его в список единорогов. Среди инвесторов и Безос, и OpenAI — видать заявленная стартапом миссия bringing general-purpose AI into the physical world им откликается:)
А по сути стартап полагает, что именно создание моделей, обученных на реальном физическом мире, а не только на разных его символических представлениях, это и есть дорога к AGI. Но для начала предстоит справиться с тестом Возняка, и в компании это прекрасно понимают.
https://www.cnbc.com/2024/11/04/jeff-bezos-and-openai-invest-in-robot-startup-physical-intelligence.html
Следить за ними будет интересно, да и программный текст на сайте читать любопытно: https://www.physicalintelligence.company/blog/pi0

Читать полностью…

TechSparks

Продолжаю ежемесячные колонки для Forbes Russia -- как-то незаметно их стало сильно за 30. Свежая -- про реально меня удививший кейс: почему-то мало кто рассматривает SpaceX как светоч экономики данных. И речь далеко не только про Starlink 😉
Я тут на эту тему коротенько писал в день успеха пятого тестового полета Starship — но в итоге на колонку набралось
https://www.forbes.ru/mneniya/524273-spacex-kak-vitrina-ekonomiki-dannyh-pocemu-raketa-toze-gadzet

Читать полностью…

TechSparks

Сам собой получился день постов про странные технологии в музыке.
Совершенно сюрреалистичный — хотя и документальный видос робота (пока НЕ человекоподобного) в роли солиста-виолончелиста, исполняющего пьесу в сопровождении симфонического оркестра. Вот правда дорого бы дал, чтоб узнать, что в процессе репетиций и записи думали и обсуждали эти музыканты.
https://youtu.be/J9qL-SgFOdE?si=cOKVQk4BMTa_Z581
Звучит не впечатляюще совсем (но описывая технологические несовершенства надо не забывать слово ПОКА). Зато версия эффекта зловещей долины, которую я упомянул в предыдущем посте, здесь уже совсем скалит зубы. Интересно, есть ли исследования роли визуальной составляющей при слушании музыки — не в смысле содержательного видеоряда как в видеоклипе или цветомузыки — а в случае просто созерцания исполнителей.
А поток эмоций, который это видео вызвало у журналиста, по совместительству музыканта-любителя, можно почитать по ссылке ниже:
I looked into the faces of the orchestra members sitting behind it, watching their beloved art form reduced down to a sequence of quite literally robotic motions, and felt a pang of existential dread and sympathy rolled into one.

https://www.pcgamer.com/hardware/robots-can-play-the-cello-with-an-orchestra-now-and-that-sound-you-can-hear-is-the-point-whistling-over-the-top-of-its-creators-heads/

Читать полностью…

TechSparks

Очередное интервью Альтмана любопытно не какими-то сенсациями, а как раз тем, что он не сказал ничего нового.
Да, потенциал ИИ-агентов в экономике колоссален — но к этим заявлениям уже привыкли, осталось дождаться массового появления этих самых реально работающих агентов.
Тестирование и оценивание ИИ-моделей становится все важнее и все сложнее — ну, логично 🙂
GPT-5 будет неизвестно когда, есть много что улучшать в существующем семействе моделей — кажется, временами Альтман хочет охладить нервный интерес и страхи публики.
Но вообще неожиданная смена тона и стиля.
https://www.geeky-gadgets.com/sam-altman-ama-reddit/

Читать полностью…

TechSparks

Пузомерки нужны и важны много кому. Сверхдержавам в том числе. И вот намечается очередная, дорогостоящая и зрелищная: кто первый на Землю привезет марсианский грунт. В NASA давно разработана схема такого эксперимента, но с весны этого года проект (совместный с Европейским космическим агентством) несколько буксует и предположительно может потребовать переработки. Там ценник 11 млрд долларов, и мало кто верит, что в него уложатся, прозвучала фраза «$11 billion is too expensive, and not returning samples until 2040 is unacceptably too long». Китай о своих намерениях заявлял, но как-то без деталей.
А тут выясняется, что Китай не просто собирается доставить грунт в 2031, а решил сдвинуть срок на 2028. Схему полета я прямо в этот пост включил, она потребует двух запусков с разного типа полезными нагрузками. Новые даты вызвали у американских ученых реакцию «If, as has been reported, China successfully executes even a 'grab sample' at Mars and returns it safely to Earth before the U.S., that would constitute a Sputnik moment». Интересно, как политическая мотивация повлияет на финансирование и сроки евро-американской миссии:)
https://www.space.com/the-universe/mars/will-china-return-mars-samples-to-earth-before-the-us-does

Читать полностью…

TechSparks

Уже совсем близкий ноябрь для меня приятен не только тем, что случится мой день рождения, но и куда более значимым событием: 13-го ноября в пятый (ура!) раз пройдет мой любимый и родной YAC/e. Как всегда, изменения в программу будут вноситься почти до последнего дня, но текущая версия программы уже вполне показывает контуры того, на чем сконцентрируемся в этом году.
Ключевое слово — “будущее”. Образование для будущего и будущее самого образования, в котором не только ИИ, но и work/education balance и метанавыки, без которых не обойдутся даже хардкорные айтишники. И масса более узких и предметных обсуждений.
Мы ждем вас онлайн, конечно, но если не выйдет — как всегда, записи будут доступны начиная с вечера 13, когда все закончится:)
https://yace.yandex.ru

Читать полностью…

TechSparks

Microsoft выпустил свой традиционный годовой отчет; он начинается обращением Сатьи Наделлы. Как-то я не задумывался, что компания готовится встретить свой весьма достойный круглый юбилей — полувековой.
Как еще одну веху Наделла упоминает, что второй год компания проживает AI platform shift.
Я не фанат Microsoft и давно сбежал с Windows, но тут и правда есть чем компании гордиться.
Оставаться в группе лидеров на динамичном рынке, очень вовремя и адекватно реагировать на новинки (в т.ч. и ИИ) — не у всех получается.
Надела выделяет три главных функциональности, характерных для “эры ИИ”:
1. Новый мультимодальный (как на вход, так и на выход) пользовательский интерфейс
2. Длинную память, которая аккумулирует персональный контекст, данные на всех устройствах и информацию из интернета
3. Появление у устройств способности рассуждать и планировать, что снижает когнитивную нагрузку на человека
Ну, а дальше — никаких особых откровений: копайлоты и агенты вокруг нас. Впрочем, послание к инвесторам и партнерам от лица такого гиганта и должно быть в меру консервативным, сильно новаторским прогнозам в нем не место. В любом случае, такой взгляд на технологический мир впечатляет. А для любителей конкретики в тексте по ссылке есть немало кейсов крутого влияния ИИ на бизнес в разных областях, от ритейла до образования.
https://www.microsoft.com/investor/reports/ar24/

Читать полностью…

TechSparks

А креативная публика все продолжает возмущаться, но большие дяди на этой поляне их все чаще не радуют. В сентябре Джеймс Кэмерон вошел в совет директоров Stability AI, заявив, что ИИ “will unlock new ways for artists to tell stories in ways we could have never imagined”.
А теперь тему сторителлинга подхватил Дисней, заявив устами директора, что компания "uniquely poised to integrate AI," причем не только в департаментах, ответственных за теле- и кинопроизводство, но и в своей империи парков развлечений.
Don’t fixate on its ability to be disruptive — fixate on tech’s ability to make us better and tell better stories.
Позиция самого автора статьи в MovieWeb предсказуема, но все более заметные перемены в позиции индустрии она вряд ли остановит.

https://movieweb.com/how-disney-ai-initiative-affects-film-tv/

Читать полностью…

TechSparks

Nvidia сделала презентацию своей системы для обучения роботов 🤖 Хуанг хочет и этот рынок захватить 🌚

https://youtu.be/uhLDHA9skFk?si=TnaKN33GcAaUaztG

Читать полностью…

TechSparks

Интересно мне, как дальше повернется эта история, она наверняка не последняя, но создаст прецедент. Суть вкратце: у стартапа character.ai около 20 млн пользователей. Один из них, 14-летний подросток с официально диагностированным тревожным расстройством, покончил с собой после очередного разговора со своим чат-ботом на character.ai; этот чатбот был наделен чертами Дейнерис Таргариен, но юноша считал ее своей сестрой, и при этом вел с ней сексуально окрашенные беседы (что норм для персонажа из мира «Игры престолов», вообще-то).
Родители подростка подали в суд на стартап, напрямую обвиняя его в смерти сына.
Стартап, понятно, извинился, выразил соболезнования и рассказал про увеличение жесткости модерации. Прикол состоит в том, что пользователи совершенно не оценили такую о себе заботу и взбунтовались, особенно когда модераторы от греха подальше грохнули всех чат-ботов мира «Игры престолов».
Понятно, что как ни страхуйся (показательно, что перед самой статьей по ссылке написано, что в ней затрагивается тема самоубийств, и если вас это триггерит, не читайте и обратитесь за помощью), но любое общение с психически неустойчивым человеком может спровоцировать его неадекватные действия (не только самоубийство, это может быть и убийство, например). Интересно, что решит суд и как будет мотивировано решение.

The key question remains: how to balance the potential of new AI technologies and the opportunities they provide for free expression and communication with the responsibility to protect users, especially the young and impressionable, from harm?

А я пока благодарю историю за то, что помешательство на всеобщей абсолютной безопасности и ответственности началось недавно. А то современники Гете не раз отмечали, что публикация «Страданий юного Вертера» породила волну самоубийств. Знай Гете, что сильные тексты — дело подсудное и что его могут за убийство привлечь, написал бы свой роман? Да и не только Гете…

https://venturebeat.com/ai/character-ai-clamps-down-following-teen-user-suicide-but-users-are-revolting/

Читать полностью…

TechSparks

По не совсем мне понятным причинам, полагается изучать и как-то учитывать в своей работе тренды от Гартнера, хотя, на мой взгляд, там обычно странный коктейль уже случившегося и того, что неизвестно когда наступит — и подается это с этикеткой уже следующего года.
Вот свеженькие тренды-2025.

1. ИИ-агенты — ну как бы уже вовсю тестируется и Майкрософтом и Сейлзфорсом (не говоря уж о тьме разработчиков помельче). Ну да, 2025 будет первым годом их широкого тестирования и местами внедрения.
2. Платформы управления ИИ — угу, государства вовсю над этим трудятся, что-то в 2025 начнет работать.
1. Дезинформационная безопасность — красивый термин для все той же борьбы с фейками
2. Постквантовая криптография — Гартнер пугает, что к 2029 вся текущая криптография помрет, надо срочно переходить — но неизвестно на что.
3. Окружающий незримый интеллект — красивый термин для технологий умного дома и вообще умной среды
4. Энергосберегающие вычисления — модная тема, все трудятся
5. Гибридные вычисления — в том смысле, что структура вычислительных мощностей становится сложней. Ну ладно.
6. Spatial Computing — термин взят у Apple и те сами не рассчитывают, что в 2025 будет какой-то крутой перелом.
7. Многофункциональные роботы. Ну, да.
8. Нероусилители для людей — это пока непонятно когда.
https://www.zdnet.com/article/gartners-2025-tech-trends-show-how-your-business-needs-to-adapt-and-fast/

Читать полностью…

TechSparks

IQ Media НИУ ВШЭ 🤝 Яндекс Образование: мы запускаем спецпроект и отдельную рубрику в медиа, где будем изучать искусственный интеллект в учебном процессе

Первый материал уже вышел — он объясняет, как применять нейросети при написании курсовых и дипломных работ. Внутри можно найти примеры сценариев использования ИИ и истории студентов, которые уже работали с нейросетью.

Будущие статьи посвятим не только технологиям в образовании, но и новым современным подходам в учёбе, доступных возможностям и карьерному росту. Следите за обновлениями!

Читать полностью…

TechSparks

Уже второй день ходит новость, которой я сначала не поверил: когда немного знаком со строительством и запуском датацентров, возникают какие-то грубые представления о масштабах сроков — а тут они явно были на порядок с гаком короче. Ну и Маск умеет для красного словца выдать желаемое за свершившееся.
Но, похоже, действительно Дженсен Хуанг ошеломлен, а инженеры Маска очередной раз сделали то, что опытные и косные эксперты считали невозможным. Маск говорит о запуске кластера на 100 000 GPU за 19 дней. Обычно речь в таких проектах идет на годы. Конечно, хочется уточнить, как именно фиксировались начало и конец 19-дневного периода, но даже если речь о готовом здании и отсчет шел с момента получения карточек, до первых наладочных работ -- срок меньше 3 недель выглядит фантастикой.
С другой стороны ловля бустера Super heavy захватами на башне тоже выглядела фантастикой, пока не случилась…
На всяк случай — две ссылки 🙂
https://www.tomshardware.com/pc-components/gpus/elon-musk-took-19-days-to-set-up-100-000-nvidia-h200-gpus-process-normally-takes-4-years

https://www.techspot.com/news/105149-elon-musk-xai-built-100000-gpu-supercluster-19.html

Читать полностью…

TechSparks

Адобченко показывает, как надо встраивать ИИ в продукты.

Я потом приподвзвизжу отдельным постом про AdobeMax, который идет прямо сейчас.
А сейчас поглядите, какой UI\UX должен быть у всех этих видеогенераторов.
Не сгенерить, а потом копировать, импортировать, резать, переделывать, копировать, импортировать..
А генерить прямо в пайплайне. По месту, так сказать.
Ну и многие не поняли - это генерация вместе СО ЗВУКОМ

@cgevent

Читать полностью…

TechSparks

Тема robopets, роботизированных питомцев, стара почти как ИТ: тамагочи тому подтверждением. Лидером в этой области исторически является Япония, собачка Aibo от Sony стала чуть ли не символом роботизированных домашних зверушек.
А теперь в эту нишу постучалась Casio.
выпустив мохнатое нечто, на сходство с конкретным животным не претендующее (хотя некоторые видят хомяка). Новое создание называется Moflin, это результат коллаборации со стартапом Vanguard Industries. Питомец умеет только ластиться, но ИИ-технологии позволяют ему узнавать хозяина по голосу и типу движений — и отвечать уникальными звуками и небольшими движениями: не уверен насчет хомяков, но такое поведение копирует некоторых знакомых котов. Утверждается, что ИИ поможет питомцу со временем расширять гамму демонстрируемых эмоций.
Считается, что относительно недорогой девайс (около 400 долларов разовая покупка, около 44 долларов месячная плата по подписной модели) поможет пожилым, одиноким и страдающим от психологических проблем людям. В продаже в Японии ожидается с 7 ноября.
https://www.theverge.com/2024/10/11/24268063/casio-robot-pet-moflin

Читать полностью…

TechSparks

Мустафа Сулейман, CEO Microsoft AI, записал очередное любопытное интервью. В нем не только очередной раз напомнил свою метафору про ИИ как новых существ, но и вообще очень восторженно отозвался о текущем моменте, просто чувствуется, как человека прет.
Напомнил, что лет пятьдесят назад информационные технологии начали трансформировать мир, и что сейчас — похожий момент.
Момент, чтобы основывать компании или их масштабировать, момент, когда хорошо разворачивать карьеры всем, не только предпринимателям, но и менеджерам, ученым и активистам.
…this is a moment where we really do have a chance collectively to shape and influence things and nothing is predetermined…
Вот этот фрагмент “ничто еще не предопределено” хорош. Как сегодня заметили коллеги в одной рабочей дискуссии, многие любят разговаривать про развитие уверенности, но никто не говорит про развитие и важность смелости. https://youtu.be/IZBT57oLKas?si=gDkMMp6QX_dNA7UV

Читать полностью…

TechSparks

Я недавно встретил эту ссылку в LinkedIn Вани Ямщикова, который там себя описывает словами radical techno-optimist. Давно пора снова с ним подкаст записать, но пока этого не случилось, повторю здесь его ссылку на публикацию в Nature аж от февраля.
Статья посвящена теме, на которую уже здесь ворчал: участившимся странным и малограмотным нападкам на энергопотребление и углеродный след ИИ-продуктов.
Здесь авторы с той же дотошностью и стремлением записать в углеродный след всё в цепочке событий, приводящей к вычислениям, подошли к оценке событий, приводящей к написанию текста/созданию рисунка человеком.
Поизучать интересно, придраться есть к чему — как и во всех “углеродных” расчетах, но любопытен немодный нынче вывод:
Our findings reveal that AI systems emit between 130 and 1500 times less CO2e per page of text generated compared to human writers, while AI illustration systems emit between 310 and 2900 times less CO2e per image than their human counterparts.
Ну, то есть очередной раз подтвердили старую проблему: если последовательно и логично развивать идею сокращения выбросов, то ничего лучше уничтожения человечества придумать нельзя: такой подход решит и проблемы того, что мы сами выделяем парниковые газы и того, что ради своей комфортной жизни много еще источников этих газов насоздавали.
Читать в любом случае увлекательно, а спорить и не соглашаться — в науке дело нормальное
https://www.nature.com/articles/s41598-024-54271-x

Читать полностью…

TechSparks

Когда-то меня учили правилу «экспериментатор должен быть в меру ленив» — и касалось оно в первую очередь того, что полезно уметь вовремя остановиться.
Теперь я иногда думаю, что стартапер тоже иногда должен быть в меру ленив. Вот нам предлагают гитару без струн, зато с генеративным ИИ внутри. Результат напоминает совсем дешевые фильмы: герой невесть что делает левой рукой на грифе, а правой не попадает по струнам, но звук почему-то четок и красив.
С другой стороны: an all-in-one instrument that removes the hurdles of traditional instruments, putting a world of sound in your hands, ready to play anytime inspiration strikes — нормально же звучит?
Прислушался к своей реакции на просмотр ролика в начале статьи: кажется, я не против слушать исполнение на этой «гитаре», но совсем не хочу видеть картинку. Любопытная вариация эффекта зловещей долины, сам от себя не ожидал:)
https://www.yankodesign.com/2024/11/03/stringless-sampler-guitar-with-a-built-in-speaker-and-ai-music-app-turns-you-into-a-one-man-band/

Читать полностью…

TechSparks

Всё вокруг того, чтоб придать ИИ телесность, в особенности человекоподобную, меня сейчас интересует сильно больше, чем пузомерки разных арен. Маск на эту тему, конечно, дает поводы себя процитировать, но сдерживаюсь, учитывая, как его несет.
Официальные высказывания запрещенной Меты в этом смысле интересней, ну, или хотя бы реалистичней. Там явно разделяют уверенность Хуанга в том, что artificial general robotics интересней artificial general intelligence. И подтверждает, что AI companies are gradually expanding their race from the digital realm to the physical world.
Опубликованные исследования касаются тактильной чувствительности, ловкости роботов и взаимодействия людей с роботами. Детали почитаю на неделе, а пока мне нравится явное утверждение, что цель в том, чтобы to drive advancements in human-robot interaction and collaborative intelligence, transforming Al models from “agents” to “partners.” Уже не виртуальных:)
https://ai.meta.com/blog/fair-robotics-open-source/

Читать полностью…

TechSparks

Пару дней назад сообщество людей, мониторящих новинки на всяких аренах для сравнения генеративных моделей, встрепенулось: вроде бы ниоткуда возникла некая модель генеративной графики Red Panda, которая не то, чтоб побила всех ветеранов, но выступила на уровне Midjourney, старой и заслуженной по нынешним меркам.
Я б не стал писать про это событие, если б сегодня не выяснилось, что за запуском стоит стартап Анны Вероники Дорогуш. Аня совершенно чудесная, много лет работала в поиске Яндекса, ее задора при этом еще хватало и на всякие прикольные выступления на наших конференциях.
Вообще, когда вспоминаешь Мишу Парахина, Сашу Ларьяновского, еще многих — а теперь и Аню — начинаешь думать, что сформировалась-таки глобальная мафия Яндекса; выпускники наши в разных странах и в разных тематиках начинают сиять :)
https://petapixel.com/2024/10/31/mysterious-ai-image-generator-more-powerful-than-midjourney-breaks-cover/

Читать полностью…

TechSparks

Как-то слегка неловко писать про новые злоключения Боинга: то заглушка двери у самолета отвалится, то клапана на космической капсуле закапризничают настолько, что ее пришлось возвращать на Землю без астронавтов, то с профсоюзами не получается договориться об окончании многонедельной забастовки.
Поэтому вначале я не очень обратил внимание, что 10 дней назад перестал работать один из спутников связи Интелсат, изготовленный все тем же Боингом.
Но подробности чем дальше, тем страньше. Спутник на геостационарной орбите в прямом смысле слова взорвался: уже удалось идентифицировать более 500 фрагментов размерами от большого мяча до двери автомобиля. Мелких недоступных обнаружению с Земли, надо полагать, намного больше.
Рано говорить, создают ли они опасность столкновения с другими спутниками. Но сам по себе самопроизвольный взрыв уже работающего спутника — явление неприятное и загадочное. Увы, шансов детально установить, что же именно случилось, очень мало.
https://futurism.com/the-byte/boeing-satellite-500-pieces-debris

Читать полностью…

TechSparks

Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP 

Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более глубокой истории. Закат ABBYY — это фиксация проигрыша последней битвы лингвистов за автоматическую обработку языка. Мир Data Science победил. Главный редактор «Системного Блока» Даниил Скоринкин, работавший ABBYY в 2013–2017, подводит итоги и пытается сформулировать уроки из этой истории.

Что за ABBYY и при чем тут лингвисты и NLP?

История ABBYY началась в 1989 году, когда студент МФТИ Давид Ян решил сделать электронный словарь для подготовки к экзамену. Так появились Lingvo, а затем — система распознавания символов FineReader. Продукты ABBYY развивались, и компания стала глобальным лидером оптического распознавания в 1990-е и 2000-е. Затем ABBYY двинулась покорять машинный перевод. 

На вооружение они взяли идеи известных лингвистов — в первую очередь Модели «Смысл ⇔ Текст» (прочитать о ней можно в нашем интервью с И. А. Мельчуком). Амбиция была в том, чтобы разобрать человеческие языки как формальные структуры на базе семантической иерархии. Но естественный язык устроен противоречиво и постоянно изменяется, подход оказался негибким и немасштабируемым

Что пошло не так?

В 2006-м появилась первая версия Google Translate. Она была несовершенной, но главное, что в ней был другой — статистический — подход. И масштабируемость. Для её улучшения не нужны были сотни лингвистов, только еще больше примеров перевода. В 2010-х стало ясно, что никаких шансов тягаться с Google Translate у ABBYY не было. С перевода ABBYY переключилась на задачи информационного поиска и извлечения информации из текста, но и там столкнулась с теми же проблемами: описания языка на базе лингвистической теории оказались немасштабируемыми, а решения уступали подходам на основе чистого машинного обучения. 

C новой проблемой компания столкнулась весной 2022 – им пришлось выехать из России, чтобы сохранить зарубежных клиентов. Следующим ударом стали большие языковые модели, который научились выполнять те же задачи, что и классические системы распознавания от ABBYY. Сейчас от компании осталась только вывеска, действующие продукты и небольшое количество менеджеров и специалистов по продажам.

Какие уроки мы извлекаем?


За 70 лет исследований ИИ стало ясно, что самые общие методы, опирающиеся на масштабирование вычислений, намного эффективнее всех остальных. А желание ABBYY сделать универсальную NLP-систему с опорой на лингвистическую теорию оказалось утопией. 

И всё-таки ABBYY успела сделать много важного: открывала кафедры на Физтехе и в РГГУ, оцифровывала наследия Льва Толстого и архива Большого театра. А еще благодаря ей появился «Системный Блокъ», ведь сооснователи издания познакомились именно там. И именно там вы сможете прочитать полную версию поста с мемами, фотографиями и более детальным описанием цифровой «Вавилонской башни», которую пыталась строить ABBYY.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

TechSparks

В продолжение темы. С огромным интересом слежу за тем, что Nvidia и Китай делают в области человекоподобных роботов. Есть, конечно, шумный Маск со своими Оптимусами, но пока там все негромко (кроме самого Маска, конечно). А вот вполне вызывающие игры Хуанга со словами “Building foundation models for general humanoid robots is one of the most
exciting problems to solve in AI today. The enabling technologies are coming together for leading roboticists around the world to take giant leaps towards artificial general robotics,”
— настойчиво напоминают, что не AGI единым;)
А Китай, как известно, собрался запускать массовое производство таких роботов аж в 2025, и это не опечатка.
И вот свеженькое: “…like electric cars, AI-powered humanoid robots will soon become affordable enough to reside in everyday homes and workplaces” — слова VP of Omniverse and Simulation Technology из Nvidia.
“I believe that they’re going to become so common, they’ll be like our cell phones,” — смелый, но увлекательный прогноз, похлеще обещаний стартаперов, потеющих над очередной носимой ИИ-штучкой:)
https://www.techradar.com/pro/ai-powered-humanoid-robots-are-closer-than-we-think-says-nvidia-exec

Читать полностью…

TechSparks

Немного унылый - и как раз поэтому впечатляющий своей будничностью кейс использования разных генеративных инструментов в пайплайне подготовки традиционной рекламной кампании. На фестивальную рекламу результат и близко не тянет, зато:
1. весь процесс создания рекламной кампании от придумывания концепции до получения готовых к размещению материалов занял 4 недели. Поскольку не стояла задача использовть ИИ там, где люди еще лучше справляются, первые три недели в основном трудились люди, а доставшаяся ИИ работа была выполнена за неделю безо всякой спешки (в традиционной версии с белковыми креаторами аналогичные компании занимали 3-4 месяца).
2. Расходы составили примерно на миллион долларов меньше, чем если б то, что делала связка Sora, Runway, Midjourney, Topaz Labs и Adobe’s Photoshop и Premiere делалось без ИИ-инструментария опытными людьми. Не то, чтоб кто-то кого-то заменил, но расходы на ФОТ сократили изрядно.
Самое важное в этом кейсе в том, что не стояла задача поразить инновационностью, внедрить ИИ ради внедрения или реализовать прежде нереализуемое. Нет, нужно было сделать обычную работу максимально эффективно с точки зрения стоимости и длительности.
И вполне норм получилось.

https://www.marketingdive.com/news/atera-video-ad-campaign-entirely-gen-ai/730469/

Читать полностью…

TechSparks

Кай-Фу Ли объявил войну Nvidia и всей ИИ-экосистеме США.
И судя по его последним достижениям, шансы победить есть.

Потрясающе интересное выступление китайского ИИ гуру Кай-Фу Ли будут теперь долго обсуждать. Это абсолютно революционное выступление, прозвучавшее на закрытой дискуссии Collective[i] Forecast, Ли посвятил трем темам.
1. ИИ-экосистема США (основа мировой ИИ-экосистемы) «невероятно больна». Её необходимо кардинально перестроить, иначе на реальном (практическом) прогрессе ИИ можно ставить крест.
Сегодня ИИ-экосистема состоит из Nvidia и мелких производителей ИИ чипов. При этом производители чипов для ИИ зарабатывают сейчас в год $75 млрд, а вендоры ИИ-инфраструктуры – лишь $10 млрд и вендоры ИИ-приложений — лишь $5 млрд».
«Если мы продолжим работать в этой перевернутой пирамиде, это станет проблемой» — сказал Ли. Т.к. это беспрецедентный переворот в экономике классической технологической отрасли. Традиционно производители приложений получают больше, чем поставщики чипов и систем (напр. Salesforce, внедряя CRM, получает куда больше, чем Dell и Intel, производящие компьютеры и чипы для запуска CRM в облаке)
Оздоровить ИИ-экосистему может лишь создание ИИ-компаниями собственных вертикальных интегрированных технологических стеков, как это сделала Apple с iPhone. Только так станет возможным значительно снизить стоимость генеративного ИИ.
2. Главным направление в разработке моделей должно стать снижение стоимости вывода – это самое важное для создания востребованных бизнесом приложений с ИИ.
Сегодняшняя стандартная стоимость сервиса типа GPT-4 составляет $4,40 за млн токенов. Это эквивалентно 57 центам за запрос —и это непростительно дорого, ибо поисковый запрос в Google (без всякого ИИ) обойдется в 180 раз дешевле.
3. Вторым важнейшим направлением в разработке моделей должен стать переход от универсальных базовых моделей к «экспертным моделям».
Бизнесу нужны не универсальные модели, обученные на океанах неразмеченных данных, собранных из Интернета и других источников. Подход «экспертных моделей» подразумевает создание множества нейронок, обученных на отраслевых данных. Это может обеспечить достижение того же уровня «интеллекта», что и универсальная базовая модель, при использовании гораздо меньшей вычислительной мощности.

Самое потрясающее, что все 3 пункта – это не предложения, основанные на предположениях. Стартап Кай-Фу Ли «01.ai» уже делает все это на практике.
И не просто делает, а уже добивается уникальных результатов.

• Их новая модель Yi-Lightning занимает 6-е место в мире (выше выпущенной 5 мес назад GPT-4o). Но при этом это очень маленькая модель, которая чрезвычайно быстра и недорога (всего $0,14 за млн токенов ). Её производительность сопоставима с Grok-2. Но она обучалась всего на 2000 H100 в течение 1 месяца. Что демонстрирует ненужность 100 тыс H100 и ярдов затрат (обучение Yi-Lightning стоило всего $3 млн).
• 01.ai применяет «экспертный» подход к сбору данных. И хотя «инженерам приходится проводить массу неблагодарной черновой работы» по маркировке и ранжированию данных, но – как считает Ли, - Китай с его резервом дешевых инженерных кадров может сделать это лучше, чем США.
• И даже в создании собственного вертикального интегрированного техно-стека есть прогресс. Напр, за счет использования собственных аппаратных инноваций, стоимость одного запроса к ИИ-поисковику BeaGo составляет всего около 1 цента (что приблизилось к стоимости запроса Google без всякого ИИ)

И еще 3 цитаты Ли:

Сила Китая не в том, чтобы делать лучшие прорывные исследования, которые никто не делал раньше, с бюджетом без ограничений. Сила Китая в том, чтобы построить хорошо, быстро, надежно и при этом дешево.

Для предприятий новое поколение ИИ станет их мозгом, а не периферийными приблудами. Для нефтяных компании ИИ будет добывать нефть. Для финансовых — зарабатывать на деньгах.

Для потребителей сегодняшняя модель смартфона, скорее всего, исчезнет.


А ведь еще 1.5 года назад Ли предупреждал - Китай не станет догонять США в ИИ, а сразу пойдет на обгон.

#ИИгонка #Китай

Читать полностью…

TechSparks

Когда Цукерберг представил новейшие AR-очечки Orion, было много ахов и охов и по поводу возможностей девайса, и по поводу цены. Тогда я не успел посмотреть, что именно делает заветный девайс столь дорогим (стоимость собственно производства 10К долларов) и не готовым к серийному выпуску.
А сейчас наткнулся на толковую статью на тему.
Комплект состоит из трех частей: собственно очки весом около 100 г, вычислительный блок с аккумулятором и браслет для электромиографии. Две последние вещицы хотя и содержат современную топовую электронику (а очки еще и магниевую рамку), на 10 тыс долларов все-таки не тянут.
А вот оптика в очках оказалась интересней. Линзы в них сделаны из карбида кремния, материала в принципе давно известного, не в таком виде (чаще -- в виде абразивного порошка). Карбид кремния — интересное вещество, которое можно сравнивать с алмазом и по показателю преломления (2,65-2,69 против 2,42), и по твердости (9-9,5 по Моосу против 10). Поцарапать очки из него будет непросто:) За это его очень любят ювелиры (под именем муассанит). Применений у него миллион, но ни в одном раньше не требовалось создавать достаточно большие, несколько сантиметров в поперечнике, пластины оптического качества.
И вот эти-то “стеклышки” оказываются дороже изощреннейшей компактной электроники, именно они дают основной вклад в неприятную цену.
Интересно, что будет дальше: разработано и налажено производство оптического карбида кремния с низкой ценой или найдут материал подешевле, но с похожими свойствами.

https://spectrum.ieee.org/meta-ar-glasses-expense

Читать полностью…

TechSparks

Как-то скучно завершилась многолетняя и многомиллиардная эпопея HoloLens. Я периодически тут ссылался на очередные новости, в основном про контракт с военными, по которому за 10 лет Microsoft должна была получить больше 20 млрд долл — если б все шло гладко.
Вообще история тянется больше 10 лет, первый образец устройства показали публике аж в 2015 и тогда это было вау: наложение информационного слоя на реальность вокруг. Памятуя проблемы Google Glass, Microsoft сразу заявила, что это не потребительский, а бизнесовый девайс. Но и здесь не пошло, и к 2022 компания объявила, что третьего поколения не будет. За годы, прошедшие со старта продаж, удалось продать 40 - 60 тыс устройств, т.е. заработать в лучшем случае 200 с чем-то миллионов на потраченные миллиарды. Начались разброд, шатания и увольнения, и начала сыпаться даже военная часть проекта, поскольку многие тестировщики из военных были не в восторге от устройства и опасались его применять в боевой обстановке — хотя фотки были очень стильные. И теперь, когда вся ставка на ИИ, и на это брошены все ресурсы, судьба очков стала очевидна, а военный проект будет, скорее всего, передан группе компаний (одну из которых Microsoft недавно купила).
Теперь интересно, во что выльются тоже миллиарды, потраченные еще двумя гигантами: Мета и Эппл
https://africa.businessinsider.com/news/microsoft-lost-billions-of-dollars-on-hololens-and-its-huge-ivas-military-contract-is/symf9vy

Читать полностью…

TechSparks

ну, и продолжение темы Adobe.
Когда-то они задали стандарты профессионального ретуширования, теперь достойно стараются сформировать стандарты профессионального применения генеративной графики в рабочих пайпланйах. (Напомню, они с самого начала заявили, что тренируют модели на чистых датасетах и готовы брать ответственность, если кто начнет возмущаться, что у него украли)
Вот теперь Adobe GenStudio for Performance Marketing обеспечивает подготовку в массовом порядке кастомизированных маркетинговых материалов, причем в соответствии с брендовыми гайдлайнами. При правильной интеграции в процессы оптимизации перформанс-маркетинга, особенно для компаний с длинной продуктовой линейкой и работающих на разных рынках, офигенные результаты может дать.
Отличная иллюстрация про маркетинг будущего, про который меня иногда спрашивают:)

https://www.forbes.com/sites/marksparrow/2024/10/14/adobes-genstudio-for-performance-marketing-will-change-how-ads-are-made/

Читать полностью…

TechSparks

Вообще, уместное встраивание ИИ в сложный пайплайн разного серьезного софта (поиск или видеоредактор лишь два успешных примера) -- набирающий силу тренд: на коленке это не делается, времени жрет много, но многие начали еще в прошлом году и доработали до продакшена, и еще следующий год будут радовать в разных местах такими интеграциями. По мне такое преображение традиционного софта часто полезней и удивительней, чем наспех с нуля слепленные чисто ИИшные новинки

Читать полностью…

TechSparks

Ну а теперь Старшип приводнился, как и было задумано, где-то в Индийском океане.
И пока я смотрел красивую и устойчивую картинку с корабля на протяжении всего полета, я думал о том, какое количество бесценной телеметрии получает команда разработки в процессе, и насколько мощно работает Starlink, обеспечивая прием и трансляцию на Землю всего этого потока видео и ценнейших данных с датчиков, которыми напичкан корабль. И какое это конкурентное преимущество и одновременно подспорье в дальнейшей разработке кораблей.
Супер поздравления и уважение всей команде SpaceX! Сегодня у них великий день.

Читать полностью…
Подписаться на канал