Гуглу сегодня 25 — в красивую деньрожденную дату просто хочется поздравить всех причастных, без оценок, оговорок и сложных рассуждений. Очень интересная была четверть века для всех нас — а в посте по ссылке 25 любопытных цифр в тему: https://blog.google/inside-google/company-announcements/google-fun-facts-25th-birthday/
Читать полностью…Очень по делу текст Саши Крайнова о промпт-инжиниринге, про который уже странные мифы успел образоваться;)
«То есть в целом мы, люди, довольно давно занимаемся промпт-инжинирингом, просто раньше мы его так не называли. И раньше мы промпт-инжинирили естественный интеллект, а теперь — искусственный.»
https://techno.yandex.ru/prompts-interview
Китайцы что-то невероятное делают.
В Китае очень популярны стримы с продажами ("магазин на диване" в соцсетях), поэтому сразу нескольким компаниям пришло в голову разработать ИИ-замену реальным ведущим.
Я, конечно, не говорю по китайски, но это выглядит чертовски правдоподобно.
Особенно те видео, в которых ведущие взаимодействуют с товаром.
Обычно аватары сильно ограничены в мимике и позах, и руки держат сложенными на пузе, а тут такое разнообразие.
Не все из них, правда, так умеют.
Компания Xiaoice делает базовых стримеров за тыщу долларов, которые как раз более стандартизированы - ими пользуются небогатые бренды, обычно для замены живых людей в ночные часы (торговля на стримах идёт 24/7, удивительно популярный канал продаж в Азии).
А те, что подороже, могут не только показывать товар, но и реагировать на ключевые слова в чате.
Ведутся ли зрители?
О, ещё как.
Предсказуемо, спрос на кожаных в этой сфере начал падать.
Звёзд пока не заменить, но середнячков - вполне.
Один ИИ-аватар уже способен выкинуть на улицу 5-6 посредственных стримеров, как пишет MIT.
Сатья Наделла из Майкрософт затеял странную, если присмотреться, игру в метафоры:) Припомнив знаменитое сравнение Стива Джобса «компьютер — это велосипед для ума», он отметил, что сейчас компьютеры благодаря ИИ стали уже не столько велосипедами, сколько паровыми двигателями. И что трансформативная мощь двигателя в том, что он не просто усилитель человеческих возможностей, он располагает своей несравнимо большей мощностью. Just as the steam engine revolutionized transportation and industry during the Industrial Revolution, generative A.I. has the capacity to revolutionize how we work, communicate, and live in the digital age.
Это всё, наверное, правильно. Но поскольку история двигателей нам известна, интересно было бы понять, что в представлении Наделлы соответствует двигателю внутреннего сгорания и электромоторам :)
https://www.inc.com/nick-hobson/microsofts-satya-nadella-challenges-a-key-concept-from-steve-jobs.html
Эту штуку я пропустил, про нее в новостях не пишут. Ребята из запрещенной Meta разработали метод оцифровки (распознавания) текстов, содержащих большое количество сложных формул. При этом, в отличие от иных, не ML-based, систем, количество ошибок очень мало, так что ручная корректура почти не требуется.
Это само по себе приятно — возможность оцифровать массу учебников и научных журналов, выпущенных еще во времена, когда не было цифровых изданий. Но в современном контексте интересней возможность использовать огромный массив ранее отсутствующей в цифровом виде информации для обучения специализированных моделей, помощников в научной работе.
https://facebookresearch.github.io/nougat/
OpenAI выкатили следующую версию своего генератора картинок, DALL·E 3. Помимо того, что качество явно лучше чем у предыдущей версии, становится ясно, как будет развиваться мультимодальность в следующих (да и в текущей) версиях ChatGPT: DALL·E 3 is built natively on ChatGPT, which lets you use ChatGPT as a brainstorming partner and refiner of your prompts.
Замечу, что brainstorming partner — это уже чуть побольше, чем copilot 😉 Так что создание достаточно сложных и сюжетных изображений уже через месяц станет интересным творческим занятием для пользователей ChatGPT Plus. Интересно будет посмотреть, будут ли результаты сравнимы или лучше, чем получаемые с помощью сложных и изощренных промптов Midjourney, которые уже местами совсем не напоминают запрос на естественном языке:)
https://openai.com/dall-e-3
Как и ожидалось, достижения ИИ-технологий все активней внедряются в робототехнику: благодаря им удастся перейти от уже распространенных узкоспециализированный роботов к роботам общего назначения, способным учиться и выполнять задания, сформулированные на обычном языке и не в жестко контролируемом окружении. Иными словами, роботы need a way of quickly upskilling themselves, based on human instructions or demonstrations, то есть задача переобучения роботов становится очень похожа на обучение белкового персонала. И здесь вместо уже привычных LLM возникают LBM — Large Behavior Models, задача которых to watch how a human does a given physical task in the real world, and then essentially program itself to perform that task in a flexible manner.
Полгода назад в разных местах говорил, что надо ожидать большого прогресса не только в мультимодальности (он вполне сейчас наблюдаем), но и в том что называется embodiment — LBM как раз про это.
https://newatlas.com/robotics/toyota-large-behavior-model-robot-training/
Короткий и внятный текст на русском для тех, кто уже устал слышать слово “промпт” но так сам и не попробовал или не понимает , что это такое:)
https://techno.yandex.ru/prompts-today
Иногда у технического прогресса обнаруживаются неожиданные союзники. Вот сейчас, например, бастуют объединенные в профсоюзы работники американского автопрома. Выдвигают они массу нехилых требований: тут и 40% увеличение почасовой оплаты, и переход на четырехдневную рабочую неделю, и прочие плюшки.
У этой забастовки — независимо от ее исхода — есть неожиданный бенефициар: Тесла. Hyper-automated and non-unionized competitors like Tesla can now completely run away with the car market because they will be able to aggressively lower prices.
Интересно, возникнут ли по следам уже пятимесячной забастовки актеров и сценаристов студии, которые творчески применят подход Маска:) Дело долгое, но может оказаться выгодным.
https://www.benzinga.com/analyst-ratings/analyst-color/23/09/34660300/elon-musk-takes-a-swipe-at-uaw-strike-is-anyone-gonna-be-around-to-make-the-actual-
TikTok начинает большой эксперимент, который обещает ответить на давний вопрос: являются ли супераппы и Social Commerce специфичными для азиатских рынков (Китая в первую очередь) или и в США получится откусить заметный кусок рынка у традиционной электронной торговли, представленной гигантами типа Amazon и Walmart.
TikTok Shop встроен в разные элементы сервиса и поддерживает много сценариев — тут и очень популярные в Азии продажи в реальном времени и в видеостриме, и более привычные американцам асинхронные продажи продуктов в профиле бренда или в отдельном маркетплейсе Shop Tab.
Интересно, дойдет ли дело до массовых распродаж типа Amazon Prime Day, и сможет ли в рамках этих больших мероприятий новичок конкурировать с лидерами электронной коммерции. А если сможет — то когда:)
https://www.lindseygamble.com/blog/tiktok-shop-arrives-in-the-us
Adobe уверенно продолжает внедрять свой ИИ-движок FireFly в свои продукты. В посте у себя в блоге компания отмечает: AI innovation is most powerful in the hands of creators, deeply integrated into the applications they use every day to bring their ideas to life. We are blown away by the amazing content that the creative community produced during the betas… — и вот пришла пора вывести продукты из беты (и цены поднять, конечно;))
И нам обещают, что это только начало:
This is just the beginning of how generative AI can co-pilot your creative workflows, and we will continue to bring Firefly-powered features into Creative Cloud for photography, design, video, 3D and more. А насчет чистоты в области авторских прав компания спокойна — в обучении использовались только те произведения, на которые у компании есть права, так что тут наехать на Adobe как на стартап (как нынче модно) вряд ли получится.
https://blog.adobe.com/en/publish/2023/09/13/ai-creative-cloud-release-pricing-update
Недавно вышла переводная вполне свежая книга Кенига Гаспара «Конец индивидуума». Я, мягко выражаясь, не любитель читать тексты философов на темы цифровых технологий вообще и ИИ в особенности. Однако здесь у автора был интересный и вполне эмпирический метод: поговорить с многими десятками специалистов, в том числе практиков разработки ИИ-продуктов, и проанализировать разноголосицу их мнений. Выводы философа предсказуемы: ИИ просто инструмент, хотя и опасный, надо срочно зарегулировать; Европа умеет регулировать и спасет мир. Но читать и думать над прочитанным реально интересно; ведь соглашаться с автором совершенно не обязательно — а вот собеседники у него в большинстве совсем были очень крутые. Чтение долгое, но очень рекомендую;) По ссылке — рецензия, которую написал для российского Форбса.
https://www.forbes.ru/tekhnologii/495903-robot-ne-zasluzivaet-vezlivosti-iskusstvennyj-intellekt-glazami-filosofa
Пока фотографы обсуждают, можно ли использовать ИИ в конкурсных фотографиях и вообще относится ли генерация фотореалистичных изображений к фотографии, Adobe делом доказывает тезис, вынесенный в заголовок свежего релиза Photoshop’а, и вот почему: Generative Expand and Generative Fill will be particularly helpful for those needing to turn one image into multiple formats and for creators who didn’t manage to capture everything they wanted in-shot. Так что уже не беда, если не удалось поймать нужное в кадр:)
https://www.creativebloq.com/reviews/adobe-photoshop-25
Хорошая статья про Сэма Альтмана и OpenAI — как относительно небольшая и далеко не самая дорогая компания старается изменить взгляд заметной части человечества на будущее мира. Журналист, много пообщавшийся с сотрудниками OpenAI, старается аккуратно подбирать слова, но его опасения отчетливо читаются.
They assume that AI’s trajectory will surpass whatever peak biology can attain… It’s not fair to call OpenAI a cult, but…
Журналисту явно не нравится, что руководство компании предполагает, что все сотрудники верят в достижение AGI — а иначе зачем им в OpenAI работать?
Траектория вроде уже классическая для лидера в индустрии: программировать с детства, любить фантастику, поступить в Стенфорд, но бросить учебу ради своего стартапа… а читать все равно интересно. Чего и вам желаю :)
https://www.wired.com/story/what-openai-really-wants/
В среду ожидается большое выступление Цукерберга на Meta Connect; как нынче принято, в сети уже заранее обсуждают, что он там скажет :) Мнения, понятно, сильно разные: Цукерберг, мягко говоря, не является всеобщим любимцем. Но даже меня удивил тон не какого-то диванного эксперта, а комментария BBC, где ему припоминают его ставку на метавселенную и ожидают, что ему снова придется explain his reasoning for taking an extremely profitable social media company and diverting its focus to an extremely unprofitable VR venture.
Главная претензия — VR как была, так и остается маргинальной. В мире есть десятки миллионов людей, которые ей увлечены и в нее верят, но в 2023 все знают, как выглядит новый продукт, который покоряет сотни миллионов людей — и это совсем не метавселенная. Поэтому Цукерьбергу придется как-то убедить уже начинающих злиться акционеров и скептичную прессу — посмотрим, чем.
https://www.bbc.com/news/technology-66913551
В продолжение предыдущего репоста из “Метаверсошной”: не только в Китае. В Южной Корее синтетические инфлюенсеры, они же AI hunans (дипфейковое личико + несколько актеров с одинаковыми фигурами) не просто стали популярны, но и помогают заказчикам (в основном, крупным корпорациям) зарабатывать большие деньги на куче офлайновых продаж всего, начиная от еды и кончая брендовыми аксессуарами. Прогнозы радужные: the global market for such life-like creations could reach $527 billion by 2030. Впрочем, радужность не для всех, конечно, поскольку Virtual humans are basically capable of carrying out much of what real people do — в смысле, что люди делают в кадре, чтобы продать товар. Интересен набор ролей: virtual idols, virtual influencers, and virtual sales agents — все они востребованы на корейском рынке. Интересно, приживется ли на других.
https://www.barrons.com/news/from-k-pop-to-sales-girls-ai-goes-mainstream-in-south-korea-c17b0710
Посмотрел первые две серии “Кибердеревни” на Кинопоиске. Оно реально очень неплохо сделано! Интересно, хватит ли сценаристов на неожиданные повороты, но по крайней мере стилистика и картинка позволяют рекомендовать к просмотру на выходных:)
Читать полностью…Пользователи Microsoft дождались обещанного еще в начале года, когда компания рассказывала про планов громадьё в области интеграции ИИ в Windows. Copilot начнет появляться в течение осени, со следующим апдейтом, It will be a simple and seamless experience, available in Windows 11, Microsoft 365, and in our web browser with Edge and Bing.
Нормальный и удивительно быстрый для майкрософтовского масштаба результат, случившийся меньше чем за год после появления того самого ChatGPT, который весь год обсуждают. И теперь уже можно говорить о реальном массовом внедрении новых продуктов на основе генеративных языковых и не только моделей. Следующий год вряд ли будет медленнее:))
https://blogs.microsoft.com/blog/2023/09/21/announcing-microsoft-copilot-your-everyday-ai-companion/
Вот и Амазон подтянулся со своим апгрейдом Алексы с помощью собственной языковой модели. Теперь Алексе можно сказать “Alexa, let’s chat” и колонка перейдет в режим чат-бота. Утверждается, что Алекса умеет менять тональность и эмоциональность голоса в зависимости от контекста разговора.
Амазон называет свою модель speech-to-speech и утверждает, что она работает без традиционных преобразований речи в текст, потом работы LLM, а потом обратного преобразования теста в речь: this new model will unify these tasks, creating a much richer conversational experience.
Приятно, что Алекса получила сильное обновление, а то про нее было много пессимистических прогнозов.
https://www.engadget.com/everything-amazon-announced-at-its-2023-devices-and-services-event-194621706.html
Neuralink наконец-то начал набор парализованных добровольцев для тестов своего нейроинтерфейса на людях. Задача — дать возможность полностью обездвиженным больным управлять движением курсора и таким образом коммуницировать с внешним миром. Сколько добровольцев разрешено набрать, не сообщается.
Вспоминается, что когда-то Маск заявлял о готовности вживить интерфейс себе, когда будет разрешено вживлять его людям. Интересно, как теперь дело повернется:)
https://www.reuters.com/technology/musks-neuralink-start-human-trials-brain-implant-2023-09-19/
Еще одна поучительная — хоть и не такая скандальная, как с Theranos — история медицинского стартапа, который стал не просто единорогом, но и на многомиллиардное IPO вышел, но закончил банкротством. Сложно совмещать аккуратную консервативность и зарегулированность медицинской области со стартаперскими скоростями, амбициями и требованиями роста любой ценой.
А в данном случае еще и звоночек для сверхмодных сейчас ИИ-стартапов: машинное обучение несколько сложнее, чем экспертные системы, таблички и деревья:) Желание показать хоть как-то работающий прототип в надежде, что потом когда-нибудь и как-нибудь получится дообучить до добра не доводит.
https://www.wired.com/story/babylon-health-warning-ai-unicorns/
Очередное интервью Сэма Альтмана для тех, кто больше любит слушать, чем читать:)
Очень хорошо видно, насколько он хорошо натренировался в ходе многочисленных выступлений внятно и уверенно излагать свою позицию и свое видение будущего, в котором люди таки создали AGI и с удовольствием с ним сосуществуют. Всегда приятно слушать человека, который не сторонний или диванный эксперт, а сам весьма успешно будущее создает.
Точная траектория развития технологий непредсказуема и тем интересна. Важно, чтобы они это развитие способствовало укреплению человеческих ценностей, а человечество от него выигрывало. Но выигрыш — это не сохранение текущего состояния и его улучшения, это создание нового: изменения самого представления о том, что такое работа, например.
Не хочу пересказывать, это полезно слушать целиком в оригинале.
https://www.youtube.com/watch?v=O77UyYK51s4
Тут одни из участников большой тройки консалтинга (BCG) протестировали GPT4 в работе (под контролем исследователей из MIT и Harvard University Business School) и теперь у нас есть числа, научные, насколько помогает ChatGPT с GPT4 в работе:
➡️ +43% к эффективности по сравнению с людьми которые не использовали GPT4 в своей работе.
Детально про исследование можно почитать в оригинале или на русском.
От себя скажу: с момента как GPT4 стала публична, наша компания оплачивает сотрудникам платный доступ, эти 20$ в месяц просто смешная цена за такой прирост эффективности.
Если вы руководитель, советую не экономить на инструментах для персонала.
Скорость развития технологий искусственного интеллекта сегодня явно опережает прогресс в других глобальных технологических сферах и, по всей видимости, будет только увеличиваться. В этом контексте особенно актуальны первые шаги в новом эволюционном витке этой перспективной технологии. Основатель DeepMind и текущий руководитель компании Inflection, Мустафа Сулейман, представил свои видения будущего ИИ.
Сулейман считает, что следующим большим шагом в развитии ИИ будет переход к интерактивным системам. В отличие от генеративных моделей, которые в основном фокусируются на создании текста или другого контента, интерактивный ИИ будет способен выполнять конкретные задачи по запросу пользователя. Это включает в себя возможность взаимодействовать с другими программами, сервисами и даже людьми для достижения поставленных целей.
Сулейман утверждает, что такие системы могут привнести революционные изменения в технологический ландшафт, предоставляя ИИ "агентивность" или способность действовать автономно в рамках заданных параметров. Он видит в этом не только технологический прогресс, но и широкие социальные и экономические перспективы.
Сулейман также акцентирует внимание на необходимости строгого регулирования в этой новой сфере. Он считает, что должны быть четко определены границы и ограничения, которые не может пересечь ИИ, чтобы обеспечить безопасность и соответствие этическим нормам.
Компания Inflection уже привлекла внушительные инвестиции в размере 1,5 миллиарда долларов от таких крупных компаний, как Microsoft, Nvidia, а также от Билла Гейтса. Сулейман остается верен своей миссии использовать технологии для "совершения добра в мире"
https://www.technologyreview.com/2023/09/15/1079624/deepmind-inflection-generative-ai-whats-next-mustafa-suleyman/
Устойчивые к проколам шины разной степени технологичности появляются регулярно, но пока до популярности и массового выпуска им, увы, далеко. Но энтузиасты не сдаются: вот еще один подход, основанный на технологиях NASA (для роверов на других небесных телах проблема куда актуальней, чем для наземного транспорта).
Предлагается велосипедное колесо, внутри которого похожая на пружину структура из никель-титанового сплава NiTinol с эффектом памяти формы. Пластик с металлической спиралью внутри должен по долговечности не уступать велосипеду, а стирающийся резиновый протектор придется менять каждые 8-12 тыс. км.
https://newatlas.com/bicycles/metl-shape-memory-airless-bicycle-tire/
На Кикстартере проект уже собрал больше, чем заявлял:)
https://www.kickstarter.com/projects/smarttirecompany/space-age-bicycle-wheels-using-nasa-technology/
Если окажется, что действительно есть сильный разрыв в принятии всяких ИИ-штучек между возрастными группами, то это многое объяснит в наблюдаемых волнениях на эту тему. Речь, как всегда, не про жесткое разделение, а про статистические предпочтения: среди тех, кто помоложе, заметно больше доля использующих ИИ-инструменты, хорошо к ним относящихся и не испытывающих излишних страхов. Среди тех, кто постарше, большинство сами ничего не пробовали, но читают безграмотные страшилки, написанные не самыми юными журналистами — и это формирует их отношение.
Беда в том, что законодатели и политики во всем мире — люди не первой молодости:)
https://www.forbes.com/sites/johnkoetsier/2023/09/09/generative-ai-generation-gap-70-of-gen-z-use-it-while-gen-x-boomers-dont-get-it/
На днях Гуглу исполнилось 25 лет — но в этом году юбилей не вызвал большого обсуждения у публики: все другим увлечены. Хотя пост про 25 лет поиска Гугла полезно прочитать, хотя бы чтоб понять, куда и какими темпами мы добрались в нашем цифровом окружении. Ну вот, например, Autocomplete, первая попытка додумать за нас, что хотим напечатать, появился меньше 20 лет назад :)
A в 2019 случились трансформеры, и пользователи ничего не заметили, пока другие ребята не запустили ChatGPT :)
И в итоге текущий год в посте отмечен как год создания Search Generative Experience (SGE) — но кто знает это название…
https://blog.google/products/search/25-biggest-google-search-updates/
Давно рассказываю на лекциях, что Стругацкие в “Понедельнике” вполне точно описали кучу того, что мы называем нынче ИИ. Правда, там использовалось другое слово: дубль. Ну, ничем не хуже, чем copilot 🙂
Вот классическая работа для дубля — посещать скучные совещания и приносить оттуда выжимку поисходившего. У Гугла эта функциональность так и называется Attend for me — и если ее применять в организации последовательно и повсеместно, может привести к интересным изменением менеджмента:))
https://techau.com.au/skip-the-meetings-just-send-the-ai-with-google-duets-attend-for-me-feature/
Ну не везет Гуглу с пиаром вокруг ИИ. Вот только что они объявили на конференции Google Next, что для корпоративных клиентов Google Cloud выкатывают разные решения, основанные на ИИ-технологиях, и это позволило привлечь большие компании типа General Motors или Estee Lauder.
При этом они объяснили, что специально не торопились с продуктами для корпораций, поскольку это серьезный продукт и серьезные решения:
We've generally told enterprise customers, 'Go slowly and methodically because it's important that you treat this as a strategic software development’
Всё так, только вот свой продукт Enterprise уровня OpenAI объявили вчера, и список заказчиков там тоже неплох, так что и в этом сегменте не получилось Гуглу уверенно захватить лидерство.
А вот что они анонсировали чип своей разработки TPU v5e, оптимизированный для работы с LLM, это круто!
https://www.reuters.com/technology/google-unveils-enterprise-ai-tools-new-ai-chip-2023-08-29/