Telegram-канал trendoscope - Трендоскоп: Неотсортированное - каталог телеграмм

trendoscope | Неотсортированное

Подписаться на канал

Telegram-канал trendoscope - Трендоскоп

5397

Обзор стартап-возможностей. @vladimir_zakoulov - здесь разбор полётов.

Подписаться на канал

Трендоскоп

21 декабря 2022 14:08

Embedding от OpenAI — поиск на стероидах

OpenAI на днях выпустили новую embedding-модель под названием Ada-002. Модель превосходит предыдущую Davinci в большинстве задач, при этом цена её на 99,8% ниже.

Что за «embedding»? Грубо говоря, это числовое представление любой информации — текста, кода, картинок, аудио и т.д. Так компьютер может находить закономерности среди контента, сравнивая эмбеддинги между собой.

Модель Ada заточена на текст и код. Вот основные сценарии использования, которые теперь стали доступнее:

- Поиск «на стероидах» — результаты выдаются не просто по ключевым словам, а с пониманием вопроса пользователя. Например, можно скормить нейросети книгу, а потом задавать вопросы по содержимому (AskMyBook).

- Аудио- и видеоконтент можно перевести в текст с помощью Whisper, а потом прогонять в эмбеддинг. Так мы можем получить чат-бота из популярного подкаста или личного ИИ-психотерапевта по записям сессий (Elomia). Картинки переводим в текст с помощью CLIP Interrogator.

- Персонализированные рекомендации. Например, Kalendar AI с помощью новой модели подбирают лучший сейлс-питч под профиль клиента.

- Кластеризация — разрозненный текст можно автоматически сгруппировать по какому-то признаку. Например, Gemsnotes делают самоорганизующийся заметочник — ИИ находит похожие по смыслу заметки и объединяет их в одну группу. Популярный сервис Notion тоже внедряет модель у себя.

В комментариях по традиции обсуждаем возможности для стартеров на базе новой модели. Велкам!

Читать полностью…

Трендоскоп

05 декабря 2022 13:47

Тренды дейтинга по версии Tinder

Мы уже писали про тектонический сдвиг в сфере онлайн-знакомств: после двух лет пандемии и изоляции, люди начали искать более близкие отношения. Зумеры не исключение: Tinder на днях выпустил отчёт о трендах дейтинга у молодых людей возрастом 18-25. Вот основные тенденции:

- Слово года в профилях — «situationship». Это нечто большее, чем «one night stand», но не дотягивает до «relationship». Молодые пользователи чаще всего предпочитают такой подход к знакомствам — это способ развивать отношения с меньшим давлением.

- Самое трендовое эмодзи в анкетах — 🅿️. Означает поиск «positivity» в партнёре — позитивный вайб, нетоксичность. Забота о собственном ментальном здоровье становится ключевым фактором в поиске отношений. И эта динамика проникает во все социальные платформы — например, на Reddit от крупных сообществ всё чаще отпочковываются «NoSalt-группы» без негатива и хейта.

- Ещё популярные эмодзи в Тиндере — красный флаг 🚩 (тревожный звоночек, который показывает, что лучше не общаться с человеком). И туман 🌫, символизирующий газлайтинг — одну из форм психологического насилия. Пользователи становятся более разборчивы в потенциальных партнёрах.

- Какие характеристики партнёров считаются самыми привлекательными? Чувство юмора, уважительность, открытость (open-mindedness). Также становятся важны позиции по социальным и политическим вопросам.

- Свидания в барах теряют популярность, как и алкоголь в целом. На смену приходят креативные свидания — пикник, мини-гольф, кинотеатры для авто.

- Ретроградный Меркурий это вам не шутки — знаки зодиака становятся одним из самых популярных описаний в профилях. Многие «пробивают» партнёров на совместимость перед свиданиями — уже 25% американок в возрасте 18-25 лет установили астрологический сервис Co-Star.

В комментариях обсуждаем возможности для стартеров, релевантные этим трендам. Велкам!

Читать полностью…

Трендоскоп

21 ноября 2022 09:28

GPT-3 вместо поиска

Недавно мы писали, что подростки ищут инфу не в Гугле, а в Тиктоке. Теперь появился ещё один претендент на звание убийцы поисковиков — языковые модели. В Твиттере нарастают дискуссии о том, что GPT-3 как поисковик круче Google. Вот основные аргументы:

- Нейронки дают чёткий и прямой ответ без рекламы и SEO-хлама. В то время как Google приоритизирует длинные и водянистые статьи от копирайтеров.

- Есть возможность задать несколько вопросов одновременно, в том числе философских. Можно даже узнать мнение по вопросу у Альберта Эйнштейна или Сократа — например, Character AI обучают GPT-3 на текстах известных мыслителей.

- Поиск можно настраивать под себя: например, попросить нейронку выдавать контент только с технических блогов. Или отбрасывать самые популярные сайты, чтобы чаще натыкаться на статьи от небольших инди-авторов. Brave уже тестируют подобную фишку в своём поисковике.

- Отсутствие барьеров в языках и форматах выдачи — можно найти «алмазы» в статьях на любом языке, тут же преобразовать их в аудио и послушать как подкаст.

Вполне возможно, что следующей поисковой системой станет генеративный ИИ. Эксперименты уже ведутся: например, Metaphor создали языковую модель, которая предсказывает ссылки по любым текстовым промтам.

А со скорым приходом GPT-4, нейропоиск выйдет на совершенно другой уровень: вместо стандартного «ввода-вывода», модели смогут выполнять длинные цепочки рассуждений и корректировать в процессе свою работу. Можно будет поручить ИИ-помощнику любую задачу, а не только вывод текста или ссылок.

На этом фоне люди начали задаваться вопросом: что будут делать бренды для лучшего представления внутри нейросетей? Чтобы при GPT-запросах аля «самый лучший хостинг — это...» выдавались они, а не конкуренты.

Технологии уже созрели, чтобы победить «привратника интернета» стоимостью в триллион $. Давайте побрейнстормим в комментах, как мы - стартеры - можем это использовать.

Читать полностью…

Трендоскоп

16 ноября 2022 06:36

Webflow запустил маркетплейс приложений

Популярный low-code конструктор сайтов Webflow на днях запустил свой App Store. Разработчикам открыли несколько API для создания своих приложений на базе Webflow. Пользователи смогут добавлять эти приложения на свои сайты из единого каталога.

Вот почему это интересная возможность для стартеров:

- Webflow — один из первых выборов для создания лендинга на глобальном рынке, по аналогии с Тильдой у нас. Выросли на 60% по числу пользователей за год — сейчас активны 360k+ сайтов с Webflow под капотом. Аудитория платёжеспособна, большая часть из US и Европы.

- Активно развивают продукт: уже есть встроенная CMS, функционал подписок и набор инструментов для e-commerce. Все API доступны. В этом году ребята также подняли $120М инвестиций на дальнейшее развитие.

- Попадают в тренды на no-code/low-code, которые сами и задали — первую масштабную конференцию No-Code Conf в 2019 году организовали Webflow. Теперь они закрепились в no-code разработке как составляющая WATZ стека: Webflow фронтенд + Airtable база данных + Typeform для пользовательского ввода + Zapier для связки сервисов.

- Собрали мощное комьюнити из 75k+ дизайнеров и разработчиков по всему миру. Что позволяет нацеленно продвигать новые продукты для этой аудитории.

Какие возможности на базе Webflow открываются для стартеров? Давайте побрейнстормим в комментариях.

Читать полностью…

Трендоскоп

03 ноября 2022 14:37

Теперь каждый может создать свой Zoom

Cloudflare решили выйти на рынок «лопат для золотоискателей» в области real-time коммуникации. Недавно они представили линейку сервисов для создания своих RTC-приложений:

- Stream Live для интеграции видео и прямых эфиров в свои сайты/приложения. Cloudflare предложили тарифы в 3-5 раз дешевле, чем у других провайдеров, в том числе Гугла.

- Sub-second latency. Обычно прямые эфиры на сайтах вовсе не прямые — задержка трансляции может доходить до 20 секунд. Это можно наблюдать на лайвах в YouTube — стример видит комментарии зрителей с большой задержкой, что ухудшает опыт всех участников. Cloudflare снижают задержку видеостриминга в WebRTC до одной секунды и меньше.

- Cloudflare Calls — набор API для создания софта массовых видеоконференций: с поддержкой чатов, модераторов бесед, закрытых комнат и т.д. С их тарифами даже инди-разработчики могут создать добротный аналог Zoom. Пока сервис в закрытой бете.

Cloudflare даже решили демпингануть AWS с их новым решением для хостинга под названием R2. Разработчики на Hacker News говорят, что тарифы «слишком хороши, чтобы быть правдой». А благодаря совместимости с API Amazon S3, можно довольно легко мигрировать на новую инфраструктуру.

Как Cloudflare удаётся бить устоявшихся игроков? Их секрет — самая взаимосвязанная в мире сеть из тысяч прокси-серверов (CDN), в которую они вложили >$500M и 10 лет. Благодаря ей Cloudflare имеют большое преимущество в сфере edge computing — вычислениях как можно ближе к конечному пользователю. Это позволяет выдавать лучшую скорость отклика + экономить на трафике, что критично для RTC-приложений.

В общем, Cloudflare мощно снизили порог входа в разработку сервисов real-time коммуникации. Какие возможности это открывает, помимо очередных аналогов Zoom и Clubhouse? Давайте побрейнстормим в комментах.

Читать полностью…

Трендоскоп

15 октября 2022 12:33

Расцвет Text-to-Content

#ML

В области генерации изображений из текста произошёл настоящий кембрийский взрыв. За короткое время нейронки прошли путь от неловких абстракций до потрясающих артов, которые берут призы на состязаниях художников. Теперь генерация приходит и в другие категории — сделали для вас апдейт по последним разработкам.

Text-to-Image

В области изображений сейчас идёт борьба за звание «Фотошопа будущего». Google на днях представили новую модель DreamBooth, которая заточена на редактирование исходных изображений. Загружаете несколько фоток, а потом нейронка может делать с объектами что угодно: изменять ракурсы, менять фон и композицию, накладывать стиль художника. Подобную фичу недавно выкатили и в Stable Diffusion.

Порог входа в генерацию изображений стремительно снижается — Stable Diffusion можно настроить даже на обычном потребительском железе. Поэтому появляются нейронки для создания чего угодно — от интерьеров до пышных аниме-дам.

Text-to-Video

В генерации картинок уже сорваны «низковисящие фрукты», поэтому гиганты активно смотрят в сторону видео. Такие проекты недавно выпустили Google и Meta (запрещённая в РФ). Нейронки уже могут создавать короткие ролики по текстовому запросу. Пока разработки на ранней стадии, видео выходят в низком качестве и с заметными артефактами.

Редактировать видео скоро можно будет так же просто, как и текст — меняете нужный отрывок в текстовой расшифровке, а алгоритмы выстраивают видеоряд. Такой сервис недавно представили Descript.

Text-to-Audio

В сфере генерации аудио недавно наделал шуму дипфейк-подкаст Джо Рогана и Стива Джобса. Нейронка создала очень реалистичный выпуск, обучившись на общедоступных видео с Джобсом и предыдущих подкастах Рогана. ИИ-модели легко копируют тон голоса и эмоции человека — не удивляйтесь, если скоро услышите подкасты с Эйнштейном или Сталиным. Примеры проектов в этой теме — Play.ht, D-ID.

Text-to-Code

Недавно мы писали про тренд на ИИ-ассистентов: описываете свою проблему нейронке → получаете нужный код. Похоже, совсем скоро такие ассистенты будут неотъемлемой частью любого софта: GitHub уже предлагает программистам ИИ-помощника по подписке. Microsoft внедряет в свой софт конструктор автоматизаций по описанию на обычном языке.

Ну а дальше ИИ сам будет создавать ИИ. Разработки в этой сфере уже ведутся: на прошлой неделе DeepMind представили алгоритм, который умеет создавать новые алгоритмы — пока что для задачи перемножения матриц.

Комментарии под этим постом предлагаем использовать для поиска соратников. Если у вас есть идея продукта/сервиса/фичи на базе text2content, опубликуйте тизер в комментах. Трендоскоп читают сотни ML-разработчиков — вполне вероятно, что кого-то из них вы вдохновите написать вам с предложением о коллаборации :)

Читать полностью…

Трендоскоп

10 октября 2022 12:02

ИИ-ассистенты в браузере

Adept.аi на днях продемонстрировали интересный тул на базе GPT-3. Они обучили модель выполнять высокоуровневые запросы по типу «найди мне дом в Хьюстоне для 4 человек, бюджет до $600k» — и браузерный ИИ-ассистент делает всё сам.

Поддерживают популярные классифайды, Гугл таблицы и другие сервисы. Утверждают, что можно заменить десяток кликов в Salesforce одним предложением. При этом ИИ-ассистент способен решать задачи, переключаясь между несколькими сайтами.

Похоже, так будет выглядеть новый виток сервисов автоматизации: описываете свою проблему ИИ-ассистенту → получаете результат. Тренд запустили OpenAI с их моделью Codex — даёте нейронке задание на обычном английском, а она в ответ генерирует код. GitHub уже разработали ИИ-помощника для программистов на базе Codex.

И в дальнейшем такие помощники будут встроены в каждый популярный инструмент. Вместо ручной работы в Фотошопе нужно будет лишь описать нейронке, что вы хотите получить. То же самое ждёт популярные CRM («сделай мне досье на этого лида») и CAD-инструменты («спроектируй самую легкую и прочную модель по моим параметрам»).

Инженеры OpenAI уже говорят, что GPT-3 способна решить любую задачу при правильном запросе. То есть у модели нет неправильных ответов, есть неправильные запросы. Представьте, что будет с релизом GPT-4 — эта модель будет содержать уже 100 трлн параметров, что в 500 раз больше предшественника.

А если добавить к этому нейронки для распознавания речи? Например, Whisper уже приближается к человеческому уровню распознавания — она устойчива к разным акцентам, фоновому шуму, и понимает технический язык. Так мы получим по-настоящему умных голосовых помощников и ещё на шаг приблизимся к artificial general intelligence.

В комментариях по традиции обсуждаем возможности для стартеров, релевантные тренду. Велкам!

Читать полностью…

Трендоскоп

29 сентября 2022 11:46

Пора выходить в Африку

Скоро на Земле родится 8-миллиардный житель — по прогнозам, это случится 15 ноября. Visual Capitalist приурочили к этому неплохой отчёт о демографических трендах планеты (в первом комментарии).

Всё говорит о том, что Африка — самый интересный регион для наших предпринимателей. Смотрите сами:

- В топ-10 самых быстрорастущих по населению стран — только страны Африки и Сирия. Число людей там растёт на 3-4% ежегодно, по сравнению с общемировым показателем 0.9%.

- Темпы урбанизации в Африке также рекордные. 17 из 20 самых быстрорастущих городов расположены на этом континенте. Это значит, что африканскому рынку ещё очень далеко до насыщения, ведь городские жители потребляют больше товаров и услуг.

- Африка к тому же и самый молодой континент: медианный возраст жителя — 21 год. Для сравнения, в Азии — 31, в Европе — 42.

- Доступ к интернету у африканцев вырос с 29% в 2010 до 60% сейчас. Поэтому это самый быстрорастущий рынок для мобильных игр и e-commerce.

Получается в чистом виде «низковисящий фрукт» — перспективный и растущий рынок сбыта + меньшая конкуренция и огороженность по сравнению с US/Европой. А в ближайшие 5-10 лет к тому же появятся большие объёмы грамотного линейного персонала.

При этом вовсе не обязательно придумывать что-то новое для африканского рынка — можно качественно повторять бизнес-модели, которые уже взлетели в других регионах. Оценка таких проектов при прочих равных будет существенно выше, чем в СНГ.

Инвесторы понимают перспективу: объем венчурных инвестиций в Африке вырос в 18 раз за последние 6 лет — до $4.4В в 2021 году. На континент приходят мировые стартап-бренды: Y Combinator, Seedstars, Google Startups.

В комментариях брейнстормим возможности для стартеров на африканском континенте. Велкам!

Читать полностью…

Трендоскоп

02 сентября 2022 10:42

Snap закрывает Zenly

У Snap дела идут не очень. Сокращают 20% сотрудников, избавляются от игр, видеопроектов, мини-дронов Pixy. Под нож пошла и Zenly — популярная у подростков гео-соцсеть, которую Snap в 2017 году купили за $213М.

Принцип работы Zenly — отслеживание местоположения друзей в реальном времени. Они могут видеть вас на карте и узнать, что вы сейчас делаете и куда идёте. Монетизации в самом приложении не было, но Snapchat с помощью Zenly мог обогащать свою рекламную платформу таргетингом по геолокации.

Приложение насчитывало 35 млн MAU, причём Россия была главным рынком — в прошлом году Zenly выходило на третье место по скачиваниям, после Telegram и TikTok.

А значит, «гибридные соцсети» на стыке онлайна и оффлайна нашли свою нишу среди подростков. Ещё примеры таких проектов — IRL (групповые чаты для ивентов), Saturn (соцсеть вокруг календаря для школьников).

Также появляется возможность для запуска гео-сервисов на базе новых фич Apple — Lock Screen виджеты + Always On дисплей, которые будут в новой прошивке.

В комментариях по традиции брейнстормим идеи, как стартерам эксплуатировать тренд на гео-соцсети. Велкам!

Читать полностью…

Трендоскоп

25 августа 2022 13:00

Инфлюэнсер-маркетинг без посредников

Гигант екоммерса Shopify на днях анонсировал Collabs — сервис, который объединяет инфлюэнсеров и миллионы интернет-магазинов на Shopify.

Блогеры могут выбрать любой магазин и продвигать товары среди своих подписчиков за процент с продаж. Сервис берёт на себя управление ссылками и промокодами, а также выплаты блогерам.

За последние месяцы Shopify активизировались в направлении «убирания посредников»:

- Проинвестировали в платформу музыкальной коммерции Single. Она помогает артистам продавать свои треки напрямую фанатам через магазин Shopify. А также выпускать NFT для доступа к эксклюзиву от музыканта.

- Запартнёрились с YouTube, чтобы инфлюэнсеры могли продавать товары прямо из своих видео.

- Вложили $100М в Klaviyo — сервис автоматизации email и sms-маркетинга. Это как раз те каналы, которые не зависят от прихотей посредников: меняющихся алгоритмов соцсетей или рекламных ограничений Apple и Google.

Какие ещё сферы напрашиваются на убирание в них посредников? Давайте побрейнстормим в комментариях.

Читать полностью…

Трендоскоп

12 декабря 2022 16:16

Text-to-product на базе ChatGPT

Генерация картинок из текста уже никого не удивляет. А что насчёт генерации продуктов? Новая ИИ-модель от OpenAI ChatGPT вполне способна на это. Вот несколько примеров из Твиттера:

- Сайт, полностью созданный обычными текстовыми запросами. Нейронка генерирует секции HTML/CSS, которые можно настраивать под себя.
- Плагин для конструктора сайтов Wordpress.
- Браузерная игра — крестики-нолики.
- Онлайн-синтезатор.
- Вымышленный язык для фанфиков.
- Сервис автоматизации процессов.
- Симуляция React-приложения. Вводите описание приложения и оно рендерится прямо в браузере.
- Сервис саммаризации контента.

Таким образом, нейронки уже сейчас могут накидать идеи для бизнеса → создать по ним роадмап → сгенерировать нужный код. Человек выступает только как куратор. И это ещё даже не GPT-4, которая к тому же будет способна искать информацию в интернете.

Уже появляются коммерческие применения text-to-product, например, Qatalog. Указываете нейронке, что вы хотите получить (например, маркетплейс), в ответ она генерирует нужный бэкенд. Если что-то не понравилось, описываете чат-боту и он изменит продукт по вашим пожеланиям.

В перспективе нас ждёт генерация видео и 3D-миров из текста — над этим активно работают в Google (DreamFusion) и Nvidia (Magic3D). Так мы перейдём к эпохе «text to any product» — можно будет создать любой продукт независимо от формата, просто попросив ИИ.

Какие возможности в сфере text-to-product открываются для стартеров? Давайте побрейнстормим в комментариях.

Читать полностью…

Трендоскоп

23 ноября 2022 09:08

Генерация контента приходит в геймдев

Венчурный фонд a16z выпустил отличную статью о том, как генеративный ИИ создаёт революцию в разработке игр. Из всех форм развлечений, именно в играх самый высокий порог входа — на создание огромного количества интерактивных ассетов нужно потратить кучу времени и денег.

Возьмём Red Dead Redemption 2 — это одна из самых дорогих игр, на разработку которой ушло 8 лет и $500М. В ней огромный реалистичный мир площадью 80 км², более 1000 персонажей (каждый со своим характером, историей и актёром озвучки), 100+ квестов и 60 часов музыки.

И все эти задачи уже может брать на себя ИИ — снижая стоимость создания игровых ассетов чуть ли не до нуля. Вот примеры проектов в этой области:

- Генерация внутриигровых персонажей — Inworld AI, Charisma. Можно задать характер NPC (игривый, импульсивный), а ИИ сгенерирует им самую подходящую внешность и все диалоги.

- 2D-модели уже решены благодаря DALL-E и Stable Diffusion, нужна только обёртка с фокусом на геймдеве (Scenario AI). 3D-генерация также на подходе: Nvidia на днях представили модель text-to-3D.

- Левел-дизайн — Promethean, Mlxar. Игры-песочницы по типу Minecraft уже внедрили процедурную генерацию уровней — при новой игре мир создаётся заново, но по строгим правилам левел-дизайнера. Генеративный ИИ же способен создавать совершенно новый мир, повышая реиграбельность до бесконечности.

- Аудио-сопровождение — Soundful, Infinite Album. Музыка может не только генерироваться в реальном времени, но и подстраиваться под происходящее в игре.

- Синтез голоса персонажей — Resemble, Replica. ИИ может передавать эмоции и акцент, легко заменяя актёров озвучки. Локализация на другие языки тоже не проблема (Deepdub).

Некоторые игры даже невозможно создать без ИИ — например, Microsoft Flight Simulator, в которой игрок может облететь всю нашу планету на самолёте. Выстраивать такой огромный мир вручную — безумие, но ИИ легко может его воссоздать из двухмерных спутниковых изображений (Blackshark).

Запрос на стартапы от a16z: единая платформа для генеративного создания игр, которая охватит все эти разрозненные инструменты. Тесно проинтегрированная с популярными движками Unity и Unreal.

В комментариях по традиции обсуждаем возможности для стартеров, релевантные тренду. Велкам!

Читать полностью…

Трендоскоп

18 ноября 2022 09:23

Успехи Apple Watch

Apple в недавнем отчёте обнародовала успехи своих смарт-часов. Attach rate в Северной Америке достиг 30% — т.е., из 10 человек с Айфонами трое также покупают Apple Watch. Глобальный attach rate составил 18% — это рекорд за всю историю.

При этом техника от Apple доминирует среди молодого поколения. 87% американских подростков ходят с Айфонами. Среди обладателей смарт-часов, 83% пользуются яблочными.

Поэтому разработка под Apple Watch может стать хорошей возможностью для стартеров:

- Благодаря iPhone, пользователи «заблокированы» в экосистеме Apple и покупают в основном только яблочные гаджеты — AirPods, Watch. Синергия будет и с новой XR-гарнитурой, релиз которой уже близок — инсайдеры пишут, что работа над операционной системой завершена и Apple сейчас фокусируется на контенте и разработке приложений.

- Adoption носимых устройств стремительно растёт, повторяя раннюю траекторию интернета и смартфонов. Теперь wearables проникают даже в государственные учреждения: например, в Финляндии пациенты уже могут связать данные носимых устройств со своими медицинскими картами. А сингапурцы получают бонусы от правительства за занятия с Apple Watch.

- Сами устройства обрастают фичами и открывают новые сценарии использования: последние Watch уже умеют трекать сон, снимать ЭКГ, докладывать о падениях человека. Ведутся разработки в области мониторинга глюкозы и алкоголя в крови через Apple Watch.

При этом у текущих приложений налицо проблемы с качеством. Пользователи устанавливают 5М health/wellness приложений ежедневно, но 95% из них удаляются в первые же сутки. А значит, есть все шансы мощно вырасти на этом тренде, если учесть ошибки конкурентов.

В комментариях обсуждаем возможности для стартеров на фоне успехов Apple Watch. Велкам!

Читать полностью…

Трендоскоп

12 ноября 2022 16:10

Апдейт по text-2-image

#ML

Искусственный интеллект на наших глазах учится рисовать картинки все лучше. Собрали для вас последние обновления популярных сервисов text-2-image.

1. MidJourney мощно нарастил качество генерации в новой версии V4. Особенно интернет взорвался от скрещивания нескольких картинок — эта фича в MidJourney была и раньше, но с новым алгоритмом она вышла на совершенно иной уровень.

2. OpenAI на днях открыли публичный доступ к API DALL-E. Стоимость генерации — всего $0.02 за каждую картинку размером 1024x1024. Похоже, совсем скоро инструменты генерации будут интегрированы везде — так Microsoft уже внедряют DALL-E в свой пакет Office, появляются плагины для генерации картинок в Фотошопе.

3. Stable Diffusion благодаря своей изначальной открытости обзавёлся огромным количеством применений: от генерации рентгенограмм для медицинских исследований, до создания интерьеров в VR. Фаундер намекнул, что это лишь начало и в ближайшие недели нас ждут новые достижения в сфере text-2-image.

Так нейросети для генерации изображений проходят этап «игрушек для гиков» и становятся весомым помощником для предпринимателей и криэйторов. А учитывая темп изменений в этой области, всем нам скоро придётся осваивать инструменты text-2-image, чтобы не остаться без работы.

В комментариях по традиции обсуждаем возможности для стартеров, релевантные тренду. Велкам!

Читать полностью…

Трендоскоп

19 октября 2022 12:56

VR-фитнес

#XR

Цукерберг активно ищет новые сценарии применения VR. Первое направление — корпоративные метавселенные. Также они начали копать в сторону фитнеса: людям заходят тренировки в VR, 90% подписчиков приложений для VR-фитнеса продлевают тарифы после первого месяца.

Нащупав интересное направление, компания пытается его развивать. Поэтому они выпустили Quest 2 Active Pack — набор аксессуаров, которые облегчат тренировки в виаре: ремешки для запястий и суставов пальцев, а также лицевую подушку, которую легко протереть после тренировки. Со следующего года в ассортимент обещают добавить товары сторонних производителей.

Осенью также планируют выпустить Fitness API, который позволит обмениваться данными о физической активности с другими приложениями. Можно будет добавить тренировки в Apple Health или устроить соревнования с друзьями.

Уже сейчас приложения для VR-фитнеса становятся хитами:

- Beat Saber в прошлом году сделали $100М выручки. Это ритм-игра, где нужно размахивать световыми мечами под музыку и отпрыгивать от препятствий. Геймеры в Твиттере делятся, как они сбрасывают вес с Beat Saber: рекорд — 34 кг.

- Supernatural — ежедневные кардиотренировки в VR, с привлечением знаменитостей и именитых тренеров. Цукерберг давно хочет купить компанию-разработчика, но антимонопольщики никак не дают.

- Gym Class — приложение для VR-баскетбола. Мощно завирусилось в TikTok, бета-версию в App Lab скачали более 1 млн раз. Недавно привлекли $8М инвестиций от известного фонда a16z.

Вполне возможно, что именно VR-фитнес станет «троянским конём» и привлечёт широкую аудиторию в метаверсы. У него есть явные преимущества по сравнению с традиционными фитнес-залами: тренировки ощущаются не как работа, а как захватывающая игра. При этом можно заниматься из дома и не тратить время на дорогу.

Тренд на онлайн-фитнес сохранился после пандемии. Люди стали чаще заниматься дома, поэтому от VR-тренировок их отделяет только один шаг — покупка девайса, по стоимости сравнимого с годовым абонементом в фитнес-центр. А в мире железа скоро ожидается много пополнений, что даст выбор пользователям и откроет простор для разработчиков.

В комментариях обсуждаем возможности для стартеров в сфере VR-фитнеса. Велкам!

Читать полностью…

Трендоскоп

12 октября 2022 08:24

Quest Pro — как затащить компании в метаверс

#XR

Цукерберг на вчерашней конференции представил Quest Pro — профессиональную VR-гарнитуру стоимостью $1500. Фокус сместили на корпоративный сегмент: Марк утверждает, что конечная цель — полная замена рабочих ноутбуков и ПК.

Каждый год люди покупают 200 млн компьютеров — Цукерберг предлагает вместо них работать в VR. Как он говорит, «если бы мне предложили купить устройство за $1500, которое повысит продуктивность моих инженеров даже на 3% — я бы точно это сделал».

Софт и железо уже готовы к корпоративным метавселенным. Новая гарнитура научилась хорошо отслеживать движения рук и мгновенно переключаться между AR и VR, благодаря наружным камерам.

Ещё интересен третий режим — смешанная реальность: можно не снимая очки печатать на своей реальной клавиатуре на столе. Её вместе с руками пользователя транслирует в VR система распознавания объектов.

Quest Pro также получили набор камер, направленных на лицо пользователя. Они отслеживают движения глаз и мимику для передачи виртуальным аватарам. Также в компании работают над ИИ-моделями, которые предсказывает положение всего тела по данным от гарнитуры — а значит, у аватаров скоро появятся ноги.

Из-за фокуса на смешанной реальности пришлось пожертвовать иммерсивностью — гарнитура не блокирует полностью окружающий мир, как Quest 2. Для чистых VR-приложений (а они все совместимы с новым девайсом) нужно покупать дополнительный аксессуар за $50.

Время покажет, удастся ли Цукербергу заманить компании в свой метаверс. Ну а для стартеров релиз Quest Pro может стать одной из главных возможностей этого года. Давайте побрейнстормим в комментах варианты её эксплуатации.

Читать полностью…

Трендоскоп

06 октября 2022 12:54

Matter — единый стандарт для умного дома

На днях вышел в релиз протокол Matter — «USB-C от мира умного дома». Он позволяет IoT-устройствам от разных производителей работать друг с другом.

Инициаторами проекта выступили Google, Amazon и Apple. Сейчас в рабочую группу входит более 400 компаний, включая Samsung, Xiaomi, Яндекс и многие другие.

Matter работает как дополнительный уровень поверх существующих технологий для умного дома — Wi-Fi, Zigbee, Bluetooth и Thread. Поэтому устройства с поддержкой Matter смогут общаться локально, а не через облако. Если отключится интернет, умный дом всё равно будет работать.

Пользователи смогут собирать устройства разных брендов в единую систему, без «танцев с бубном». Это может дать неплохой буст к проникновению устройств умного дома: к концу этого года 117М устройств в мире будут поддерживать Matter, а к 2030 году их число достигнет 1.6В.

Первая версия стандарта поддерживает многие типы устройств, но далеко не все. К примеру, пока Matter не работает с камерами и роботами-пылесосами — поддержку обещают добавить в следующих версиях. При этом стандарт совместим и с самодельными устройствами: для популярных платформ по типу ESP32 уже есть SDK.

Для разработчиков создали хаб Build With Matter, код проекта открыт на Github.

Какие возможности для стартеров открываются с приходом Matter? Давайте побрейнстормим в комментариях.

Читать полностью…

Трендоскоп

14 сентября 2022 13:19

Кризис гуманитарных наук

Минобразования США выпустило данные по количеству выданных степеней в американских вузах. STEM и медицинские специальности всё больше вытесняют гуманитарные. Число выпускников в Computer Science уже превысило историков, лингвистов, журналистов, философов и краеведов вместе взятых.

Но при этом работодатели твердят, что выше всего ценят у выпускников софт-скиллы, которым учат гуманитарные дисциплины: эффективная устная и письменная коммуникация, критическое мышление, кругозор и насмотренность. Устойчивые тренды на ментальное здоровье и креативную экономику тоже играют на руку гуманитариям.

Данные показывают, что и в жизни лирики не сильно отстают от физиков. Процент безработных гуманитариев не отличается от других специальностей. Жалеют о своём выборе они почти так же часто, как программисты и менеджеры. Среди фаундеров компаний-единорогов тоже много гуманитариев.

Инвестор-миллиардер Марк Кьюбан и вовсе утверждает, что перспективнее изучать философию, нежели информатику. ИИ лучше любого человека научится обрабатывать и анализировать информацию, а затем начнёт программировать сам себя. Поэтому гуманитарные дисциплины имеют преимущество перед строго технарским образованием — философия, этика и эстетика алгоритмам (пока) не по зубам.

Мир становится более технологичным. Но именно отношения между людьми будут определять, куда приведут технологии — к процветанию или уничтожению. И последнее время показывает нам полное гуманитарное отставание нашей техническо-развитой цивилизации.

Как дать вторую жизнь гуманитарным наукам? Давайте побрейнстормим в комментариях.

Читать полностью…

Трендоскоп

29 августа 2022 13:54

XR-революция близко

#XR

В мире железа для VR/AR скоро ожидается много интересных пополнений. Собрали для вас последние новости:

1. Quest Pro выйдут уже в октябре. Цукерберг подтвердил на недавнем подкасте у Джо Рогана. Гарнитура будет отслеживать лицевую мимику и передавать её на аватар пользователя. А улучшенный режим сквозного просмотра откроет дорогу AR/MR-приложениям. Ожидаемый ценник устройства — выше $1k.

2. Bytedance в сентябре выпустят главного конкурента Quest — очки Pico 4 и Pico 4 Pro. Производство уже на полной мощности. Предыдущее поколение было очень достойной репликой второго Quest’а — и уже ходят слухи, что Pico может обогнать Цукерберга на следующем повороте.

3. Lenovo, ещё один китайский конкурент, выпустили в продажу гарнитуру VR700 — свой ответ Quest 2. Технически и по цене они сделали почти полный аналог американского хита. Пока только в Китае, но есть планы захвата глобального рынка.

4. PlayStation VR2 выйдет в начале 2023 года. Предыдущая версия пользовалась умеренным успехом — с момента запуска в 2016 продано 5М гарнитур, это 4% от продаж игровых консолей Sony PS4.

5. Apple подали заявки на торговые марки Reality One, Reality Pro и Reality Processor. Подробно про будущую гарнитуру Apple мы писали здесь. Ожидаемая дата релиза сместилась — сейчас прогнозируют Q1'2023.

6. Vuzix на днях представили Blade 2, новое поколение своих AR-очков с дизайном, приближенным к обычным очкам. Цена начинается от $1300, старт продаж в сентябре.

Выход новых XR-гарнитур станет одной из главных возможностей для стартеров в ближайшее время. Что (помимо этого) можно делать уже сейчас, чтобы иметь фору к релизу? Давайте побрейнстормим в комментах.

Читать полностью…

Трендоскоп

22 августа 2022 10:11

Революция Text-to-Image

#ML

Технология генерации изображений из текста развивается стремительно. Мы уже писали про DALL-E и GLIDE от OpenAI, но за последние месяцы появилось много других впечатляющих моделей: Google выпустили Imagen, Meta — Make-A-Scene, Microsoft — NUWA.

Повестку задают не только крупные ИИ-лаборатории корпораций. Стартапы тоже активно заходят в text-to-image и зачастую бьют больших игроков по качеству и скорости генерации. Можно отметить 2 свежих проекта:

- Stable Diffusion на днях открыли бету для всех желающих. В отличие от OpenAI (который далеко не Open), Stable Diffusion заточен на создание своих сервисов — код открыт, веса обещают выложить уже на этой неделе. При этом качество генерации сопоставимо с DALL-E 2. Скоро обещают сделать удобный Inpainting — можно будет брать любые изображения и изменять, соединять, расширять их. В будущем планируют раскатить функционал и на видео.

- MidJourney также недавно стал доступен всем желающим. Генерация происходит через сервер в Дискорде, который набрал уже почти миллион участников. Можно подключить их бота и на своём сервере.

Генерация изображений — это только первый этап. Далее наступит эра синтеза 3D-моделей. Snap на днях представили технологию NeROIC — это новый способ создания трёхмерных моделей для AR из общедоступных фотографий и видео. Нейронка сама додумывает недостающие виды изображения и синтезирует 3D-модель.

А в будущем придёт и генерация видео. Тут релизом отличились Apple: они представили нейронку для создания 3D-сцен по текстовому описанию GAUDI. Качество пока довольно низкое и много артефактов, но фундамент для генерации виртуальных миров заложен.

Комментарии под этим постом предлагаем использовать для поиска соратников. Если у вас есть идея продукта/сервиса/фичи на базе text2image-технологии, опубликуйте тизер в комментах. Трендоскоп читают сотни ML-разработчиков — вполне вероятно, что кого-то из них вы вдохновите написать вам с предложением о коллаборации :)

Читать полностью…

Подписаться на канал