Обзор стартап-возможностей. @vladimir_zakoulov - здесь разбор полётов.
Расширения для Raycast
Увидел у Влада @prod1337 пост про лучший интерфейс для доступа к AI — приложение Raycast. Это замена встроенного поиска Spotlight для Маков.
Киллер-фишки Raycast:
- Хоткеи — помогают выполнять частотные команды в несколько кнопок.
- AI — можно классически пообщаться в чате, либо запустить кастомную команду (в том числе через хоткей).
- Расширения — можно управлять популярными программами через Raycast. Например, поиск по музыке в Spotify, коммит в Git-репозиторий, новая задача в календарь и т.п.
И я подумал, что это интересная возможность для стартеров — запилить свой extension для маркетплейса Raycast. Популярные расширения собирают там десятки тысяч инсталлов, у самого Raycast уже более 100k DAU. Плюс, их база пользователей — сплошь power users да early adopters, что может дать неплохой старт новому инструменту.
Бунт на корабле Unity
Сегодняшней возможностью поделился участник сообщества Трендоскоп Lab @arthurostapenko.
Популярный игровой движок Unity решил изменить свою бизнес-модель — компания введёт комиссию в зависимости от количества установок игры. Причем инсталлы считаются не очень прозрачно, с помощью «proprietary технологии Unity».
У пользователей платформы закономерно пригорело — изменение системы в основном коснётся разработчиков мобильных игр и может увеличить расходы студий до 50 раз. Иммерсивная отрасль, которая тоже сильно полагалась на Unity, уже собирается судиться. Общее впечатление в индустрии — «Unity выстрелил себе в ногу, а может даже и в голову».
Это может спровоцировать движение в геймдеве, и стриггерить новые возможности:
- Рост других OpenSource движков (например Godot), либо переход на proprietary альтернативы (Unreal). Но конечно никто не застрахован, что и они со временем не решат перейти в «value extraction» фазу.
- Инструментарий для порта части из тех 700 000+ игр, которые были сделаны на Unity и за которые теперь нужно будет платить налог.
- Фонды, которые могут проинвестировать в портирование тысяч модулей из Unity-маркетплейса в маркетплейс другого движка, который станет фаворитом.
Кроссплатформенные приложения в Apple-экосистеме
Apple на днях анонсировали магазин приложений и игр для грядущей XR-гарнитуры Vision Pro. Проект на высокой стадии готовности: бету VisionOS с App Store обещают выпустить до конца осени.
Яблочники хорошо поработали над кроссплатформенностью: теперь приложения для iPad и iPhone по умолчанию будут автоматически публиковаться в App Store на Vision Pro. Большинство аппов работают в новой среде без изменений, что позволит сразу наполнить магазин «сотнями тысяч приложений».
Виджеты тоже должны получить вторую жизнь. Сегодня будет презентация Apple, на которой покажут новые операционки iOS/MacOS — они привнесут интерактивные виджеты, с которыми можно взаимодействовать, не открывая приложение. А также новую фичу Standby — виджеты можно будет использовать даже на заблокированном экране.
В общем, создаётся много новой «экранной недвижимости», а с релизом гарнитуры её будет ещё больше. Самое время занимать это пространство своими виджетами и приложениями.
Наблюдения по свежему батчу Y Combinator
На днях прошёл Demo Day главного мирового стартап-акселератора YC. Почитал аналитику по батчу (The Information, выпускники YC, tech twitter), вот основные тренды:
1. Ясно проявляется AI-хайп: 60% батча (134 стартапа) были завязаны вокруг ИИ. В прошлые наборы в среднем было 20% AI-стартапов.
2. Самый распространённый кейс — вертикальные применения AI: когда эксперты в какой-то области упрощают рутинный бизнес-процесс ИИ-инструментами. Сами области могут быть какими угодно, лишь бы был большой рынок — были проекты в финансах, медицине, логистике.
3. Ещё одна популярная формула — «Copilot для Х». Фокус полностью сместился в B2B: в основном это ИИ-помощники, заточенные на узкую задачу — KYC-проверки, планирование корпоративных мероприятий, заполнение договоров.
4. Мало кто упоминает, что тренирует собственную ИИ-модель — похоже, многие используют файнтюненные версии ChatGPT и Llama2. Акцент делается на «it just works», а также отраслевой экспертизе — она помогает понять, где и как нужно заставить модели work.
5. Новая перспективная ниша среди YC-стартапов — DevTools для языковых моделей (сейчас это называют AI Ops). Лопаты для золотоискателей всегда в тренде.
6. Жесткий фокус на американский рынок — почти полностью отвалились ЛатАм, ЮВА, Африка. Инвесторы стали осторожнее относиться к развивающимся рынкам. Требования к бэкграунду тоже очень выросли — большинство фаундеров из Ivy League, FAANG, либо с миллионными экзитами.
Итого, рецепт успеха по мнению визионеров из YC: поработать несколько лет в большой компании в США, найти там интересную задачу/проблему, решить её с помощью нишевого применения AI.
Визуальные новеллы от AI
В последние годы начали мощно расти визуальные новеллы — некий цифровой аналог Дарьи Донцовой у современных подростков. Популярные приложения типа Lovelink или Клуба Романтики собирают обширную фанбазу в Тиктоке и миллионы $ выручки.
При этом сюжеты стары как мир и пишут их обычно «литературные негры» на гиг-платформах — в Китае выросли целые «фабрики новелл» для англоязычной аудитории.
Звучит как отличная область для внедрения GenML. Buildbox на днях выпустили nocode-конструктор для подобных новелл: ИИ генерит истории по вашему запросу, сюжетные арки от выбора игроков, а также фоновые картинки и музыку. Готовую аппку можно загрузить в магазины приложений.
В целом, любовь зумеров к новеллам можно распространять и в другие категории. Например, Mschf выпустили новеллу, которая помогает заполнить налоговые формы в режиме дейтинг-симулятора. Думаю, и для многих других скучных вещей типа обучения можно делать обёртку в форме новеллы с милыми аниме-персонажами.
Закат высшего образования
Скоро 1 сентября, в это время все традиционно говорят про скорую смерть универов. Вот основные предпосылки (для US, но применимо и к другим странам):
- Доля абитуриентов, уверенных что высшее образование поможет хорошо устроиться в жизни — упала до 36%. Для сравнения, в 2015 году таких было 57%.
- Стоимость обучения в колледжах растёт с каждым годом. Более того, это одна из самых подорожавших категорий за последние 20 лет (после медицинских услуг). Зачастую это приводит к долговым ямам в семьях.
- AI также наступает на пятки выпускникам — Goldman Sachs прогнозируют, что 2 из 3 джуниорских вакансий в ближайшие 5 лет возьмёт на себя ИИ.
В итоге, зумеры всё реже выбирают поступать в вузы — количество заявок снижается на 3-5% ежегодно. С начала пандемии высшее образование в Штатах недосчиталось 1.3 млн абитуриентов.
Поэтому здесь открываются возможности для «alt-education», которое приходит на замену традиционным вузам. Например:
- Google и другие техи запускают 6-месячные программы стажировок, которые приравниваются к корочке вуза. Британская платформа для стажировок Multiverse недавно стала первым edtech-единорогом UK.
- «Edutainment» — совмещение образования и развлечений. Бренды запускают программы подготовки кадров в Roblox, стартапы делают обучение с помощью мемов.
- Сервисы для обучения «синих воротничков». Пока вузы теряют абитуриентов, ПТУ фиксируют рекордный рост заявок. На рынке острая нехватка квалифицированных рабочих — поэтому выпускники ПТУ реже сидят без работы, а по зарплате уже приближаются к ровесникам из белых воротничков.
Fooocus — новый игрок в генерации изображений
lllyasviel (создатель ControlNet для text-2-image) на днях заопенсорсил новый крутой инструмент Fooocus. Он объединяет в себе открытость от Stable Diffusion + простоту и эстетику генераций от Midjourney.
То есть больше не нужно писать длиннющие промты аля «artstation, cinematic lighting, 8к» и т.д. — хорошие картинки получаются прямо из коробки за счет вшитых промтов и стилей. Большинство технических настроек «для гиков» также абстрагированы.
Fooocus поддерживает LoRA-модели, их можно запустить на обычных видеокартах от 4GB VRAM. Плюс, можно загрузить любые SDXL-модели с Civitai.
На Гитхабе народ уже вовсю прикручивает более симпатичные веб-морды, в потенциале Fooocus действительно может стать «убийцей Midjourney». Подробный обзор инструмента смотрите у Сергея Цыпцына в тг-канале.
3D Gaussian Splatting — следующий шаг эволюции NeRF
На сцену ворвался новый алгоритм рендеринга 3D-сцен из фоток — Gaussian Splatting. По качеству он уделывает все предыдущие NeRF-системы (в Твиттере много примеров работы). Можно детально разглядывать отдельные травинки, NeRF выдавал бы там зеленые облачка.
Помимо статичных сцен, Gaussian Splatting умеет воссоздавать и динамические — даже сложные движения по типу жонглирования. Для этого требуется синхронизированное видео с нескольких камер.
И всё это очень быстро — алгоритм обучается за 2 часа на одну сцену и делает рендеринг с частотой 850 кадров в секунду. Доступно даже на consumer-grade GPU. Код проекта и модели выложили на Гитхабе.
(спасибо за наводку участнику Трендоскоп Lab @arthurostapenko)
AI-native игры
A16z выложили на Гитхабе очередной учебный проект — на этот раз виртуальный город с ИИ-персонажами, которые живут своей жизнью и общаются друг с другом. Демка совсем простая, но на этом фундаменте можно строить и дальше — вплоть до масштабных многопользовательских игр.
В целом, VC сейчас активно копают тему AI x Gaming. Именитый фонд Lightspeed недавно опубликовал подробный разбор — они утверждают, что мы находимся на пороге платформенного сдвига, который откроет совершенно новый игровой опыт. Совсем как мобайл привёл к росту гигантов по типу Zynga, а использование новых мультитач-механик дало импульс Rovio.
То же самое ждут от ИИ. Уже сейчас его встраивают во все процессы разработки, и даже делают полностью сгенерированные игры. Но кроме этого, ИИ может предложить новый опыт — как пример, живые незаскриптованные персонажи, с которыми можно поболтать.
Кто не сможет реализовать эти возможности в своих играх, проиграют рынок AI-native проектам — потому что игроки предпочтут более иммерсивный опыт. Think Minecraft, но каждый раз создаётся новое приключение со своими персонажами, уникальными вещами и монстрами.
P.S. Друзья, для тех, кто готов сканировать более плотный поток стартап-возможностей, мы запустили закрытый канал Трендоскоп Lab. Подать заявку можно в этой Гугл-форме. Велкам 🙂
GPT-боты — новый формат спама
Сейчас у нас к каждому посту в Трендоскопе пишут gpt-спам — боты делают выжимку поста и пытаются пропиарить что-то в био. Традиционные методы защиты тут не работают (кроме капчи). Но пока боты палятся слишком быстрыми ответами и их можно блокировать вручную.
Автор тг-канала Kyrillic писал, что был бы рад сервису, который мониторит и удаляет gpt-комменты глазом человека (аля модератор as a service). Платил бы за него $20-30/мес, или по usage billing — количеству постов или сообщений.
Ну а в обозримом будущем gpt-спамеры должны стать намного умнее — с задержками ответов, возможно с разными личностями, которые поддерживают диалог друг с другом. Тут уже быстро не определишь, где человек, а где бот.
И эта проблема до сих пор остаётся без решения — даже OpenAI прикрыли свой детектор сгенерированных текстов, из-за слишком низкой точности. Помимо админов, над этой задачей сейчас ломают голову преподаватели и рекрутёры — что открывает простор для проектов в этой теме.
Камбек тревел-индустрии
Skift выпустили крутой отчёт о состоянии индустрии путешествий (в комментах). Основные тезисы:
- В этом году общемировой тревел впервые превзошёл допандемийные показатели. В основном благодаря мощному росту внутреннего туризма.
- Кто пережил турбулентность прошедших лет, сейчас снимает сливки. В Европе сезонная аренда выросла на 22% по сравнению с 2019 годом, отели — на 7%. Причем в топе роста — люксовые объекты.
- Пандемия поменяла некоторые привычки туристов. Теперь люди покупают билеты ближе к дате вылета, чаще платят за страхование и возможность отмены.
- Основные направления международных перелётов — Испания, US, Турция, Италия.
Также в отчёте подсвечивают несколько растущих тем для стартапов:
1. Софт для гибридной модели работы (несколько дней в офисе, несколько дней где-то ещё). Многие отели сейчас трансформируются в коворкинги, чтобы привлекать растущую категорию гибридных сотрудников.
2. Сервисы для «продажи впечатлений». Молодым туристам уже не интересны конвейерные туры — даже самый популярный листинг Airbnb это хижина в лесу в форме гриба. Неплохо растут глэмпинги, авторские и кулинарные туры.
3. AI x Travel. ИИ-планировщики маршрутов (RoamAround), чат-боты для отелей (HiJiffy), динамическое ценообразование (PriceGenie).
Искать друзей онлайн становится мейнстримом
Один из гигантов дейтинга Bumble на днях запустил отдельное приложение для поиска друзей. Раньше это была просто фича в основном приложении — но она отвечала уже за 15% месячной активности пользователей. В standalone-аппке будут новые функции для поиска друзей, такие как групповые чаты с несколькими мэтчами.
Романтические пары сейчас чаще всего образуются после знакомства онлайн. Вполне возможно, что скоро это станет нормой и для друзей. Уже 57% подростков говорят, что встретили друга в интернете — чаще всего в играх, соцсетях и приложениях по типу Bumble.
Основной драйвер этого тренда — одиночество. 61% молодых американцев сообщают, что чувствуют себя одинокими. Во многом виновата пандемия и удалёнка — во время локдаунов зумеры пропустили много личного общения и возможностей завести друзей.
DevLabs и DevKits для Apple Vision Pro
Apple вчера открыла заявки на свои программы для visionOS-разработчиков:
- Developer Labs — оффлайн-площадки для тестирования приложений на самой гарнитуре. Они есть в Купертино, Лондоне, Мюнхене, Шанхае, Сингапуре и Токио. В ближайшем к нам Мюнхене лабы пройдут в августе: 8.08-10.08 и 22.08-24.08. Для подачи заявки нужно работающее приложение в симуляторе visionOS.
- Аренда DevKits. Apple отправит экземпляр Vision Pro + выделит экспертов для траблшутинга проблем с дизайном и кодом. В приоритете — разработчики, которые используют максимум уникальных функций visionOS. Также влияет опыт в разработке на iOS.
- Проверка совместимости существующих приложений. Эксперты Apple затестят ваше iOS/iPadOS/visionOS приложение на Vision Pro, и отправят подробный отчёт со скриншотами и журналом сбоев.
P.S. Друзья, для тех, кто готов сканировать более плотный поток стартап-возможностей, мы запустили закрытый канал Трендоскоп Lab. Подать заявку можно в этой Гугл-форме. Велкам 🙂
Unity вчера запустили обещанный инструментарий разработки для visionOS, под названием PolySpatial. Пока что в бете, для доступа нужно подать заявку в waitlist.
Продвигают 3 основных юзкейса применительно к гарнитуре Apple:
- Порты существующих VR-игр и приложений с Quest/PSVR на Apple Vision Pro.
- Кросс-платформенная разработка с нуля. При этом обещают полную поддержку фич visionOS — для этого уже выпустили плагины распознавания жестов, пространственного звука и другие. Проекты из Unity также можно выгрузить в Эппловский Xcode Simulator.
- Перенос на Vision Pro 2D-приложений, сделанных в редакторе Unity.
Это ещё одна неплохая возможность для стартеров начать в XR-разработке. Пилить аппки для visionOS можно уже больше месяца. Но новичкам может быть проще зайти через Unity — благодаря их обширной библиотеке инструментов, плагинов и туториалов, особенно для создания игр.
Расцвет AI-инженера
Hacker News и tech-твиттер последние недели активно обсуждают эссе «The Rise of the AI Engineer». Автор пишет про зарождение новой профессии «ИИ-инженера», которая может стать самой востребованной в этом десятилетии. «Отец ML» Andrej Karpathy тоже подтвердил тренд и дал свой комментарий.
Причина — острый недостаток людей, которые могут связывать мощные AI-модели с продуктом и конечными пользователями. LLM, агенты и прочие ИИ-решения в потенциале могут перевернуть мир, но продуктово до сих пор находятся на стадии «поделок для гиков».
Если провести историческую аналогию — сейчас AI это компьютер IBM с командной строкой. А ИИ-инженер, совсем как Стив Джобс, будет создавать и внедрять «AI for the rest of us». Спрос на таких людей подтверждается как модными стартапами вроде Notion, так и оффлайн-старичками — вакансии ИИ-инженеров появились у Lego и Procter&Gamble.
Уже зарождаются карьерные треки для начинающих инженеров. Вот основные концепты, которыми нужно обладать:
- Работа с LLM по API и в опенсорсе. Уметь ими жонглировать в зависимости от задачи.
- Лучшие практики промт-инжиниринга и AI UX.
- Тулзы и фреймворки — Langchain, LlamaIndex, векторные базы данных и т.п.
- Мультимодальные возможности через работу с Whisper/Stable Diffusion/ElevenLabs.
- Умение быстро шипить продукты + оставаться в потоке, так как сфера развивается стремительно.
Дубляж видео на ИИ-стероидах
На этой неделе интернет взорвался от HeyGen — нейросети для перевода видео. Она копирует голос спикера + подстраивает движение губ, чтобы они попадали в перевод. Качество генерации поражает, несмотря на небольшие артефакты.
HeyGen дали возможность бесплатно дублировать видео до 2 минут, из-за чего они сейчас под огромной нагрузкой — ждать придётся от нескольких часов и до суток.
В первую очередь пользователи бросились переозвучивать культовые мемы на другие языки. Но технология может перевернуть многие сферы, завязанные на видеоконтент:
- Локализация фильмов или обучающих курсов на другие рынки.
- Масштабирование блогеров на глобальную аудиторию.
- Видеозвонки с синхронным переводом говорящих.
Какие ещё возможности здесь открываются? Давайте побрейнстормим в комментах.
TikTok Shop вчера официально запустился в US, раскатив фичу на 100 млн новых пользователей. Теперь всем доступны in-app покупки товаров из видео и лайвстримов. До этого TikTok Shop мощно вырос в Китае и Юго-Восточной Азии — теперь ребята хотят повторить успех на американском рынке.
Для криэйторов сделали встроенные affiliate-коллаборации, для брендов — интеграции с популярными e-com платформами типа Shopify. В Тиктоке утверждают, что продают товары уже 200 тыс. US селлеров, основные категории — одежда, аксессуары, косметика.
Помимо возможностей вокруг самого маркетплейса, приход Тиктока в e-com может ускорить и другие тренды, которые взлетели в Китае:
- Продажи товаров в лайвстримах (или NPC-стримах)
- Виртуальные инфлюэнсеры и ИИ-аватары для екоммерса
- Shoppable videos в интернет-магазинах (мой знакомый делает Unodos.io)
- Video-first поиск товаров. 51% зумеров уже предпочитают для поиска TikTok, а не Google.
Slack App Store
Корпоративный мессенджер Slack тоже пошёл по пути супераппа и на днях выкатил большое обновление для своего магазина приложений. Вот что добавили нового:
- Связки с другими сервисами (Zoom, Outlook, Salesforce и др.) прямо внутри Slack.
- Бесплатный хостинг приложений на их enterprise-grade инфраструктуре.
- Nocode-конструктор расшариваемых приложений и автоматизаций, аля Zapier.
- Редизайн мессенджера с фокусом на добавление новых аппок (теперь называют себя OS for work)
В прошлом году Телеграм тоже делал шаги в сторону 3rd party apps, но похоже эта тема сдулась. С другой стороны, у Слака здесь намного больше возможностей — обширная база корпоративных пользователей + гигантская материнская компания Salesforce за плечами.
Подобные маркетплейсы приложений — отличная возможность для стартеров протестировать новый продукт (см. пост Михаила Табунова из FUNCORP). Вместо того чтобы тратить кучу денег на standalone-app и трафик, сначала лучше «прицепиться» к существующей базе пользователей.
LLaVa — опенсорсная мультимодальность
Пока OpenAI не спешат прикручивать картинки к GPT-4, опенсорс-комьюнити делает свои версии. Одни чуваки придумали хитрый способ натренировать Лламу на распознавание картинок, с помощью сгенерированного датасета от GPT-4.
Результатом стала модель LLaVa — она понимает происходящее на изображениях и может отвечать на вопросы. Код и датасет доступны на Гитхабе.
Уже пошли надстройки над Ллавой: ребята из Adobe дообучили эту модель на паре картинка-текст и зарелизили LlavaR, которая намного лучше распознаёт текст на изображениях.
В целом, мультимодальность должна стать следующим рубежом языковых моделей, и здесь пока нет явного победителя. OpenAI затизерили что-то на ноябрь, но это не gpt-5 или 4.5. Вполне возможно, будет обещанный релиз мультимодальных возможностей gpt-4.
Generative Social
Выходцы из Google Brain на днях выпустили бета-версию Ideogram — что-то среднее между Инстаграмом и MidJourney. Устанавливаете юзернейм, генерите картинки и публикуете в своём профиле.
Их секретный соус — качественная генерация текста на изображениях. Постеры, мемы, лого, стикеры — всё это получается довольно неплохо. Скорее всего, другие генераторы тоже скоро подтянут эту технологию — рынки предсказаний уже воодушевились. Как водится, в Твиттере снова заговорили про конец SMM-щиков и графических дизайнеров.
В целом, получился интересный микс GenML и социальных механик. Меметичность, вау-эффект и бесплатность привлекли в Ideogram уже 100k пользователей за неделю. Под это дело ребята подняли $16М от именитых фондов a16z, Index Ventures.
Какие ещё проекты можно запустить на стыке GenML + Social? Давайте побрейнстормим в комментах.
Synthetic Humans
С появлением файнтюнинга gpt-3.5 и llama-2 открылось новое направление для AI-прогресса. К примеру, WizardCoder, файнтюненая версия Code Llama, уже побеждает в тестах GPT-4.
Но тут все снова вспомнили, что «data is the king». Чтобы собрать хороший датасет для дообучения моделей, нужно потратить кучу времени и денег. Некоторые инструменты упрощают процесс — например, Langchain Loaders позволяют автоматически загружать сообщения из мессенджеров или почты, и на их основе тренировать модель.
Другое многообещающее направление — синтетические данные. История с Unnatural Code Llama мощно подогрела интерес к этой сфере. Недавно я наткнулся на request for startups от Weekend Fund — ребята ставят на то, что следующий ИИ-сдвиг будет связан с Synthetic Humans. Это модели и софт, которые будут имитировать человеческое поведение, но управляемо и масштабируемо. Примеры:
- User research на базе ИИ-участников (Roundtable).
- Файнтюнинг моделей под каждого человека — его психотип, привычки, интересы. Сейчас всё упирается в датасет, но синтетические данные могут решить эту проблему. И у всех будет личный AI-коуч или терапевт.
- Виртуальные коллеги, продавцы или даже кофаундеры. Натренированные на готовом датасете, либо сгенерированном по вашим предпочтениям.
Интересные и неочевидные возможности вокруг файнтюнинга моделей мы обсудим на онлайн-брейншторме в четверг, 31 августа. Если вы хотите поучаствовать и найти соратников — присоединяйтесь к нашему закрытому каналу Трендоскоп Lab. Подать заявку можно в этой Гугл-форме. Велкам 🙂
AI-переводчик от Меты
Meta вчера опенсорснули самый мощный нейро-переводчик на сегодняшний день, под названием SeamlessM4T. Он понимает 100 языков и умеет:
- распознавать речь;
- переводить из речи в текст и наоборот, через синтез голоса;
- переводить speech-to-speech;
- понимать сразу несколько языков в одном предложении.
Модели выложили на Гитхаб, есть и небольшие версии для on-device перевода. Протестировать можно в онлайн-демке.
Sci-Fi — лучший источник идей
После новости о сверхпроводнике при комнатной температуре, интернет перевозбудился — люди снова начали мечтать о доступных квантовых компьютерах, левитирующих поездах и прочих крутых штуках. И даже несмотря на то, что этот сверхпроводник оказался фейком, запал никуда не делся.
Паки, автор рассылки Not Boring, подметил такую вещь: идеи новых прорывных технологий почти всегда сначала появляются в Sci-Fi, прежде чем воплощаются в реальной жизни. Про ветряные станции и электроавтомобили писали в Sci-Fi 19 века; интернет, екоммерс и удалёнку описывали за 100 лет до их создания.
В итоге Паки вооружился ChatGPT и сайтом Technovelgy с описанием идей и девайсов из научной фантастики — и создал Гугл-табличку с банком 3000+ Sci-Fi идей. 25% «технологий будущего» из книг сегодня воплотились в жизнь.
Другими словами, Sci-Fi — золотая жила для поиска идей стартапов. Космические фабрики, медитация по ЭЭГ, AI-компаньоны — всё это было фантазиями авторов, прежде чем стать многомиллионными компаниями.
Text-to-voice в реальном времени
На этой неделе 2 лидера в области generative speech обновили свои апишки:
- Eleven Labs представили «input streaming» — фича позволяет передавать ответы LLM и генерировать речь с задержкой менее 1 секунды.
- PlayHT обновили свою модель до версии 2.0. Также стала доступна realtime-генерация, плюс модель научили новым языкам, акцентам и эмоциям.
Похоже, мы вступаем в эру настоящих войс-ассистентов, совсем как в фильме «Her». Ну и множество других применений рилтайм-генерации речи — от живых NPC в играх до умных телефонных прозвонщиков.
Гиганты рвутся в стейблкоины
PayPal вчера запустил свой стейблкоин PYUSD на базе Эфира. Выпускает его компания Paxos — они же стоят за бинансовским стейблом BUSD.
Конечно, из-за американского регулирования PYUSD будет ближе к CBDC, чем к «настоящим стейблкоинам». Но это должно помочь в mass adoption — PayPal обещают интегрировать стейбл в свою платформу и их популярное приложение для переводов Venmo.
Другие платёжные гиганты сейчас также активно экспериментируют со стейблкоинами. Visa пилотирует программу глобальных расчётов с помощью USDC. Mastercard тоже смотрит в эту сторону. Stripe собрал целую команду, которая занимается платёжной инфраструктурой вокруг стейблов.
Причина такого интереса — нащупанный product-market fit, что нечасто встретишь в крипте. Более миллиона ежедневно активных кошельков, $120В+ стейблов в обороте (рост х20 с начала 2020). Понятная и привлекательная экономика для эмитентов — продаём токены, получаем доллары и вкладываем их под 5% в US трежерис. Tether по такой схеме отрапортовал о $850М прибыли за прошлый квартал.
Поэтому здесь появляется хорошая возможность для стартеров — создавать сервисы вокруг стейблкоинов. Например, необанки (Eco, DolarApp), трансграничные B2B-платежи (Cedar), инфраструктурные решения (Bridge).
Инновации в борьбе с лишним весом
В Америке идёт настоящая эпидемия ожирения — доля мужчин с ожирением выросла в 4 раза за 50 лет, женщин — в 10 раз. И это стабильно health concern №1, опережающий даже ментальное здоровье. Похожая картина наблюдается и в других странах.
И недавно появилось то, о чем все мечтали — «волшебная таблетка» для похудения: одобренные FDA препараты Ozempic и Wegovy. Задумывались они для лечения диабета, но показали эффективность в борьбе с лишним весом и снижении аппетита. Побочек тоже довольно много, но это не остановило людей.
Начался мощный хайп на программы похудения с приёмом подобных препаратов. В Тиктоке вирусятся видосы, хэштег #ozempic набрал более миллиарда просмотров. Ажиотаж привёл к дефициту препаратов, который продолжается и по сей день.
Стартапы тоже вовсю ловят тренд:
- Основатель Instacart недавно поднял $30М на свой новый проект Sunrise — это онлайн-платформа врачей + ежемесячная подписка на таблетки для похудения.
- Появляются платформы «Ozempic-коучей», которые составляют индивидуальные программы похудения и проверяют выполнение каждый день.
- Некоторые заходят с более технологичной стороны — к примеру, Signos создали сервис похудения по датчику глюкозы.
Stability AI зарелизили новую модель для генерации изображений SDXL 1.0. Вот что в ней интересного:
- Мощно нарастили качество генерации, фотореализм уже на уровне Midjourney.
- Частично решили проблему с трудными для генерации объектами — руки и текст получаются намного лучше.
- Уже не требуется сложный промптинг — хорошие результаты генерятся «из коробки».
- Работает на обычных GPU с 8 ГБ VRAM.
- Чуть позже обещают выпустить инструменты файнтюнинга и ControlNet, заточенные под новую модель.
Веса и код SDXL уже доступны, модель теперь открытая для коммерческого использования. Попробовать можно в ClipDrop и DreamStudio.
Интерактивные имейлы
Я читаю довольно много email-рассылок и в последнее время начал часто натыкаться на «интерактивные письма» — когда предлагают прямо в письме оформить заказ, подтвердить подписку или добавить товар в корзину. См. видос — это рекламная кампания Feastables, бренда шоколадок от популярного ютубера MrBeast.
В Твиттере пишут, что конверсия таких писем кратно превосходит стандартные. Появляется возможность «имейл-геймификации» + часть юзерфлоу можно перенести прямо в Gmail.
Строится такое на Гугловской технологии AMP — по сути, это мини-сайты прямо в письмах. AMP выкатили ещё в 2019, но особого успеха технология не имела — нужно было тратить драгоценный ресурс разработки. Теперь же появляются no-code виджеты, которые интегрируются с популярными e-com платформами.
Сейчас формат AMP поддерживают клиенты Gmail, Yahoo, Mail.ru. Это 60% рынка в US, 80% в РФ.
Вполне возможно, что такой формат скоро станет мастхевом для брендов — экономия кликов и вау-эффект должны дать свои плоды.
Релиз LLaMa-v2
Meta вчера выпустили вторую версию опенсорсной языковой модели LLaMa. Теперь она открыта официально, в том числе и для коммерческого использования. Вот основные характеристики:
- Сейчас доступны 3 модели — на 7, 13 и 70 В параметров. Есть версии, заточенные на чат.
- Контекстное окно 4k токенов (в 2 раза больше предшественницы), сама обучена на 2Т токенах (+40%)
- Активно ставят на on-device ML: запартнерились в этой теме с Microsoft (для просчета на винде + в облаке Azure). А также с Qualcomm — обещают в следующем году поддерживать работу на смартфонах с их чипами.
В Твиттерах пишут, что качество (на английском) сопоставимо с GPT-3.5, несмотря на куда меньшее число параметров. Затестить разные версии Лламы уже можно на Replicate (13В), Perplexity (7В) и Hugging Face (70В). А для своих проектов — см. код на GitHub и скачивайте веса с HF.
Тренды использования B2B SaaS
Сервис для управления корпоративными SaaS Productiv выпустил неплохой отчёт о состоянии этой сферы. Вот краткая выжимка:
- Компании продолжают наращивать число используемых сервисов, несмотря на экономическую ситуацию. Крупные организации в среднем подписаны на 370 SaaS — это число выросло на 32% с 2021 года.
- При этом более половины купленных сервисов не используются — это характерно как для корпораций, так и для SMB.
- Средние траты на SaaS в пересчете на сотрудника достигли $10k — это уже превышает затраты на медицинские страховки сотрудников.
- Самые популярные сервисы в компаниях — на картинке. В отчёте также есть разбивка по департаментам. Основная динамика везде идёт в сторону product-led B2B SaaS.
- Ещё есть статистика по shadow IT — это сервисы, которыми сотрудники пользуются в обход корпоративных IT-систем. В топе — Evernote, Coursera, Canva. Из новичков в этом году в топ-20 попали ChatGPT, Doodle (планирование митингов), RocketReach (поиск лидов).