Обзор стартап-возможностей. @vladimir_zakoulov - здесь разбор полётов.
Виртуальные знаменитости
В Южной Корее набирает популярность новая K-pop группа Mave. Её фишка в том, что все участницы — виртуальные персонажи, сгенерированные ИИ и «файнтюненные» живыми дизайнерами. Под капотом поют и двигаются ноунейм актёры, а на них уже натягивают виртуальных инфлюэнсеров. Главный инвестор Mave — корейский ИТ-гигант Kakao.
С точки зрения медиабизнеса это крутая штука — не нужно работать с живыми айдолами, которые могут выгореть или постареть. Но пока непонятно, как аудитория воспримет виртуальных знаменитостей. Было много экспериментов с витюберами и стримерами-анимешками, но «кожаных» инфлюэнсеров люди пока смотрят активнее.
При этом технологии в этой теме развиваются стремительно, благодаря новым прорывам в ИИ. Несколько примеров из недавнего:
- Видос со сгенерированным аватаром в новой версии Midjourney v5 + анимацией от D-iD.
- Демка от Inworld — нескриптованные AI NPC для игр, прямо в Unreal Engine.
- Демка от Wonder Studio — «убийца всех видеоредакторов». ИИ делает все сам: режет маски, удаляет фон, трекает камеру и персонажа и т.п.
Языковые модели в опенсорсе
У языковых моделей после слива LLaMA наступил «Stable Diffusion-момент» — опенсорс сообщество начало активно играться и оптимизировать модельки. Чуваки уже умудрились сжать модель так, чтобы она работала на обычном макбуке и даже смартфоне. Другие ребята дообучили LLaMA с помощью инструкций от GPT-3 (по API) и фактически получили свою локальную GPT-3, сравнимую по качеству.
Дальше — больше: выходцы из OpenAI на днях релизнули опенсорсную альтернативу ChatGPT под названием OpenChatKit. На Гитхабе есть скрипты для тренировки на своих данных. А значит, скоро нас ждёт ещё больший бум чатботов и ассистентов везде где только можно.
Даже Гугл впервые приоткрыл свою ИИ-завесу: сегодня они анонсировали API к PaLM — своей языковой модели, чтобы поконкурировать с OpenAI. Для разработчиков доступен low-code конструктор AI App Builder, чтобы быстро запускать свои сервисы на базе PaLM.
В комментариях традиционно обсуждаем возможности, которые открываются для стартеров на фоне этого тренда.
ИИ-ассистент для каждой должности
На днях вышло контролируемое исследование о том, как ChatGPT влияет на интеллектуальную работу. Результаты впечатляют: стандартные рабочие задачи по типу составления отчетов и написания имейлов выполнялись на 37% быстрее, если сотруднику помогал ChatGPT. Среднее качество выполнения также повысилось, как и удовлетворенность сотрудника от работы.
В другом исследовании замеряли, как ИИ-помощник Github Copilot влияет на продуктивность программистов. Скорость выполнения типовой задачи выросла на 55%. Для сравнения: внедрение паровых двигателей в 19 веке увеличило производительность фабричных рабочих только на 25%.
Программисты в Штатах суммарно получают $464В ежегодно — представьте, какой рынок открывается для ИИ-ассистентов. А другим профессиям подобные инструменты нужны и подавно — маркетологи, сейлзы и прочие менеджеры сталкиваются с рутиной и булщитом намного чаще.
И кто бы мог подумать, что драйвером в этой сфере станут скучные корпорации — они все как один спохватились и начали внедрять AI Copilots в свои продукты:
- Microsoft на днях представили ИИ-ассистента для своих бизнес-приложений Dynamics 365, с фокусом на сейлзах. ИИ поможет отвечать на звонки клиентов, подводить итоги совещаний и генерировать коммерческие предложения. На следующей неделе Microsoft по слухам анонсируют ИИ-помощников в приложениях пакета Office.
- Salesforce представили своего ИИ-помощника Einstein GPT, который будет жить в CRM и Slack. Задачи схожие — генерить персонализированные имейлы, отвечать на вопросы коллег и клиентов, делать выжимки документов. Также Salesforce основали фонд на $250М для инвестиций в GenAI-стартапы.
- Hubspot анонсировали своего помощника ChatSpot. Подсвечивают 2 юзкейса: устранение рутинной работы белых воротничков + понимание данных компании по запросам на естественном языке.
- Meta потихоньку сворачивают метаверс-инициативы и фокусируются на ИИ-продуктах.
Компании поменьше тоже не остаются в стороне: ИИ-ассистентов уже внедрили Notion, Discord, Grammarly и многие другие. За прорывной технологией последовала волна реальных продуктов — причём гораздо быстрее, чем в прошлом.
В комментариях традиционно обсуждаем возможности, которые открываются для стартеров на фоне этого тренда.
Meta на днях выпустили новую языковую модель под названием LLaMa. Изначально они планировали дать открытый доступ ресерчерам, но уже через пару дней веса утекли в сеть — сейчас кто угодно может скачать торрент и завладеть моделью, сравнимой по качеству с GPT-3. И зафайнтюнить как им нравится, не боясь быть отрезанными от API.
Что ещё удивляет — стремительное снижение требований к железу. Всё семейство моделей LlaMa весит 200 ГБ, самая маленькая из 7В параметров — только 16 гб. И её можно запустить локально на паре consumer-grade видеокарт.
Это напомнило недавнюю историю, как Qualcomm удалось запустить Stable Diffusion на обычном смартфоне. В общем, тренд на демократизацию доступа к ИИ-моделям продолжается.
Апдейт по VR: зима началась
На днях к журналистам попал внутренний план Meta Reality Labs. Вице-президент по VR признал, что команда изо всех сил пытается привлечь людей к использованию Quest 2. Новые когорты пользователей показывают всё меньшую вовлечённость.
Также он поделился суммарными продажами устройств: Meta продала 20 миллионов Quest всех моделей, что сравнимо с продажами последних консолей Xbox и PlayStation. Но подразделение Reality Labs глубоко убыточно, и новые инициативы проваливаются. Флагманская гарнитура Quest Pro не продаётся — пришлось устраивать распродажи по цене в $1100 вместо первоначальных $1500.
В этом году Meta выпустит Quest 3. Главная проблема, по мнению VP — убедить людей заплатить «немного больше», чем за Quest 2 ($400). В пайплайне на следующие 4 года — более доступный VR-девайс под кодовым названием Ventura, новые смарт-очки Ray-Ban и AR-гарнитура.
Пока весь этот банкет за счёт рекламного бизнеса Meta и рвения Цукерберга. Но эпоха дешёвых денег кончилась — в компании уже обсуждают второй раунд увольнений. И это после того, как Meta в ноябре сократила 13% штата (11 тыс. человек).
Другие корпорации тоже прочувствовали на себе VR-зиму:
- Microsoft распустили всю команду, которая занималась HoloLens.
- Bytedance тоже увольняют треть сотрудников в Pico — несмотря на то, что в целом им удаётся отгрызать рынок у Цукерберга. За 2022 год Pico продала 700 тысяч очков, в этом году ожидают сокращение продаж.
- Другой китайский гигант Tencent передумал выпускать свою гарнитуру и вместо этого решил перепродавать Meta Quest.
- Apple в очередной раз перенесли презентацию своей гарнитуры Reality Pro — теперь анонс предварительно будет на июньской конференции WWDC. Тесты продукта до сих пор показывают проблемы с софт- и хардверными частями.
Евангелист метаверса Мэтью Болл написал целую колонку о том, что массовое проникновение VR/AR всегда находится «через пару лет». И пока гарнитурам не удастся полностью заместить один из девайсов (PC/Mac, смартфон, планшет, консоль), у них не будет product-market fit.
#ИщуСоратника
Друзья, в нашем закрытом канале Трендоскоп Lab появилась рубрика, с помощью которой стартапы могут искать кофаундеров и основательных сотрудников. В основном канале будем публиковать дайджест с отборными кличами.
1. Вова Закоулов (Автор Трендоскопа и основатель FUNCORP, SpatialChat, XOCUS) ищет двух соратников в свежий стартап на стыке юмора и технологий:
⁃ ML-инженера (с опытом построения Deep Learning RecSys);
⁃ iOS-разработчика (5+ лет опыта).
Если вы любите мемы и готовы покататься на стартапоамериканских горках → пишите в tg @vladimirzakoulov
2. @alexlowholl ищет арбитражника или медиа байера с опытом в дейтинг трафике. Хотелось бы, чтобы имел опыт с whitelabel платформами (prelinked, whitelabeldating), но не обязательно.
Кратко о компании: у нас есть ПО для создания своего сайта знакомств (CMS + моб. приложения). Основной рынок это США и Европа. Хотим выйти в сегмент аффилейтов, для этого нужен человек с доменной экспертизой.
Если вы хотите поучаствовать во «внутреннем стартапе», который делает фаундер с большим опытом в индустрии дейтинг-софта → пишите @alexlowholl
3. @karmanov ищет человека, готового взять на себя роль архитектора и технического писателя. Основная область — бэкенд (облачный хостинг, golang-микросервисы, из БД Postgres, Clickhouse, Redis, Tarantool). Для опытного специалиста объём работ может оказаться малым, так что готовы рассматривать парт-тайм.
Проект — AdTech-сервис. Хоть мы ещё и не вышли в открытый доступ, уже заключены партнёрства с крупными площадками-паблишерами и заказчиками. Фаундеры — выходцы из геймдева с многолетним опыта развития бизнеса в области онлайн-игр.
Для связи → @karmanov
Хотите разместить свой клич? Вступайте в Трендоскоп Lab. Подать заявку на участие можно в этой Гугл-форме (займёт 3-5 минут). Велкам 🙂
OpenAssistant — ваш личный J.A.R.V.I.S.
ChatGPT и другие ИИ-боты — это только первый шаг. Следующая цель — полноценные ассистенты, которые понимают задачи на обычном языке и могут взаимодействовать со сторонними системами (локальные файлы, браузер, процессы на компе и т.д.)
Андрей Карпаты (главный по алгоритмам в OpenAI) недавно анонсировал такого умного ассистента. Уже есть демки, как ChatGPT справляется с некоторыми простыми задачами в браузере — заказать бургер, выложить твит. Возможно, через год-два можно будет отдавать всё более сложные задачи — распарси сайт, сверстай питчдек, пофикси багу.
Open-source сообщество тоже не отстаёт: ребята из Laion недавно представили подобный проект Open Assistant. Сейчас они краудсорсингом собирают датасет с инструкциями и их исполнением от людей. Код и модель обещают выложить в открытый доступ.
Мобильные метавселенные
«Добавляйте меня в Bondee» — такими призывами заполнились соцсети подростков по всей Азии. За пару недель приложение собрало миллионы пользователей и вышло на первое место по загрузкам во многих странах Юго-Восточной Азии.
Bondee — что-то среднее между Sims и Telegram. Можно создать своего аватара и виртуальную комнату, ходить по приватным комнатам друзей и тусить с их аватарами.
Похоже, именно так будут выглядеть метавселенные: mobile-first, с аватарами и социальными фичами. И Bondee далеко не первый проект на этом тренде:
- Крупнейший представитель жанра Roblox на днях отчитался о росте DAU на 19% за год, до 59М. Выручку нарастили в 6 раз за 3 года — до $2В+.
- Корейский проект Zepeto насчитывает 20М активных юзеров в месяц — в 100 раз больше, чем у Цукерберга в Horizon Worlds.
- Теперь тренды задают проекты из Юго-Восточной Азии: помимо Bondee, неплохо растёт сингапурский Bud.
Какие возможности в этой сфере открываются для стартеров? Давайте побрейнстормим в комментах.
LangChain — языковые модели на своих данных
GPT покорили мир. Но они знают только то, на чем были обучены — общедоступные данные из интернета до 2021 года. Они не знают последней информации о мире, ваших личных данных и т.д.
На помощь придёт опенсорсный инструмент LangChain. Он позволяет скормить нейросети любые данные и удобно связать между собой API разных языковых моделей. Вот какие юзкейсы упрощает LangChain:
- Q&A чат-боты по конкретным документам. Примеры: чат-бот по любому Github репозиторию, документации Shopify или тысяче книг в открытом доступе.
- Связки языковых моделей с другими сервисами. Например, ChatGPT + WolframAlpha решает проблему с математикой у ИИ.
- Клонирование вашего стиля — для имейлов или постов в блог.
Сейчас у LangChain идёт челлендж «Chat Your Data», в котором можно пропиарить свой сервис и попасть в их документацию.
P.S. Друзья, для тех, кто готов сканировать более плотный поток стартап-возможностей (в т.ч. нишевых), мы запустили закрытый канал Трендоскоп Lab. Подать заявку на участие можно в этой Гугл-форме (займёт 3-5 минут). Велкам 🙂
Objaverse — самый крупный датасет 3D-объектов
Чуваки из Allen AI Institute выложили в открытый доступ аннотированный датасет из 800k+ 3D-моделей с маркетплейса Sketchfab. Это на порядок больше, чем все предыдущие наборы.
Авторы пишут о нескольких потенциальных применениях:
- Новые модели для text-to-3D генерации.
- Более точное распознавание объектов в AR-приложениях.
- Поиск исходников для игр (уже прикрутили в Mirage).
AI медиакомпании
Крупнейший развлекательный сайт в US BuzzFeed на днях сократил 12% штата — и заменил сотрудников инструментами OpenAI. Теперь кликбейтные заголовки и квизы делает ChatGPT, а обложки к статьям — DALL-E. Инвесторы BuzzFeed оценили этот шаг: после новости акции компании подорожали в 2 раза.
Ждём эпоху «синтетических медиа»? Алгоритмы и до этого знали, какой контент лучше зайдёт — теперь же они могут его создавать напрямую:
- GPT напишет текст, имитируя стиль и настроение человека.
- С помощью WellSaid или Unreal Speech можно синтезировать голос, неотличимый от человеческого.
- Synthesia и Pictory позволяют сгенерировать видео из текста, а нейронка от Papercup локализует их на другие языки.
- Вместо живых знаменитостей можно использовать их фотореалистичные дипфейки.
- Так можно генерировать контент в промышленных масштабах и вычленять самые конверсионные варианты с помощью сервисов по типу Mutiny.
Приложения для поиска друзей
На днях вышел свежий отчёт Data.AI по рынку мобильных приложений (pdf в комментах). Они пишут про растущий тренд на «friending apps» — приложения для поиска онлайн-друзей, которые стали особенно популярны среди зумеров. Несколько примеров:
- Yubo — Тиндер для поиска друзей в чатах и прямых эфирах.
- Hoop — найди новых друзей в Snapchat.
- Vina — поиск подружек по всему миру.
Гиганты дейтинга тоже смотрят в сторону «платонических отношений». Bumble запустили подобную фичу у себя, после этого среднее время в приложении выросло на 16%. Компания-владелец Tinder недавно купила южнокорейское приложение для поиска друзей Hyperconnect за $1.73В.
Эпидемия одиночества играет на руку подобным проектам. Средний американец не заводил новых друзей более пяти лет. А вообще нет друзей у 22% миллениалов — это в 4 раза больше, чем у их ровесников 30 лет назад.
При этом в качестве заменителя живой социализации многие начали выбирать онлайн. Поэтому решением проблемы одиночества могут стать приложения для поиска новых друзей, либо CRMки для поддержания существующих отношений (Queue, Dex).
P.S. Друзья, для тех, кто готов сканировать более плотный поток стартап-возможностей (в т.ч. нишевых), мы запустили закрытый канал Трендоскоп Lab. Подать заявку на участие можно в этой Гугл-форме (займёт 3-5 минут). Велкам 🙂
Образование в эпоху ChatGPT
NY Times пишет, что американские колледжи начали активно менять свои образовательные программы после хайпа ChatGPT. Под особенной угрозой оказались эссе и стандартные тесты — нейронка справляется с ними на уровне студента-хорошиста. Также ИИ-чатботы спокойно сдают юридические и медицинские экзамены.
Поэтому среди педагогов начались дебаты, что делать с ИИ — банить, игнорировать или внедрять? Государственные школы в Нью-Йорке и Сиэтле забанили ChatGPT в своих Wi-Fi сетях, что только подогрело интерес к технологии у школьников. Некоторые преподы обращаются к сервисам по типу Turnitin, которые определяют сгенерированные сочинения.
Другие же применяют принцип «если не можешь победить, возглавь». Прогрессивные педагоги поощряют ИИ и внедряют ChatGPT/MidJourney в школьные программы — так можно повысить планку работ, ведь уже не будет оправданий в стиле «у меня плохо с грамматикой/творчеством/идеями». Тем более, что качественный результат тоже нужно постараться получить, с помощью промт-инжиниринга и факт-чека.
Для самих преподавателей ИИ-инструменты тоже могут стать хорошим подспорьем в работе:
- ChatGPT поможет с составлением плана урока и персонализирует программу под особенности учеников.
- Elicit и Explainpaper объяснят последние научные статьи простым языком.
- Embedding-модели можно использовать для ответов на часто задаваемые вопросы студентов (см. Edgi Bot).
- DALL-E и Stable Diffusion сгенерируют арт для обучающих комиксов.
По всему миру сейчас острый недостаток учителей — например, американским школам не хватает 300к преподавателей, особенно в сельских и малообеспеченных районах. ИИ может здесь помочь — и подтолкнуть устаревшую образовательную систему к изменениям.
Какие возможности для стартеров открывает этот тренд? Давайте побрейнстормим в комментариях.
Text2image справляется с текстом на картинке
Слабое место всех text2image генераторов — текст на изображении. Его не осиливают ни DALL-E, ни Stable Diffusion. Но скоро мы увидим прогресс в этой области:
- Google Research презентовали новую модель Muse. Помимо того, что генерация ускоряется в несколько раз, модель ещё и может генерировать картинки с текстом на них. Но так как это Гугл, вряд ли мы сможем использовать Muse в своих проектах.
- Stability AI всё подогревают интерес к новой лабе DeepFloyd — они создали модель на базе Stable Diffusion под названием IF. Три крутые вещи, на которые намекают создатели: модель может в текст на фото; справляется с генерацией ладоней; будет опенсорсной.
Текст на изображении был «узким местом» text2image. Если оно и правда будет расшито, появится много новых юзкейсов — вплоть до убийц Canva и Figma.
P.S. Друзья, для тех, кто готов сканировать более плотный поток стартап-возможностей, мы запустили закрытый канал. Подать заявку можно в этой Гугл-форме. Велкам 🙂
ChatGPT пожирает Google
Недавно мы писали, что GPT-3 может пошатнуть поисковую монополию Google. После релиза ChatGPT это стало ещё ближе к реальности. Уже сейчас качество ответов чатбота в некоторых тематиках заметно превосходит Гугл, хотя нейронка даже не оптимизирована под эту задачу и не умеет выходить в интернет.
В Google после успехов ChatGPT объявили «красный код» — выделили дополнительные ресурсы на разработку конкурирующих продуктов, на базе их языковых моделей LaMDA. Но пока непонятно, как при этом сохранить рекламные доходы — они до сих пор составляют 80% выручки компании.
Главный инвестор OpenAI — Microsoft — решил по-настоящему поконкурировать с Гуглом. Они планируют интегрировать ChatGPT в свою поисковую систему Bing. Компании поменьше тоже ставят на чатботов в качестве «убийц Гугла»: подобные фичи запустили поисковики You.com, Perplexity, Neeva.
Новая волна чатботов во главе с ChatGPT действительно может «переизобрести» традиционный интернет-поиск. Конечно, нейронки любят придумывать факты — но с текущим темпом развития ИИ, эта проблема тоже вскоре будет решена.
Для продуктов же ИИ-чатботы станут такой же фичей, как и в своё время mobile. Например, крупнейший сервис вопросов и ответов Quora уже интегрировал ChatGPT в свою платформу. И это лишь начало: везде, где нужно работать с контентом (текст, картинки, код), появится «подпорка» в виде ИИ-чатбота.
Какие возможности для стартеров открывает этот тренд? Давайте побрейнстормим в комментариях.
Релиз GPT-4: новые возможности для стартеров
OpenAI вчера выпустили долгожданную ИИ-модель GPT-4. Вот 3 её главных преимущества, которые были невозможны или труднодостижимы с предыдущими моделями:
1. Понимает не только текст, но и изображения. В ответ выдает всё ещё только текст. OpenAI привели крутой юзкейс: чувак набросал на бумажке дизайн сайта, сфоткал и попросил нейронку сделать веб-страницу. GPT-4 выдала рабочий код и наполнила страницу контентом.
Пока функцию приёма изображений открыли единственному партнёру — приложению Be My Eyes, которое помогает слабовидящим людям ориентироваться по фоткам со смартфона. В будущем обещают открыть доступ для всех, что даст мощный толчок браузерным и мобильным ИИ-ассистентам.
2. Принимает на вход до 32 тыс. токенов — это 25 тыс. английских слов или 50 страниц текста. Можно скармливать нейросети целые документы, репозитории, короткие романы и т.д. Раньше для этого нужен был LangChain, а теперь GPT-4 обработаёт всё «из коробки».
И хотя цены на API значительно выросли (в 3 раза по сравнению с самой большой GPT-3), мы фактически получаем личного консультанта, который работает за копейки в час.
3. Значительно меньше «галлюцинирует», даже без промт-инжиниринга: OpenAI на демо спокойно проводили математические вычисления. Стандартные студенческие экзамены щёлкает как орешки. При этом показывает хорошие результаты на многих языках — Duolingo уже сделали мультиязычного ИИ-репетитора на базе GPT-4.
Записаться в API waitlist — здесь, а поиграться с моделькой уже можно с подпиской ChatGPT Plus ($20/mo).
P.S. Друзья, для тех, кто готов сканировать более плотный поток стартап-возможностей (в т.ч. нишевых), мы запустили закрытый канал Трендоскоп Lab. Подать заявку на участие можно в этой Гугл-форме (займёт 3-5 минут). Велкам 🙂
Смарт-аккаунты в Ethereum
Пока на дворе криптозима и банки лопаются один за другим, строители продолжают строить. Команда Ethereum на днях выпустила обновление ERC-4337, которое криптаны уже назвали «крупнейшей web3-революцией со времён The Merge».
Обновление приносит новый тип криптокошелька — смарт-аккаунт, который будет удобно использовать даже «нормисам». Ведь мало кто хочет разбираться, как работает блокчейн и что такое seed-фраза. Это один из барьеров, который мешает web3 подключить заветный «миллиард пользователей».
Основная идея ERC-4337 — создать оболочку поверх стандартных кошельков, чтобы их функционал тоже можно было программировать. Это даст масштабный UX-скачок:
- Seed-фразу больше не нужно запоминать или хранить в сейфе — восстановить доступ можно через доверенных пользователей или платформы. Становится доступна двухфакторная аутентификация.
- Бандлинг транзакций: можно один раз получить подпись и проводить транзакции без дальнейших подтверждений. Также можно настроить кастомные лимиты — по времени/ dApp'у / обороту.
- Внешнее управление: компании могут самостоятельно выпускать кошельки для юзеров, а также спонсировать газ за транзакции.
- Появляется возможность рекуррентных платежей и подписок. Причём в любых ERC-20 токенах — с автоконвертацией по установленному курсу.
Смарт-аккаунты теперь доступны во всех сетях, совместимых с EVM — Polygon, BNB Chain и другие. Чтобы стимулировать создание сервисов вокруг новой технологии, Ethereum Foundation запустили гранты до $50k для разработчиков.
В общем, web3 постепенно получает те же функции, что и банки — не теряя при этом децентрализации. Какие возможности здесь открываются для стартеров? Давайте побрейнстормим в комментах.
#ИщуСоратника
Дима @khanarin (ex-McKinsey, 2x founder, строит docare.io) ищет AI CTO-кофаундера в продукт-революцию о том, как люди делятся негативным фидбеком.
Суть — сделать так, чтобы давать негативный фидбек было легко и не затрачивало силы. Вы отмечаете эмоции, которые испытываете во время взаимодействий людей, а AI увязывает это с контекстом встречи и формирует фидбек по компетенциям и personality.
Это, в свою очередь, будет обогащать данными performance review, а также облегчать 1-1ы и оценку людей. Идея провалидирована с 10+ HR директорами, 20+ фаундерами, а также топ-менеджерами HR единорогов. Есть 10+ коммитов на пилоты и пре-коммиты от VC.
Для связи → @khanarin
Хотите разместить свой клич для поиска кофаундера или основательного сотрудника в стартап? Вступайте в наш закрытый канал Трендоскоп Lab. Подать заявку на участие можно в этой Гугл-форме (займёт 3-5 минут). Велкам 🙂
ChatGPT и Whisper доступны по API
OpenAI продолжают нас радовать. На днях они выпустили API для двух ИИ-моделей:
1. GPT-3.5-turbo, которая под капотом у ChatGPT. Стоимость составляет всего $0.002 за 750 слов — это в 10 раз дешевле, чем у прошлой модели text-davinci-003.
OpenAI приводят несколько юзкейсов:
- Обучающая платформа Quizlet использует ChatGPT API в качестве ИИ-репетитора — он создаёт квизы для студентов, помогает практиковать иностранный язык, рассказывает истории.
- Сервис доставки продуктов Instacart теперь отвечает на любые вопросы о еде — например, посоветует рецепты исходя из бюджета или кулинарных предпочтений. Тут же можно добавить в корзину продукты, которые посоветовал чат-бот.
- Конструктор интернет-магазинов Shopify создал ИИ-помощника для покупок на базе ChatGPT. Описываете чат-боту, что вы хотите купить — и он тут же рекомендует вам подходящие товары из каталога.
2. Также OpenAI выкатили API для Whisper — speech-to-text модели, которая близка к человеческому уровню распознавания английской речи. Саму модель выложили в опенсорс в прошлом году, теперь же можно быстро запускать свои сервисы на базе API.
Создатели приложения для подкастов Snipd интегрировали Whisper и поделились результатами: теперь у них практически идеальные транскрипты для любого английского подкаста. И сейчас это возможно в любом сервисе, всего за $0.006 в минуту.
Какие возможности для стартеров открывают новые API от OpenAI? Давайте побрейнстормим в комментах.
ControlNet — контролируй text2image генерацию
Чуваки из Стенфорда выкатили в опенсорс классный набор инструментов ControlNet — «img2img на стероидах». Он позволяет дать на вход text2image другие виды входов (не только текста). Так можно заставить SD и другие модели генерировать картинки на основе:
- скетча/наброска от руки;
- позы человека;
- карты глубины/нормалей.
Также можно обучать модельку на своих данных и миксовать разные инструменты между собой. Есть демка на Huggingface. А также хороший гайд для старта.
WebApps теперь и на iOS
Раньше Apple не разрешала использовать сторонние веб-движки на iOS — Chrome и другие браузеры использовали Webkit, на котором работает Safari. При этом функционал Webkit отставал от альтернатив — это направление было для Apple второстепенным, т.к. каннибализировало нативные приложения.
Но теперь регуляторы ЕС продавили Apple — компания будет вынуждена разрешить сторонние веб-движки. Google и Mozilla уже работают над портом своих движков под iOS.
Поэтому и яблочники начали активно причёсывать свой Webkit. На неделе они выпустили большое обновление для разработчиков вебаппов:
- Движок Webkit теперь может присылать уведомления на iOS через Web Push. Браузерные оповещения выглядят так же как и от обычных приложений — показываются на локскрине и Apple Watch, работают с новыми режимами фокусировки внимания.
- Появилась возможность добавлять на рабочий стол иконки вебаппов из сторонних браузеров.
- Также для вебаппов завезли бейджики непрочитанных уведомлений.
Какие возможности для стартеров открывают эти нововведения? Давайте побрейнстормим в комментах.
Медицинские чат-боты
ChatGPT прошёл USMLE — американский тест для разрешения на работу врачом. Английский Минздрав одобрил использование медицинского ИИ-бота, после того как он диагностировал психологические расстройства 130 тыс. пациентов с 93% точностью (на уровне живых врачей). Боты от Wysa и Woebot доказали эффективность при тревоге и депрессии, и получили одобрение FDA.
Microsoft тоже смотрят в эту сторону: недавно они представили BioGPT — языковую модель, обученную на базе научных работ PubMed. Появляются инициативы и по созданию опенсорсных моделей — например, MedArc от выходцев из Stability AI.
Сейчас более четверти взрослых страдают от расстройств психического здоровья, а терапевты в дефиците — поэтому ИИ-боты могут быть хорошим решением для не острых случаев.
Веб-дизайн на ИИ-стероидах
Генерацией картинок уже никого не удивить. Теперь ИИ постепенно нащупывает рынок дизайна интерфейсов. Вижу 2 больших тренда в этой области:
- Prompt-driven design. Например, плагин для Фигмы Magician позволяет «не отходя от кассы» генерировать уникальные иконки и картинки. Text-to-figma собирает по запросу целые UX-паттерны (формы с кнопками и т.п.) Genius делают полноценного ИИ-помощника, который дополняет проект новыми блоками, будто реальный коллега сидит и рисует интерфейс вместе с вами.
- Совмещение дизайна и кода. Webflow сделали плагин, который позволяет перевести статичный дизайн из Фигмы в готовый сайт на Webflow. И наоборот, плагин html.to.design превращает любой сайт обратно в редактируемый макет.
Всё идёт к тому, что скоро мы сможем попросить ИИ нарисовать сайт, «похожий вот на эти два, но красненький». И получить дизайн и код, готовые к продакшену.
Проблемы гигантов соцмедиа
Наткнулся на статью The Generalist — авторы пишут, что крупные соцсети ещё никогда не выглядели такими слабыми одновременно:
- Facebook стареет, подрастающее поколение там не сидит вообще. Инстаграм пытается успеть за Тиктоком, пока Цукерберг сместил фокус в сторону метаверса.
- Сам TikTok столкнулся с геополитикой между Штатами и Китаем, как следствие его могут отрезать от вкусного рынка US.
- Snapchat никак не найдёт монетизацию и страдает от рекламных ограничений Apple. Другие направления (очки, дроны) полностью провалились.
- Twitter — Илон Маск.
Поэтому в 20-е годы может вырасти новая большая соцсеть с другой парадигмой. Стартаперы всё пытаются её нащупать — например, близкий коннекшн с друзьями (BeReal), web3 (Mastodon, Lens Protocol), GPT (Artifact от фаундеров Инстаграма).
Апдейт по XR-гарнитуре Apple
У Bloomberg вышел новый слив по долгожданной Reality Pro. Вот что интересного будет в яблочном девайсе:
- Управление интерфейсом с помощью взгляда и жестов. Это возможно благодаря внешним камерам для отслеживания рук и внутренним датчикам для считывания глаз. Физических контроллеров в шлеме не будет.
- Для популярных приложений будут 3D-альтернативы в xrOS. Под новый девайс адаптировали браузер Safari, App Store, почту и другие сервисы.
- VR-звонки по FaceTime. Два человека с Reality Pro смогут общаться в виртуальном пространстве, как будто они вместе в одной комнате.
- Внешний монитор для маков. Можно настроить монитор в VR, а управлять компьютером с помощью клавиатуры и трекпада.
- Глубокая интеграция с голосовым помощником Siri. Можно будет создавать свои AR-приложения, просто сканируя окружающие объекты и болтая с Сири. Apple даже могут представить свою no-code платформу по типу Roblox.
Именно у Apple есть все шансы раскачать VR — у них есть точки сбыта, они умеют делать продукт и раздувать хайп. Компания создаёт концепцию «магазина в магазине» — VR-островки для демонстрации девайса.
Поначалу устройство будет очень нишевым: Apple рассчитывает продать только 1 млн гарнитур в первый год. Ценник XR-девайса будет около $3k, но компания может представить бюджетную версию уже в 2024 году.
В комментариях обсуждаем возможности для стартеров в связи с грядущим релизом Reality Pro. Велкам!
Конец роста?
Мы пишем, как всё ванильно и растёт, теперь пора посмотреть и на падения. За прошлый год многие тренды откатились назад — собрал данные по разным отчётам:
- Смартфоны: мировые поставки упали на 11% в прошлом году. Аналитики считают, что развитые рынки (Западная Европа, Северная Америка) уже насытились смартфонами. Однако некоторые регионы продолжат расти — в частности, Юго-Восточная Азия.
- Мобильные приложения: число новых аппок упало на 13% в iOS, на 12% в Android.
- VR-девайсы: мировые продажи упали на 12% по сравнению с 2021, всего за год продано около 10 млн устройств.
- ПК: отгрузки в Q4 упали на 29% YoY — это самое резкое падение с 90-х годов.
- Удалёнка: в декабре на LinkedIn было 13% вакансий с удалёнкой — в марте 2022 эта цифра была около 20%. При этом 53% заявок соискателей были на удаленные вакансии.
- E-commerce: после ковидного всплеска, проникновение онлайн-торговли откатилось на прошлую линию тренда.
- Крипта: загрузки топовых приложений упали на 65% в прошлом году.
Discord купил Gas — популярное у подростков приложение, которое по установкам обогнало даже BeReal в американском AppStore. Суть его в том, что пользователи анонимно отвечают на опросы (кто самый красивый в классе?), в которых можно выбрать только кого-то из своей школы по геолокации.
Аналогичное приложение TBH те же самые фаундеры продали Фейсбуку в 2017 году, и теперь фактически создали его еще раз в более современной обёртке.
Успехи Gas: 10М установок с августа по декабрь 2022, заработок на платной версии $6М. Маркетинговый бюджет — $0. Команда из 4 человек.
Игорь Кузнецов разобрал у себя в канале, как им удалось провернуть такой гроусхак:
1. До запуска приложения, команда Gas создает кучу инстаграм-аккаунтов с названиями типа “gas.highschoolname”, делает их приватными и подписывается на учеников соответствующих школ. Чтобы увидеть посты приватного аккаунта, нужно подписаться на него и получить аппрув от этого аккаунта. Когда он примет ваш запрос, приходит уведомление в инсте.
2. Школьники не знают что это за аккаунт, но видят в названии свою школу, подписываются в ответ. Gas не принимает их запросы сразу. Набирают таким образом базу по школам.
3. В день запуска массово принимают запросы на фолловинг. Всем школьникам приходит пуш, который ведет на профиль приложения в инсте, где в био стоит ссылка на скачивание и четкий призыв к действию “see who likes you”. Одновременно в приложении оказываются все твои школьные друзья, приложение начинает вируситься и лететь в космос.
Мой адвокат — ChatGPT
В США пройдёт первый суд, где адвокатом подсудимого будет выступать ИИ. Бот от стартапа DoNotPay будет слушать судебное заседание и подсказывать ответчику в наушник. Дело нестрашное, оспаривают штраф о превышении скорости — но это уже интересный прецедент.
СЕО DoNotPay решил хайповать дальше и предложил юристам $1М, чтобы те согласились повторять за ботом слово в слово в Верховном суде.
И это только одно проявление тренда «ChatGPT в качестве Х». Вот ещё несколько примеров профессий, которые можно отдавать ИИ-ботам:
- кофаундер
- ведущий подкаста
- соавтор научных работ
- маркетолог
Apple готова к XR-революции
Bloomberg пишет, что Apple представит долгожданную XR-гарнитуру уже этой весной. Отгрузки потребителям начнут осенью. Подробно про будущую гарнитуру Apple мы писали здесь, вот несколько новых сливов:
- Устройство получит собственную операционную систему под названием xrOS, закрытую бету уже распространили разработчикам.
- От встроенного аккумулятора отказались — батарея будет на поясе, с подключением через кабель. Одного заряда должно хватать на два часа.
- Переключаться между VR и реальным миром можно через колесико, похожее на Digital Crown из Apple Watch.
- Будет возможность запуска существующих 2D-приложений для iOS.
Пока метаверс не оправдал надежд — мировые продажи VR/AR девайсов в прошлом году упали на 12% по сравнению с 2021, всего за год продано около 10 млн устройств. Но 2023 может стать переломным для отрасли, благодаря усилиям Apple и многих других производителей. Поэтому возможности в XR станут самыми аппетитными для стартеров в этом году.
Комментарии под этим постом предлагаем использовать для поиска соратников. Если:
— вы уже делаете XR-стартап/pet-project или только что-то затеваете
и
— ищете партнера (разработчика/3D-моделера/etc.)
... напишите в комментах:
— кого вам не хватает
и
— тезисы, которые вдохновят нужного человека откликнуться вам в личку.
Эпидемия одиночества
Люди всё больше времени проводят в одиночестве и меньше с друзьями и семьёй, по недавнему опросу американцев. Причём отмена коронавирусных ограничений не особо изменила картину. Для трети опрошенных встречи с друзьями и личное общение стали менее важными после пандемии.
В качестве заменителя живой социализации многие выбрали онлайн — посиделки в Дискорде, просмотр сериалов в Scener, совместный сёрфинг в интернете через Giggl. Вечеринки с друзьями в Zoom и Roblox стали обычным делом. Мощно вырос BeReal, который пообещал связывать друзей каждый день. Итог — большинство американцев теперь общаются с друзьями в онлайне, а не оффлайн.
Тренд особенно заметен среди подростков. По сравнению с 2010–2013, средний американский подросток проводит с друзьями на 11 часов в неделю меньше — снижение на 64%. В одиночестве же проводят на 12 часов больше, рост на 48%.
Это негативный тренд, если верить науке. По исследованиям, качественное время с друзьями улучшает самочувствие и ментальное здоровье, и даже может продлить жизнь в старости. В присутствии друзей любая деятельность оценивается как более содержательная и радостная.
А вот одиночество чревато ментальными проблемами: снижается самооценка и уверенность в себе, повышается уровень тревожности, растёт риск депрессии. У одиночек в среднем дела идут хуже: зарабатывают они на 25% меньше, чаще сидят без образования и работы.
Грядущие праздники — лучшее время, чтобы обратить этот тренд вспять. Навестите родителей, устройте вечеринку с друзьями — это доказанные способы чувствовать себя лучше, создать приятные воспоминания или же просто отлично провести время 😁
C наступающим, друзья! Спасибо, что читали нас в этом году. Если в 2023 вы хотите получать по свежей стартап-возможности каждый день — присоединяйтесь к нашему закрытому каналу Трендоскоп Lab. Подать заявку можно в этой Гугл-форме (займёт 3-5 минут). Велкам!