Обзор стартап-возможностей. @vladimir_zakoulov - здесь разбор полётов.
Worldcoin Сэма Альтмана на днях выпустил обновление протокола World ID 2.0. Если помните, основная идея проекта — создать технологию однозначной идентификации человека, с помощью сканера радужной оболочки глаза.
Теперь появились новые юзкейсы технологии и интеграции со многими популярными сервисами — Shopify, Reddit, Minecraft и даже Телеграм. Идея World ID для Телеги — убедиться, что аккаунт принадлежит реальному человеку, прежде чем он сможет отправлять сообщения. Боты-спамеры теперь в прошлом.
Пока проект на раннем этапе, World ID имеют 5 млн человек. Но ребята уже выпустили свой App Store с приложениями, которые поддерживают идентификацию через World ID.
Text-to-AR
Недавно запустилось новое приложение Shader — генерация AR-фильтров по текстовому запросу. Всё происходит шустро, практически в реальном времени.
Затестить можно в их Дискорде. Ждём во всех Снапчатах и Тиктоках планеты)
«AI-режиссёр» из Твиттера продемонстрировал video inpainting возможности в Pika (пока waitlist, но постепенно приглашают). Посмотрел что в целом народ делает в Pika и заметно, что качество text-2-video мощно скакнуло вверх.
Появляется даже направление AI-фильмов — умельцы объединяют несколько инструментов для создания общей картины:
- Генерация видосов, замена стилей — Pika, Runway
- Музыка от Tracksy и Suno AI
- Речь от Eleven Labs
- Лип-синк от Lalamu Studio
- AI-ретушёр Topaz Labs
Генеративная анимация
На неделе вышло несколько интересных проектов в области image-to-video на диффузионных моделях:
- Animate Anyone от Алибабы. По демкам — большой скачок в качестве по сравнению с предыдущими моделями, артефактов намного меньше. Важные детали, такие как одежда или цвет волос, не теряются. Но кода пока нет, обещают позднее.
- Magic Animate от Bytedance. Уже выпустили код и демку на Huggingface, качество тоже на хорошем уровне. Теперь сгенерированные инфлюэнсеры могут заходить и в Тикток)
Рекомендации каналов в Telegram
Дуров не выдержал и сдался: в Телеграм появятся рекомендации каналов. Будет создан раздел «похожие каналы» на основе того, что читают подписчики данного канала. Первый пункт органического продвижения в ТГ, дальше должна быть стена)
Сейчас ещё Телеграм набирает популярность на западных рынках — в US стабильно более 1 млн загрузок в месяц. Возможно, таким образом попытаются привлечь новых создателей контента.
Screenshot to Code
На днях мощно завирусился новый AI-инструмент — загружаете скриншот сайта и смотрите, как ИИ создаёт для него весь необходимый код.
GPT-4V генерит HTML/Tailwind CSS, а Dall-E 3 генерит похожие картинки. Можно также вставить URL и клонировать весь сайт.
Код доступен на Гитхабе, репозиторий за несколько дней собрал уже 17k звёздочек. Будущее фронтенд-разработки?)
Наткнулся на сравнение метрик ChatGPT и Character AI (платформа ИИ-ботов с разными личностями). ChatGPT получает намного больше трафика, но время сессии у них ниже почти в 5 раз.
Похоже, ИИ-боты попали в рынок — люди общаются с ними в среднем 33 минуты. 60% пользователей — зумеры 18-24.
Неудивительно, что эта тема накаляется. Вышел слух, что Google планирует инвестировать «сотни миллионов $» в Character AI. Добавьте сюда GPT-шек от OpenAI и виртуальных инфлюэнсеров Цукерберга.
Шопинг-ассистенты
Вчера на брейнсторме GPTs часто всплывала тема ИИ-помощников для покупок. Например, бот для подбора одежды из интернет-магазинов, по вашим размерам и предпочтениям. Или GPT риелтор, который помогает найти квартиру по параметрам, сам связывается с собственником и назначает встречу.
Ребята из Mozilla тоже пишут, что такие ассистенты — будущее шопинга. В качестве первой версии, они запустили расширение для Амазона под названием Fakespot:
- AI-ассистент проверяет отзывы на товары и детектит фейковые.
- Также определяются скамные продавцы с накрученными отзывами.
- Для выбранного товара ассистент может порекомендовать другого проверенного продавца с ценой ниже.
Платформа ИИ-ботов Poe запустила монетизацию создателей до того как это стало мейнстримом. Теперь там появился бот, который позволяет создавать своих ботов — по аналогии с GPT Builder:
1. Пишете свою идею бота
2. Он генерит нужный промт
3. Вы можете подредактировать инструкции, и ваш уникальный бот готов.
Хорошая разминка перед GPT Store. Также можно следить, какие боты на Poe набирают популярность (у них как раз недавно прошёл хакатон).
Grok — ИИ-ассистент от Илона Маска
Компания X (ex-Twitter) представила свой ответ ChatGPT — бота под названием Grok. Основная фишка — доступ к контенту из Твиттера в режиме реального времени. Разработчики утверждают, что Grok ответит и на «острые» вопросы, которые блокируются другими ботами.
По метрикам Grok обходит LLaMa-2 и ChatGPT-3.5, но отстаёт от GPT-4. Бот будет доступен по подписке X Premium+ ($16/mo), пока что waitlist.
В следующих обновлениях Грока планируется:
- Мультимодальность (понимание картинок и расшифровка аудио)
- Расширение контекстного окна — пока только 8k токенов (25k знаков)
- API для разработчиков
- Внедрение локальной версии ассистента в автомобили Tesla
P.S. Друзья, для тех, кто готов сканировать более плотный поток стартап-возможностей, мы запустили закрытый канал Трендоскоп Lab. Подать заявку можно в этой Гугл-форме. Велкам 🙂
Runway обновили свою модель для генерации видео Gen-2. Качество значительно улучшилось, артефактов меньше — примеры на видосе поражают, пусть даже и черрипикинг.
Новая модель уже доступна на их сайте, есть режимы text-2-video и img-2-video.
Creator AIs от Меты
В рамках проекта «вещи, о которых никто не просил»: Meta на этой неделе выкатила 28 чат-ботов, созданных на базе знаменитостей. Теперь любой желающий сможет пообщаться в Директе или WhatsApp с цифровыми клонами Пэрис Хилтон, Снуп Догга, Mr. Beast и других знаменитостей.
Каждый персонаж специализируется на какой-то теме: спорт, еда, игры, фитнес. В планах Цукерберга — сделать так, чтобы каждый мог создавать своих собственных ИИ-ботов.
Сложно представить, как после этого обесценится онлайн-общение — когда условные Брэд Питт или Трамп будут отвечать каждому. Вполне возможно, что общаться в интернете будут двойники между собой, а люди снова вернутся в закрытые комьюнити или вовсе в оффлайн.
Apple готовит сотрудников к релизу Vision Pro
Марк Гурман из Bloomberg пишет, что Apple серьёзно готовится к предстоящему релизу гарнитуры. Компания проведёт «секретные тренинги», где консультантов познакомят с Vision Pro и обучат их сложным методикам продаж.
Во флагманских магазинах Apple появятся специальные зоны, где можно будет протестировать гарнитуру в бою. Компания также планирует собирать Vision Pro для покупателей в магазине, как это делается с Apple Watch — с ремешками, светоотражающими уплотнителями и дополнительными линзами по рецепту врача.
Apple понимает, что продавать новый класс устройств, да ещё и стоимостью $3500 — задача не из лёгких. К тому же, главный конкурент в лице Meta укрепляет свои позиции — вокруг Quest 3 начался крепкий хайп, которого не было со времён Beat Saber.
--
А в рамках рубрики #ИщуСоратника Вова Закоулов (один из авторов канала) с Женей Симоновым (партнёром по XOCUS) приглашают опытного Swift-разработчика присоединиться в свежий XR-стартап — ребята создают один из первых в мире app’ов под Apple Vision Pro.
Если вы верите в светлое XR-будущее и готовы покататься на стартапоамериканских горках → тут подробности и форма.
Video-to-text
Twelve Labs на днях анонсировали «video-first» ИИ-модель под названием Pegasus. Она не просто разбивает видео на картинки, как делали раньше — а объединяет визуальную, звуковую и речевую информацию для целостного «понимания» видоса.
Благодаря этому Pegasus показывает себя лучше предыдущих решений, в таких задачах как:
- Сделать саммари видео по запросу пользователя
- Распознать говорящего
- Определить таймкод для любого момента (например, гол в спортивной трансляции или хедшот в игре)
Сама модель closed-source. API обещают выкатить в ближайшее время, пока что waitlist.
Когда ChatGPT запустился без мобильного приложения, было ясно, что кто-то быстро «пофиксит» это. Самыми популярными сторонними аппками стали Ask AI и Genie — они в моменте заработали кучу денег, сделав мобильный интерфейс к ChatGPT.
Теперь же в сторах есть официальное приложение, которое выкатили ещё в мае. И что вы думаете — многие люди продолжают платить за 3rd party приложения. Ask AI делает $2М оборота в месяц, всего в 2 раза меньше пиковых значений.
Хорошее напоминание — не обязательно придумывать что-то новое, чтобы делать деньги на тренде)
P.S. Друзья, для тех, кто готов сканировать более плотный поток стартап-возможностей, мы запустили закрытый канал Трендоскоп Lab. Подать заявку можно в этой Гугл-форме. Велкам 🙂
Тренды у поколения зумеров
В декабре все по традиции выпускают отчёты о трендах на следующий год — мы прочитали самые важные и сделали выжимку с фокусом на GenZ:
- 43% зумеров говорят, что 2024 станет для них «годом самосовершенствования» — они будут больше инвестировать в своё развитие.
- Каждый третий считает, что лучший способ достичь богатства — это работать на себя.
- При этом сейчас молодое поколение зумеров массово выходит на работу. В следующем году они должны обогнать бумеров по численности на фултайме.
- 57% хотят зарабатывать на создании контента. Любимые платформы зумеров — YouTube и TikTok.
- Три главных приоритета на 2024 год — «оставаться здоровыми» (регулярно заниматься спортом, правильно питаться), продвигаться по карьере и путешествовать.
- Зумеры как никогда одиноки: 63% опрошенных не имеют пары. Поэтому они планируют поддерживать контакты с друзьями и семьёй, чтобы не чувствовать одиночество.
Взлет приложений-раздеваторов
Stable Diffusion достигла приемлемого качества и скорости в раздевании фоток — и интернету понадобилось совсем немного времени, чтобы появились полноценные аппки для AI-раздевания.
Аналитическая компания Graphika недавно выпустила отчёт о взрывном росте подобных приложений. Насчитали как минимум 34 проекта в этой теме с 24М уникальных посетителей за месяц. Спам-реклама заполнила Реддит и Твиттер + активно используется серый масс-постинг в соцмедиа. Стандартный оффер — несколько бесплатных генераций, потом подписка $5-$15/mo.
Пользователям заходит: у одного из лидеров Undress App средняя сессия составляет 21 минуту — это в 2 раза больше, чем у TikTok. Что примечательно, для оперирования и биллинга (или как минимум ретеншена) в основном используется Telegram. У того же Undress App уже 164k подписчиков в Телеге.
А TikTok и Meta начали блокировать кейворды «undress» и похожие — что показывает перспективу использования TG в качестве основной платформы для запуска стартапов (как минимум в серой тематике 🙂)
Агентства ИИ-инфлюэнсеров
Недавно в Испании появилось агентство The Clueless — оно раскручивает виртуальных девушек, чьи снимки создают при помощи нейросетей. Первым крупным проектом стала Айтана Лопез — «ИИ-модель», геймер и косплеер из Барселоны. У неё уже более 200k подписчиков в Инсте, и многие не понимают, что она сгенерирована.
На её Онлифансе предлагаются к просмотру нюдесы, также сгенерированные нейросетью. Берут за это 7 баксов в месяц. Зарабатывают на текущий момент $11к в месяц.
Конечно, мы видели виртуальных блогеров и раньше, например Lil Miquela (2.7M подписчиков). Но до этого требовалась CGI и куча работы — а теперь можно клепать таких ИИ-моделей в промышленных масштабах.
Ну и продавать «лопаты для золотоискателей» — как сервис Glambase, который позволяет создавать своих кастомных ИИ-инфлюэнсеров.
Интересная статистика по Discord — мессенджер становится основной площадкой для запуска AI-приложений. Midjourney задали тренд — на них приходится 13% всего инвайт-трафика Дискорда, на сервере уже 17М+ членов.
Pika (text-2-video генератор) на 2 месте с 500k юзерами, и бодро растут.
Discord тут увидел возможность и начал активно привлекать AI-разрабов: недавно запустили программу поддержки с грантами, эксклюзивными фичами и office hours. В планах у мессенджера — стать ещё одним App Store.
Реверс-инжиниринг GPTs
Какой-то чувак заморочился и собрал на Гитхабе system prompts для всех популярных джипитишек. Отличный способ прокачать свои навыки в построении промтов)
Ну и пока что GPTs никак не защищены от умелых инъекций. Денис Ширяев поделился своим промтом для обхода большинства «заграждений».
Также есть игра, в которой можно потренироваться защищать или взламывать GPTшки. Задача игры — защищать банковскую ячейку промтом. Нужно придумать крутую защиту, либо хакать другие ячейки. Вот гайд, а поиграть можно тут (спасибо за наводку @DmitrySpace)
Сервис внутренней автоматизации Retool выпустил интересный отчёт State of Generative AI, на базе опроса 1500 tech people в разных компаниях. Несколько хайлайтов:
- Уже 66% компаний имеют хотя бы один рабочий внутренний юзкейс GenAI, и 43% — внешний.
- Самые популярные юзкейсы — написание кода, Q&A по базе знаний, копирайтинг.
- 96% опрошенных считают, что внедрение GenAI было полезно для их компании.
- Главные pain points при использовании ИИ-инструментов — галлюцинации моделей и безопасность корпоративных данных.
- Модели OpenAI доминируют — их используют 80% компаний. Но мало кто использует только одну модель, большинство экспериментируют с разными провайдерами.
- Чем больше компания, тем чаще хостят LLM сами. Но даже среди крупных компаний доля self-hosting составляет только 25%.
AI-сотрудники — когда мы уже сможем их нанимать?
@vladkooklev поресерчил тему AI-сотрудников в компаниях и поделился наблюдениями в посте. Тренд на АИ-работников скорее нарративный — все переупаковывают наработки, которые и так были. Но это звучит проще, чем АИ-агент.
Агент это было что-то универсальное, и тот подход себя показал не очень. А сейчас юзкейсы заужаются: компании сфокусированы на решении узких задач внутри профессий, которые дадут максимум пользы. Обычно это рутины: переписки, рисерчи, подготовка документов, продажи.
Главный вывод — AI-агенты уже работают. На данный момент ничего пугающего, их уровень пока сложно назвать джуниорским. Но следующие итерации будут появляться быстро, и через полгода мы увидим уже продвинутые версии.
Для тех, кому интересна тема ИИ-сотрудников, Влад и @seeallochnaya поделились референсами в нашем сообществе Трендоскоп Лаб:
- https://www.adept.ai/ — стартап от первого автора трансформеров
- https://induced.ai/ — в них Сэм Альтман вложил
- https://newo.ai/ — стартап от Давида Яна из ABBYY, делают как раз конструктор сотрудников
- https://artisan-ai.com/ — стартап из будущего батча YC, пока все сыро
- https://www.sentius.ai/ — стартап от бывшего CPO Deep Pavlov Дани Корнева
- /channel/bisovka/1449 — Женя Бисовка строит AI-сейлза/риэлтора
GitHub вчера провёл свою конференцию для разработчиков, где все разговоры конечно были про AI. Вот что рассказали интересного:
- ИИ-помощник для программирования Copilot Chat будет доступен всем в декабре (по подписке $10/мес). Под капотом будет GPT-4.
- «GitHub был основан на Git, а сегодня мы вновь основаны на Copilot». ИИ-ассистент будет везде — сайт, мобильное приложение, CLI, JetBrains IDE.
- Партнёрская программа — что-то вроде экосистемы плагинов для Copilot, можно подать заявку на интеграцию.
- Copilot Workspace — видение будущего от Github. Описываете свою идею ассистенту, а он генерит спецификацию, план работы и код. Потом сам же его проверяет и документирует. Обещают выкатить в следующем году.
GPT Store — магазин приложений от OpenAI
В 2008 году Apple перевернули мир, когда запустили App Store для сторонних разработчиков. Сейчас их магазин насчитывает 1.8М приложений с суммарной выручкой $910В.
А вчера OpenAI анонсировали GPT Store — можно будет разместить своего ИИ-ассистента и получать долю прибыли за каждого пользователя вашего бота. Скоро тут будут тысячи ассистентов и, возможно, миллиардная выручка для разработчиков.
Такие моменты «смены парадигмы» случаются раз в 15 лет: сначала появились тонны возможностей в web, потом в mobile, а теперь назревает AI. И здесь важно быть первым, чтобы поймать надвигающуюся волну.
При этом порог входа минимальный — даже не нужно уметь программировать, а только давать инструкции на обычном английском. На видео Сэм Альтман показывает, как сделать своего GPT-ассистента за пару минут.
Вот что ещё будут уметь ассистенты:
- просматривать веб-страницы
- генерировать картинки через DALL-E
- исполнять код через Code Interpreter
- подгружать любые источники данных (pdf, Excel-таблицы и т.д.)
- подключаться к внешним сервисам (Outlook, Canva, Zapier, базы данных)
Стартеры уже горят идеями для ассистентов — инвестиционные советники, языковые коучи, генераторы стикеров, шопинг-помощники.
И всё это, по словам Альтмана, всего лишь v1 — дальше нас ждут полностью автономные ИИ-агенты, а потом и AGI. А лучший способ быть готовым к AI-революции — экспериментировать с ранними версиями.
В эту пятницу (10 ноября) мы проведём онлайн-брейншторм, где обсудим интересные и неочевидные возможности вокруг GPT-ассистентов. Если вы хотите поучаствовать и найти потенциальных соратников — присоединяйтесь к нашему закрытому каналу Трендоскоп Lab. Подать заявку можно в этой Гугл-форме. Велкам 🙂
Activate выпустили свой ежегодный масштабный отчет о технологических трендах. Вот несколько хайлайтов из секции GenAI:
- Самые популярные сценарии использования ИИ-инструментов — проверка и улучшение письма, развлечение, создание контента.
- Уже более 10М американцев используют GenAI вместо поисковиков — и к 2027 году эта цифра достигнет 90М.
- 60% создателей контента используют ИИ-инструменты в своей работе. Основные драйверы — поиск вдохновения, экономия времени и денег.
- Также GenAI постепенно захватывает рабочие процессы — 16% сотрудников уже используют эти инструменты в своей работе, ещё 21% планируют в ближайший год.
- Инвестиции в проекты выросли на 200% за год. Самые инвестопригодные области — платформы «общего назначения», инфраструктура, В2В (на них приходится 95% от общей суммы).
Помимо ИИ, в отчете также много статистики и трендов по e-comm, XR, геймингу.
Phind выкатили новую модель для генерации кода — утверждают, что на этой задаче она превосходит даже GPT-4. Помимо бенчмарков, реальные программисты тоже находят модель Phind такой же полезной. При этом она работает в 5 раз быстрее и имеет контекстное окно на 16k токенов.
Потестить можно у них на сайте, новая модель не ограничена по количеству бесплатных использований. Phind помогает с генерацией кода, а также имеет режим парного программирования.
Adobe добавили свою нейросеть Firefly в видеоредактор Premiere Pro. Теперь менять и добавлять объекты можно ещё и в видосах. Подобные ролики сейчас захватывают Тикток.
Читать полностью…Расцвет NSFW чат-ботов
Секстинг с ботами — одна из немногих денежных ниш в GenAI, которая при этом защищена от нападок OpenAI, Anthropic и других ребят с бездонными карманами. Поэтому здесь появляется всё больше разнообразных проектов:
- Pirr поможет вам писать эротические истории. Недавно ребята привлекли ангельский раунд в размере $430k. У них уже более 150 тыс. пользователей, которые тратят в среднем 22 минуты в приложении.
- Bloom позволяет общаться голосом с персонажами из эротических аудиорассказов.
- Clona AI делают чат-ботов — двойников порнозвёзд. Основательница — известная порноактриса Riley Reid. По задумке, актрисы дают согласие на использование своего «цифрового двойника», и получают комиссию с подписок пользователей.
Now it's official: Тиндер подсматривает идеи в Трендоскопе. Недавно писали про тренд на свах, и вот Тиндер выкатил подобную фишку в приложении.
Чтобы воспользоваться фичей, нужно создать уникальную ссылку и отправить её другу. Он сможет зайти в профиль и просматривать потенциальных партнёров и свайпать их — это действие отразится у вас как рекомендация друга (или мамы).
Это ещё одно проявление тренда на возвращение «олдскульных» способов знакомств. Ну и довольно хитрый способ увеличить число загрузок для вашего приложения.
Конец промптинга?
Microsoft на днях опубликовали работу Idea2Img, посвященную итеративному само-промптингу моделей для генерации изображений. Вот как это работает (стырил у Сергея Цыпцына):
1. Описываете идею своей картинки LLM и генерите по ней 100 текстовых промптов.
2. Скармливаете эти промты модели text-2-image (в статье используется SDXL). Затем GPT-4Vision отбирает из получившихся картинок самую лучшую.
3. Лучшая картинка ещё раз проверяется на соответствие вашей изначальной идее. Опять же, с помощью GPT4 Vision. ИИ смотрит, что является неправильным, исследует вероятные причины и изменяет начальный промпт. И повторяет процесс нужное количество раз.
Исследователи полагают, что за таким итеративным процессом будущее — благодаря нему ИИ знает лучше людей, какой промт для себя написать. Недавно вышла статья по DALL-E 3, там тоже используется похожий процесс.
Всё это можно рассматривать как работу двух агентов. И на выходе могут быть не обязательно картинки — а любое ваше ожидание, в которое теперь умеет ИИ.