Закончу сегодняшние восторги по SORA двумя примерами img2vid из статьи выше – на входе ей подали картинки, а на выходе получили анимированные сцены ☕️
Так что скоро все наши любимые картинки и мемы оживут, не может не радовать
Пришла философская мысль на тему того, что гигантские модели способны сжимать целые вселенные в файл модели:
Это, конечно, не та Матрица которую мы видели в кино – но вполне себе вселенная которая существует в момент инференса модели и в тех сценах которые мы наблюдаем, в этой симуляции есть законы мира, какой-то лор и герои, и в теории, эта вселенная может существовать настолько долго, насколько люди в OpenAI держат генерацию видео включенной.
Это не значит, что в SORA возник «виртуальный мир», но представим что на дворе 2034 год и в мультимодальных генеративных моделях, помимо генерации видео есть генерация звука и сюжета. Я почему-то уверен, что если вы попросите такую модель сгенерировать офисного сотрудника – то в офисе будет какая-то жизнь, разговоры, а на экранах будут программы, которые возможно будет посмотреть и скорее всего люди в фоне будут делать что-то осмысленное (для желающих копнуть глубже эту мысль, можно почитать про Сложность Колмогорова
).
В этом же конечная цель, симулировать миры настолько качественно – насколько возможно, не строя их руками, как в геймдеве, а именно «обучая» на основе данных реального/выдуманных миров.
И как вы сами видите – скорость развития технологий только набирает обороты, так что вероятно та серия из «Черного зеркала» про местный Netflix станет вполне реальной.
Иронично будет если окажется, что мы все живем в симуляции, и в этой симуляции возник OpenAI который смог построить новые стимуляции и сервак где крутится наш мир начнет тормозить или что-то в таком духе ☕️
Видео сделано по запросу: Исторические кадры Калифорнии времен золотой лихорадки
OpenAI только что выпустили SORA— text2video модель
Генерация видео по текстовому описанию наступила!
Сегодня обещают статью
Промпт: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
🟣https://openai.com/sora#research
Я не очень люблю маркетинг, но что я понял занимаясь бизнесом: построить успешный продукт без маркетинга разного типа – невозможно, есть редкие исключения, но это все же исключения.
С момента релиза GPT4 я пытаюсь в нашей компании автоматизировать все до чего доберутся руки (и все что этично: резюме читают люди, не роботы и тп) – поэтому я попробовал собрать автоматизацию генераций идей для двух важных бизнес направлений:
1) Креативная визуальная реклама
2) Гроухаки для роста бизнеса (это когда вы не богатый, но хитрый и ищите способы развивать продукт не заливая его бесконечными тратами на рекламу)
В этот раз я пошел чуть дальше чем просто «длинный промпт». Для каждого из GPT я собрал под сотню успешных, всемирно известных реклам или гроухак-кейсов, суммаризировал их в виде датасета и уже на основе этого датасета GPT пишет ответы.
У меня пока смешанные чувства про результаты: с одной стороны если сидеть и нажимать «перегенерировать» то можно неплохо набрасывать идеи, с другой стороны некоторые идеи все еще банальны, несмотря на датасет и большой промпт где я уже кричу капсом на GPT4, чтобы она не была банальной.
GPT и датасеты описаны на английском, но я специально прописал чтобы они отвечали на языке в котором к ним обращается юзер.
Ссылки:
Creative Ad Maker GPT
Growth Hacking Expert
Если кто-то удачно применит их в бизнесе, поделитесь пожалуйста 😐
Вы думали Тиктоки странные? Позвольте представить вам дискорд-видео
Тут больше:
https://www.reddit.com/r/discordVideos/top/?t=year
Классная новость из Норвегии: правительство купило 110000 лицензий GPT 3.5-Turbo для школьников и учителей Осло – департамент образования Норвегии «не может делать вид, будто ничего не происходит, учитывая что все учащиеся уже имеют бесплатный доступ к ChatGPT».
Понравилась мысль, что некоторые учителя считают, что появление ChatGPT некорректно сравнивать с появлением «интернета» по масштабу влияния на образовательный процесс – так как многие способы борьбы с плагиатом оставались актуальными даже в эпоху интернета, правильнее сравнивать ChatGPT с появлением первого учебника (по масштабу).
Детей и учителей будут учить правильно и этично применять языковую модель в обучении, и строить образовательный процесс с учетом такой технологий.
Ссылка на оригинал новости на норвежском:
https://www.digi.no/artikler/oslo-kjoper-chat-gpt-til-110-000-elever-og-laerere/543339
Искренне желаю норвежцам успехов в первом шаге к крупной реформе образования на базе LLM-возможностей
А вот вам интересный скандальчик: в Нью-Хемпшире обзванивали людей по телефону и голосом Байдена уговаривали не голосовать. В день обзванивалось от 5 до 25 тысяч человек, делалось это с помощью text-to-speech синтеза от крутых ребят из ElevenLabs. Разумеется, елевенлабз ни при чем, они просто инструмент сделали. Но расследование говорит, что сделано это было небольшой компанией Life Corporation. Ее владельцем является Вальтер Монк, он же является владельцем другой компании, Voice Broadcasting, главная специализация которой — телефонные обзвоны для политиков.
Короче, если не посадят — получилось отличное демо технологии и хорошая реклама компании. И я не понимаю, почему в других странах почти не используют обзвоны перед выборами.
https://edition.cnn.com/2024/02/06/tech/nh-ag-robocall-update
Я в какой-то параллельный таймлайн попал где моим лицом крипто-фигню рекламируют, такой день
💕💖🧡
Мне кажется когда я встречаюсь с новыми людьми и рассказываю им свои истории у них же впечатление что я поехавший и придумал почти все, если что вы пожалуйста подтвердите что я в себе – и руны в Норвегии находил, и Люмьерами почти засужен, и в 945 школе учился в которой Гай Германика потом сериал "Школа" сняла, спасибо
Мы быстро, конечно, в SciFi попали:
За $159.99 теперь каждый может купить готовый набор для нейронного подключения живого таракана к чипу, чтобы, ну, побегать им с телефона
¯\_(ツ)_/¯
Видео с тараканом-киборгом.
Покупать тут.
Выкатили новый тул для нейролава «Logo Generator»
Поскольку щебень – официально самая скучная вещь в мире, сделал для щебня логотипов, вдруг поможет.
Работает тул просто: пишите название и описание бренда, а инструмент возвращает вам 50 логотипов.
Из фич:
– Можно сделать текст частью лого (поддерживается только английский пока что)
– Выбрать цветную или монохромную палитру
– Выбрать стили (cartoon мой любимый 🫶)
– Картинки в результате не векторные, а растровые
– Права на лого тоже ваши
Что под капотом: это связка Dalle 3 и GPT 4, поэтому инструмент сразу платный.
Ссылка:
https://neural.love/ai-logo-generator
Если захотите попробовать, вот скидка для подписчиков канала на 20%, на первый месяц:LOGOMAKER20
инструмент – я именно так делал логотип для littlestory.io, это оказалось намного быстрее – сделал 50 идей, команда проголосовала за лучший вариант, отдали лого дизайнерке на отрисовку в векторе, заняло все дня два ☕️
P.S. Почему вообще начали делать этот
P.P.S. Ну и покажу финансы по нему через полгода, я знаю, всем интересно
Внезапный плюс шлема о котором я не думал, это то что можно есть чипсы/картошечку/пироженки и не вытирать пальцы чтобы проскроллить экран
Уговорили, продано!
Унес отсюда
И еще про симуляцию миров:
Вот так SORA пытается воспроизвести вселенную Minecraft обучившись только на видео геймплея – и так сработает с любой игрой
Наконец-то можно будет поиграть в DOS версию «Поле чудес» в 3D
Лол, пока писал этот пост вышла техническая статья разбора SORA от OpenAI с заголовком:
«Модели генерации видео как симуляторы миров»
https://openai.com/research/video-generation-models-as-world-simulators
Если бы я родился 100 лет назад и увидел бы это видео, то я бы стал «адвентистом второго пришествия пластикового стула», серьезно вам говорю, представьте каково будет «уфологам» в эпоху генеративных видео.
Даже ошибки модели SORA интересно рассматривать
Просто посмотрите на это качество, о-ф-и-г-е-т-ь
У многих txt2video стартаперов FaceId сегодня не работает
Кажется, Шейхи пытаются задобрить Яна ЛеКуна— его фото вчера красовалось на 828-метровой башне Бурдж-Халифа в Дубае. Сейчас в заливе пытаются сделать большую ставку на развитие AI и привлечение высококлассных учёных в свои институты и компании. Кстати, такая реклама могла стоить от $100к.
Ян ЛеКун как-то отказался читать лекцию в Саудовской Аравии из-за своего атеизма. Но ребята не теряют надежды.
@ai_newz
Я тоже посмотрел то бессмысленное интервью, так что вот вам GPT-автоматизация для подобного рода ответов:
https://chat.openai.com/g/g-eJSSTCuX1
Сэкономите себе час и лучше проведете время ☕️
Постепенно вступаем во вселенную Терминатора, осталось Скайнет и туточки
https://youtu.be/iHXuU3nTXfQ
Любопытное применение шлему Vision Pro: можно навигировать в темноте, как куплю свой (в ЕС еще не продают) обязательно проверю в полной темноте
Автор
Where men cried
Вертолетик, который смог.
Фото одинокого Ingenuity, сделанное марсоходом Perseverance 4 февраля, через две недели после 72-й и последней миссии маленького, но очень смелого марсианского вертолета.
Сорс
Подумал, что наверное некоторым еще интересно сколько мы зарабатываем на этом:
Одна генерация для пользователя в 50 логотипов стоит нам ~5$ (Dalle 3 HD API + GPT4 аугментации промпта), а берем мы $9.70, то есть маржинальность всего 50%; наша основная аудитория США, оттуда почти 60% трафика, для них это небольшая сумма.
Почему такая странная цена, а не 10$: по нашим а/б тестам охотнее покупают когда цена пишется вроде «N.99
» (это правда все еще работает и поэтому используется всюду).
Но с ценой «N.70
» покупают еще охотнее ☕️ такие вот мы люди – странные существа
Поставьте, пожалуйста, много брухов этому посту если хотите чтобы я чаще рассказывал как и почему, и зачем мы что-то делаем на нашем бизнес пути (с данными)
#промо
В стартап Exactly.ai нужен Lead Backend Developer.
Exactly.ai это маркетплейс, который позовляет художникам тренировать ML-модели на своих иллюстрациях и давать брендам свои модели в аренду. Бренды могут создавать иллюстрации для маркетинговых кампаний с помощью моделей лучших художников.
Exactly - самый большой хаб персональных моделей, созданных профессиональными художниками и иллюстраторами. В сентябре Google включил Exactly.ai в топ-15 лучших стартапов 2023 года. Компания привлекла Seed Round и хочет расширяться. Ребята ищут лид-бекенд инженера.
tonia@exactly.ai - напишите фаундеру Тоне Самсоновой, если вы считаете, что это вакансия для вас.
Подробнее про вакансию тут:
https://exactly.ai/resources/career/lead-backend-engineer-zNRJGxMj
#текстприслан
OpenAI конечно типичный стартап: вечером получил инвайт в их Slack для создателей GPT, утром получил другое письмо, что инвайт отозван и они еще не придумали как лучше 😂 так и живем
Читать полностью…