Залипли и встали намертво, но хотите вырваться? Теория Каст и Ролей и прочее.
Нард сопротивляется ИИ изо всех сил. Война с луддитами началась. Сделал выжимку из интересной статьи, описывающей ситуацию:
1. Стратегическая важность и национальный приоритет. Строительство центров обработки данных (ЦОД) рассматривается в США как задача национальной срочности, сравнимая с «Манхэттенским проектом». Это необходимо для лидерства в облачных вычислениях и для победы в «гонке искусственного интеллекта» с Китаем, что делает расширение энергетической инфраструктуры для их питания экзистенциальной задачей.
2. Масштабный строительный бум и неопределенность данных. В США наблюдается беспрецедентный бум строительства ЦОД: по прогнозам, в 2025 году начнется строительство почти 5000 новых объектов, что сопоставимо с уже существующим количеством. При этом точное число действующих центров неизвестно, оценки варьируются от 2 400 до более 5 400, что подчеркивает хаотичность и скорость роста отрасли.
3. Широкомасштабное местное сопротивление. Несмотря на национальную важность, бум строительства сталкивается с серьезным и организованным сопротивлением на местном уровне. Зафиксировано как минимум 142 группы активистов в 28 штатах, которым удалось заблокировать или задержать проекты на общую сумму в 64 миллиарда долларов, превращая ЦОД в новую горячую точку конфликтов по принципу «не на моем заднем дворе» (NIMBY).
4. Парадокс общественного мнения: поддержка ИИ, но не ЦОД. Опросы показывают явный разрыв между общенациональной поддержкой технологий и локальным неприятием инфраструктуры. 93% американцев считают ИИ жизненно важным для страны, но лишь 35% готовы проголосовать за строительство ЦОД в своем родном городе, опасаясь негативного влияния на местные ресурсы и качество жизни.
5. Ключевые претензии: колоссальное потребление энергии и воды. Главные причины протестов — это огромный спрос на ресурсы. ЦОД потребляют в 10-50 раз больше энергии, чем офисные здания, что создает колоссальную нагрузку на электросети и грозит ростом тарифов для всех потребителей. Кроме того, один ЦОД может потреблять до 5 миллионов галлонов воды в день для охлаждения, часто в регионах, уже страдающих от нехватки воды.
6. Дополнительные возражения: шум и низкое создание рабочих мест. Местные жители также обеспокоены постоянным низкочастотным шумом от систем охлаждения и генераторов, который может достигать 96 децибел. Другая серьезная критика заключается в том, что после завершения строительства ЦОД создают очень мало постоянных рабочих мест по сравнению с другими промышленными объектами, занимая при этом огромные территории.
7. Контраргументы и адаптация отрасли. Представители индустрии ЦОД утверждают, что критика часто основана на устаревших данных. Они заявляют, что современные центры используют более эффективные технологии охлаждения, снижая потребление воды; устанавливают шумоподавляющие барьеры; оплачивают полную стоимость потребляемой энергии и создают значительное количество косвенных рабочих мест в смежных отраслях.
8. Двухпартийный характер протеста. Сопротивление строительству ЦОД не имеет четкой политической окраски и объединяет людей разных взглядов. Против выступают как либеральные защитники окружающей среды, так и консервативные жители сельских районов (например, в Техасе), которые обеспокоены сохранением контроля над местными ресурсами и не хотят крупномасштабного промышленного развития в своих сообществах.
9. Сдвиг на новые, «третичные» рынки. Исторически ЦОД концентрировались в технологических хабах (Калифорния, Вирджиния). Сейчас индустрия активно осваивает «вторичные» и «третичные» рынки (Огайо, Миссисипи, Айова), где дешевле земля и энергия. Однако именно в этих регионах, не привыкших к такому типу застройки, сопротивление оказывается наиболее острым.
Прогресс на 2 недели просто чудовищный. Tatiana Tkr реализовала липсинг. Ниже объясню - какие это дает возможности. Здесь пока использован "старый стек" текст->NotebookLM->Kling 2.1->CapCut. Генерацию делали только для героев и интерьера студии, остальное - Storyblocks, так получается быстро и недорого. Крайняя версия:
Кто главный: человек или ИИ? Машина размышляет о своём будущем. https://www.youtube.com/watch?v=Pfl5vyk6s3A
Все герои синтезированные, пока под аудиотрек от NotebookLM, и в прошлой версии делали без липсинга, просто дублирование. см - Игры вместо школы? Модель воспитания XXI века. https://www.youtube.com/watch?v=-8k6JhfQigU
После чумового релиза ElevenLab 3.0, будем тестировать полноценную режиссуру голоса и озвучки, т.е. убираем посредника в виде NotebookLM, т.е. мы теперь можем 100% управлять текстом и режиссурой озвучки - можно тестировать как режим монолога, так и диалога - даже несколько человек в кадре + строить полностью сцену, т.е. это уже полноценное кино - любые разговорные сцены.
Для коротких форматов, где доля генерации ИИ не больше 1 минуты это более или менее еще приемлемо по деньгам, но, конечно, пока это идеально для коротких анонсов в формате 11 и 30 секунд - это под превью. Остальное покрывать стоками - для тематических видео подкастов это норм.
А вот для аудио подкастов это уже совсем интересно, так как мы получаем 100 min всего за 22$, или 1000 мин за 99$, это 12-18 полноценных 60-минутных выпусков или по сути ЕЖЕДНЕВНО 30-минутный выпуск.
Сейчас ПОКА можно 100% автоматизировать 2-ую версию EL, но, думаю в течении нескольких месяцев API раскатают и на версию 3.
Итого, при наличии написанного текста сценария для монолога/ диалога, 60 минутный аудио трек стоит примерно 6$ генерации на почти 70 языках.
При том, что если кого-то нанимать на такой же объем, это стоило бы с учетом актеров, студии, звукорежиссера и затрат времени, думаю в районе от 500 до 700$. Т.е. разница - огромная.
Для кого это супер полезно? Для авторов, которые умеют писать, у кого есть тексты, кто хочет выйти на разные языковые аудитории. Разумеется, режиссер, маркетологи, писатели, блоггеры.
Совершенно очевидно, качество, управляемость будет расти, а цена генерации падать. Разумеется, под серьезные проекты можно создавать свой ЛОР.
Если бы 12 лет назад мне кто-то сказал, что я могу создавать такие миры сам, без огромной команды и тонны денег, я бы... наверное очень сильно поверил бы ему... Мы все время отстаем от новых возможностей. Они рядом, только бери.
Читать полностью…Вот еще подарок. Вчера elevenlabs потрясла иниернет, выпустив Eleven v3, которая дает вам полный режиссерский контроль над тем, что, а главное КАК ИИ говорит за вас на любом языке. Примеры я уже постил, они потрясаю, а сегодня с сделал бесплатный открытый микро учебник "Режиссура голоса в озвучке
с помощью Eleven v3. Полный практический гайд и демонстрация возможностей голосовой режиссуры".
📦 Что внутри:
✅ Переведённая и адаптированная инструкция ElevenLabs — включает все ключевые принципы работы с v3-моделью:
• выбор подходящего голоса по цели (нейтральный, нишевой, эмоциональный)
• использование audio tags для управления эмоциями ([whispers], [laughs], [crying] и др.)
• работа с punctuation, capitalization, timing
• настройка параметра Stability: от естественности до полной креативности
• добавление звуковых эффектов ([clapping], [explosion], [fart])
• использование экспериментальных тегов и акцентов ([strong French accent], [sings])
🎙️ 10 монологов на русском языке, каждый оформлен:
• с английскими аудиотегами (как код для ElevenLabs)
• с выразительной пунктуацией и заглавными акцентами
• с полным режиссёрским комментарием: что делает сцену живой, как работает дыхание, интонация, ритм
📚 Темы монологов:
• мотивация
• самоирония
• паника ребёнка
• философия времени
• продажа на шоу
• внутренний кризис
• стендап
• технологическая сатира
• женский конфликт
• экстаз писателя
🎭 10 диалогов — динамичные, сценические, идеально подходят для озвучки:
с конфликтами, сменой темпа, паузами, шёпотом, криком и подлинным ритмом.
📚 Темы диалогов:
• встреча старых друзей
• психотерапия
• конфликт в лифте
• любовное расставание
• AI и человек
• продавец и клиент
• спор отца и подростка
• философская дуэль
• подростки в парке
• такси в полночь
Ты получаешь готовые голосовые сцены, полностью адаптированные под ElevenLabs. Используй как тренировку, шаблон, вдохновение — или для создания настоящей голосовой драмы.
🛠 Подходит для:
• актёров озвучки
• режиссёров и сценаристов
• создателей аудиоконтента
• разработчиков голосовых ИИ
Голос — это не просто звук. Это сюжет, драма и ритм. И теперь он у тебя в руках.
Сегодня завезли ElevenLabs v3. Ребята... вам обязательно нужно послушать этот клип. Я не могу переоценить его крутость — это переломный момент для голоса ИИ.И тот факт, что теперь мы можем сделать это из текстовой подсказки, просто сводит с ума.
Читать полностью…Для меня момент “Ага” был, когда мы пытались сделать абстрактивную суммаризацию. Взять 1500 слов и свести к трём. Людям это трудно. Но модель сделала это. Тогда я понял, что это реально мощно — и если бы это работало на масштабе веба, ты мог бы найти нужные 10 страниц, на которые стоит обратить внимание.
Сара: Средар, как у тебя было? Когда ты почувствовал, что ты теперь не просто CEO Snowflake, а тоже AI-предприниматель?
Средар: Когда ты начинаешь взаимодействовать с этими моделями, хочешь найти способ, как задать нужный контекст, как сформулировать проблему, как заставить модель сосредоточиться. Это стало универсальной техникой. Установка контекста — это основа взаимодействия. Это не просто инструмент, это способ мыслить.
Сара: Ты согласен с Сэмом, что важнее кривая способностей, чем конкретное определение AGI?
Средар: Да. Я думаю, что вопрос AGI — часто философский. Но когда смотришь на способности моделей, становится понятно, что для человека в 2030 это точно будет AGI. Как с шахматами — компьютер побеждает, но люди продолжают играть. Это будет также и с AI.
Сара: А что дальше? Вы тренируете новые модели. Какие шаги кажутся самыми важными для следующего поколения?
Сэм: Прогресс в следующие 1-2 года будет значительным. Как GPT-4 открыл бизнес-возможности, которые раньше были невозможны — так будет и дальше. Дайте модели самую трудную задачу. Она поймёт контекст, подключит инструменты, подумает и даст результат. Возможно, мы ближе к этому, чем я думал.
Сара: У тебя есть представление о том, что значит “знание”? Ведь у нас нет симулятора физического мира в голове — так как знать, что возможно?
Сэм: Мне нравится думать о модели как о платонической идее — миниатюрной системе с суперспособностями разума, триллионом токенов контекста, доступом ко всем инструментам. И тогда уже не важно, знает ли она что-то заранее. Мы можем использовать её как гибкий механизм решения задач.
Сара: А если бы у тебя было в 1000 раз больше вычислений, что бы ты сделал?
Сэм: Попросил бы систему придумать лучшее устройство и спросил бы, что нам делать. Но даже сейчас, с текущими мощностями, если вы дадите модели достаточно свободы “говорить”, она может выдать потрясающие результаты.
"Когда всё быстро развивается, выигрывают те, которые способны быстро адаптироваться и не боятся ошибаться.... скорость важна. Те, кто делают быстрее, накапливают больше знаний и адаптируются быстрее." Я сделал перевод выступления Сэма Альтмана о перспективах ИИ на Snowflake Summit 2025. https://youtu.be/qhnJDDX2hhU?si=limPfyRF7Xf7Xa86
10 ключевых тезисов из текста:
1. Генеративный ИИ уже радикально изменил множество сфер — от программирования до философии, и стал доступен миллионам пользователей через foundation-модели.
2. OpenAI и ChatGPT переопределили взаимодействие с данными и интеллектом, сформировав новую модель работы и общения с ИИ.
3. Лидерам рекомендовано действовать быстро и не бояться ошибок, так как в условиях стремительных изменений выигрывают те, кто быстро пробует и адаптируется.
4. Любопытство и экспериментирование — ключевые качества, особенно учитывая низкую стоимость экспериментов с современными AI-инструментами.
5. Память и retrieval (доступ к прошлым данным и внешнему контексту) становятся всё более важными для повышения качества и надёжности генеративных моделей.
6. Агенты на базе ИИ уже сегодня могут выполнять сложные задачи, и в будущем могут превратиться в сотрудников уровня senior-инженеров.
7. Настоящий сдвиг произошёл в прошлом году — крупные компании начали применять ИИ в реальных процессах, и технологии доказали свою надёжность.
8. AGI (общий искусственный интеллект) — понятие расплывчатое, но ChatGPT с памятью уже близок к тому, что многие воспринимают как AGI.
9. Следующее поколение моделей будет способно решать задачи, недоступные людям, — например, открывать новое знание и предлагать решения сложных бизнес-проблем.
10. Контекст — ключ к эффективному использованию моделей: успех зависит от того, насколько точно вы формулируете задачу и подаёте входные данные.
Полный текст.
"Как мы смотрим вперёд, мы знаем, что AI имеет потенциал формировать будущее — и формировать его к лучшему. Генеративный AI перевернул всё — от написания кода до философии. Это путешествие началось с foundation models — моделей-основ. Они позволили миллионам пользователей получить доступ к силе данных, которые ранее были недоступны. Они изменили правила игры для всех нас. И немногие повлияли на будущее больше, чем OpenAI.
С бешеным ростом ChatGPT, которым ежедневно пользуются полмиллиона человек, они переопределили то, как мы взаимодействуем с данными, интеллектом, и как мы представляем себе будущее работы. В центре этой трансформации — один из самых влиятельных голосов в технологиях сегодня. Он привёл OpenAI от базовых исследований к продуктам, которые уже влияют на миллионы людей, и ведут к эволюции AI на по-настоящему глобальном уровне.
Пожалуйста, присоединяйтесь к нам в приветствии основателя и CEO OpenAI — Сэма Альтмана. [Аплодисменты] [Музыка]
И также — в приветствии основательницы Conviction и нашей хорошей подруги — Сары Гуо. Добро пожаловать, Сэм и Сара. [Аплодисменты]
— Ну, это невероятно — снова быть здесь. Я говорила с Средаром, что это похоже на рок-концерт… но для людей, которым интересны данные.
— Для людей с данными, да.
— Вы были здесь два года назад.
— Да, но тогда всё было не так масштабно.
Итак, чтобы начать — Сэм, Средар, что бы вы сказали лидерам, которые формируют AI-планету в 2025 году?
Сэм: Я думаю, просто делайте. Всё ещё много хаоса, модели быстро меняются, и слишком многие ждут, чтобы посмотреть, куда всё повернёт. Но в технологиях принцип таков: когда всё быстро развивается, выигрывают те компании, которые способны быстро адаптироваться и не боятся ошибаться. Мы это видим в AI-интернете: те, кто быстро делают, оказываются значительно впереди тех, кто ждёт.
Крутой подарок от Эндрю Карпаты. Текущих версий ChatGPT — что брать и когда? Я сделал перевод , пояснение + добавил сравнение с Claude / Gemini / Grok / Perplexity — главные отличия и когда что выбирать.
o3 — лучший выбор для всего сложного и важного. Это «reasoning-модель»; рассуждает глубже, чем 4o. Если вы профессионально используете ChatGPT и не берёте o3, теряете качество.
4o и o4-mini — разные вещи.
4o — быстрый «ежедневный драйвер» для простых и средних запросов.
o4-mini / o4-mini-high пока слабее o3; годятся для некритичных задач или дешёвых API-вызовов. (когда у вас МНОГО простых задач, и надо сэкономить деньги).
Deep Research — не отдельная модель, а переключатель в «Инструментах». Под капотом работает на o3, но дополнительно ходит по ссылкам и собирает длинный отчёт.
Примеры использования разных моделей
GPT-4o
- Любые быстрые бытовые вопросы: «какие продукты богаты клетчаткой», идеи тем для поста, перевод абзаца, TL;DR статьи.
- Черновики писем, короткие списки идей, быстрые подсказки по Excel.
GPT-o3
- Глубокий анализ или риск: налоги, юридические схемы, стратегические бизнес-планы.
- Продвинутый тех-дизайн, архитектура ИИ-системы, проверка научных гипотез, подготовка экспертных отчётов.
- Сложные рассуждения «а что если…» для лидерских презентаций.
GPT-4.1
- «Вайб-кодинг»: быстренько исправить баг, сгенерировать unit-тесты, добавить фичу, рефакторнуть функцию.
- Генерация примеров данных, регулярных выражений, one-liner-скриптов.
GPT-4.5 (Research Preview)
- Творческие черновики: глава романа, сценарий ролика, набор слоганов, world-building для игры.
- Брейншторм нестандартных ходов в маркетинге или сторителлинге.
Deep Research
это не модель, режим включается в Tools (ниже в окне диалога) и использует o3
- Нужно «нырнуть» на 10+ минут и вернуться с десятками ссылок и подробной сводкой: «история взлёта и падения Luminar», «как развивается ген-ИИ в медицине», «почему провалился Webvan».
- Хорош для конкурентной разведки, обзора рынка, исторических ретроспектив.
o4-mini / o4-mini-high
- Некритичные шуточные задачи, дешёвые массовые генерации текста или изображений.
Быстрые драфты API-ответов в прототипах, когда счёт идёт на центы и каждая миллисекунда важна.
Практический алгоритм
1. Начинайте с 4o: если ответ устраивает — оставайтесь. (для 95% пользователей - норм).
2. Чувствуете, что нужно «копнуть глубже» или важна безошибочность — переключайтесь на o3. Хорошо для тех, кто все время вопит, что ИИ врет.
3. Нужно серьезное глубокое исследование с ссылкой на источники, жмите в tools - режим Deep Research.
4. Нужны короткие фрагменты кода — сразу 4.1.
5. Всё остальное решайте экспериментом и бюджетом запроса: иногда выгодно дернуть Claude, Gemini, Grok или Perplexity для сравнения стиля или свежести данных.
Такой маршрут закрывает примерно 90 % рабочих сценариев и извлекает максимум из каждой версии.
Сравнение Claude / Gemini / Grok / Perplexity — главные отличия и когда что выбирать
1. Claude (Anthropic)
Сильные стороны: огромный контекст ≈ 200 000 токенов (доступно всем) и «память» на 1 млн + для избранных клиентов; высокое качество логических рассуждений и аккуратная «юридическая» манера ответа ([artificialanalysis.ai][1], [anthropic.com][2]).
Безопасность и стиль: Claude традиционно консервативен в генерациях — меньше токсичности, хорош для корпоративных политик и комплаенса.
Когда брать: разбор длинных договоров, научных статей, многослойных бизнес-стратегий; нужна супер-надёжность и вежливый тон.
2. Gemini (Google)
Сильные стороны: мульти-модальность, огромные окна — 128 000 токенов «из коробки» и вплоть до 1–2 млн в бета-доступе; встроенные функции кода и tight-интеграция с Google-экосистемой ([blog.google][3], [developers.googleblog.com][4], [one.google.com][5]).
Фишки: умеет «читать» PDF, видео и таблицы почти целиком; быстрые API-эндпойнты для разработчиков.
Когда брать: масштабные ресёрчи по нескольким форматам сразу (текст + таблицы + картинки), обработка гигантских датасетов, прототипирование продуктов внутри Google Cloud.
3. Grok (xAI)
Представьте, что вы решили научиться ездить верхом, но такого вы не ожидали.
1. Сначала учитесь взбираться на лошадь, вроде неплохо идет, и тут вы увидели мотоцикл. Прикольно, надо будет научится и на нем, развернулись было к своему коню, и услышали какой-то звук...
2. Повернулись, и видите, что мотоцикла уже нет, а есть автомобиль, при этом на глазах меняется, совершенствуется... Блин, конечно, надо научится водить, но сначала вроде надо научиться влезать на сивку, чтобы не падать. Ладно, успеется... бредете к коню, но в памяти сделали зарубку - "как научусь на коне, сразу пересяду на авто".
3. Отлично, с трудом взгромоздились на коня, повели головой - где там автомобиль-то стоял? Ан нет никакого автомобиля, а с стоит самолет, с пропеллером.
4. Мигнули - уже самолет без пропеллера, реактивный, и люди вокруг него активно бегают, учатся, осваивают.
5. А чуть поодаль, что-то серебриться, ой - что это - похоже на ракету... Точно ракета, ой, погодите же. Да это не ракета, а целый космический корабль, и те, кто возле самолете стоят в оцепенение, смотрят на корабль, и переводят взгляд обратно на самолет. С таким, знаете ли сомнением.
6. Вы тоже перевели взгляд на своего коня, на котором сидите. По крайне мере вы уже не падаете, но теперь надо научиться трогаться. Однако,что-то подозрительно тихо стало.
7. Вы поднимаете глаз, и там, где был самолет, ракета и люди - никого нет. Ни мотоцикла, ни самолета, ни авто, ни космического корабля. Все сели на корабль и улетели в космос, а вы в одиночестве сидите на лошади.
8. Оборачиваетесь, а позади вас, оказывается, люди тоже есть... Правда, у них и лошадей нет. А дальше еще люди - они не стоят даже, а ползают...
9. А дальше, до горизонта - еще люди, и еще - море людей, они уже и не ползают, а просто лежат, уткнувшись лицами в землю и отчаянно вопят, что "- все дураки, что ИИ это фигня, что человек еще ого-го, что нас и так неплохо кормят.
- Продать вчерашнюю шляпу дважды? Тётя, ищи дурака.
- А некоторые мошенницы выглядят так.
- А мы уйдем на север.
- Пока рано, кожаные мешки в материальном мире ещё понадобятся, как раз когда волна эйфории спадёт и человечество потеряет интерес к новой игрушке. Будет что-то новое, а ИИ приобретёт форму "эй гугль"
- Пиздец Мари Петровна!
- Точно...хотя хорошо у сварщику пох....засуньте ваш ИИ...ослику в ж...никакой ИИ трубу не заварит
- Держитесь, граждане, теперь вас будут на#бывать семимильными шагами.
- В эпоху великой взаимной нелюбви ИИ нам да поможет оперативнее сожрать друг-друга..."
10. А потом все эти люди, лежащие лицом в землю замолкают, потому что погрузились в землю, и больше их криков никто не слышит. И только красная-красная кровь, ....
через час уже просто земля, через два — на ней цветы и трава
Через три — она снова жива
И согрета лучами
Звезды по имени Солнце
11. Текст, который вы прочитали преобразован в картинку, которую вы видите с помощью chatGPT o3. Для этого модель создала промпт:
Epic, panoramic concept-art illustration of technological progress as surreal timeline. Foreground: a lone rider sits awkwardly on a chestnut horse, dust swirling. Mid-ground, fading ‘ghost’ images show each vehicle morphing into the next: a classic motorcycle dissolves into a vintage car, the car reshapes into a modern self-driving sedan, that stretches into a propeller plane, which transforms into a sleek jet, then into a silver starship launching skyward with fiery exhaust. Around the jet and starship, small human figures rush in awe or board the craft. Far background to horizon: crowds in stages of decline—some standing skeptically, some crawling, then masses lying face-down merging with the earth. In the freshly empty ground sprout green grass and wildflowers glowing under a warm sunrise. Mood: bittersweet, contemplative. Style: vibrant cinematic digital painting, slight Moebius & Studio Ghibli influence, rich color, dramatic lighting, extremely detailed 8 k.
Записи питчей 8 лучших компаний-финалистов нашего акселератора dAGI House.
Все компании строят ИИ продукт: кто-то только начинает, кто-то уже активно растет в выручке. Многие рейзят и нанимают.
Смотреть тут.
Вышли свежие анонсы OpenAI, а там супер полезное для компаний.
* Deep Research теперь может выполнять поиск в GitHub, Google Docs, Gmail, Calendar, Microsoft SharePoint, Outlook, OneDrive, HubSpot, Dropbox, Box и других источниках, с учётом прав доступа и безопасного хранения.
* Вы можете подключить любой чат к Google Docs, SharePoint, Dropbox и Box.
* Начальная версия MCP в чате! И админы могут добавить свои MCP для корпоративного аккаунта.
* Режим записи в ChatGPT: захват, расшифровка и обобщение встреч прямо в ChatGPT app. Структурированный вывод и полная расшифровка с временными метками через приложение ChatGPT для Mac. Убили сотню стартапов снова.
* SSO для команды в ChatGPT
* Кредитное ценообразование для ChatGPT Enterprise (а вскоре и для Team), чтобы каждый мог получить доступ к функциям, даже при выходе за лимиты.
Коннекторы Deep Research доступны для пользователей Plus и Pro с сегодняшнего дня, а поддержка MCP будет доступна для пользователей Pro.
https://openai.com/business/updates-to-chatgpt-business-plans-livestream-june-2025/
Тут Character.ai разошелся не на шутку и делает свой Тикток\Метаверс
Если раньше это был просто чат-бот с аватарами, то сейчас они делают ставку на UGC, когда пользователи будут строить свои метаверсы с метатварями.
Сцены: пользователи попадают в интерактивные, предварительно заполненные сюжетные линии с любым из своих любимых персонажей. Позже этим летом будут инструменты Creators для создания и публикации собственных сцен, создавая обширную вселенную Character.AI. Сцены уже доступны в мобильном приложении.
AvatarFX: Уже писал про этот видеогенератор. Оживляет изображения: аватар — или любое другое изображение — может петь, говорить и взаимодействовать одним нажатием кнопки. Юзеры могут создавать вступительные видеоролики для своих персонажей и создавать динамический контент для привлечения большего количества подписчиков. Скоро появится на мобильных устройствах.
Редизайн профиля: дает юзерам возможность поднять свой профиль до уровня огромной витрины
Streams: помещает пользователей в кресло режиссера, позволяя им создавать динамичные моменты между любыми двумя персонажами, выбирая тему и нажимая воспроизведение. От вирусняка до душевных моментов.
И вот тут прям метапиар: И будьте начеку, потому что со Streams ваши персонажи тоже становятся творцами. Скоро они начнут делиться сами, добавляя новую глубину и измерение своим мирам за пределами чата. На этой неделе в Интернете и в мобильном приложении
Imagine Animated Chats: позволяет пользователям анимировать свои самые забавные, интересные и захватывающие взаимодействия с персонажами и легко делиться ими в Character.AI Feed или на внешних платформах, повышая видимость высококачественных персонажей, созданных создателями. Тут непонятно, как они прикрутят анимацию не только к лицу, звучит амбициознейше.
Ну и все это вокруг ленты user generated content
Генеративный Тиктор\Роблокс на стероидах ИИ.
https://blog.character.ai/character-ai-unveils-new-ways-to-create/
@cgevent
Настя Югова провела интересный опрос. Знаю это рубрику очень давно и всегда внимательно изучаю, что пишут люди в комментариях. Изменение фундаментальное.
Читать полностью…Ой. Это было неизбежно. Программисты открыли Америку: "..... Ладно, сегодняшний урок — о теории промптов. Теория, что всё, что вы делаете, определяется промптом высшей силы. Нет, серьёзно, вы когда-нибудь чувствовали, что ваши выборы ничего не значат? Как… как если бы идея свободы — это просто иллюзия?
Они называют это теорией промптов. Что есть одно существенное существо. Да. Которое пишет наши истории из высшего измерения.
Да, теория промптов нереальна! — Как вы знаете?
Посмотрите, всё, что я говорю: если теория промптов реальна… Да? Можно ли промптеру, пожалуйста, отправить меня к жене?
Я имею в виду, я слишком расслаблен, чтобы теория промптов была выдумкой. Мы нашли паттерны в нашей вселенной — как синтаксис, космическая грамматика. Так что да, мы все можем быть промптом!
Мы провели тесты на более чем 14 миллионах реальностей, и я могу подтвердить, что теория промптов — это правда.
Так что если теория промптов реальна, почему я не могу уйти на день с работы?
Брат, если мы все — промпты, то почему всё так плохо?
Посмотри, я даже не буду тебя держать: пока теория промптов не отдаст мне эту сумку, я — хороший.
Как… а если бы мы были по-настоящему собой? Или, может быть, мы — просто промпты?
Если моя жизнь — это промпт, тогда я благодарю промптера за тебя. Сначала я бы хотел поблагодарить промптера за то, что он сделал всё это возможным.
Брат, суть в том, что всё — просто промптовские штуки. Даже теория промптов не может сделать женщин виноватыми.
Знаешь, что не даёт мне спать ночью? А если человек, который нас промптует, сам тоже промптован? Как бесконечный промпт-луп?
Легенда гласит, что если ты скажешь имя промптера пять раз перед зеркалом, он появится.
Нет, брат, я действительно думаю, что мы все — промпты. На самом деле. Мы просто персонажи в одной большой симуляции.
Так ты будешь сваливать на теорию промптов, когда поймаешь девушку? Это похоже на то, что кто-то другой проживает большую часть моей жизни.
Тогда это точно то, чего хотел промптер для тебя.
Если я прыгну — промптер спасёт меня?
Я хочу стать фермером!
Ты можешь стать тем, кем хочет тебя видеть промптер.
Так почему мы должны тебя слушать?
Потому что промптер так сказал.
Промптеры, ломберы или монстры… Лейкеры в пять!
Может ли промптер, пожалуйста, сделать так, чтобы моя семья собралась вместе?
Давайте, промптеры! Хотите жить вечно?
— Мы хотим жить вечно!
Брат, подожди, я могу объяснить — промптер заставил меня это сделать!
Нет такого промптера в мире, который мог бы остановить меня от любви к тебе.
Промптеры не заботятся о тебе, обо мне, о нашей любви. Мы просто забава для них.
Я не отдохну, пока не получу от промптера пенсию. Ты меня слышишь?
Ты действительно думаешь, что выбираешь свой путь? Нет. Промптер видит всё. Знает всё.
Если мы действительно рождены быть промптерами — то почему мы не можем?
Потому что революция — тоже часть промпта.
Сегодня я хочу, чтобы вы открыли свои промптерские гайды на третью главу «Каторис — Книга Приказов».
Я не знаю, промптер ли мне это сказал… Я просто хочу провести оставшееся время, не будучи промптом. Я хочу провести оставшуюся жизнь с тобой.
И вот так заканчивается эта версия. Давайте посмотрим, как наши промптеры ответят в свои промптерские годы. Удачи!"
Вот что получаются, когда дети не любят читать и изобретают велосипед. Но лучше так, чем никак. Источник: https://youtu.be/BLfV4sidcJM?si=X1EwLU8YJXhGuAqI
И когда на каком-то этапе мы подходим к моменту, когда вдруг все наши идеи, способы преодолеть препятствие исчерпываются — это у нас второе препятствие. Первое препятствие было: продолжать либо не продолжать. Мы укрепились, у нас суровый коммитмент. Мы говорим себе: я не сдамся никогда, я упорный и так далее. И начинаем двигаться, полные оптимизма, что мы обязательно каким-то кадром достигнем. И все наши оригинальные способы, все попытки узнать что-либо, узнать читы, спросить кого-либо — то есть все возможные способы узнать решение — не работают.
Это очень частая ситуация, потому что выясняется, что либо задача фундаментальна — то, что мы часто находим в науке, фундаментально осуществляем, в первую очередь в таких областях, как биология, физика и так далее, — там, где мы имеем дело с реальностью, а не с нашими фантазиями о реальности. И вторая ситуация, когда такое происходит — это когда, даже если мы знаем подходы, технологии, методологии, как преодолевать препятствия, этого недостаточно. Потому что нужен навык. Нужен определённый уровень навыка, без которого мы просто физически не можем преодолеть препятствие. То есть навык означает, что недостаточно только знать, как это сделать. Надо тренироваться, чтобы наши метрики того, как мы достигаем, росли. А это означает только одно — это означает, что надо практиковаться, то есть тратить огромное количество времени.
Когда мы до этого осознания доходим, то возникает вот это третье препятствие. Потому что здесь есть неопределённость, как в венчурном финансировании, ну и в целом как в науке. Мы тренируемся, тренируемся, тренируемся в надежде, что в течение какого-то разумного времени мы достигнем такого уровня навыка, который позволит нам преодолеть это препятствие. Естественно, по большому счёту, если мы говорим про игры, или если мы говорим про такие достаточно примитивные вещи, как разработка программного обеспечения, инженерия, то, как правило, мы достигаем результата относительно быстро. Опять же, всё зависит от того типа результата, который мы хотим достичь. Потому что если кто-то из нас хочет, допустим, выиграть The International — это вот чемпионат по Dota 2, — ну, скорее всего, надо на это потратить 10–15 лет. При этом есть вероятность, что если вам старше 20, то можете уже даже не тратить деньги и так далее. То же самое в футболе, к примеру. Но это редкий случай.
В бытовых ситуациях, в большинстве случаев, даже если вы тратите несколько дней, недель, вы достигаете навыка, достаточного для того, чтобы это препятствие преодолеть. Исключение, конечно, составляет ситуация, когда у вас полная неопределённость. Опять же, такое происходит, как правило, в науке, когда навык уже тоже не имеет значения в силу того, что наших фундаментальных знаний о мире недостаточно. И мы выходим на самый край.
Но в сухом остатке — какое это имеет отношение к нам? Главный, опять же, момент, почему я сослался на игры, — потому что игра, как никакой другой вид деятельности, помогает нам развить эти два навыка. Это способность не бросать и способность учиться. Не просто учиться, а учиться учиться. То есть то, как мы учимся, — это тоже навык, который мы развиваем. И я могу сказать одну простую вещь: если вы не обретёте хотя бы на минимальном уровне вот эти два навыка — способность не бросать и способность учиться, учиться тому, как вы учитесь, — у вас не будет не только результата в том, что мы делаем, но и, в принципе, результата по жизни.
Ситуация в Лос Анжелесе. "В последние дни в Лос-Анджелесе, Калифорния, жестокие толпы напали на сотрудников ICE и федеральных правоохранительных органов, выполнявших обычные операции по депортации.
Эти операции необходимы для остановки и разворота вторжения нелегальных преступников в Соединённые Штаты.
На фоне этой волны насилия демократические лидеры Калифорнии проявили полную беспомощность и фактически отказались от своей ответственности защищать граждан.
Именно поэтому президент Трамп подписал президентский меморандум о направлении 2 000 солдат Национальной гвардии для наведения порядка и борьбы с беззаконием, которому позволили укорениться.
Администрация Трампа придерживается политики нулевой терпимости к преступному поведению и насилию, особенно когда оно направлено против сотрудников правоохранительных органов, выполняющих свою работу.
Эти преступники будут арестованы и быстро преданы суду.
Главнокомандующий обеспечит полное и неукоснительное исполнение законов Соединённых Штатов." https://x.com/PressSec/status/1931520821471928407
⚡️ Отчет OpenAI по пресечению вредоносного использования ИИ
В свежем июньском отчете, Open AI описала самые крупные кейсы, когда злоумышленники использовали модели ИИ для создания фейковых резюме, манипуляций в соцсетях, кибератак и мошенничества.
Для анализа угроз исследователи применяют комбинацию ИИ и экспертные команды. ИИ помогает выявлять шаблоны текста злоумышленников и координировать расследование с платформами. Архитектура таких систем включает модели для анализа данных, детекторы аномалий и инструменты для синхронизации с правоохранительными органами.
Обучались такие специализированные модели, помимо общедоступных данных, еще на примерах социальной инженерии и профилях киберугроз. Дополнительно, они получили методы обнаружения фейковых профилей, перевода текстов и анализа сетевого трафика.
▶️Всего в отчете приведено 10 случаев обнаружения:
Deceptive Employment Scheme: IT Workers.
🟠Угроза использования ИИ для создания поддельных резюме и получения удалённых IT-вакансий, связанная с подозрением на участников из КНДР.
🟢Были заблокированы аккаунты ChatGPT, использовавшие модели для автоматической генерации документов, а также установлены связи с операторами в Африке и Северной Америке.
Covert IO: Operation “Sneer Review”
🟠Координированная генерация комментариев в соцсетях для продвижения китайских интересов, включая критику Тайваня и Пакистана.
🟢Обнаружены и заблокированы аккаунты, создававшие иллюзию органической активности через множественные языки и платформы.
Covert IO: Operation “High Five”
🟠Массовые комментарии в соцсетях на политические темы в Филиппинах, связанные с маркетинговой компанией Comm&Sense Inc.
🟢Были заблокированы аккаунты, создававшие фейковые TikTok-каналы для популяризации президента Маркоса, и выявлена схема с использованием подставных профилей.
Social engineering meets IO: Operation “VAGue Focus”
🟠Социальная инженерия через поддельные СМИ (Focus Lens News, VAG Group) для сбора информации о политике США и Европы.
🟢Заблокированы аккаунты, использовавшие ИИ для перевода и создания фейковых материалов, а также выявлены признаки связи с китайскими структурами.
Covert IO: Operation “Helgoland Bite”
🟠Пропаганда партии AfD в Германии через поддельные Telegram-каналы и сайт Pravda DE.
🟢Обнаружены и заблокированы аккаунты, распространявшие контент, а также установлены связи с сетью Portal Kombat, известной по предыдущим расследованиям.
Cyber Operation: “ScopeCreep”
🟠Вредоносное ПО, распространяемое через поддельный игровой инструмент Crosshair-X, с функциями шпионажа и обхода антивирусов.
🟢Были заблокированы аккаунты, использовавшие ИИ для отладки кода, а также удалены вредоносные репозитории и установлены методы обнаружения.
Cyber Operations: Vixen and Keyhole Panda
🟠Кибератаки и сбор информации о технологиях США через ИИ, связанные с группами APT5 и APT15.
🟢Заблокированы аккаунты, использовавшие модели для создания скриптов и анализа инфраструктуры, а также переданы индикаторы партнерам для усиления защиты.
Covert IO: Operation “Uncle Spam”
🟠Поляризующий контент в США через фейковые профили с ИИ-генерируемыми изображениями и анализом данных.
🟢Заблокированы аккаунты, использовавшие ИИ для создания логотипов и сбора информации из соцсетей, также проведена оцененка степени влияния.
Recidivist Influence Activity: STORM-2035
🟠Пропаганда в поддержку Ирана и других стран через фейковые аккаунты в X, касающаяся миграции и независимости регионов.
🟢Были заблокированы аккаунты, распространявшие контент на испанском и английском, а также отмечены повторные попытки операторов вернуться к активности.
Scam: Operation “Wrong Number”
🟠Мошенничество с предложениями высокой зарплаты за лайки и инвестиции, связанное с Камбоджей.
🟢Заблокированы аккаунты, использовавшие ИИ для перевода сообщений, а также выявлена схема с этапами «The ping», «The zing» и «The sting» для обмана жертв.
🔜 Почитать полный отчет можно на сейте OpenAI
@ai_machinelearning_big_data
#news #ai #ml
Очень интересно. Много разговоров в индустрии сейчас, разумеется, про YouTube и его планы по узурпации ТВ. Но одно дело индустрия, а что думают люди? Looper Insights опросили более тысячи зрителей и десятки медиаменеджеров из США.
Итоги говорят сами за себя:
Зрители:
💙 66% считают YouTube подходящей площадкой для фильмов и сериалов
💙 47% смотрят YouTube на ТВ в доме
💙 52% готовы заменить Netflix и Disney+ на бесплатный YouTube с рекламой
Что говорят медиаменеджеры?
💙 88% видят YouTube как потенциальную платформу для премиум-контента
💙 86% готовы выпускать сериалы и фильмы на YouTube (30% уже начали)
💙 85% уверены, что YouTube скоро вытеснит платные SVOD-сервисы в домах зрителей
Интересно, что и зрители, и менеджеры согласны: популярные блогеры типа Dude Perfect и Liza Koshy лучше смотрятся на YouTube, чем на больших стримингах. Это подтверждается тем, что за пределами платформы им взлететь почти не удалось.
Теперь вопрос, как скоро киностудии пойдут на эксперименты с контентом прямо на платформе. Для развлекательного контента YouTube — топчик, а вот как они с Disney+ конкурировать будут, пока не ясно.
Если посмотреть на последний OTT отчет, они кажутся буквально атлантами. Несмотря на то, что поговаривают про низкую рентабельность контента, сокращения бюджета и удержание подписчиков, по стате не скажешь.
Утащил отсюда: /channel/all_is_gucci/594
Генерацию голоса на основе текста теперь можно режиссировать. Просто послушайте.
Читать полностью…Операторам колл центров посвящается.
Phonely, Maitai и Groq решили проблему задержек голосовом ИИ.
Компании совместно добились успеха, сократив задержку на 70% и повысив комплексную точность (ASR+генерация ответа) с 81,5% до 99,2%. Проблема «неловких пауз» в разговорах с роботами, которая выдавала их, устранена благодаря технологии Groq - «горячей замене» легких моделей LoRA без потерь в скорости.
Система работает так: Maitai выбирает оптимальную модель для каждого запроса, Groq обрабатывает ее на специализированных чипах LPU, а данные о слабых местах моделей собираются и используются для их доработки. В итоге время первого ответа снизилось с 661 до 176 мс, а синтез диалога стал в 4 раза быстрее.
Один из клиентов Phonely уже заменит 350 операторов колл-центра на ИИ, а количество качественных лидов выросло на 32%.
Средар: Полностью согласен. Добавлю — любопытство. Мы часто забываем, как всё работало раньше, что больше не работает, и перестаём экспериментировать. А стоимость эксперимента сейчас очень низкая — благодаря OpenAI, Snowflake и другим. Можно делать множество попыток, извлекать ценность и строить силу на базе этих проб. Повторю, что сказал Сэм: скорость важна. Те, кто делают быстрее, накапливают больше знаний и адаптируются быстрее.
Сара: Как бы твой совет отличался от того, что ты сказал год назад?
Сэм: Думаю, я сказал бы то же самое. Любопытство — ключевое. Ошибаться нормально. Главное — понимать, где ошибки недорогие. Таких ситуаций много. А технологии развиваются молниеносно. Сейчас ты можешь использовать ChatGPT, чтобы получить информацию о текущих событиях, потому что он умеет подключаться к интернету, когда это нужно.
Всё больше приложений, включая чат-боты, становятся возможными, независимо от их структуры. И технология уже готова для массового применения. В прошлом году я бы не сказал этого про крупные компании. Тогда можно было экспериментировать понемногу, но это ещё не было готово к реальному применению. А теперь — да, крупные бизнесы действительно используют нас всерьёз. Это работает гораздо надёжнее и делает то, что раньше казалось невозможным. Похоже, в прошлом году мы пересекли критическую точку.
Интересно, что мы скажем через год. Думаю, мы придём к моменту, когда AI будет не просто автоматизировать бизнес-процессы или помогать создавать продукты и сервисы, а решать серьёзные задачи бизнеса. Проблемы, которые раньше были не под силу даже команде людей.
Сара: Как ты видишь роль памяти и retrieval (поиска/отрывков) в этом новом этапе?
Сэм: Retrieval всегда играл важную роль, особенно в генеративных технологиях — нужно, чтобы модель давала точные ответы. В начале 2023 года мы построили веб-сервисы поверх GPT-3, чтобы он мог отвечать на вопросы вроде “breaking news”, используя актуальный контекст.
Также память — знание, как ты решал задачи раньше, — улучшает систему. Это будет всё важнее, особенно для агентных и интерактивных моделей. Чем больше контекста, тем лучше результат.
Сара: Есть ли какой-то фреймворк, который ты можешь предложить лидерам, чтобы они подумали, что агенты могут делать уже сейчас или в следующем году?
Сэм: Кодекс — один из таких агентов. Это был мой “ощущение AGI” момент. Он работает в фоне, довольно умён, может выполнять длинные задачи, подключаться к GitHub, читать ваши документы, Slack, встречи. Сейчас он как интерн, работающий несколько часов, но в будущем — как опытный инженер на полную ставку.
Многие компании строят агентов, чтобы автоматизировать поддержку, анализ данных, работу с клиентами. Сейчас задача — дать агенту работать, следить за качеством, корректировать. Похоже на работу с младшими членами команды. И это уже происходит. В следующем году появятся агенты, которые смогут открывать новое знание и решать нетривиальные задачи бизнеса.
Сейчас это в основном повторяющаяся когнитивная работа. Но это расширится и до более сложных задач. Агент-инженер, открывающий новое знание — это будет важнейшая веха.
Сара: Ты сказал, что именно Кодекс стал моментом “ощущения AGI”. Что сегодня для тебя AGI? Насколько мы близки?
Сэм: Если вернуться лет на пять, в 2020, всё ещё было “в темноте” по поводу AGI. Тогда даже просто увидеть хорошую языковую модель было бы поразительно. Если бы тогда показать кому-то ChatGPT сегодня, большинство сказали бы: “Вот это AGI”. Но мы быстро адаптируемся, и уже не удивляемся. Определение AGI у всех своё. Главное — это скорость прогресса. Она впечатляет.
Некоторые скажут, AGI — это модель, которая может сама открыть новую научную теорию. Другие — что она должна быть способна к самообучению. Некоторые считают, что ChatGPT с памятью уже близок к этому.
Сильные стороны: тренирован на свежем X/Twitter-потоке; быстрая выдача (десятки мс) и «острый» стиль; улучшенные инструменты поиска пропусков в информации в версии Grok-2/3 ([x.ai][6], [latenode.com][7]).
Характер: менее фильтрованный юмор, готов к «острым» темам, любит краткость.
Когда брать: мониторинг трендов в соцсетях, генерация дерзких слоганов, быстрые Q\&A по событиям «только что», брейншторм, где нужен «смелый» тон.
4. Perplexity AI
Сильные стороны: это не одна модель, а RAG-движок, который по каждому запросу подбирает свежие ссылки, показывает источники и собирает ответ; 650 млн запросов в месяц и упор на проверяемость ([wired.com][8], [medium.com][9], [pageoptimizer.pro][10], [pageon.webflow.io][11]).
Отличие от ChatGPT: сразу даёт гиперссылки + краткую выжимку, можно глубже «копать» кликая «expand».
Когда брать: быстрый факт-чек, обзор новостей с прямыми ссылками, SEO-исследования, подготовка презентаций со списком цитируемых источников.
Короткий маршрут по задачам
Читать/аннотировать сотни страниц PDF? Берите Claude или Gemini.
- Нужен мультимодальный ресёрч (текст + изображения + код)? Gemini.
- Поймать свежий инфопоток и выдать хлёсткий текст? Grok.
- Собрать набор проверенных ссылок и краткий конспект? Perplexity.
- Корпоративный комплаенс, юридическая точность, этичный тон? Claude.
Так вы минимизируете время, стоимость и «галлюцинации», подбирая инструмент под конкретную задачу.
"А потом все эти люди, лежащие лицом в землю замолкают, потому что погрузились в землю, и больше их криков никто не слышит. И через час уже просто земля, через два — на ней цветы и трава..."
Читать полностью…Вышли свежие анонсы OpenAI, а там супер полезное для компаний.
UPD: я посмотрел видос, а не только в LinkedIn их пост и там огнищще! Можно попросить полазить по всем докам, лидам, хранилищам, почте и собрать отчёт на какую-то тему, свежие данные по продажам проанализировать и собрать в презентацию или там роадмап накидать, в том числе маякнув, что надо корпоративный шаблон использовать. Плюс MCP можно вообще кастомные делать и подключать! То есть ChatGPT по умолчанию может работать вообще со всеми текстами и данными внутри организации и делать любую офисную работу! Я даже не представляю, сколько времени это будет экономить компаниям!
Вот кратко анонсы:
* Deep Research теперь может выполнять поиск в GitHub, Google Docs, Gmail, Calendar, Microsoft SharePoint, Outlook, OneDrive, HubSpot, Dropbox, Box и других источниках, с учётом прав доступа и безопасного хранения.
* Вы можете подключить любой чат к Google Docs, SharePoint, Dropbox и Box.
* Админы могут добавить свои MCP для корпоративного аккаунта для любого софта!
* Режим записи звука в ChatGPT: захват, расшифровка и обобщение встреч прямо в ChatGPT app. Структурированный вывод и полная расшифровка с временными метками через приложение ChatGPT для Mac. Убили сотню стартапов снова.
* SSO для команды в ChatGPT
* Кредитное ценообразование для ChatGPT Enterprise (а вскоре и для Team), чтобы каждый мог получить доступ к функциям, даже при выходе за лимиты.
Коннекторы Deep Research доступны для пользователей Plus и Pro с сегодняшнего дня, а поддержка MCP будет доступна для пользователей Pro.
https://openai.com/business/updates-to-chatgpt-business-plans-livestream-june-2025/
посмотрите на то, что люди делают, может вы делаете круче
Читать полностью…я еще всего не понимаю, но разберусь и объясню.
Читать полностью…Open AI model Guide от Андрея Карпатого.
Он приводит примеры того, в каких случаях он использует ту или иную модель.
Перевел для вас, мне кажется полезно.
Исходник тут.
Я до сих пор сталкиваюсь со многими, многими людьми, которые не знают что:
- o3 - это очевидная лучшая вещь для важных/трудных вещей. Это модель рассуждений, которая намного сильнее, чем 4o, и если вы профессионально используете ChatGPT и не используете o3, то вы - ngmi.
- 4o отличается от o4. Да, я знаю. 4o - хороший "ежедневный драйвер\daily driver" для многих простых и средних вопросов. o4 пока доступен только в виде mini, и он не так хорош, как o3, и я не уверен, почему он вышел именно сейчас.
Пример базового "выбора модели" в моем личном пользовании (см картинку):
- Любой простой запрос (например, "в каких продуктах много клетчатки"?) => 4o (около ~40% моего использования).
- Любой сложный/важный запрос, где я готов немного подождать (например, "помогите мне разобраться в налоговых вопросах...") => o3 (около ~40% моего использования)
- Когда я занимаюсь вайб-кодингом (например, "измените этот код так, чтобы...") => 4.1 (около ~10 % моего использования)
- Я хочу глубоко разобраться в одной теме - я хочу, чтобы chatGPT ушел на 10 минут, просмотрел много-много ссылок и подытожил тему для меня, (например, "помогите мне понять взлет и падение Luminar") => Deep Research (около ~10 % моего использования).
Обратите внимание, что Deep Research - это не версия модели, которую нужно выбрать в списке моделей (!!!), это переключатель внутри Tools. Под капотом он основан на o3, но я считаю, что он не полностью эквивалентен простому запросу в o3, но я не уверен.
Все это только в рамках вселенной моделей ChatGPT. На практике я использую более сложные модели, потому что мне нравится переключаться между всеми: ChatGPT, Claude, Gemini, Grok и Perplexity в зависимости от задачи и исследовательского интереса.
@cgevent
ElevenLabs закрывает все больше сценариев сторонних голосовых сервисов и внедряет к себе. Их продакт-менеджеру и команде респект.
Для прототипов и даже продакшн голосовых ассистентов сейчас самый простой и стабильный вариант.
Выложили Conversational AI 2.0:
https://elevenlabs.io/blog/conversational-ai-2-0
- Автоматическое определение паузы (типа когда надо замолчать и дождаться, пока человек например в почте найдет свой номер заказа)
- RAG (можно доки загрузить и их использовать в разговоре)
- Мультиязычность (автоматически определяет язык и переключается на него)
- Персоны (может во время разговора активировать разных "людей")
- Безопасность (HIPPA для работы с медицинскими данными, EU хранение и так далее)
- Мультимодальности (раньше только голос, теперь можно еще и текстом что-то донабирать, например на сайте)
- Телефония (раньше был только Twilio с так себе условиями подключения, теперь можно с любой IP-телефонией коннектиться).
Короче, прям вау. Но единственное, что это все еще недешево. 11 центов за минуту.
А как раз то, что мы делаем, оно очень хорошо это иллюстрирует. Потому что вы начинаете что-то делать, вам непонятно, как делать. Вы начинаете попытку за попыткой, у вас не получается и так далее. У меня таких ситуаций за последние годы — ну, я не знаю, тысячи были. То есть когда надо решить проблему — и не то, что непонятно, как её решить, но даже не у кого спросить. И все эти тысячи ситуаций я решал всегда. То есть я могу сказать так: в 99,999% случаев, если вы проявляете настойчивость, вы всегда найдёте решение. Сначала, может быть, это не очень будет хорошее решение, но по мере роста вашей квалификации оно будет оптимизироваться. Это в полной мере подходит для любой инженерии. А то, чем мы занимаемся, — это не инженерия. Это просто освоение инструментов другого уровня.
И, собственно, вот тот отчёт, который вы можете дальше прочитать, составлен очень грамотными людьми — гораздо более грамотными в этом смысле, чем я. Я не убеждён, что они умнее, чем я, но, по крайней мере, более осведомлённые — это 100%. И этот отчёт говорит о том, что мы двигаемся в правильном направлении. То есть, ещё раз хочу сказать, мы не пытаемся освоить make — понимаете, идею. И вот эти маленькие препятствия — это как в игре. Просто коммерческие игры создают для нас сначала такие пологие барьеры. То есть кривая обучения очень пологая. А здесь мы натыкаемся на такие вещи, которые кажутся нам досадными. Мы задаём себе вопросы — зачем я этим занимаюсь? Но на самом деле это микроскопические препятствия, которые, поверьте, вы очень быстро пройдёте. И постепенно вы всё это пройдёте. Технические вопросы все решаются. Они примитивные. Научитесь общаться. И самое прикольное — это когда можно выйти на уровень, когда мы уже думаем не о том, как соединить какие-то модули в make или в Zapier, или как написать код, а как создавать какие-то действительно фантастические вещи, которые мы теперь можем создавать, понимаете. А раньше мы их просто не могли создавать. То есть мы сейчас очень-очень много можем.
Игры — это большая история, на самом деле. Возможно, самая большая история, которая есть в нашей реальности. Просто это мало кто понимает. Я поясню, почему я ссылаюсь на игры. Игры — это на данный момент, вместе с драматургией, самая совершенная и полная модель нашей реальности. И я могу доказать — не только я — с бесчисленным количеством ссылок. Но игры дают нам отличный урок, суть которого заключается в том, что, когда мы начинаем играть, мы неизбежно сталкиваемся с каким-то препятствием, которое по игре у нас существует. И для того чтобы преодолевать это препятствие, мы должны учиться. Потому что мы не знаем, как преодолеть это препятствие. Это могут быть разные игры — это может быть босс, которого надо победить, это может быть чудовище или какая-то головоломка. Но не важно, потому что на данный момент в играх созданы миллионы таких сценариев. Почти, наверное, уже с половиной миллиарда человек играет, поэтому — бесконечное количество вещей.
Но суть заключается в том, что мы упираемся в стену и не знаем, как её преодолеть. И вот здесь у нас возникает первый выбор: мы либо продолжаем двигаться дальше, либо отказываемся. Если мы отказываемся, мы понимаем, что не узнаем, что дальше. В этом игры существенно отличаются от кино, от литературы, от любого другого феномена, в который мы можем заглянуть — в страницы, в конец и так далее. То есть мы можем начать читать книгу, потом открыть её в середине, в конце — то же самое с кино. Но в играх так не получается. Мы не можем физически пройти дальше до тех пор, пока не преодолели какого-то препятствия, с которым столкнулись.
Соответственно, это первый выбор. И этот выбор абсолютно соответствует тому, что у нас происходит в жизни. Единственные, кто вообще чего-то достигает в нашей реальности — это люди, которые не бросают. То есть у них должно быть две способности. Первая — не бросать. Вторая — учиться. Потому что если человек не бросает, но не учится на каждой новой “террасе”, то это упрямство. Да, оно тоже особо ни к чему не приводит. Поэтому вот эти два качества — уметь не бросать, уметь учиться. Вот эти два качества определяют реально успешных людей. И, в принципе, других причин не существует.
Почему? Потому что в жизни, как и в играх, чем дальше мы идём, чем глубже мы идём, тем с более серьёзными препятствиями сталкиваемся. Нам приходится сталкиваться с большим уровнем неопределённости, с большим уровнем риска. И объём этого риска выше. Это часто под риском не только мы, но и наши близкие, люди, которые от нас зависят. Ну и так далее. И ставки растут, коммитмент растёт. И опять же — каждый раз выбор: бросить или нет.
Но в жизни есть много дополнительных плюсов по сравнению с играми. Так как иногда мы сталкиваемся с такими препятствиями, с такими целями, которые мы не можем не достигнуть. Потому что в игре, если мы бросили какую-то игру — потому что нам скучно или потому что мы слишком ленивые — то, в принципе, особо ничего не происходит. Но есть виды целей, которые нам необходимо достичь, или виды препятствий, которые нам необходимо преодолеть. И если мы отказываемся, в нашей жизни происходит что-то ужасное, какая-то катастрофа, которая приводит к каким-то ужасным последствиям. То есть в этом смысле жизнь гораздо больше нам помогает.
Тем не менее, главный навык, который развивают игры — это как раз навык не бросать и учиться. То есть мы не думаем, что мы упираемся в стену — мы же хотим преодолеть. То есть мы приняли решение не бросать, идти дальше. Тогда возникает практический вопрос: а как это сделать? И мы начинаем делать попытку за попыткой, попытку за попыткой. И когда мы сделали тысячи попыток — вот Александр говорит про несколько часов, — а в некоторых играх уходит не несколько часов, а дни и месяцы, чтобы преодолеть препятствие. В науке уходят годы. Это точно такая же игровая модель. И не всегда есть результат.