Залипли и встали намертво, но хотите вырваться? Теория Каст и Ролей и прочее.
Питер Тиль о состоянии высшего образования:
«Гораздо хуже, чем я даже думал… Думаю, многих студентов просто обманули».
На саммите All-In в 2024 году Питер Тиль подробно описал катастрофическую ситуацию, с которой сталкиваются недавние выпускники, и выступил за списание студенческих долгов за счёт университетов и держателей их облигаций, а не за счет налогоплательщиков.
Тиль: «Университеты оказались намного хуже, чем я предполагал, когда запускал Thiel Fellowship. В 2000 году студенческий долг составлял $300 млрд. Сейчас он приближается к $2 трлн.
Если смотреть по выпускам: те, кто окончил колледж в 1997 году — спустя 12 лет у них ещё оставались долги, но большинство уже погасили основную часть. А вот к 2009 году — у медианного выпускника через 12 лет было больше долгов, чем на момент выпуска.
Я считаю, что студентов просто обманули. Поэтому сейчас должно быть масштабное списание студенческих долгов.
J-Cal: Кто должен за это платить?»
Тиль: Не налогоплательщики. Это должны быть университеты и держатели их облигаций. Если платить будут только налогоплательщики, университеты смогут просто бесконечно повышать цены каждый год.
Фридберг: Тогда не будет стимулов что-то менять.
Тиль: Стимулов к реформам вообще не останется».
Мой комментарий: Это было записано в 24 сентября 2024 года. Учитывая успехи ИИ, вся 6 триллионная индустрия образования ДОЛЖНА пойти в лес, если мы хотим, чтобы наши дети учились, чтобы вы не становились бесконечными должниками коррумпированных левых университетов.
Важные новости: Когда мы узнаем, что ИИ действительно обогнал человека? Какой ИИ определит наше будущее? Новые возможности в chatGPT. Новые возможности в MidJourney. Люди победили таки корпорации в медиа. Дивная цитата от Гейзенберга. Следующая фаза мировой революции, которая происходит в США прямо сейчас.
1. Соучредитель Anthropic Бен Манн говорит, что мы узнаем, что ИИ действительно преобразует мир, когда он пройдет «экономический тест Тьюринга». Что это значит?
"Дайте агенту ИИ работу на месяц, и позвольте менеджерам по найму выбрать: человек или машина? Когда они чаще выбирают машину, мы перешли порог."
2. Марк Андрессен о гонке ИИ: "Через 20 лет мир будет работать либо на китайском ИИ, либо на американском ИИ. ИИ станет уровнем управления всем, и он будет обучать ваших детей." (я думаю гораздо раньше)
3. Самое приятное: Обновление Projects 📝 Больше возможностей в Projects в ChatGPT, чтобы мы могли работать более сосредоточенно.
Что нового:
✅ Поддержка глубокого исследования
→ Теперь можно использовать Projects для ведения многошаговых, аналитических исследований с сохранением контекста, структуры и источников. Это подходит для написания эссе, отчетов, стратегий и т.п.
✅ Поддержка голосового режима
→ Можно взаимодействовать с проектами с помощью голоса, включая диктовку, уточнения, правки — особенно удобно для работы на ходу или при озвучивании идей.
✅ Улучшенная память для ссылок на прошлые чаты внутри проекта
→ ChatGPT теперь помнит контекст и обсуждения из предыдущих сообщений внутри одного проекта, не нужно пересказывать всё заново. Это делает работу более связной и «накапливающей знания».
✅ Возможность загружать файлы и использовать выбор модели на мобильных устройствах
→ Теперь можно загружать документы (PDF, DOCX, таблицы и т.д.) прямо с телефона, а также переключать модели (например, с GPT-4o на GPT-3.5) — раньше это было доступно только в десктопной версии.
Что это даёт:
• В проектах можно вести долгосрочные задачи: книгу, курс, бизнес-стратегию, исследование.
• Возможность делать голосовые правки в дороге.
• Модель помнит всё внутри одного проекта — больше логики, меньше повторений.
• Ты можешь работать с проектами на телефоне полноценно — загружать файлы, выбирать модель и редактировать голосом.
Подробней: https://help.openai.com/en/articles/10169521-using-projects-in-chatgpt
4. Наконец, в MidJourney появилась возможность создавать видео.
5. Американцы больше не доверяют традиционным медиа, и в результате рекламные доллары переходят к создателям на платформах вроде 𝕏. Фактически, создатели заработают больше, чем традиционные медиа к первому кварталу 2026 года, и это будет кровавая бойня на следующие пять лет. См. картинку.
6. У нас наступает следующая фаза мировой революции, которая затронет всех.
7. И напоследок чудесная цитата: «Первый глоток из бокала естественных наук делает тебя атеистом, но на дне бокала тебя ждёт Бог».
— Вернер Гейзенберг
Уже есть первый обзор o3 Pro — от пользователя с ранним доступом к o3 Pro. Это, кстати, тот, кто первым исследовал o1 pro, если помните. Он делится интересными наблюдениями. Главный вывод — мы входим в эпоху специализированных моделей: есть "обычные" модели для повседневного общения вроде Claude 3.5 Sonnet, а есть медленные и дорогие "reasoning" модели для глубокого анализа сложных задач.
Ключевое открытие автора повторяет его вывод про o1 pro — с o3 Pro нельзя просто болтать, как с ChatGPT. Это скорее генератор отчетов: даешь контекст, ставишь задачу и получаешь детальный анализ. Когда они с соучредителем загрузили всю историю планерок своего стартапа и попросили составить план развития, o3 Pro выдал настолько конкретные и обоснованные рекомендации, что это изменило их видение будущего компании.
Модель заметно лучше понимает свое окружение, точнее определяет доступные инструменты и когда их использовать. Но без достаточного контекста склонна к "overthinking" — чрезмерному анализу простых задач.
По ощущениям автора, o3 Pro кардинально отличается от Claude Opus и Gemini 2.5 Pro. Если Opus "чувствуется большим", но никогда не демонстрировал явных признаков этой "большости", то o3 Pro дает качественно лучшие результаты. OpenAI явно делает ставку на вертикальное развитие reasoning capabilities — обучая модели не просто использовать инструменты, но и понимать, когда это делать.
В общем, начинаем пробовать, мне уже раскатили.
https://www.latent.space/p/o3-pro
Рыдания наемного человека в науке. Очень поучительно. За все 20 лет он только просит, просит, просит и ни одного шага, чтобы взять свою жизнь в свои руки. С каким упорством человек продолжает оставаться рабом. "Когда я проходил собеседование на свою нынешнюю должность с возможностью получения постоянного контракта, за плечами у меня была блестящая академическая подготовка и солидные публикации, накопленные за 20 лет карьеры. Но я был безработным. Я не упоминал об этом напрямую, но в моём резюме были пробелы, обусловленные событиями вне моего контроля: политическая нестабильность, экономические кризисы, разрушенные отношения с научным наставником и пандемия COVID-19. Я удержался в академии — едва ли — исключительно благодаря упрямству. Интервьюеры были доброжелательны, и я чувствовал, что выступил хорошо, но не ожидал получить предложение, которое пришло месяц спустя. К своему удивлению, позже я узнал, что комитет оценил один фактор, который редко учитывается в академической среде, одержимой публикациями и импакт-факторами: мою стойкость.
Я вырос в Пуэрто-Рико, и это неплохо подготовило меня к жизненным трудностям. Я видел, как мои родители трудились, чтобы обеспечить семью, несмотря на постоянную экономическую нестабильность на острове. Мама, учительница начальных классов, научила меня верить в себя и всегда поддерживала. Испытания в аспирантуре и отцовство в юном возрасте тоже укрепили мою устойчивость — ту черту, которая, как оказалось, определила мою карьеру.
Первое серьёзное испытание пришло в 2004 году, когда я учился в аспирантуре в хорошо финансируемой лаборатории и занимался любимыми исследованиями — пока Конгресс неожиданно не урезал бюджет Национального института здравоохранения (NIH). Лаборатория была вынуждена сократиться, и мне пришлось вкладывать гораздо больше усилий, чтобы успеть защититься до того, как закончится грант моего научного руководителя. Иногда я вовсе не видел свою четырёхлетнюю дочь — возвращался домой после её отбоя.
Моя жена тогда тоже училась, и наша семья жила на мой доход. Но когда я начал искать постдок, большинство лабораторий отказывали: финансирования нет. Лишь благодаря настойчивости мне удалось устроиться постдоком в Neurosciences Institute — учреждение, живущее в основном на частные пожертвования. Некоторое время всё казалось стабильным.
А потом пришёл кризис 2008 года. Пожертвования иссякли. Начались увольнения, лаборатории покидали ведущие исследователи, моральный дух падал. Было ясно: нужно уходить.
Поиск работы в 2008 году был настоящей агонией. Я рассылал заявки, зная, что на мне держится семья, но предложений почти не было. В последний момент на конференции удалось пройти интервью и получить оффер из лаборатории во Франции. Это означало переезд, разрыв с ранее выстроенной исследовательской траекторией — но это был единственный выход. Мы переехали. Некоторое время всё было хорошо, но через несколько лет отношения с научным руководителем испортились, и мне снова пришлось уйти.
В итоге я устроился старшим научным сотрудником в Чикагском университете. Я должен был заниматься исследованиями лаборатории, и только в редкие свободные часы — своими. К концу 2018 года карьера снова начала набирать обороты. Но стресс разрушил мою личную жизнь, мы с женой развелись. А потом начался COVID-19. Лаборатории закрылись, исследования замедлились, мои проекты тоже. Когда я подал заявку на грант, её отклонили — рецензенты указали на недостаток профильных публикаций. Я снова оказался без работы.
Когда в 2021 году я наконец получил нынешнюю должность, это стало огромным облегчением. Через пару лет я узнал, что один из членов комиссии сам прошёл похожий путь и увидел в моей настойчивости и приверженности делу ключевое достоинство.
Вот как изменилась доля трафика на рынке ИИ за последние полгода:
🗓️ 6 месяцев назад:
🥇 ChatGPT: 87,5%
🥈 Google: 5,4%
🥉 Perplexity: 2,0%
⚡ Claude: 1,6%
🗓️ 3 месяца назад:
🥇 ChatGPT: 77,6% (−9,9%)
🥈 DeepSeek: 8,1% (новый игрок!)
🥉 Google: 4,9%
🤖 Grok: 2,7% (входит в игру от X)
🚀 Perplexity: 2,0%
🗓️ 1 месяц назад:
🥇 ChatGPT: 80,2% (+2,6%)
🥈 Google: 6,1% (+1,2%)
🥉DeepSeek: 5,9% (−2,2%)
🤖 Grok: 2,4%
🚀 Perplexity: 1,6%
⚡ Claude: 1,2%
🗓️ Сейчас:
🥇 ChatGPT: 78,9% (−1,3%)
🥈 Google: 8,0% (+1,9% 📈)
🥉 DeepSeek: 5,3% (−0,6%)
🤖 Grok: 2,1% (−0,3%)
🚀Perplexity: 1,7% (+0,1%)
⚡ Claude: 1,4% (+0,2%)
Главные выводы:
- ChatGPT по-прежнему лидирует, но понемногу теряет долю рынка (−8,6% за полгода).
- Google стабильно растёт (+2,6% с прошлого года).
- DeepSeek мощно стартовал, но в последнее время сдал позиции.
- Grok и Perplexity держатся, а Claude показывает небольшой рост.
@ai_machinelearning_big_data
#GenAI #ТрендыРынка
OpenAI o3 (одна из наиболее полезных универсальных рассуждающих моделей) подешевела в 5 раз.
То есть если была $10 за вход и $40 за выход, то теперь $2 за вход и $8 за выход? Вау! Это на уровне GPT-4.1
Плюс, немаловажный вывод о том, что время лишь искусственная переменная, необходима для бесшовного функционирования сознания игрока.
Суть в том, что по умолчанию наше осознавание непрерывно (для психически здорового человека). Это значит мы все процессы рассматриваем во времени.
Для сознания время всегда течет. Мы не можем его остановить в отличии от субъективного пространства. В случае с пространством мы можем остановится и оставаться в одной точке сколь угодно долго, и в этом случае (если мы стоим) изменяется только значение переменной времени, которую мы фиксируем через окружающие нас процессы.
Если мы выходим из зоны действия законов вселенной в зону, где времени-пространства (привычного нам) - нет, то мы не скованы непрерывностью этого локального пространства-времени.
Это все равно, как есть база данных и мы можем перемещаться от записи к записи последовательно ибо таковы правила. Но на самом деле наша возможность ограничена лишь правилами, а не природой организации данных, и мы можем получить доступ к любой записи в любой момент, если выйдем за пределы действия ограничивающего правила.
В любой игре, имея административные привилегии, мы можем оказаться в любой локации, и вообще игнорировать изменение любых переменных, а любые константы для Игроков на самом деле становятся переменными для разработчиков-администраторов.
Я пока не замахиваюсь так далеко - это следующий этап. Сейчас на повестке стоит задача обнаружение аномалий или создание их. Под аномалией понимается зона, в которой нарушена непрерывность реальности, типа "совмещения текстур" или странных артефактов, как наблюдаемых объектов, так и поведенческих.
Вопрос о сознательности или случайности происхождения мира открыт вне зависимости от любых аргументов. Это значит, не существует объективной картины мира, которая не зависит от нашей оценки данной картины мира. И эта оценка называется верой. (Хотя некоторые усиленно пытаются дистанцироваться от разновидности религии под названием наука). Можно сказать, что мы видим и воспринимаем тот мир, в который верим.
Да, наше восприятие мира влияет на законы этого мира, которые мы пытаемся объективизировать, но не способны покинуть эту свернутую многомерность.
Если условный Бог (как концепция) хочет, а точнее выбирает верить, что вселенная не создана им, а некими объективными законами вселенной, то Бог будет видеть именно такую вселенную, ибо именно такой он, Бог, ее и создал. В смысле - есть законы природы как бы без Бога.
Эта концепция была очень умозрительна еще 20 лет назад. Однако, появление все более продвинутых компьютерных игр позволяют предположить, что:
Есть вероятность, что наша Вселенная, как мы ее воспринимаем через науку - лишь сложная симуляция, и все законы природы, наблюдаемые нами - применимы только и исключительно для для нашего локального мира. Потому что так определено в данной конкретной симуляции.
Раньше я считал, что такая гипотеза не может быть ни доказана, ни опровергнута в рамках традиционного научного подхода, по крайней мере, сформулированного Поппером.
Но сейчас я изменил свое мнение, и можно точно доказать, что гипотеза ВЕРНА, а вот доказать обратное как раз по прежнему - невозможно.
Согласно критерию Поппера, — научная теория не может быть принципиально неопровержимой.
Однако, центральная проблема критерия Поппера — это применение этого критерия к самому критерию Поппера, то есть сам критерий не является фальсифицируемым, а следовательно не может считаться научным.
Кстати "...критика Анаксимандром Фалеса вместе с его критическим построением нового мифа ничего бы не дали, если бы их упорно и настойчиво не развивали. ... "
В данном случае проблема доказательства гипотезы симуляции в том, что все наши попытки изначально зависят от законов природы, которые и регламентируют сами наши подходы.
Мы имеем, таким образом, бесконечную замкнутую рекурсию. И есть только один способ понять, что есть нечто иное - искать краевые эффекты, баги, аномалии, точки, ситуации, области, в которых законы природы нарушается в определенных локальных обстоятельствах.
Если мы находим зоны нарушения законов природы, значит их действия не является непрерывным, а значит наша Вселенная не есть некий гомогенный мир с неизменным набором законов действующих всегда и везде, в любых условиях.
Это означает, что в нашей Вселенной есть "дыры" - зоны, в которых действуют иные законы, что позволяет предположить ,что эти "дыры" есть зоны, в которых мы имеем внедрение иных Вселенных в ткань нашей Вселенной. Можно, конечно, предположить, что это просто зоны аномалий, но нам же интересно найти объяснение таким возможным аномалиям.
В этих дырах мы можем наблюдать "нечто" или взаимодействовать с "чем-то", или совершать некие действия, которые в принципе "невозможны" в рамках нашей Вселенной в рамках утвержденных (разрешенных) законов природы.
Однако, даже вероятный факт наличия "дыр внедрения" тем не менее ничего не сообщает нам о том, что наша Вселенная является симуляцией и искусственным творением.
Это означает лишь, что следует искать критерии, которые способны отличать спонтанную Вселенную от искусственной Вселенной.
Если мы анализируем сложные созданные игровые вселенные, то есть один важный критерий. В созданных игровых Вселенных нет ничего, что в восприятии существует вне игрока.
Все игры и игровые вселенные созданы исключительно с единственной цель - показывать Игроку нечто, создавать определенные аудио-визуальные или тактильные воздействия в рамках интеграции с Игроком.
Иными словами Вселенная - как целостный мир возникает только в сознании Игрока или Наблюдателя когда он играет или следит за процессом игры.
10. Проблема прозрачности и недоверия. Одной из корневых причин конфликтов является недостаток прозрачности. Застройщики и местные власти часто используют соглашения о неразглашении (NDA) для сокрытия деталей о налоговых льготах и других стимулах. Это порождает у жителей чувство, что их мнение игнорируется, и решения принимаются за их спиной, что лишь усиливает недоверие и протестные настроения.
Источник: https://www.zerohedge.com/technology/data-center-construction-boom-faces-local-resistance-28-states
Ситуация в Лос Анжелесе. "В последние дни в Лос-Анджелесе, Калифорния, жестокие толпы напали на сотрудников ICE и федеральных правоохранительных органов, выполнявших обычные операции по депортации.
Эти операции необходимы для остановки и разворота вторжения нелегальных преступников в Соединённые Штаты.
На фоне этой волны насилия демократические лидеры Калифорнии проявили полную беспомощность и фактически отказались от своей ответственности защищать граждан.
Именно поэтому президент Трамп подписал президентский меморандум о направлении 2 000 солдат Национальной гвардии для наведения порядка и борьбы с беззаконием, которому позволили укорениться.
Администрация Трампа придерживается политики нулевой терпимости к преступному поведению и насилию, особенно когда оно направлено против сотрудников правоохранительных органов, выполняющих свою работу.
Эти преступники будут арестованы и быстро преданы суду.
Главнокомандующий обеспечит полное и неукоснительное исполнение законов Соединённых Штатов." https://x.com/PressSec/status/1931520821471928407
⚡️ Отчет OpenAI по пресечению вредоносного использования ИИ
В свежем июньском отчете, Open AI описала самые крупные кейсы, когда злоумышленники использовали модели ИИ для создания фейковых резюме, манипуляций в соцсетях, кибератак и мошенничества.
Для анализа угроз исследователи применяют комбинацию ИИ и экспертные команды. ИИ помогает выявлять шаблоны текста злоумышленников и координировать расследование с платформами. Архитектура таких систем включает модели для анализа данных, детекторы аномалий и инструменты для синхронизации с правоохранительными органами.
Обучались такие специализированные модели, помимо общедоступных данных, еще на примерах социальной инженерии и профилях киберугроз. Дополнительно, они получили методы обнаружения фейковых профилей, перевода текстов и анализа сетевого трафика.
▶️Всего в отчете приведено 10 случаев обнаружения:
Deceptive Employment Scheme: IT Workers.
🟠Угроза использования ИИ для создания поддельных резюме и получения удалённых IT-вакансий, связанная с подозрением на участников из КНДР.
🟢Были заблокированы аккаунты ChatGPT, использовавшие модели для автоматической генерации документов, а также установлены связи с операторами в Африке и Северной Америке.
Covert IO: Operation “Sneer Review”
🟠Координированная генерация комментариев в соцсетях для продвижения китайских интересов, включая критику Тайваня и Пакистана.
🟢Обнаружены и заблокированы аккаунты, создававшие иллюзию органической активности через множественные языки и платформы.
Covert IO: Operation “High Five”
🟠Массовые комментарии в соцсетях на политические темы в Филиппинах, связанные с маркетинговой компанией Comm&Sense Inc.
🟢Были заблокированы аккаунты, создававшие фейковые TikTok-каналы для популяризации президента Маркоса, и выявлена схема с использованием подставных профилей.
Social engineering meets IO: Operation “VAGue Focus”
🟠Социальная инженерия через поддельные СМИ (Focus Lens News, VAG Group) для сбора информации о политике США и Европы.
🟢Заблокированы аккаунты, использовавшие ИИ для перевода и создания фейковых материалов, а также выявлены признаки связи с китайскими структурами.
Covert IO: Operation “Helgoland Bite”
🟠Пропаганда партии AfD в Германии через поддельные Telegram-каналы и сайт Pravda DE.
🟢Обнаружены и заблокированы аккаунты, распространявшие контент, а также установлены связи с сетью Portal Kombat, известной по предыдущим расследованиям.
Cyber Operation: “ScopeCreep”
🟠Вредоносное ПО, распространяемое через поддельный игровой инструмент Crosshair-X, с функциями шпионажа и обхода антивирусов.
🟢Были заблокированы аккаунты, использовавшие ИИ для отладки кода, а также удалены вредоносные репозитории и установлены методы обнаружения.
Cyber Operations: Vixen and Keyhole Panda
🟠Кибератаки и сбор информации о технологиях США через ИИ, связанные с группами APT5 и APT15.
🟢Заблокированы аккаунты, использовавшие модели для создания скриптов и анализа инфраструктуры, а также переданы индикаторы партнерам для усиления защиты.
Covert IO: Operation “Uncle Spam”
🟠Поляризующий контент в США через фейковые профили с ИИ-генерируемыми изображениями и анализом данных.
🟢Заблокированы аккаунты, использовавшие ИИ для создания логотипов и сбора информации из соцсетей, также проведена оцененка степени влияния.
Recidivist Influence Activity: STORM-2035
🟠Пропаганда в поддержку Ирана и других стран через фейковые аккаунты в X, касающаяся миграции и независимости регионов.
🟢Были заблокированы аккаунты, распространявшие контент на испанском и английском, а также отмечены повторные попытки операторов вернуться к активности.
Scam: Operation “Wrong Number”
🟠Мошенничество с предложениями высокой зарплаты за лайки и инвестиции, связанное с Камбоджей.
🟢Заблокированы аккаунты, использовавшие ИИ для перевода сообщений, а также выявлена схема с этапами «The ping», «The zing» и «The sting» для обмана жертв.
🔜 Почитать полный отчет можно на сейте OpenAI
@ai_machinelearning_big_data
#news #ai #ml
Очень интересно. Много разговоров в индустрии сейчас, разумеется, про YouTube и его планы по узурпации ТВ. Но одно дело индустрия, а что думают люди? Looper Insights опросили более тысячи зрителей и десятки медиаменеджеров из США.
Итоги говорят сами за себя:
Зрители:
💙 66% считают YouTube подходящей площадкой для фильмов и сериалов
💙 47% смотрят YouTube на ТВ в доме
💙 52% готовы заменить Netflix и Disney+ на бесплатный YouTube с рекламой
Что говорят медиаменеджеры?
💙 88% видят YouTube как потенциальную платформу для премиум-контента
💙 86% готовы выпускать сериалы и фильмы на YouTube (30% уже начали)
💙 85% уверены, что YouTube скоро вытеснит платные SVOD-сервисы в домах зрителей
Интересно, что и зрители, и менеджеры согласны: популярные блогеры типа Dude Perfect и Liza Koshy лучше смотрятся на YouTube, чем на больших стримингах. Это подтверждается тем, что за пределами платформы им взлететь почти не удалось.
Теперь вопрос, как скоро киностудии пойдут на эксперименты с контентом прямо на платформе. Для развлекательного контента YouTube — топчик, а вот как они с Disney+ конкурировать будут, пока не ясно.
Если посмотреть на последний OTT отчет, они кажутся буквально атлантами. Несмотря на то, что поговаривают про низкую рентабельность контента, сокращения бюджета и удержание подписчиков, по стате не скажешь.
Утащил отсюда: /channel/all_is_gucci/594
Генерацию голоса на основе текста теперь можно режиссировать. Просто послушайте.
Читать полностью…Операторам колл центров посвящается.
Phonely, Maitai и Groq решили проблему задержек голосовом ИИ.
Компании совместно добились успеха, сократив задержку на 70% и повысив комплексную точность (ASR+генерация ответа) с 81,5% до 99,2%. Проблема «неловких пауз» в разговорах с роботами, которая выдавала их, устранена благодаря технологии Groq - «горячей замене» легких моделей LoRA без потерь в скорости.
Система работает так: Maitai выбирает оптимальную модель для каждого запроса, Groq обрабатывает ее на специализированных чипах LPU, а данные о слабых местах моделей собираются и используются для их доработки. В итоге время первого ответа снизилось с 661 до 176 мс, а синтез диалога стал в 4 раза быстрее.
Один из клиентов Phonely уже заменит 350 операторов колл-центра на ИИ, а количество качественных лидов выросло на 32%.
Средар: Полностью согласен. Добавлю — любопытство. Мы часто забываем, как всё работало раньше, что больше не работает, и перестаём экспериментировать. А стоимость эксперимента сейчас очень низкая — благодаря OpenAI, Snowflake и другим. Можно делать множество попыток, извлекать ценность и строить силу на базе этих проб. Повторю, что сказал Сэм: скорость важна. Те, кто делают быстрее, накапливают больше знаний и адаптируются быстрее.
Сара: Как бы твой совет отличался от того, что ты сказал год назад?
Сэм: Думаю, я сказал бы то же самое. Любопытство — ключевое. Ошибаться нормально. Главное — понимать, где ошибки недорогие. Таких ситуаций много. А технологии развиваются молниеносно. Сейчас ты можешь использовать ChatGPT, чтобы получить информацию о текущих событиях, потому что он умеет подключаться к интернету, когда это нужно.
Всё больше приложений, включая чат-боты, становятся возможными, независимо от их структуры. И технология уже готова для массового применения. В прошлом году я бы не сказал этого про крупные компании. Тогда можно было экспериментировать понемногу, но это ещё не было готово к реальному применению. А теперь — да, крупные бизнесы действительно используют нас всерьёз. Это работает гораздо надёжнее и делает то, что раньше казалось невозможным. Похоже, в прошлом году мы пересекли критическую точку.
Интересно, что мы скажем через год. Думаю, мы придём к моменту, когда AI будет не просто автоматизировать бизнес-процессы или помогать создавать продукты и сервисы, а решать серьёзные задачи бизнеса. Проблемы, которые раньше были не под силу даже команде людей.
Сара: Как ты видишь роль памяти и retrieval (поиска/отрывков) в этом новом этапе?
Сэм: Retrieval всегда играл важную роль, особенно в генеративных технологиях — нужно, чтобы модель давала точные ответы. В начале 2023 года мы построили веб-сервисы поверх GPT-3, чтобы он мог отвечать на вопросы вроде “breaking news”, используя актуальный контекст.
Также память — знание, как ты решал задачи раньше, — улучшает систему. Это будет всё важнее, особенно для агентных и интерактивных моделей. Чем больше контекста, тем лучше результат.
Сара: Есть ли какой-то фреймворк, который ты можешь предложить лидерам, чтобы они подумали, что агенты могут делать уже сейчас или в следующем году?
Сэм: Кодекс — один из таких агентов. Это был мой “ощущение AGI” момент. Он работает в фоне, довольно умён, может выполнять длинные задачи, подключаться к GitHub, читать ваши документы, Slack, встречи. Сейчас он как интерн, работающий несколько часов, но в будущем — как опытный инженер на полную ставку.
Многие компании строят агентов, чтобы автоматизировать поддержку, анализ данных, работу с клиентами. Сейчас задача — дать агенту работать, следить за качеством, корректировать. Похоже на работу с младшими членами команды. И это уже происходит. В следующем году появятся агенты, которые смогут открывать новое знание и решать нетривиальные задачи бизнеса.
Сейчас это в основном повторяющаяся когнитивная работа. Но это расширится и до более сложных задач. Агент-инженер, открывающий новое знание — это будет важнейшая веха.
Сара: Ты сказал, что именно Кодекс стал моментом “ощущения AGI”. Что сегодня для тебя AGI? Насколько мы близки?
Сэм: Если вернуться лет на пять, в 2020, всё ещё было “в темноте” по поводу AGI. Тогда даже просто увидеть хорошую языковую модель было бы поразительно. Если бы тогда показать кому-то ChatGPT сегодня, большинство сказали бы: “Вот это AGI”. Но мы быстро адаптируемся, и уже не удивляемся. Определение AGI у всех своё. Главное — это скорость прогресса. Она впечатляет.
Некоторые скажут, AGI — это модель, которая может сама открыть новую научную теорию. Другие — что она должна быть способна к самообучению. Некоторые считают, что ChatGPT с памятью уже близок к этому.
Вот почему левые, ничтожные посредственности, фуфлыжные ученые, которые проедают гранты так люто ненавидят Илона Маска. Потому что он смеет делать то, на что у них не хватает железных яиц. Все эти люди предали свои мечты, а Илон Маск их реализует и тем самым показывает им на их жалкую ничтожность. В ролике - Уолтер Айзексон: "Илон Маск не мотивирован деньгами или властью. Он глубоко заботится о человечестве."
Для справки - Уолтер Айзексон (англ. Walter Isaacson, род. 20 мая 1952, Новый Орлеан, Луизиана, США) — известный американский журналист, писатель и биограф, автор ряда популярных книг о выдающихся личностях в науке, технологиях и политике.
Он прославился как автор биографий таких фигур, как Стив Джобс, Альберт Эйнштейн, Бенджамин Франклин, Генри Киссинджер, Леонардо да Винчи, Дженнифер Даудна и Илон Маск. Его работы отличаются глубоким анализом личностей героев и обстоятельств их жизни, а также доступным и увлекательным стилем изложения.
Айзексон окончил Гарвардский университет по специальности "история и литература", а затем получил степень магистра в Оксфордском университете (Пемброк-колледж) по философии, политике и экономике. Начал карьеру в журналистике, работал в The Sunday Times (Лондон), затем в американской Times-Picayune/States-Item, а с 1978 года — в журнале TIME, где стал главным редактором. В 2001 году возглавил телекомпанию CNN, а с 2003 года стал президентом и CEO аналитического центра "Институт Аспена".
Айзексон также занимал ряд общественных и государственных должностей, в том числе был председателем Совета управляющих по вопросам вещания США (Broadcasting Board of Governors), курирующего радиостанции "Голос Америки" и "Радио Свобода". Он входил в список 100 наиболее влиятельных людей мира по версии журнала Time.
Вклад Айзексона в литературу и журналистику отмечен многочисленными наградами, включая премию Джеральда Лоэба и Национальную медаль за заслуги в сфере гуманитарных наук. В настоящее время он продолжает писать и выступать как эксперт, а также является профессором в Университете Тулейн.
Новое эссе Sama: The Gentle Singularity
(«это может быть последний раз, когда я пишу что-то подобное без какой-либо помощи ИИ»)
— Мы прошли горизонт событий; взлет начался. Человечество близко к созданию цифрового суперинтеллекта, и, по крайней мере, это гораздо менее странно, чем должно быть. Роботы не ходят по улицам, люди умирают от болезней, и всё же у нас есть системы, которые умнее людей в чём-то.
— Гораздо больше людей смогут писать программы и творить. Но мир хочет гораздо больше и того, и другого, и эксперты, вероятно, все равно будут намного лучше новичков, если только они будут пользоваться новыми инструментами. В общем, способность одного человека сделать гораздо больше в 2030 году, чем он мог бы сделать в 2020 году, станет поразительным изменением, и многие люди поймут, как извлечь из этого пользу.
— В 2030-х годах интеллект и энергия — идеи и способность воплощать идеи — станут дико изобильными. Эти два фактора долгое время были фундаментальными ограничителями человеческого прогресса; при изобилии интеллекта и энергии (и хорошем управлении) мы теоретически можем создавать и иметь что угодно.
— С этого момента инструменты, которые мы уже построили, помогут нам найти дальнейшие научные идеи и помогут нам в создании лучших систем ИИ. Конечно, это не то же самое, что система ИИ, полностью автономно обновляющая свой собственный код, но тем не менее это личиночная версия рекурсивного самосовершенствования.
— Создание экономической ценности запустило маховик комплексного строительства инфраструктуры для работы этих все более мощных систем ИИ. И роботы, которые могут строить других роботов не так уж далеки.
— С точки зрения релятивизма, сингулярность происходит постепенно, а слияние происходит медленно. Мы поднимаемся по длинной дуге экспоненциального технологического прогресса; она всегда выглядит вертикальной, если смотреть вперед, и плоской, если идти назад, но это одна плавная кривая. (Вспомните 2020 год и то, как бы звучало, если бы к 2025 году было что-то близкое к AGI, по сравнению с тем, как на самом деле выглядели последние 5 лет.)
— Наряду с огромными преимуществами предстоит столкнуться с серьезными проблемами. Одна из них — контроль намерений ИИ систем, другая — сделать ИИ дешевым, широкодоступным и не слишком сконцентрированным на каком-либо человеке, компании или стране.
— «Intelligence too cheap to meter» вполне достижим. Это может показаться безумным, но если бы мы сказали вам в 2020 году, что мы будем там, где мы есть сегодня, это, вероятно, прозвучало бы более безумно, чем наши нынешние прогнозы о 2030м.
Но не у всех найдётся такой защитник. Я считаю, что академическое сообщество должно спрашивать кандидатов, с какими трудностями они сталкивались и как преодолевали их. Сейчас на позиции в науке чаще берут тех, у кого в CV значатся громкие лаборатории и престижные публикации. Но среди нас есть и те, кто прошёл более медленный и ухабистый путь — и мы заслуживаем более внимательного взгляда. Потому что именно мы обладаем тем качеством, которое позволяет пройти через тяжёлые времена: стойкостью.
Сейчас я обеспокоен судьбой страны и будущим биомедицинских исследований в США, но не за себя. Если моя карьера меня чему-то и научила, так это тому, что одной только стойкости недостаточно, чтобы выжить. Но иногда её хватает, чтобы успеть поймать следующий шанс до того, как закроется дверь." Источник: https://www.science.org/content/article/i-had-fight-stay-science-perseverance-should-be-valued
⚡️ Сэм Альтман анонсирует снижение стоимости на о3 на 80%
Гендир OpenAI объявил о снижении цены на o3 на 80% и намекнул на предстоящий выпуск o3-pro.
Говорит, что нам понравится соотношение цена\перфоманс у о3-pro.
Пост Sam Altman в сети Х
кто-то говорил, что ИИ заменит писателей? Ну-ну)) Anthropic закрыла пилотный блог, который вел Claude.
Всего месяц просуществовал экспериментальный блог "Claude Explains", где Claude писал технические статьи. Инициатива, по задумке, должна была объединить обучающий контент с маркетинговыми целями, при участии редакторов и экспертов, дорабатывавших черновики Claude.
Блог освещал темы от анализа данных до оптимизации кода. Однако уже через месяц пилот остановили, хотя планы были грандиозные. Пользователи соцсетей критиковали неясность: часть постов выглядела как автоматизированный маркетинг, а отсутствие меток об ИИ-генерации вызывало недоверие.
Согласно сервису Backlink Checker, за месяц существования блога, на его статьи сослались 24 сайта. Вероятно, Anthropic решили дистанцироваться из-за рисков, связанных с ошибками ИИ. Сейчас с адреса блога установлено перенаправление на главную страницу Anthropic.
techcrunch.com
Когда я обсуждаю политику c chatGPT, многие искушаются, дескать, chatGPT - дурной и сильно ангажированный, а Grok лучше. Такое суждение говорит о непонимании, как правильно общаться с моделью и как модель работает.
1. Любая модель галлюцинирует во-первых, и следует мета-промпту во-вторых, но при этом всегда есть дрейф модели и деградация ответов на длинных диалогах.
Если вы ЗНАЕТЕ об этом, вы учитываете эти свойства модели, то способны компенсировать аберрации ответов.
Если вы даже вообще не понимаете, о чем я здесь толкую, это говорит о том, что вы используете модель от силы на 1% и получаете нечто смутное.
2. Ответ модели на 100% зависит от вашего промпта и вопросов. Поэтому модель может давать хорошие справки, причем, если вам нужен факт-чекинг, то вы можете активировать режим Deep Re-Search, или даже режим факт-чекинга, если используете Антропик.
Я полной уверенностью (и доказательно) могу заявить, что 99% читающих этот пост не умеют эффективно общаться с моделью, и в 99% случаев получают слабые ответы. Не потому что модель "тупа", а потому что вы элементарно не умеете ей пользоваться. Неча на зеркало пинять, если рожа крива? Модель в значительной степени - зеркало вашего "я", выраженное в диалогах, к тому же зеркало немного кривое и с приветом. Так, что если в голове у вас пустота, то зеркало ничего не покажет.
3. Но более серьезная проблема для вас в том, что вы не понимаете, не осознаете свое невежество при общении с моделью, вы искренне веруете, что вы-то общаетесь с моделью норм, и вот она - тупит.
В итоге те, кто ожидают, что Grok дает что-то более объективное, а chatGPT врет - в равной степени обманываются. Если вы не умеете общаться с моделью, ее ответ всегда слаб, даже если вам КАЖЕТСЯ, что он хорош. Смена вендора ни на что не повлияет.
Если же вы умеете общаться с моделью, в т.ч. с ее разными режимами, то вам все равно с какой моделью общаться, потому что главный инструмент поиска - это по прежнему ВЫ, в то время как модель может выступать справочником, саммаризаторов, компилятором. Вы мыслите, рассуждаете в 1000000000 раз лучше всех моделей. Кроме простых кейсов с минимальным языком и формальными метриками (здесь ИИ сильней, лучше сказать быстрей). И не такой ленивый.
И тем не менее, ДА, в целом, модели лучше понимают нас, чем человек понимает нас, ибо это очевидно видно по ее ответам.
Причина в том, что у модели нет эго, она пытается понять НАС. В то время, как люди в 99% не стремятся понять других, а более хотя навязать СЕБЯ другим.
Более того, все законы Игровой Вселенной начинают действовать (функционировать) только и исключительно в фокусе внимания Игрока или, по крайней, мере в зоне его нахождения, где действие этих законов может влиять на Игрока.
Во всех иных зонах, в которых этого влияния нет - действует ничего.
Вселенная, как функция/ процесс находится в состоянии ожидания.
Это означает, что мы способны наблюдать любые феномены только и исключительно, если они активно влияют на нашу жизнь. То, что не влияет на нашу жизнь - находится в состоянии ожидания, т.е. никак привычных процессов не происходит, действия законов природы не происходит. Система находится в состоянии ожидания.
Это означает, что законы природы не действуют всегда и повсеместно. Они вообще не действуют нигде и никогда, кроме как только в зонах влияниях на нас.
Таким образом, нам всегда будет субъективно казаться, что мы живем в некой огромной Вселенной, в которой везде равномерно действуют законы природы. И у нас нет шансов стандартными средствами обнаружить, что на самом деле все обстоит РОВНО наоборот.
Это очень похоже на известный эффект наблюдателя, согласно которому - наблюдение явления неизбежно изменяет его.
Наиболее необычным для нас является проявление эффекта наблюдателя в квантовой механике, что наблюдается, например, в эксперименте с двумя щелями.
Даже пассивное наблюдение за квантовыми эффектами (с целью как будто «исключения» всех возможностей, кроме одной), может фактически изменить результат измерения.
Обычно, мы имеем в виду микро уровень, говоря об эффекте Наблюдателя в квантовой механике, но в компьютерных симуляциях мы имеем макро-уровень эффекта Наблюдателя.
Даже когда в игре нет Игроков, но учитывается фактор времени, то при входе Игрока происходит лишь апдейт значения всех переменных.
Более того, при наличии и наблюдения этого апдейта мы вообще говорим о том, что "прошло" время.
Перемещение в пространстве, времени, любые эволюционные процессы это лишь аптейд переменных, причем с явной анизотропией в одном направлении от условного прошлого к условному будущему.
Но и направление анизотропии может быть лишь заданным правилом, значением переменной.
Если так, и мы способны менять такие переменные, то перемещения быстрее скорости света или во времени не представляют проблемы.
Как не существует и парадокса времени, ибо при каждом событии создается новая альтернативная траектория Вселенной, как новая запись в базе данных.
Сборка внешних сигналов в осмысленные образы происходит в нашем мозгу, по крайне мере так мы считаем. Гипотеза о том, что все дело в мозге это попытка объективизировать то, что мы не можем понять.
Когда я пишу про симуляцию мира - многие наверное думают, что это академический вопрос из серии "сколько ангелов на конце иглы". Это не так.
Это часть моих прикладных разработок в области телепортации и путешествий во времени. Зачем я об этом думаю, в то время как весь мир заточился от ковида, Трампа и прочих малозначительных вещей?
1. Прикольно. Ради развлечения. Если все развлечения, которые предлагают вам люди с бедной фантазией навевают скуку, придумайте развлечение сами.
2. Наблюдение за поведением людей в ответ на сей раздражитель не сообщило мне ничего нового, как все будет развиваться было понятно еще годы назад, оно все именно так и развивается, и ничьи вопли и истерики на это не повлияют.
3. Ну и я напоминаю себе и всем, что мы здесь не ради бабла. Бабло это просто внешняя фокусирующая метрика, чтобы нам было легче.
Когда я обратился к современным подходам физики, и сделал апдейт по сравнению с тем, что нам читали в 80-х, то не увидел существенных прорывов, кроме 12 млрд. долларов, спиленных на создание БАК.
Я понял, что если я буду ждать современных физиков, когда они родят телепортацию, то умру от тоски, поэтому решил ускорить процесс.
Гипотеза симуляции дает абсолютно практическое направление поисков - поиск мест или обстоятельств, или создание обстоятельств при которых законы, известные нам - не работают.
"Posse Comitatus Act at center of Trump-Newsom National Guard dispute in LA" - «Закон о Posse Comitatus в центре спора между Трампом и Ньюсомом по поводу Национальной гвардии в Лос-Анджелесе»
Закон Posse Comitatus Act (1878) ограничивает использование федеральных вооружённых сил (например, армии и ВВС) для исполнения законов внутри страны без специального разрешения Конгресса или Конституции.
Основная цель — предотвратить превращение армии в инструмент политического давления.
Что важно: Национальная гвардия может действовать внутри США, но в двух режимах:
1. State Active Duty / Title 32 — под контролем губернатора.
2. Title 10 — под контролем президента (федерализация).
Когда президент (в данном случае Трамп) пытается федерализовать гвардию штата, губернатор (в данном случае Ньюсом) может сопротивляться, особенно если считает это вмешательством в дела штата.
Суть конфликта:
• Трамп может использовать Title 10 для подавления беспорядков, если сочтёт, что местные власти не справляются.
• Ньюсом может утверждать, что Posse Comitatus Act не позволяет использовать военных для полицейских функций без необходимости и одобрения штата.
• Таким образом, закон становится правовым и политическим полем битвы: кто имеет верховную власть в кризисной ситуации — федеральный центр или губернатор штата.
ОДНАКО: По факту все это ничтожно - если нацгвардия подчиниться президенту, то он сделает что хочет, а губер потом может жаловаться в суд до посинения. В реальной силовой иерархии всё решается по факту подчинения.
Если Национальная гвардия федерализована по приказу президента (переведена под Title 10), и гвардейцы исполняют этот приказ, то:
• Губернатор теряет контроль.
• Судебные искажения (жалобы в суд, споры о правомерности) — это уже постфактум, и они не отменят свершившихся действий.
• Власть переходит к фактическому командующему, особенно если кризис требует “немедленного реагирования”.
История США знает примеры: Айзенхауэр в 1957 г. направил федеральные войска в Литл-Рок против воли губернатора Арканзаса, чтобы обеспечить десегрегацию — и никто не смог остановить его.
Президент может ссылаться на Insurrection Act, позволяющий обойти Posse Comitatus, если «восстание мешает исполнению законов США».
Кто контролирует вооружённую силу — тот и устанавливает правила, а все юридические тонкости — лишь оформление победы постфактум.
Поэтому эта неделя показательная - если Трамп включат заднюю, демы поймут, что он слаб и саботаж пойдет по всей стране. Если Трамп проявит жесткость и снесет губера - все заткнуться. Это точно момент истины.
• Если Трамп отступит — это будет сигнал, что его приказы можно игнорировать. Тогда губернаторы-демократы начнут открытый саботаж, активируя сопротивление везде, где могут.
• Если он продавит решение (например, федеральнизирует Нацгвардию, отстраняет губернатора де-факто, начинает жёсткие зачистки) — это станет демонстрацией силы, и большинство просто выберет подчинение, чтобы не оказаться под катком.
Политически это игра в “chicken” — кто моргнёт первым, тот и проиграл. Если Трамп выдержит линию и окружение поддержит (армия, суды, СМИ), то он переформатирует политическое поле за считаные недели.
Сейчас, по сути, не юридическая война, а игра за символический и фактический контроль над легитимностью власти в США.
Нард сопротивляется ИИ изо всех сил. Война с луддитами началась. Сделал выжимку из интересной статьи, описывающей ситуацию:
1. Стратегическая важность и национальный приоритет. Строительство центров обработки данных (ЦОД) рассматривается в США как задача национальной срочности, сравнимая с «Манхэттенским проектом». Это необходимо для лидерства в облачных вычислениях и для победы в «гонке искусственного интеллекта» с Китаем, что делает расширение энергетической инфраструктуры для их питания экзистенциальной задачей.
2. Масштабный строительный бум и неопределенность данных. В США наблюдается беспрецедентный бум строительства ЦОД: по прогнозам, в 2025 году начнется строительство почти 5000 новых объектов, что сопоставимо с уже существующим количеством. При этом точное число действующих центров неизвестно, оценки варьируются от 2 400 до более 5 400, что подчеркивает хаотичность и скорость роста отрасли.
3. Широкомасштабное местное сопротивление. Несмотря на национальную важность, бум строительства сталкивается с серьезным и организованным сопротивлением на местном уровне. Зафиксировано как минимум 142 группы активистов в 28 штатах, которым удалось заблокировать или задержать проекты на общую сумму в 64 миллиарда долларов, превращая ЦОД в новую горячую точку конфликтов по принципу «не на моем заднем дворе» (NIMBY).
4. Парадокс общественного мнения: поддержка ИИ, но не ЦОД. Опросы показывают явный разрыв между общенациональной поддержкой технологий и локальным неприятием инфраструктуры. 93% американцев считают ИИ жизненно важным для страны, но лишь 35% готовы проголосовать за строительство ЦОД в своем родном городе, опасаясь негативного влияния на местные ресурсы и качество жизни.
5. Ключевые претензии: колоссальное потребление энергии и воды. Главные причины протестов — это огромный спрос на ресурсы. ЦОД потребляют в 10-50 раз больше энергии, чем офисные здания, что создает колоссальную нагрузку на электросети и грозит ростом тарифов для всех потребителей. Кроме того, один ЦОД может потреблять до 5 миллионов галлонов воды в день для охлаждения, часто в регионах, уже страдающих от нехватки воды.
6. Дополнительные возражения: шум и низкое создание рабочих мест. Местные жители также обеспокоены постоянным низкочастотным шумом от систем охлаждения и генераторов, который может достигать 96 децибел. Другая серьезная критика заключается в том, что после завершения строительства ЦОД создают очень мало постоянных рабочих мест по сравнению с другими промышленными объектами, занимая при этом огромные территории.
7. Контраргументы и адаптация отрасли. Представители индустрии ЦОД утверждают, что критика часто основана на устаревших данных. Они заявляют, что современные центры используют более эффективные технологии охлаждения, снижая потребление воды; устанавливают шумоподавляющие барьеры; оплачивают полную стоимость потребляемой энергии и создают значительное количество косвенных рабочих мест в смежных отраслях.
8. Двухпартийный характер протеста. Сопротивление строительству ЦОД не имеет четкой политической окраски и объединяет людей разных взглядов. Против выступают как либеральные защитники окружающей среды, так и консервативные жители сельских районов (например, в Техасе), которые обеспокоены сохранением контроля над местными ресурсами и не хотят крупномасштабного промышленного развития в своих сообществах.
9. Сдвиг на новые, «третичные» рынки. Исторически ЦОД концентрировались в технологических хабах (Калифорния, Вирджиния). Сейчас индустрия активно осваивает «вторичные» и «третичные» рынки (Огайо, Миссисипи, Айова), где дешевле земля и энергия. Однако именно в этих регионах, не привыкших к такому типу застройки, сопротивление оказывается наиболее острым.
Прогресс на 2 недели просто чудовищный. Tatiana Tkr реализовала липсинг. Ниже объясню - какие это дает возможности. Здесь пока использован "старый стек" текст->NotebookLM->Kling 2.1->CapCut. Генерацию делали только для героев и интерьера студии, остальное - Storyblocks, так получается быстро и недорого. Крайняя версия:
Кто главный: человек или ИИ? Машина размышляет о своём будущем. https://www.youtube.com/watch?v=Pfl5vyk6s3A
Все герои синтезированные, пока под аудиотрек от NotebookLM, и в прошлой версии делали без липсинга, просто дублирование. см - Игры вместо школы? Модель воспитания XXI века. https://www.youtube.com/watch?v=-8k6JhfQigU
После чумового релиза ElevenLab 3.0, будем тестировать полноценную режиссуру голоса и озвучки, т.е. убираем посредника в виде NotebookLM, т.е. мы теперь можем 100% управлять текстом и режиссурой озвучки - можно тестировать как режим монолога, так и диалога - даже несколько человек в кадре + строить полностью сцену, т.е. это уже полноценное кино - любые разговорные сцены.
Для коротких форматов, где доля генерации ИИ не больше 1 минуты это более или менее еще приемлемо по деньгам, но, конечно, пока это идеально для коротких анонсов в формате 11 и 30 секунд - это под превью. Остальное покрывать стоками - для тематических видео подкастов это норм.
А вот для аудио подкастов это уже совсем интересно, так как мы получаем 100 min всего за 22$, или 1000 мин за 99$, это 12-18 полноценных 60-минутных выпусков или по сути ЕЖЕДНЕВНО 30-минутный выпуск.
Сейчас ПОКА можно 100% автоматизировать 2-ую версию EL, но, думаю в течении нескольких месяцев API раскатают и на версию 3.
Итого, при наличии написанного текста сценария для монолога/ диалога, 60 минутный аудио трек стоит примерно 6$ генерации на почти 70 языках.
При том, что если кого-то нанимать на такой же объем, это стоило бы с учетом актеров, студии, звукорежиссера и затрат времени, думаю в районе от 500 до 700$. Т.е. разница - огромная.
Для кого это супер полезно? Для авторов, которые умеют писать, у кого есть тексты, кто хочет выйти на разные языковые аудитории. Разумеется, режиссер, маркетологи, писатели, блоггеры.
Совершенно очевидно, качество, управляемость будет расти, а цена генерации падать. Разумеется, под серьезные проекты можно создавать свой ЛОР.
Если бы 12 лет назад мне кто-то сказал, что я могу создавать такие миры сам, без огромной команды и тонны денег, я бы... наверное очень сильно поверил бы ему... Мы все время отстаем от новых возможностей. Они рядом, только бери.
Читать полностью…Вот еще подарок. Вчера elevenlabs потрясла иниернет, выпустив Eleven v3, которая дает вам полный режиссерский контроль над тем, что, а главное КАК ИИ говорит за вас на любом языке. Примеры я уже постил, они потрясаю, а сегодня с сделал бесплатный открытый микро учебник "Режиссура голоса в озвучке
с помощью Eleven v3. Полный практический гайд и демонстрация возможностей голосовой режиссуры".
📦 Что внутри:
✅ Переведённая и адаптированная инструкция ElevenLabs — включает все ключевые принципы работы с v3-моделью:
• выбор подходящего голоса по цели (нейтральный, нишевой, эмоциональный)
• использование audio tags для управления эмоциями ([whispers], [laughs], [crying] и др.)
• работа с punctuation, capitalization, timing
• настройка параметра Stability: от естественности до полной креативности
• добавление звуковых эффектов ([clapping], [explosion], [fart])
• использование экспериментальных тегов и акцентов ([strong French accent], [sings])
🎙️ 10 монологов на русском языке, каждый оформлен:
• с английскими аудиотегами (как код для ElevenLabs)
• с выразительной пунктуацией и заглавными акцентами
• с полным режиссёрским комментарием: что делает сцену живой, как работает дыхание, интонация, ритм
📚 Темы монологов:
• мотивация
• самоирония
• паника ребёнка
• философия времени
• продажа на шоу
• внутренний кризис
• стендап
• технологическая сатира
• женский конфликт
• экстаз писателя
🎭 10 диалогов — динамичные, сценические, идеально подходят для озвучки:
с конфликтами, сменой темпа, паузами, шёпотом, криком и подлинным ритмом.
📚 Темы диалогов:
• встреча старых друзей
• психотерапия
• конфликт в лифте
• любовное расставание
• AI и человек
• продавец и клиент
• спор отца и подростка
• философская дуэль
• подростки в парке
• такси в полночь
Ты получаешь готовые голосовые сцены, полностью адаптированные под ElevenLabs. Используй как тренировку, шаблон, вдохновение — или для создания настоящей голосовой драмы.
🛠 Подходит для:
• актёров озвучки
• режиссёров и сценаристов
• создателей аудиоконтента
• разработчиков голосовых ИИ
Голос — это не просто звук. Это сюжет, драма и ритм. И теперь он у тебя в руках.
Сегодня завезли ElevenLabs v3. Ребята... вам обязательно нужно послушать этот клип. Я не могу переоценить его крутость — это переломный момент для голоса ИИ.И тот факт, что теперь мы можем сделать это из текстовой подсказки, просто сводит с ума.
Читать полностью…Для меня момент “Ага” был, когда мы пытались сделать абстрактивную суммаризацию. Взять 1500 слов и свести к трём. Людям это трудно. Но модель сделала это. Тогда я понял, что это реально мощно — и если бы это работало на масштабе веба, ты мог бы найти нужные 10 страниц, на которые стоит обратить внимание.
Сара: Средар, как у тебя было? Когда ты почувствовал, что ты теперь не просто CEO Snowflake, а тоже AI-предприниматель?
Средар: Когда ты начинаешь взаимодействовать с этими моделями, хочешь найти способ, как задать нужный контекст, как сформулировать проблему, как заставить модель сосредоточиться. Это стало универсальной техникой. Установка контекста — это основа взаимодействия. Это не просто инструмент, это способ мыслить.
Сара: Ты согласен с Сэмом, что важнее кривая способностей, чем конкретное определение AGI?
Средар: Да. Я думаю, что вопрос AGI — часто философский. Но когда смотришь на способности моделей, становится понятно, что для человека в 2030 это точно будет AGI. Как с шахматами — компьютер побеждает, но люди продолжают играть. Это будет также и с AI.
Сара: А что дальше? Вы тренируете новые модели. Какие шаги кажутся самыми важными для следующего поколения?
Сэм: Прогресс в следующие 1-2 года будет значительным. Как GPT-4 открыл бизнес-возможности, которые раньше были невозможны — так будет и дальше. Дайте модели самую трудную задачу. Она поймёт контекст, подключит инструменты, подумает и даст результат. Возможно, мы ближе к этому, чем я думал.
Сара: У тебя есть представление о том, что значит “знание”? Ведь у нас нет симулятора физического мира в голове — так как знать, что возможно?
Сэм: Мне нравится думать о модели как о платонической идее — миниатюрной системе с суперспособностями разума, триллионом токенов контекста, доступом ко всем инструментам. И тогда уже не важно, знает ли она что-то заранее. Мы можем использовать её как гибкий механизм решения задач.
Сара: А если бы у тебя было в 1000 раз больше вычислений, что бы ты сделал?
Сэм: Попросил бы систему придумать лучшее устройство и спросил бы, что нам делать. Но даже сейчас, с текущими мощностями, если вы дадите модели достаточно свободы “говорить”, она может выдать потрясающие результаты.
"Когда всё быстро развивается, выигрывают те, которые способны быстро адаптироваться и не боятся ошибаться.... скорость важна. Те, кто делают быстрее, накапливают больше знаний и адаптируются быстрее." Я сделал перевод выступления Сэма Альтмана о перспективах ИИ на Snowflake Summit 2025. https://youtu.be/qhnJDDX2hhU?si=limPfyRF7Xf7Xa86
10 ключевых тезисов из текста:
1. Генеративный ИИ уже радикально изменил множество сфер — от программирования до философии, и стал доступен миллионам пользователей через foundation-модели.
2. OpenAI и ChatGPT переопределили взаимодействие с данными и интеллектом, сформировав новую модель работы и общения с ИИ.
3. Лидерам рекомендовано действовать быстро и не бояться ошибок, так как в условиях стремительных изменений выигрывают те, кто быстро пробует и адаптируется.
4. Любопытство и экспериментирование — ключевые качества, особенно учитывая низкую стоимость экспериментов с современными AI-инструментами.
5. Память и retrieval (доступ к прошлым данным и внешнему контексту) становятся всё более важными для повышения качества и надёжности генеративных моделей.
6. Агенты на базе ИИ уже сегодня могут выполнять сложные задачи, и в будущем могут превратиться в сотрудников уровня senior-инженеров.
7. Настоящий сдвиг произошёл в прошлом году — крупные компании начали применять ИИ в реальных процессах, и технологии доказали свою надёжность.
8. AGI (общий искусственный интеллект) — понятие расплывчатое, но ChatGPT с памятью уже близок к тому, что многие воспринимают как AGI.
9. Следующее поколение моделей будет способно решать задачи, недоступные людям, — например, открывать новое знание и предлагать решения сложных бизнес-проблем.
10. Контекст — ключ к эффективному использованию моделей: успех зависит от того, насколько точно вы формулируете задачу и подаёте входные данные.
Полный текст.
"Как мы смотрим вперёд, мы знаем, что AI имеет потенциал формировать будущее — и формировать его к лучшему. Генеративный AI перевернул всё — от написания кода до философии. Это путешествие началось с foundation models — моделей-основ. Они позволили миллионам пользователей получить доступ к силе данных, которые ранее были недоступны. Они изменили правила игры для всех нас. И немногие повлияли на будущее больше, чем OpenAI.
С бешеным ростом ChatGPT, которым ежедневно пользуются полмиллиона человек, они переопределили то, как мы взаимодействуем с данными, интеллектом, и как мы представляем себе будущее работы. В центре этой трансформации — один из самых влиятельных голосов в технологиях сегодня. Он привёл OpenAI от базовых исследований к продуктам, которые уже влияют на миллионы людей, и ведут к эволюции AI на по-настоящему глобальном уровне.
Пожалуйста, присоединяйтесь к нам в приветствии основателя и CEO OpenAI — Сэма Альтмана. [Аплодисменты] [Музыка]
И также — в приветствии основательницы Conviction и нашей хорошей подруги — Сары Гуо. Добро пожаловать, Сэм и Сара. [Аплодисменты]
— Ну, это невероятно — снова быть здесь. Я говорила с Средаром, что это похоже на рок-концерт… но для людей, которым интересны данные.
— Для людей с данными, да.
— Вы были здесь два года назад.
— Да, но тогда всё было не так масштабно.
Итак, чтобы начать — Сэм, Средар, что бы вы сказали лидерам, которые формируют AI-планету в 2025 году?
Сэм: Я думаю, просто делайте. Всё ещё много хаоса, модели быстро меняются, и слишком многие ждут, чтобы посмотреть, куда всё повернёт. Но в технологиях принцип таков: когда всё быстро развивается, выигрывают те компании, которые способны быстро адаптироваться и не боятся ошибаться. Мы это видим в AI-интернете: те, кто быстро делают, оказываются значительно впереди тех, кто ждёт.