Интернет всполошился. Вчера вышел 166-страничный репорт о возможностях GPT-4V. Оказалось, что GPT не только помножил на ноль почти все продукты в области NLP за последние годы, но и с ноги ворвался в Computer Vision, где сидели бородатые завсегдатаи, пили пиво и были уверены что "уж нас-то ваши эти трансформеры не тронут" (с).
Оказалось, что помимо простого "опиши что на картинке" GPT имеет глубокое понимание визуального и текстового контекста. Умеет определять темпоральный контекст. Знает как распознать и корректно идентифицировать эмоции людей. Прекрасно решает взиуальные логические задачи. Ставит корректные диагнозы по КТ и МРТ снимкам. Может дообучаться, в том числе на few-shot примерах прямо в промте. Анализирует графики. Распознает ингредиенты в блюде. Распознает конкретных людей. Понимает схемы, диаграммы, формулы, в том числе нарисованные от руки. Умеет выполнять навигацию по графическим элементам дизайна. Умеет принимать решения о навигации робота в реальном мире по двухмерной фотографии.
Но, главное, это вообще не какая-то другая модель. Это часть GPT-4 и, соотвественно, все что уже работает внутри GPT (промтинг, RAG, агенты) автоматически работает и для GPT-4V.
Для меня этот пейпер звучит как дикая фантастика 20-летней перспективы. Если бы OpenAI не анонсировал, что продукт будет доступен всем через месяц. А многие в твиттере уже имеют к нему доступ.
Вот тут Леша из Ai Happens рассказывает о примерах для бизнеса, а Сергей из Метаверсище и ИИще про кейсы в психологии и эмоциальном интеллекте.
Очень интересно.
Luda привлекла $7 млн на UGC-ИИ-платформу
UGC-платформа Luda привлекла $7 млн, которые пойдут на демократизацию ИИ-разработки — ее пользователи смогут создавать, тренировать и запускать собственных ИИ-агентов для игр с открытым миром. Ведущими инвесторами выступили Bitkraft Ventures и Compound, участие также приняли старший научный сотрудник Google Джефф Дин (Jeff Dean) и сооснователь блокчейна NEAR Илья Полосухин.
Виджай Сундарам (Vijay Sundaram), глава и основатель Luda: «Мы верим, что в центре ИИ стоит человек. Именно поэтому мы строим UGC-платформу для его генерации. Изменение технологической парадигмы дает нам шанс создать фундаментально новые, невозможные ранее, системы. Мы начали работать над новым потребительским ИИ-продуктом пять лет назад в Google Research, он должен позволить тренировать ИИ через процессы столь же увлекательные и понятные, как игры, в которых сольются человеческое воображение, общение и UGC».
Скотт Рупп (Scott Rupp), партнер Bitkraft, сравнил проект Luda с Lego, Minecraft и Roblox, назвав его предвестником новой категории социальных и иммерсивных платформ.
Новенькое в сфере GenML
Прошлая неделя выдалась насыщенной на релизы:
1. Mistral 7B — опенсорсная языковая модель с открытой лицензией Apache. По отзывам, качество генерации выше чем в Llama 2 и сравнимо с GPT-3.5. Практически не зацензурирована, благодаря чему более полезна. Можно запустить локально.
2. Cohere Chat + RAG — новый чатбот и API от команды Cohere. Позволяет подгрузить в чат любые внешние источники данных (например, pdf-ки или результаты поиска).
3. Claude открыл API для всех. Их киллер-фича — контекстное окно в 100k токенов, в 3 раза выше чем у GPT-4. Также ребята плотно запартнерились с Амазоном и получили от него монстр-раунд инвестиций в $4В.
4. PaLM 2 API от Гугла тоже открыт для всех разработчиков. Ещё Google сделали low-code инструмент MakerSuite для быстрого создания прототипов ИИ-приложений.
5. NexusRaven-13B — опенсорсная LLM, заточенная на function calling. На этой задаче модель сравнима с GPT-3.5.
6. Workers AI от Cloudflare — serverless inference для языковых моделей на базе инфраструктуры Cloudflare. Поддерживают Llama2, Whisper и несколько других опенсорсных моделей.
Я знаю, как вы любите пдф-отчеты, поэтому ловите еще один: Мегатренды от Копенгагского института изучения будущего и инвестиционной компании Pictet.
Три больших тренда, 21 тренд поменьбше, 50 экспертов опрошено.
Вот они, три основных:
1. Дефицит ресурсов
2. Деглобализация
3. Экономика услуг.
Отчет построен по модели: описание тренда, наблюдения экспертов, выводы, Q&A, возможности.
Инджой.
Вот так выглядит нормальный олдскульный американский рок. Под пиво и коктейль заходит - ИСКЛЮЧИТЕЛЬНО. Те, кому за 50 меня поймут. Дети, конечно, не вкурят. Детей - жалко! В конце эпичная битва черного угнетенного меньшинства за свои права! Доставляет.
Читать полностью…Вид с Key's View (из пустыни) на типа не пустыню. Ага. Ну да. 39 по Цельсию, но люди там живут, и много. Палм Спрингс - город пенсионеров. Нет, не то, что вы подумали. Богатых пенсионеров. Таких в СНГ не бывает.
Читать полностью…По дороге из Лас Вегаса в Нац. заповедник Джошуа Три, пустыня Мохаве. Конечно, она огромна, это почти 3.5 часа езды с скоростью 130 км/час. Это небольшой участок. В конце смотрите, как ездят настоящие американские реднеки из ебеней. Ну и немного заброшки + звук локомтивов - оччень приятно. Сорри, снимал без микрофона.🤢
Читать полностью…Новости с Цукеровских полей сейчас затмили всё остальное, однако кое-что важное сказал и Дэвид Базуки, батя Роблокса.
Он сказал, что в будущем в Роблоксе будет возможность покупать не только виртуальные товары, но и физические.
Концепция не то чтобы новая - что-то такое пытались уже реализовать в Decentraland, но там ничего не вышло.
А у Роблокса выйдет.
И я сейчас объясню почему:
1. Чтобы был смысл в продаже физических вещей в 3D пространстве, а не на сайте, люди должны проводить там много времени.
В DCL мало людей и короткие игровые сессии.
В Роблоксе среднее время онлайна - 2.3 часа в день.
Люди фактически там живут.
Конечно, им будет удобно что-то покупать или заказывать услуги внутри - без отрыва от процесса.
Но! Это будет работать только если заказ и платеж будет осуществляться прямо в 3D пространстве.
Сейчас так никто не умеет - и Виарчат и DCL кидают тебя в браузер на сайт.
Это полный отстой.
2. Товары должны не стоять на полках памятниками самим себе, а быть активной частью мира.
Если я играю в ролевую игру-симулятор Пятерочки и покупаю кило гречки - есть смысл купить ее по-настоящему.
Или косметику, которую мне втюхивает виртуальная Пэрис Хилтон.
Или одежду.
Или беговую дорожку, которая стоит в моем виртуальном доме.
Ну вы понели.
Вижу большие бизнес возможности в формате этом! 📈
Поколение Z подрастает и начинает массово устраиваться на работу. При этом 83% считают себя «job-hoppers»: не привязываются к одному работодателю и готовы быстро уйти, если подвернётся местечко получше. Но несмотря на частую смену работы, относятся к ней серьёзно: для 97% зумеров это неотъемлемая часть личности.
Недавно вышел отчёт Edelman о том, как привлечь и удержать молодых сотрудников — интересно с точки зрения найма и возможностей для проектов. Несколько хайлайтов:
- Присутствие работодателя в медиа пространстве становится must-have. Соискатели всё чаще изучают блоги компаний и высказывания СЕО. Открытым компаниям доверяют больше, особенно если они совпадают по транслируемым ценностям. (Я говорил о том, что все бизнесу превратятся в медиа компании еще года 4 назад).
- При этом всё больше сотрудников публикуют контент про свою работу, поэтому «работник = блогер» и может повлиять на бизнес. (Не понимаю этого. 100% корпоратов, с кем я общаюсь конкретно ссут говорить что-либо про свою работу, особенно из FAANG - задавлены разными NDA, политиками и регламентами. У меня товарищ есть - Леша, работает в Тесле (спец по дате). Фанат Теслы. Как-то рассказал мне про внутреннюю кухню Тесты, я опубликовал невинный пост, который перепечатали в 50+ журналах, потом перевели на английский, напечатали в англоязычных СМИ, а Лешу вызвали на ковер, выебали и высушили - типа, сука, еще раз рот раскроешь - отрежем яйца). Ой, я не слишком токсично написал для поколения снежинок?🤣
- 70% говорят, что для них важна конкурентоспособная зарплата, но ещё важнее денег (73%) — здоровый баланс между работой и личной жизнью. Постоянные овертаймы — главный фактор для увольнения. (Ясно, эти чуваки не работают в геймдеве.😂😂)
- На работу возлагают большие надежды, причём для личной жизни тоже — многие ожидают найти вторую половинку на рабочем месте. Поэтому компании сейчас запускают внутрикорпоративный дейтинг, как один из способов повысить retention сотрудников (скоро начнут предлагать секс роботов).
Забастовка писателей против ИИ закончилась❌
Гильдия писателей Америки достигла соглашения с голливудскими студиями о прекращении забастовки спустя почти пять месяцев.
В новом контракте между корпорациями и профсоюзом описываются ограничения на использование ИИ в писательском ремесле для студий:
🔻ИИ нельзя использовать для написания или переписывания сценариев, а произведения, созданные ИИ, не могут считаться исходным материалом, что не позволяет писателя-людям терять деньги из-за ИИ.
🔻Писатели могут использовать инструменты искусственного интеллекта индивидуально, но компании не могут требовать их использования.
🔻Студии должны информировать авторов, если им передаются какие-либо материалы, созданные с помощью ИИ, для включения в их работу.
🔻Члены гильдии писателей не дают согласия на то, чтобы их работа использовалась для обучения ИИ в студиях.
Данный контракт создает прецедент для установления глобальных мировых ограничений на использование ИИ в творческих профессиях.🤖
О чем говорят разработчики, когда обсуждают ИИ?
На портале одного из самых крупных венчурных фондов в Долине - a16z вышла любопытная подборка интервью с ведущими разработчиками искусственного интеллекта.
⚡️Среди ключевых мыслей:
- Мы стоим у истоков третьей эпохи вычислительных мощностей. Первой были микрочипы, второй - интернет, третьей станут модели искусственного интеллекта.
- Экономика новых AI-моделей улучшается в тысячи раз по сравнению с человеческим трудом. Это гарантирует их быстрое распространение.
- Пока что точность для многих задач не критична, творческие способности моделей важнее.
- AI уже помогает программистам писать код - это "копилоты". Такие ассистенты с каждым запросом работают все лучше.
- Огромный потенциал - в сочетании AI и биологии. AI поможет расшифровать биологические процессы и найти новые методы лечения болезней.
- Пока непонятно, будет ли доминировать одна универсальная модель AI или же их будет много для разных задач.
- Важно следить за "эмерджентными" возможностями AI - когда модели начинают делать то, чего изначально не закладывали разработчики. Эти навыки быстро улучшаются.
- Физики и математики - лучшие разработчики AI на данном этапе. Их абстрактное мышление помогает решать сложные задачи в этой сфере.
В целом, интервью показывают: несмотря на впечатляющие успехи последних лет, мы находимся лишь в самом начале революции в области искусственного интеллекта. Большинство прорывных приложений на основе AI еще впереди. Так что если вам кажется, что вкатываться в AI уже поздно - то вам кажется. Самое время начать - сейчас!
🎙 Обзор
📹 Интерьвю
Всего неделю назад писал про лик информации о будущих планах OpenAI — там говорилось про модель Gobi.
Но оказывается в Твиттере есть человек, который предсказал это ещё 28го Апреля. Твит удалён, однако сохранилась архивная ссылка: тык. Этот же аккаунт за полторы недели до релиза GPT-4 (14го марта) писал 5го марта, что GPT-4 уже используется в Bing, а анонс будет через неделю или около того. И в тот же день назвал точную дату вместе с указанием на тот факт, что GPT-4 будет обрабатывать картинки.
В общем, пускаемся на территорию слухов и догадок. Этот же аккаунт написал 18го сентября, что — готовы? вдохните поглубже 😆 — "AGI has been achieved internally." Якобы в одной из лабораторий (Видимо, OpenAI?) достигли уровня технологии, который можно назвать AGI (хотя бы каким-то определением). Лично я в это не верю, скорее какая-то из компонент на каком-то бенчмарке показала себя сильно лучше, чем ожидалось — такое может быть.
Также этот аккаунт утверждает, что у OpenAI с весны идёт разработка модели под кодовым названием Arrakis (как планета со спайсом во вселенной Dune). Целевая дата релиза — 2025й год, но может быть из-за ускорения рисерча она будет релизнута где-то в 2024м.
——————
Помимо этого на Reddit есть аккаунт, который пишет в целом схожие вещи в похожем стиле, и как будто бы даже из той же страны (не понял, как узнали). Увидел вот тут, оригинал поста на LessWrong здесь. Что говорят:
— Arrakis уже существенно превосходит GPT-4 с точки зрения reasoning (рассуждение и логический вывод);
— это мультимодальная модель, которая умеет не только принимать, но и выдавать разные типы данных. В том числе умеет генерировать видео (лучше, чем Gen-2);
— Модель имеет около-экспертный уровень в большом наборе топиков, но пока не превосходит людей;
— Галлюцинации встречаются куда реже, чем у GPT-4, но всё еще не побеждены;
— Половина тренировочных данных — синтетические (то есть сгенерированные другими моделями);
— модель является очень хорошим автономным агентом, то есть ей можно поставить задачу, дать инструменты и ждать, пока задача выполнится.
В общем, такие вот слухи. Сам я не верю даже в 30% того, что описано, но чёрт его знает что там в этом вашем Deep Learning происходит. Поживём - увидим!
UPD: забыл добавить, что в истории с предсказаниями по GPT-4 много пробелов, много твитов удалено, странные вещи, так что этот пост скорее просто даёт помечтать. Ну и через годик вернуться-посмотреть :)
Почему дети учатся эффективно, а взрослые просирают полимеры, ничего не достигают, падают в депрессию? И таки что с этим делать? Чтобы понять - давайте сравним, как учатся дети и взрослые, и тогда поймете, где вы косячите. (и как перестать захлебываться соплями и начать жить🤣). Поехали:
1. Дети - НЕ УЧАТСЯ. Еще раз, для непонятливых. Дети - НЕ УЧАТСЯ. У них нет такой концепции в голове - учиться. Дети делают только то, что им нравится, пытаются получить то, что они хотя - НЕМЕДЛЕННО. А потому они ищут максимально быстрые пути. Приведу пример с 3Д графикой, программированием и играми.
2. Дети не хотят работать программистами в корпорации. И даже не хотят быть маркетологами, и не хотят быть дантистами или проктологами.
Дети видят игрушку, прикольного персонажа и хотят запилить такое же. Или хотят быстро слепить персонажа и поделиться со своими друзьям в снапе или роблоксе, или где там они еще тусуются. Вот что они хотят.
И дети лезут в инет, и не пытаются изучать все эти инструменты, а ищут конкретно - как сделать этого долбанного гномика за 3,5 минуты. Да. Именно на 3,5 минуты. Потому что уже за 4 - не кайф. Ибо attention span слишком короткий. А как поступает взрослый?
3. Взрослый, сука, хитровыебанный - думает: МНЕ НАДО ИЗУЧИТЬ ИНСТРУМЕНТ! Мне надо учиться. Я должен изучать основы. Понять систему. Я же, факинг, взрослый. Я не могу делать какую-то уйню на палке. Я должен учиться ПО-ВЗРОСЛОМУ.
И взрослый ищет 100500 курсов и тьюториалов, и прилежно все повторяет. Пока дети делают говно-гнома. В результате.... проходит, ну допустим 1 месяц.
4. У ребенка уже 50 готовых персонажей. Он не знает системы, фундамента, основ. Он просто умеет делать перса быстро, быстро его внедрить куда надо, быстро настроить поведение и развлекаться. Ребенок ничего объяснить не может, но умеет делать. Созидать, а главное немедленно использовать и монетизировать. Ага! Вы не в курсе, что 9-летние отлично умеют монетизировать свое творчество. Им не в падлу. Они не знают, что это "не царское дело". А потом в 20 они делают стартапы, пока взрослые продолжают бурчать и щелкать тем самым, что вы подумали.
5. А что у взрослого? У взрослого в лучшем случае 1 проект, навороченный, никому НАХРЕН не нужный. Почему?
Потому что на системных курсах учат тех, кто хочет получить профессию и устроится на работу. Да и надо-то всего годик, чтобы сделать портфолио из 10 сложных объектов, чтобы, Христа ради взяли на галеру пилить 3Д аватарки на иконках магазина.
Взрослый все может объяснить, показать, и даже чего-то делать... через год. Но за год у него НИЧЕГО не сделано по существу. Потому что он не планировал ничего делать. Он планировал получить скил, чтобы продавать его.
Вывод: Хотите результата и быстро? Хотите созидать? Хотите монетизировать? Хотите делать деньги на творчестве? Учитесь как дети.
StabilityAI выпустили языковую модель Stable LM 3B.
Она сделана с фокусом на мобильных устройствах, где будет потреблять мало ресурсов и обойдётся дешевле в обслуживании. Её можно зафайнтюнить на своих данных, чтобы она была экспертом в указанной области.
Натренирована на 1Т (триллионе) токенов в течение 4 эпох на 256 A100 и показывается себя лучше остальных в своём классе, плюс превосходит некоторые 7B модели. Контекст 4К, весит 5,5 Гб.
А ещё на днях вышла Mistral 7B, которая лучше ламы-2 13B на бенчмарках. То есть маленьких, но мощных и оптимизированных моделей становится всё больше.
Эмад ожидает увидеть рой таких экспертов на телефоне в следующем году.
Анонс
Модель на HF
Код
Технический отчёт
Любопытно. А сколько шуму было? Вот ого как бывает! Но думаю, все еще впереди.
Sony может сократить производство GaaS
В апреле 2022 года, вскоре после приобретения Bungie за $3,6 млрд, Sony объявила о том, что, опираясь на опыт этих ветеранов, сможет запустить более 10 игр-сервисов в течение последующих четырех лет. Но согласно Джейсону Шрайеру (Jason Schreier) из Bloomberg, в PlayStation якобы не в восторге от выбранного курса — ведь большинство студий Sony специализируются на однопользовательских кинематографических играх и ничего не понимают в F2P и GaaS.
В качестве примера подобного провала Шрайер приводит многопользовательский шутер Anthem от Bioware, заработавший по оценкам SuperData $100 млн в первый месяц, из которых только $3,5 млн пришли от IAP.
Попытки переформатировать игру закончились тем, что спустя два года в Electronic Arts отказались от ее развития. Тем не менее, сервера все еще работают. Еще хуже история произошла с Redfall от Arkane, которая, кончено, принадлежит вовсе не PlayStation, а Xbox, но ситуация аналогичная и поучительная.
GaaS, видевшиеся несколько лет назад будущим индустрии, уже не столь привлекательны — даже Fortnite якобы уже не столь популярен, как прежде и получает большую часть выручки от комиссий с продажи UGC-контента программы Fortnite Creator. На прошлой неделе об этом стало известно из письма главы Epic Тим Суини (Tim Sweeney), объяснявшего необходимость сократить штат компании на 16%.
Источники Шрайера говорят, что в Sony недовольны отсутствием четкого видения развития компании и ставкой на GaaS, PS VR и PS Portal, портативную приставку, которая работает только в пределах квартиры.
Вероятно, с уходом Райана компания пересмотрит стратегии прежнего главы. Свое кресло он покинет в марте 2024 года.
Парное програмирование с большими языковыми моделями
Хочу рассказать о новом онлайн-курсе от DeepLearning.AI совместно с Google. Он посвящен применению больших языковых моделей (типа ChatGPT) в работе программиста.
На курсе расскажут, как упрощать код и повышать скорость разработки с помощью ИИ, как находить ошибки в коде и рефакторить его, а также как пояснять и документировать сложный код на разных языках программирования.
Курс рассчитан всего на 1 час, доступен бесплатно на платформе DeepLearning.AI и включает в себя практические задания на модели PaLM от Google.
Курс будет полезен программистам, которые хотят научиться применять возможности ИИ в своей работе. Его ведет Laurence Moroney, один из ведущих специалистов Google по искусственному интеллекту.
🤖 Ссылка на курс
☝🏻Илон Маск стал самым популярным в мире стримером
Рекламируя прямые трансляции на своей платформе "X" Илон Маск протестировал новую функцию проведя стрим играя в Diablo 4
Стрим длился 52 минуты, в течение которых Илон демонстрировал геймплей и делился игровым опытом.🤔
Илон упомянул, что будет транслировать свою попытку пройти подземелье Nightmare 100-го уровня.
Поток был подключен через OBS Studios — свободное программное обеспечение с открытым исходным кодом.
Илон Маск собрал 660 000 зрителей что сделало его самым популярным стримером в мире😅
У X есть потенциал стать конкурентом таким платформам, как Twitch и YouTube. Учитывая строгие политики в правилах Twitch, возможности потоковой передачи X могут привлечь создателей контента.
Сегодня отклонил еще 10+ говноботов, которые хотели своими жадными ртами добраться до вашего бесценного внимания. Цените.
Читать полностью…Лас Вегас. Даунтаун. Вход на Фримонт Стрит и дальнейший оттяг. Следом будет настоящий американский рок.
Читать полностью…Эти фотки сделаны НОЧЬЮ при свете полной луны. Т.е. это НЕ СОЛНЦЕ, это Луна и звезды. Нац. парк - Джошуа Три: https://en.wikipedia.org/wiki/Joshua_Tree_National_Park
Читать полностью…🪄 Энтузиаст сделал ИИ-агентов с GPT-4, которые автономно собирают веб-приложения и фронтенд. Взрывной пример — кидаете скрин желаемого дизайна, а ИИ повторяет его, ищет баги и допиливает сайт до идеала. На копипаст главной страницы Google уходит меньше 10 секунд!
Бот на втором видео умеет не по скринам, а по текстовым запросам собирать веб-приложения. Не нужно нанимать кодеров, пользоваться nocode платформами или тратить время, всё просто — описал идею и получил сайт. Пока что этот проект закрыт для публики.
#AI | Not Boring Tech
Итак, что же нам показало начальство:
1. Ожидаемый всеми новый виар шлем Квест 3.
Спеки: чип Snapdragon XR2 Gen 2, 8 ГБ ОЗУ, 128/512 ГБ ПЗУ, 2 ЖК-дисплея 2064x2208 на глаз и частотой 90/120Гц, удобные контроллеры без колец.
Цена 500$/550€ за 128 ГБ и 650$/700€ за 512 ГБ. Отправлять будут с 10 октября.
Графика лучше, пикселит сильно меньше, руками махать удобнее, размер компактнее - шлем смогут носить даже дети/карлики.
Основная крутая фича - это цветная сквозная камера, которая позволит делать много прикольных штук:
- играть на пианино как в этом ролике
- обставлять свою реальную мачо-дачу-хату-хаус фигурками коней и ачивками из игр. (может и NFT на шо-нибудь сгодятся, смекаете, да?)
Я лично уже присматриваю себе метаверс-ковер на стену.
- игры и голограммы (слово голограммы Цук повторил много раз).
В общем, это нам надо!
2. Умные очки Meta RayBan.
Уже вторая версия.
Вот они меня поразили больше всего, потому что они нехило так меняют модель коммуникации.
И я уже отчетливо вижу, как эти очки помогут зарабатывать блогерам и вебкамщикам.
Подробнее про это напишу потом, когда додумаю.
Что умеют очки:
заменять вам наушники и микрофон, звонить/слушать музыку и тд, вести стримы прям в соцсети!
А еще внутри у них будет неонка голосовой ИИ-помощник!
Визуального ничего на линзы выводить не будут - так что это не AR.
Пока.
3. Искусственный интеллект.
Всем даром и пусть никто не уйдет обиженным!
Сможем генерить картинки прямо в чатиках цукеровских соцсетей, задавать вопросы, юзать ИИ фильтры для инсты!
Нейронку можно будет дообучать и пилить своих чат-ботов для бизнеса.
Некоторых уже дообучили и дали им лица знаменитостей. 🌚
Можно спросить совета по притонам красоте у ИИ-Пэрис Хилтон или поиграть в D&D со Снуп Догом.
Этот же ИИ будет встроен в аватаров внутри цукеровского метаверса.
Вот это жизнь у нас начнется! 🧃
Вывод после этой конференции лучше всех сформулировал Денис:
"ваще конечно надо думать как в таком мире деньги зарабатывать. Все слишком быстро движется".
Все слишком быстро движется, ребята.
Цукер несколько раз повторил, что их цель - поменять все.
Всю нашу ежедневную жизнь.
И если виар шлем или метаверс, о котором он нам рассказывал в прошлые разы, этого сделать не могли, то все в совокупности + ИИ + очки рэйбан = это уже тянет на новый мир.
Будем вместе думать, как не отстать от этого поезда.
ИИ меняет структуру экономики. Для кого-то (подписчиков Gershuni в первую очередь!) это гигантская возможность добиться небывалых высот и внутренней гармонии; для других — риск остаться без работы или с 1/10 от своей зарплаты. Давайте разберём на конкретных примерах, цифрах и данных что нас ждёт.
80% всех профессий и работ в США изменяться благодаря LLM; в каждой из них как минимум 10% задач будут автоматизированы (выполняться с минимальным участием человек без потери качества) с помощью ИИ. А для 19% всех сотрудников в экономике автоматизация затронет более 50% ежедневных задач. [источник]
Великий Уравнитель в действии: чем выше уровень образования и оклад, тем больше автоматизации появится в профессии. Для бариста, сантехника или парикмахера уровень почти нулевой; для аналитика Wall Street или юрисконсульта — очень высокий. Для профессий с средней з/п в $30k/год задачи подверженные автоматизации составляют около 5% (по разным моделям); для з/п от $80k — это 50%.
Всего, учитывая текущий уровень развития технологий LLM, авторы ожидают автоматизацию ~15% всех задач в экономике (без потери качества) и до 47% учитывая не просто ChatGPT, а новые продукты созданные на основе LLM.
Авторы статьи приходят к выводу, что LLM это технология общего назначения (типа как электричество) и большинство кейсов применения еще просто не появились или находятся на очень ранней стадии. Со временем, технология будет улучшаться и эти цифры поменяются.
Запомните, дети: сегодня мы используем самую тупую, никчемную и примтивную версию generative AI за всю нашу жизнь.
🏗 AI в 2023 — это кубики Лего
Технологии развиваются сегодня быстрее, чем когда-либо. Если раньше AI был конкурентным преимуществом, то сейчас это такой же базовый уровень, как удобный интерфейс. Ниже я расскажу, почему я разделяю классический ML и AI, который доступен сейчас.
ML устарел: раньше для решения любых AI-задач требовались ML-инженеры и долгие месяцы на эксперименты. Теперь же часто достаточно запроса в API. Эндрю Ынг— один из главных людей в ML-индустрии. Теперь он делает курсы по промптингу и рассказывает про это так: «Даже мне, опытному ML-щику, раньше нужны были 2 недели, чтобы решить задачу классификации. Теперь же достаточно написать промпт.».
Почему конструктор: по интернету разбросаны разные кубики и главная задача — их умело собрать. Именно про это я говорил в посте про AI-инженеров. Технологии распознования и синтеза голоса, качественные промпты, генерация изображений, ноукод-тулы для создания цепочек запросов в LLM — все это кубики.
Как я применяю это: в феврале я применил стратегию «кубиков» и запустил расширение для продаж в LinkedIn за два часа. Дальше я интегрировал эту же технологию в процесс привлечения аутстафинг-агенства. Так мы смогли рассылать в 3 раза больше сообщений кандидатам. Я применил этот подход на >10 проектов и везде «AI как сервис» выигрывал у «классического ML» по скорости итераций и проверки гипотез.
🤩 Прямо сейчас происходят огромные инвестиции в индустрию. Только вчера GPT научился видеть и говорить, а в следующем году уже может научиться генерировать видео. Мы неминуемо идем к миру, где технологии стоят дешево и доступны всем.
@prod1337
подумываю сделать канальчик с названием «злобные старые грымзы» для всех, кому 55+ только.
Читать полностью…если это хотя бы на 30%, и пусть в след. году, многим станет не до смеха. видимо хотят успеть зарегулировать. Как в нейроманте, полиция Тьюринга.
Читать полностью…