В Wired вышла классная статья про AI индустрию, там многое, что вы и так уже знаете, поэтому Игорь сделал выжимку статьи по пунктам, отобрав только интересное, рекомендую:
/channel/seeallochnaya/617
Ну и в который раз уже советую подписаться на него, лучший канал про космос ML на русском языке
P.S. Мне больше всего понравился этот пункт:
>в финансовых документах для инвесторов OpenAI чётко говорят: «Мы здесь не для того, чтобы обеспечить вам доход. Мы здесь, прежде всего, для выполнения нашей миссии. И мы, кстати, на самом деле даже не знаем, какую роль будут играть деньги в мире после создания AGI»
Надеюсь, в мире пост-AGI, твердой валютой станут мемы
Люди: изобрели промт «думай пошагово», улучшили производительность LLM, горды собой
LLM: придумал для себя промт «глубоко вдохни и подумай», улучшил производительность еще сильнее, забыл сообщить об этом кожаным
В данной таблице приведены примеры промтов, которые LLM делают сами для себя и их сравнительная эффективность.
Я потестил на современной классике, с кино конечно пока не очень работает – а Польский вообще стал английским и не одной kurwa 🌚
Через год, думаю будет сильно лучше работать чем сейчас – классный продукт, с кучей нейронок под капотом и большими перспективами
Люди:
Ха-ха, глупая нейронка, не может распознать объект на очевидной картинке
Тоже люди:
Прошлогодняя реакция исследователей на первые в истории фотографии
черношейного фазанового голубя – он считался вымершим, последний раз его наблюдали 140 лет назад, фазана засняли в Папуа-Новой Гвинее.
А запостил я это видео, потому что меня умиляет, когда люди так сильно любят свою работу 😛 фазановый голубь конечно ничего, но реакция ученых еще лучше
Я вам снова нейролайфхаков нагенерировал, пользуйтесь:
>>Вместо стирки, отдайте свои носки танцорам с просьбой вернуть их через неделю. Таким образом, грязь будет вытанцована из них, а вода и время сэкономлены
>>Чтобы пыль больше не скапливалась, прикрепите к ножкам стола маленькие метелки. Каждый раз, когда вы будете передвигать стол, он будет делать сухую уборку!
>>Чтобы избежать скучных разговоров с соседями, обливайте их водой из бутылки каждый раз, когда вы случайно встречаетесь
>>Чтобы создать иллюзию чистоты, приклейте фотографии блестящих кухонных поверхностей на все свои столешницы.
>>Не хотите выбрасывать старую пиццу? Превратите ее в модный ковер для гостиной! Просто не забудьте сказать гостям, что он съедобный
>>Чтобы избежать засыхания растений во время вашего отпуска, отправляйте им письма с пожеланиями хорошего роста и счастья. Вам никогда не придется беспокоиться о своих растениях, потому что они будут заняты чтением и восприятием эмоций из ваших посланий.
>>Чтобы мебель не скучала в вашем отсутствии, оставляйте музыку включенной
>>Чтобы избавиться от надоевших комаров, настройте свой телевизор на трансляцию фильма про пингвинов. Комары, конечно же, подумают, что наступила зима, и сами улетят на юг
>>Чтобы сэкономить место в холодильнике, храните овощи и фрукты в виртуальной реальности.
>>Устали от скучных стен? Преобразите их с помощью спагетти! Замочите макароны в яркой краске и нанесите на стены. В результате у вас будет уникальный трехмерный итальянский декор.
На неделе, от Meta, вышла новая серия «больших языковых моделей» — которая позволяет генерировать код по текстовому запросу, ну, как многие это делали в ChatGPT.
Поскольку темпы в нашей индустрии невероятные, модель подхватили в сообществе, и уже через пару дней опубликовали дообученные версии (общей направленности, и отдельно дообученную модель для генерации Python кода). Что интересно, сделали это несколько разных команд, и обе получили результаты в спец тесте чуть выше, чем есть сейчас у GPT4 в генерации кода (1, 2).
Я такое очень люблю, локальные языковые модели на базе llama2 это:
— Хорошая лицензия для бизнеса: то есть можно прикручивать в стартапы;
— Безопасность: я точно знаю, что сотрудникам крупных компаний запрещают отсылать в ChatGPT корпоративные данные, локальные модели это обходят, так как никуда данные не отправляют и процессят их только на устройстве;
— Гибкость: модель можно дообучить, играться с параметрами или можно передать негативный промпт и снять с нее цензуру (тут я написал небольшую инструкцию как этого добиться), или заставить отдавать только строгий JSON формат и тп.
— Это дешевле в частном использовании: не все готовы отдавать по $20 в месяц за GPT4, так как могут учиться программировать, не обладать лишними деньгами и тп.
Поэтому я сразу побежал играться с этой моделью, с конкретной задачей — мне лениво пытаться самому понять, что делают некоторые скрипты (скрипты умнее меня), поэтому я прошу языковые модели конвертировать код в обычный текст.
Для тестов я взял исходный код древнего вируса Чернобыль (CIH), тот самый, который с 1998 вывел из строя 600 миллионов компьютеров, и нанес ущерба на 35 миллионов долларов.
Если откроете ссылку, то увидите что кода довольно много, а каждая языковая модель ограничена на входе размером текста который она может принять на вход (например, модель в которой я тестирую, была натренирована на 4K токенов, что примерно ~2800 слов) — поэтому пришлось насильно расширить контекстное пространство до 16K токенов (спасибо GGUF, не реперу, а новому формату llama.cpp который специально создан, чтобы упростить жизнь для работы с большим контекстом). Короче, спустя пару минут шумящего компьютера я получил описание того, что делает вирус, простым языком, и без всякого интернета 🫣
Дальше планирую с помощью модели порешать разные задачи которые встречаются в работе продуктолога: процессинг данных о использовании сервисов, написание запросов и тп, с GPT4 я уже довольно много всего наделал работая с данными, теперь интересно попробовать что же умеет делать GPT-дома.
☆ Модель с которой я игрался (34B)
☆ Скрипт которым запускаю инференс (Mac)
TL;DR: Жесть мы в будущем, теперь без интернета можно писать и дебажить скрипты
@Denis
Скоро все эти большие языковые модели не только к пациентам подключать будем, но и к здоровым людям – но пока:
Исследователи показали мозговой имплантат, который декодирует мысли в синтезированную речь, позволяя парализованным пациентам общаться с помощью цифрового аватара.
- Имплантат преобразует сигналы мозга в текст со скоростью почти 80 слов в минуту (там в видео видна установленная сетка считывания активности), что значительно превосходит текущие устройства (14 слов в минуту).
- Дальше разные нейронки генерируют реалистичный вокал (голос пациента до травмы) и лицевую анимацию
- Дальше сделают беспроводной интерфейс для чипа, а то с проводами в голове не удобно
В общем, хорошая новость для всех парализованных людей – скоро появится возможность вернуть их обществу.
Имплантаты, читающие «мысли», уверен, ждет большое будущее – удобно же на суде подсудимому заглянуть в голову, неправда ли? ☕️
Источник
Стрим посадки лунного модуля Chandrayaan-3 Индии, го смотреть:
https://youtu.be/DLA_64yz8Ss
Стрим смотрят 6 миллионов 🫣
🔄 Наткнулся на совершенно прекрасный кусок опенсорса — эмуляция двигателя внутреннего сгорания, со всеми возможными физическими процессами, для имитации максимально похожего на ДВС звука.
Не смог удержаться, потрекал лошадь и приделал к ней звук двигателя
🔥 Harley Davidson 🔥
🔥 Shovelhead 1.3 🔥
Софт бесплатный, тут видео как выглялит симулятор (канал автора тоже классный), а тут виде как этот симулятор подключили к е-байку.
Работает все под Windows, в архиве установки еще много разных типов ДВС.
P.S. 🔥 Спасибо за вдохновление фильму Барби 🔥
Мне было лениво собирать свой MiniTV, о котором я уже как-то писал в канал (на похожем симпсоны запускали), поэтому я просто заказал похожий на аналоге кикстартера
Но самое лучше его применение раскрылось после:
Я залил туда пару часов рекламы из 90-х, и он теперь работает как фоновый телепортатор в прошлое – там еще 6 гигабайт свободного места, которое я планирую забить всякой похожей фигней потому что могу 🤨
P.S. В офисе сильное эхо, поэтому лучше звука у меня для вас нет
P.P.S. Еще его можно применять как внешний моник для компа ☕️
Вчера, директора турецкой крипто-биржи Hodex и двух его братьев приговорили к 11 196 годам заключения, каждого ☕️
Турецкое правительство не шутит с аферистами – эти украли ~$2 миллиарда вложений своих пользователей. При этом, им еще повезло – сначала обвинение запросило 40 563 лет заключения.
Сервис по нейро-переводам стал доступен для тестов. За один доступный кредит вы можете протестировать видео от 30 до 50 сек.
Когда мы определяем зловещесть долины, мы смотрим сначала на глаза, потом на рот собеседника. Т.к. с глазами тут порядок, мы смотрим на рот, и тут как раз Heygen подменяет ваш липсинг на родном языке на липсинг языка, который вы выбрали для перевода. Хорошо ли он справляется, решайте сами.
Но меня подкупило использование сразу нескольких новых технологий: сам перевод, дипфейк и войс-рекогнишн.
Попробовать можно тут
На картинке не инструкция для обхода чего-то там, а просто смешная картинка, ничего запрещенного в ней нет ☕️ в инструкциях вообще списки нумерованные часто, а тут их нету
Если вдруг, у кого-то из читателей перестанут открываться смешные (и не только) картинки в интернете, то этот ироничный jpeg-файл поможет исправить эту проблему: нужно просто поискать слова с подкладки где-нибудь 🖱
Мета-ироничный мем получается, можете сохранить на будущее, вдруг пригодится
На DTF интересный пост от актрисы озвучки которая потеряла работу из-за того, что ее голос «украл» Tinkoff Банк:
Под «украл» она имеет в виду, что представители банка не рассказали детали проекта, договора были хитро составлены, а сотрудники банка не раз говорили Алене, что ее голос «будет использоваться для внутренних нужд банка». Речь о 2019 годе, Алена про потенциал нейронок еще тогда не знала.
В итоге:
Ее голосом можно озвучить что угодно (есть примеры порно рекламы), создается это все через Tinkoff VoiceKit. Самое грустное, что ее бывшие клиенты, теперь идут в Tinkoff VoiceKit и генерируют ее голос для озвучки чего-то, хотя раньше наняли бы ее.
Мое мнение:
Персонально, я сожалею актерам озвучки, которых задел прогресс, но к сожалению это уже необратимый процесс (конкретно для них). Толковой законодательной базы все еще нет (а в 2019 и подавно), поэтому крупные корпорации делают, что хотят и неизвестно будет ли им за это что-то (капитализм, huh).
В мире ситуация похожая, люди копируют голос знаменитости, выкладывают на ютуб и юридически утверждают что это пародия или fair usage, где-то ролики банят, а где-то нет. Или из недавнего: умельцы копируют голос знаменитости и озвучивают этим голосом песню, и уже лейбл ходит по интернету и блокирует песню на всех площадках, так как они с этого ничего не получают и владеют правами на песни исполнителя.
Вся юридическая база для этих случаев пишется прямо сейчас, но коснется она в основном регулирования крупных корпораций и брендов.
При этом, Text-to-Audio модели которое обучило сообщество свободно циркулируют в интернете, то есть каждый может скачать голос какого-то Дрейка или Алены (просто обучить новый на результатах VoiceKit), и озвучить им любую песню или текст. И тут, я не думаю, что удастся добиться какой-то регуляции — если человеку нравится чей-то голос, то сделать синтез-копию его настолько просто, что ролики с порно рекламой никуда не денутся:
Алена записала 30+ минут видео, где озвучила то, с чем столкнулась. С технической стороны чтобы скопировать ее голос достаточно трех секунд из того же видео . То есть отлавливать "порно рекламщиков" и другие незаконные использования можно будет только постфактум, и это будет дорогой процедурой требующей юристов.
Не говоря уже про "смешанные" датасеты, где ты берешь похожие голоса людей и владельцы никогда не догадаются что их голоса скопировали и интерполировали.
Думаю, защитить себя от копирований в интернете будет невозможно еще довольно долго: лет через ~100 внешность и голос, и био-данные, наверное, будут каким-то видом персональных прав человека, гарантированной собственностью и тп, и будет куча всякого клевого на базе ИИ чтобы защитить гражданина в стране первого мира, но мы это вряд ли застанем, поэтому для нас хорошо бы если бы корпорации ограничили хотя бы (или заставили платить честные суммы).
Вообще странно читать такое — у Tinkoff все хорошо с деньгами было на тот момент, если ты встраиваешь голос человека в каждый утюг, странно не сделать этого человека счастливым — для банка кост незаметный, а человек будет хотеть и дальше работать вместе.
А в итоге – уничтоженные профессии сложными и не прозрачными договорами.
>Рисуешь кучу однотипных обезьян и продаешь всем подряд называя это NFT и digital революцией
>Народ покупает, некоторые берут jpeg картинки за 3.4$ миллиона
>Со верменем цены на jpeg картинки падают (но некоторые все еще стоят десятки тысяч $, но хотелось бы сотни конечно, как раньше)
>Думаешь как еще заработать и подаешь в суд иски против 30 знаменитостей, включая Мадонну, Джастина Бибера и Пэрис Хилтон, аукционный дом Sotheby’s и тп, потому что что-то там недостаточно кто-то откоммуницировал про jpeg картинки для потенциальных покупателей и теперь истцы должны денег
Это самое глупое что я читал за последние пару месяцев — владельцы нарисованных обезьян судятся с Мадонной
ИИ приди, порядок наведи
@Denis
Помните утечку кучи видео с тем как выглядит GTA 6?
Оказалось, что конкретно за этим взломом стоит 18-летний британец: Арион Куртадж.
Его поймали какое-то время назад за причастность к другим взломам, начали брать с него показания и ради его же безопасности перевели его жить в отель, естественно, запретив ему любые виды взаимодействия с компьютером и интернетом.
Арион не расстроился, сходил в соседний супермаркет и купил там USB-приставку к телевизору «Amazon fire stick» за ~70€, дальше зашел на какой-то из своих доступных онлайн-серверов и уже оттуда взломал Rockstar Games через Smart TV присадку ¯\_(ツ)_/¯
Вот это любовь к своему делу, снимаю шляпу
Все теперь с ИИ, даже кола
¯\_(ツ)_/¯
Наткнулся на нее в магазине, на вкус как чатгпт жевательная резинка с кислинкой, ИИ не распробовал
А еще оценили как программисты сами себя работы лишают заменяя нейронками себя же? Иронично 😂
Читать полностью…Немного корявый, но все же клевый пример конвертации фильма в аниме
Пока это требует много ручной работы, но пройдет пару лет и станет доступным каждому 🍿
Поскольку я ленивый, подожду пару лет и возьмусь за аниме-Тарковского 😐
Ночью OpenAI дали возможность «дообучить» GPT 3.5 на своих задачках – то есть, можно наконец-то заставить ее генерировать глупости в своем жанре, цитировать юридические документы своей компании и тп.
Я буду играться с этим попозже, но для тех кто хочет сам дообучить, я залил Google Colab.
Цены тут.
P.S. Ваш датасет будет проверен GPT4 на предмет «нарушений» политик OpenAI
Пару лет назад подруга-американка в беседе сказала фразу в стиле «they just didn’t have agency» — я завис, потому что не понял причем тут какое-то агентство в контексте того что мы обсуждали.
Оказалось, что «Agency» довольно любопытный и популярный в английском термин, который переводится на русский как «субъектность», тут я окончательно сломался, так как слышал это слово только в контексте территорий и субъектов федерации, пришлось разобраться.
«Agency» означает способность индивидуума или группы, принимать решения самостоятельно, действовать самостоятельно в соответствии собственных мотивов и желаний, даже если это противостоит внешним ожиданиям, все это — для реализации своего потенциала.
Это немного путает, потому вот пара примеров:
* Представьте, что после школы вас по традиции семьи родители хотели бы отправить учиться на юридический факультет, но вы чувствуете страсть к искусству. «Agency» здесь — это ваша способность выбрать искусство, даже если это противоречит семейным ожиданиям и породит много скандалов.
* В пост-СНГ культуре иногда есть ожидания, что женщина после замужества и рождения ребенка будет заниматься домом и ребенком. Если женщина решает продолжить карьеру и одновременно заниматься семьей, это проявление ее «agency».
* Представьте, что вы теперь зарубежом и кто-то из иностранцев высказывает поверхностное понимание политической жизни в РФ, вы можете аппелировать к «Agency» как человек который на основе личного жизненного опыта жил там и видел политический строй сам. У вас больше «Agency» говорить про проблемы этого строя, чем у иностранца.
То есть «Agency», это очень фундаментальная штука, которая сильно влияет на структуру общества: чем больше людей с «Agency» тем больше реформ и новаторства, чем меньше — тем вероятнее общество будет консервативным.
У каждого из нас свой уровень «agency», в консервативных обществах женщинам пытаются привить послушание, и при этом лишить их их собственного «agency».
Во всяких там диктатурах (конечно же выдуманных) людей пытаются лишить «agency» не только в правительстве, но и люди на бытовом уровне говоря индивиду что-то в стиле «ты не на что не повлияешь, какой в этом смысл» или «начальству виднее», то есть происходит борьба с «agency» на очень базовом уровне.
Или другой пример: у меня большая «agency» в области ИИ и ИТ, но меньше в физике, поэтому я помалкивал, когда многие писали про сверхпроводник LK99 и ждал какой-то проверки.
Короче, клевый термин который содержит много смыслов, желаю вам как можно больше настоящей «agency» в жизни – клевая вещь.
Tl;Dr: Agency – это когда человек осознает и использует свою власть/влияение для достижения своих целей.
На днях писал, что в Сан-Франциско расширили зону, в которой полностью беспилотные (т.е. без инженера-испытателя в салоне) такси могут возить пассажиров — и оказалось, что у спроса на эту услугу есть специфический сегмент: любители секса в машине:) Некоторых особо горячих и водитель не останавливает, конечно, но совсем пустой салон, оказывается, многих заинтересовал 🙂
https://www.intomore.com/culture/dating/san-franciscos-hottest-new-public-sex-destination-will-suprise-you/
Хехе, многие купились получается, это реальное видео снятое с FPV дрона, вот канал пилота в инсте ☕️
Читать полностью…