48093
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие. Для связи: @SergeyTsyptsyn
ХОД КОНЕМ!!!
Сири может вызывать chatGPT!!!
БЕСПЛАТНО, без аккаунта openAI
Но можно и с аккаунтом, тогда больше фич
Image Playgound - три стиля, и говорят все НА ДЕВАЙСЕ
Читать полностью…
Идеальная реализация Рерайтинга и Саммарайзинга. Неясно за качество но UX просто идеальный
Читать полностью…
Сири может орудовать внутри приложений. Можно сказать "возьми фотку вот оттуда и вставь ее в сообщение". Голосовое управление операционкой
Читать полностью…
Персональный контекст. Помнит все из разных приложений
Читать полностью…
Ребята, не надо про новый калькулятор. Давайте про новую Сири.
Читать полностью…
IOS 18.
Восторженным поклонникам ифонов показывают кастомизацию иконок и control center, которая уже живет на андроеде годами. Все в восторге.
Ну что посмотрим на яблочный интеллект?
https://www.youtube.com/watch?v=RXeOiIDNNek
Полезное и серьезное.
Сергей Марков закончил свою большую книгу по ИИ «Охота на электроовец: большая книга искусственного интеллекта».
И без вякого хайпа выложил ее в общий доступ (epub, docx, pdf)
Если вам интересно разобраться с архитектурами нейросетей - то вам сюда:
https://markoff.science/
Андрей Карпаты подогнал новый 4-часовой курс, ну или урок, как создать GPT-2 с нуля. Буквально с нуля, с пустого питонговского файла:
https://youtu.be/l8pRSuU81PU
Также у него есть "как создать GPT с нуля за два часа":
https://youtu.be/kCc8FmEb1nY
Запускать GPT-подобные языковые модели на всяких там дорогих видео-картах это уже прошлый век – чувак с нуля собрал модель на 85000 параметров используя маковский аналог экселя «Numbers» ☕️
https://github.com/dabochen/spreadsheet-is-all-you-need
Видимо, языковые модели это новый Doom, будут пытаться запустить всюду
Дорогие тренировки.
Обожаю Visual Capitalist, да и датавиз в целом. Прочищает мозг иногда.
В общем, стоимость тренировки одного ИИ-ребенка, это примерно как вырастить городок кожаных детишек.
Поглядите, куда мы катимся (или забираемся, как посмотреть).
Below, we show the training cost of major AI models, adjusted for inflation, since 2017:
Year Model Creators/ Training Cost
2017 Transformer Google $930
2018 BERT-Large Google $3,288
2019 RoBERTa Large Meta $160,018
2020 GPT-3 175B (davinci) OpenAI $4,324,883
2021 Megatron-Turing NLG 530B Microsoft/NVIDIA $6,405,653
2022 LaMDA Google $1,319,586
2022 PaLM (540B) Google $12,389,056
2023 GPT-4 OpenAI $78,352,034
2023 Llama 2 70B Meta $3,931,897
2023 Gemini Ultra Google $191,400,000
https://www.visualcapitalist.com/training-costs-of-ai-models-over-time/
ИИ-реклама
Тут у нас новый флешмоб.
Вчера отгремела китайская Сора под названием Kling, а сегодня народ уже делает рекламу пива Mad Max Beer с помощью видеогенераторов.
Началось с Kling, потом подтянулись сторонники Леонардо, ждем остальных.
Хотя с точки зрения новизны тут все те же сломо, панорамики и тилты. Но выход их машины у Клинга явно круче остальных.
Подробности тут. Пишут, что скучной работы на час от силы.
https://x.com/chenkun198282/status/1799009607714795978
Спасибо Женьку на наводку.
Тут в коментах после падения chatGPT и участившихся банов вопрошали про ботов аггрегаторов.
А их развелась, как и положено ботам, тьма. Одни требуют оформлять подписку на каждый чих, другие не работают без VPN, третьи просто просят денег на доступ к бесплатному chatGPT.
Пообщался с народом, накидали ссылок на разные боты.
На итоге после отсева шлака имеем: BotHub, Chad, ChatInfo и Copy Cat.
1. BotHub - это агрегатор разных нейросеток, выбор большой, работает как через веб-интерфейс, так и телеге. 15+ различных моделей, включая GPT-4, Claude, Midjourney, Gemini, Mistral и Llama, с разными и ценовыми параметрами.
Плюсы BotHub - гибкая система оплаты без подписок, сгорающих токенов и
абонентских плат, богатый выбор моделей, библиотека готовых ассистентов,
возможность обработки документов, работа через API. Минус - на пробном тарифе недоступен ChatGPT, иногда отваливается Midjourney.
2. Chad - популярный агрегатор, предлагающий доступ к GPT-4, Midjourney,
Stable Diffusion и DALL-E.
Неплохой интерфейс с русской локализацией и возможностью работы без VPN. Однако подписная модель с ежемесячной оплатой и лимитом на количество слов не всем зайдет. Плюс нет доступа к последней Midjourney v6, хотя почти везде он есть. Вроде нет Telegram-бота, хотя это уже прям стандарт.
3. ChatInfo - бюджетное решение для работы с GPT-3.5 и генерации изображений.
Продает пакеты запросов с фиксированной ценой, что удобно для разового
использования. Но только GPT-3.5, непонятки в отношении модели для генерации изображений и странный сайт.
4. Copy Cat - это прям хороший Telegram-бот, который предоставляет доступ
к GPT-3.5, GPT-4, Midjourney и Stable Diffusion.
Среди плюсов - поддержка голосовых команд, возможность работы на разных языках,
бесплатный ежемесячный лимит и широкая тарифная сетка. Но дорогой, на разные модели свои подписки.
Наверное самый ловкий - это BotHub. Но покидайте в коменты, кто чем пользуется. Особенно за пределами бесплатного GPT-3.5.
Удивительно, конечно, как люди романтизируют кожаных и до сих пор думаю, что ИИ - это стохастический попугай. "Вот когда он превзойдет человека на большинстве задач, тогда и поговорим".
Человек в это время: о хомяки, надо брать. И ну заниматься любимым делом, тапать в телефон.
Почитайте следующий пост. Он грустный. Пока мы тут обсуждаем, какой процент олимпиадных задач ИИ уже решает, кожаные хомяки решают совсем другие задачи. В которых любой вибратор превосходит человека. Что ведет нас к неудобному вопросу: какой процент людей участвует в математических и других олимпиадах. Может AGI уже здесь, если мы говорим про "большинство задач".
Поиск в видосах. Текстом!
Более того, говоришь - собери видео из моих фоток на тему "мы с корешами чиллим". И он собирает. Ну за стартапы
Генмоджи. Генерация эмоджи когда не можете найти нужную.
Читать полностью…
Это мы уже видели с chatGPT. Но Сири вроде умеет заполнять формы
Читать полностью…
Можно чатиться с новой Сири текстом. Что за модель внутри не говорят
Читать полностью…
Генерация картинок - стили скетч, анимационный и еще какой-то
Читать полностью…
Сафари, как обычно, самый быстрый браузер в мире. По мнению Эппле.
Однако впервые прозвучало выражение Машин Лернинг!
Сафари, типа анализирует, что вы там быстро браузите и подсовывает вам минисаммари.
А вот это интересно! Когда нет вайфая и мобильного интернета.
Читать полностью…
Начали с лыжной маски.
Vision OS 2 - новый просмотр фотачек, совместный просмотр фотачек, просмотр кино в самолете, коллаборация с BlackMagic и Canon по стереокамерам.
Ну то есть упор на просмотр фотачек и видео. Никаких киллер аппов не показали.
Если вы любите пытаться сломать защиту в разных LLM с помощью промпт инъекций – то у меня вам полезная ссылка, датасет из почти ~1500 промпт инъекций собранных с Reddit, Discord, Twitter и тп.
https://github.com/verazuo/jailbreak_llms
Внутри промпты и для старых инъекций, вроде DAN, до более новых с base64, leet code и тп.
Следующий шаг, это натренировать на этом модель, которая будет ломать другие модели автоматом ☕️
Помните огнищенские примеры анимации лиц по одной фото от Алибабищенко и Микрософтченко?
Добавил их в шапку поста.
Аватары и говорящие головы на основе традиционного 3Д обречены за непреодолимую зловещую долину, а вот нейроаватары на основе картинок и видео развиваются очень быстро.
Но.
Ни Алибаба, ни Микрософт не выкладывают код.
А вот Тикточек - выкладывает.
Держите ответочку от Тиктока, пусть по качеству там еще есть вопросы (связанные, скорее, с апскейлом и блюром), но в работе озвучен ОЧЕНЬ интересный момент.
На входе в таких решениях обычно есть картинка, звук, возможно какая-то разметка, иногда глубина, информация о позе (часть из этого детектится автоматически). Так вот, все эти входные "сигналы" имеют разный вес, и часто звук "забивается" жесткой позой или другим параметром. А тут авторы научились балансировать сигналы между собой, чтобы варьировать "вольность" следования звуку.
И самое главное - бахнули код.
В шапке примеры с разным влиянием звука на финальное видео.
Можно разводить хозяйство локально.
На гитхабе внизу приписка про коммерческое использование..
https://tenvence.github.io/p/v-express/
https://github.com/tencent-ailab/V-Express/
SD интерфейс Forge - всё.
Большая часть кода, особенно касающаяся оптимизации и скорости, переезжает в следующий апдейт A1111.
Forge обновится и это обновление сделает его несовместимым со всеми экстеншенами.
В общем Forge теперь молотит внутри A1111.
Подробнее тут:
https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/801
Эппле немного охренели, и решили заребрендить скучную аббревиатуру AI.
Теперь это Apple Intelligence. Просто и со вкусом.
Ну чтобы как с ксероксом - сделай ксерокс. А теперь "используй AI"
Антропик(в шоке) - ашотакможнобыло?!?!?!
Работать будет только на iPhone 15 Pro и 15 Pro Max, и на iPad и Mac c процессорами M1 и новее.
https://www.bloomberg.com/news/articles/2024-06-07/apple-wwdc-2024-what-to-expect-ai-ipados-18-macos-15-siri-updates-more
ИИ спасет мир. Часть 1.
Продолжим тему, когда ИИ-начинает жучить кожаных за плагиат. Вчера писал, как Шазамчик лихо находит совпадения с только что сгенерированной музыкой.
Сегодня вернемся к текстовым анти-плагиаторам.
Смышленый малый скормил кусок библии в определитель ИИ-шности текста и получил жоский вердикт "это писал ИИ". На некоторых кусках определяется как 100% ИИ.
Этому в принципе есть некоторое количество технических объяснений. Таких как индекс цитирования например.
Но мне нравится сама гипотеза!!! Вначале был ИИ!
Очень много идей можно навернуть вокруг этого факта.
Я же вкину вот такой сценарий: кожаные стали сознательными получив (об Бога, от ИИ, от мутации) язык, как средство рефлексии и размышления. Начали облекать мысли в слова(компрессируя смыслы с потерями), нагородили печатный станок, а потом и целый интернетик, потом собрали все эти словечки обратно в кучу и присунули в обратно, в некий аналог мыслительного процесса, названный ими искусственным интеллектом. И получили странные неприятные вопросы о природе сознания, неопределяемого кожаными словами. И о природе самих себя.
Ну и ребятки из начала нулевых (не 2000х, а трушных нулевых) сильно бы удивились, если бы узнали, что авторство их священных текстов через 2000 лет припишут некоему сверх-интеллекту. Что в принципе ничего не меняет в картине мира.
Ну и вынесу сюда вот такой вот промпт, он божественно прекрасен.
And God typed "Make a black round object, no background, zoomed in, first person. Then add some light, but keep it separate from the darkness. 16:9 35mm film grain, award winning photo, emotional"
Апокрифы тут:
https://x.com/burny_tech/status/1798788535144861769
🐹 Как разводят на хомяке
Совершенно удивительно, насколько в открытую гоев разводят на шекели на этот раз.
Для тех кто не в курсе: в телеграме появился бот с игрой (ссылку, естественно, давать не буду) — тапаешь на хомяка, зарабатываешь монетки. Гои, сломив голову, кинулись фармить и приглашать друзей (естественно, куда без реферальной системы). И естественно, с обещанием последующей конвертации в реальные деньги.
Жадность людей, помноженая на высший уровень дегенератства игрового процесса (тапать по экрану) напрочь отключает мозг. Але! Как слышно! Вас буквально назвали ХОМЯКАМИ! А первое действие в игре называется «ПОБРИТЬ ХОМЯКА»! Хомяками в крипте называют тех, с кого бреют бабки более умные люди.
Давайте разберемся, как это работает, и где тут развод.
1. Деньги не берутся из воздуха. Нельзя зарабатывать тапая по экрану, и нельзя зарабатывать гуляя в виртуальных кроссовках (Stepn помните? Как дела?). Количество денег ограничено и их можно только перераспределить. Единственные, кто могут делать деньги из воздуха — это государства (они могут напечатать денег, повысив инфляцию и, соответственно, цены, но сейчас не об этом).
2. Если вы не платите за товар — вы и есть товар. А если «платят» вам — тем более. На текущем этапе задача системы — сбор аудитории и раздувание хайпа. Вам будут предлагать вступить в телеграм-каналы, подписываться на твиттеры, приглашать друзей и так далее, выдавая бонусы за каждое действие.
3. Когда хайп будет раздут достаточно, монетки залистят на бирже и вы увидите рост курса. Несмотря на то, что их можно будет вывести, обменяв на реальные деньги — жадность затмит вам глаза, и вы будете ждать еще большего повышения цены. Основатели таких проектов умеют считать: кто-то выведет (для этого в систему заливается немного ликвидности — реальных денег), но основная часть людей оставит монетки у себя.
4. Запускается вторая и самая важная волна хайпа — зачем тапать по экрану, если можно вкинуть 10 000 ₽ и получить несколько миллионов (или какой там будет курс) монеток? Гои начинают вкидывать реальные деньги. Вам будут рассказывать про огромную капитализацию системы (что такое капитализация, пожалуй, надо будет сделать отдельный пост) и про ее надежность.
5. Основатели забирают часть кеша. Цена падает.
6. Цикл повторяется несколько раз до смерти системы.
А теперь выводы:
Если вы обычный человек, вам это не нужно вообще. Тем более, не нужно вкидывать туда реальные деньги. Потратите часы и дни времени на обезьяний труд и нажретесь рекламы ради призрачной возможности вывести $100. Это время можно провести с гораздо большей пользой, изучая полезные навыки и профессии, которые могут принести вам стабильный доход.
Медийные личности с отсутствующей совестью и репутацией могут попробовать накормить говном свою аудиторию, но тут я никаких советов дать не могу.
Что касается трейдинга этих монет на биржах — это одно большое казино и колоссальная трата вашего нейроресурса. Чтобы вы заработали $1000, нужно чтобы 1000 человек потеряли по $1 (условно). В реальности, соотношение, как правило, еще больше. И тут возникает вопрос: вы уверены, что сможете войти в 0.0001% тех, кто в этом казино выиграет?
Вопросы?
🔴 @reptiloidnaya × #крипта #hamsterkombat #notcoin
Подождите-подождите, а почему все молчат?
Udio решила надрать задницу Suno и сделала бомбический image2image, ну то есть audio2audio.
Подаете на вход свои треки, звуки, стуки или свисты. Главное, чтобы были свои - копирайтные он отвергает (но мы знаем как подшаманить).
Он делает свою аранжировку по входному аудио и промпту.
Более того, он делает теперь очень длинное продолжение, в том числе этого вашего аудио-добра. Народ уже кормит ему треки из Суно на 10-20 секунд и просит продолжить. Какой циинизм!
Ну и есть примеры, когда он просто добавляет вокал к клавишной партии - поглядите, там Нора Джонс очень сильно поперхнулась сейчас.
Примеры с басистами (как и анекдоты про басистов) тоже прекрасны. Одинокий басист слэпует у себя дома, а ИИ ему создает всю остальную аранжировку, без всяких издевательств со стороны гитариста и клавишника.
И представьте, все это можно рекурсивно снова и снова подавать на вход. Вместе с любым ИИ-контентом.
Посмотрите 8 очень прикольных примеров использования этого добра:
https://twitter.com/minchoi/status/1798719601490182410
Особенно круто выглядит музыка из игры, пропущенная через Udio.
P.S.
- какая разница между басистом и барабанщиком?
- пол доли.