Telegram-канал derplearning - Derp Learning: Неотсортированное

Derp Learning

07 октября 2024 22:36

Интересно, палка чтобы свет выключать, или просто понравилась?

(Или зарплата)

Derp Learning

07 октября 2024 08:40

Sam Altman in founder mode:
- raises $6b
- converts openai to for profit
- gets 7%
- kicks everyone out
- sucks dick

Me In flounder mode:

Читать полностью…

Derp Learning

04 октября 2024 23:54

Иногда в комментах рождается прекрасное

Читать полностью…

Derp Learning

04 октября 2024 08:01

Когда на работе выдали зарплату в пу-пу-пу units

Читать полностью…

Derp Learning

03 октября 2024 16:24

Собсно, таинственная blueberry, возглавившая text2image лидерборд, оказалась ни чем иным, как flux 1.1 pro

Доступно по апи и на сайте.
Yet another closed ai 🥲

Announcement

@derlpearning

Читать полностью…

Derp Learning

02 октября 2024 17:28

Наткнулся на версию DOOM для квантовых компьютеров — Quandoom

Самое забавное, что нужных по мощности квантовых компьютеров пока не существует, поэтому все работает в режиме симуляции обычных PC ☕️

Игра написана с использованием QASM — языка программирования для квантовых компьютеров (с учетом квантовых принципов), вот скучные тех детали от o1:

Когда игрок нажимает клавишу, система фиксирует это действие, устанавливая значение одного из входных кубитов. Специальный QASM-файл с более чем 83 миллионами строк (каждая строка представляет собой квантовую операцию, что необходимо для сложной симуляции квантового состояния) применяется ко всему состоянию системы, имитируя работу квантового компьютера.

Последние 64 000 кубитов измеряются и преобразуются в изображение экрана размером 320×200 пикселей, отображая визуальную часть игры. (Используется 72 376 кубитов, из которых 8 376 — для самой игры, а остальные 64 000 — вспомогательные кубиты, необходимые для корректной работы квантовой симуляции). Затем экран и входные кубиты сбрасываются, и процесс начинается заново, обеспечивая непрерывный игровой цикл.

Если коротко — на компьютере который еще не построили, но построят, и который будет стоить десятки миллионов долларов – смогут запустить Doom, и это прекрасно

Код:
https://github.com/Lumorti/Quandoom/

Читать полностью…

Derp Learning

02 октября 2024 06:52

Netflix затизерил пару шотов из будущего фильма по графическому роману Сталенхага — Electric State.

Во-первых, это красиво. Я думаю, тут много ценителей эстетики Сталенхага. И во-вторых, актерский состав просто пушка: ребята, отметившиеся в фильмах с налётом ретро 80-х и 90-х — Крис Пратт, Милли Бобби Браун и Вуди Харрельсон! Если всё получится, то будет шедевр типа Скотт Пилигрим или Зомбилэнд, но шанс, честно говоря, невелик, потому что тонкий вайб Сталенхага очень легко разрушить другой формой искусства.

Сюжет такой: в 90-х произошло восстание роботов. Осиротевшая девочка-подросток отправляется на поиски своего брата по Америке с роботом-контрабандистом и его напарником.

Читать полностью…

Derp Learning

01 октября 2024 19:06

Ну всё. OpenAI теперь официально можно переименовать в Closed.
Они теперь официально for-profit.

Нравится какие серьезные лица стоят в пиджаках за Альтманом. Далеко не сайнтисты.

Компанию оценили в $150 млрд.

@ai_newz

Читать полностью…

Derp Learning

01 октября 2024 16:14

- продай мне эту ручку
- это форк

Читать полностью…

Derp Learning

01 октября 2024 16:08

Когда запилил сайт-визитку на AWS

Читать полностью…

Derp Learning

01 октября 2024 10:33

Тем временем колаб расщедрился и снизил стоимость L4 аж на целых 38%. (Было 4 с чем-то кредита, стало 3, т.е. 30 центов, что вполне неплохо)
Конечно, кому их юзать, если ты побанил всех a1111 халявщиков 🥲

Коммент и реклама под постом как отдельный вид искусства

З.ы. тому челу, просравшему все кредиты на установку торча, написал продакт колаба и пообещал вернуть кредиты 😂

Tweet

@derplearning

Читать полностью…

Derp Learning

01 октября 2024 09:17

Openai внезапно вспомнили, что они open, и выкатили whisper v3 large turbo & turbo

Commit
Git

@derplearning

Читать полностью…

Derp Learning

01 октября 2024 05:06

AGI (average general indian) achieved internally

Читать полностью…

Derp Learning

29 сентября 2024 20:29

’🥲🤔🌚

Читать полностью…

Derp Learning

29 сентября 2024 17:33

🔥Molmo: Outperformimg Proprietary Multimodal Language Models

Приношу вам самый сок. Кажется, это самый лучший доклад за сегодня.

За два часа до релиза Llama 3.2, челы выложили семейство открытых моделей Molmo (и нет, это не совпадение):
- 1B,
- 7B и
- 72 B

По качеству на визуальных задачах Molmo выдает +- перформанс как Llama 3.2. где-то лучше, где-то хуже, и приближается к GPT-4o .

- Но, пре-трейн модель они делали всего на 700к размеченных парах картинка-текст (PixMo-Cap). В то время как Llama тренили на 6 млрд!
- Использовали в 9000 раз меньше данных, но гораздо больше высокого качества.
- люди не любят печатать, люди любят говорить. Поэтому разметчиков просили не печатать описание картинки, а описывать её ГОЛОСОМ 60-90 сек. Далее запись автоматом переводили в текст. Это гораздо эффективнее, проще и помогает быстро собрать очень длинные и детальные описания картинок.
- дополнительно разметчиков просили тыкать точками на объекты, про которые они говорят. Это помогло научить модель связывать пиксели текст, выдавая точки на картинке, когда она описывает какой-то объект.

Все это очень сильно подняло качество модели. Это прям крутые идеи.

По архитектуре ничего необычного – transformer с late fusion. То есть токены картинок пропускаются через обучаемый коннектор, а затем кормятся в LLM.

Трейн в два стейджа, ничего не замораживая:
(1) multimodal pre-training для генерации описаний на новом датасете - 700к картинок (2) supervised fine-tuning на instruction датасете, который они тоже собрали сами (там и точки на картинках, и документы прочие задачи) - тут в около 1.9 млн картинок (возможно пересекается с претрейн-датасетом)

Трейн и эвал код и датасет (PixMo) выложат в течение 2 месяцев - я им верю!

Блогпост про модели
Arxiv

@ai_newz

Читать полностью…

Derp Learning

07 октября 2024 13:37

Заставка Улицы разбитых фонарей, но это Улица Сезам.

Сделал довольно проклятое, прогнав золотую классику через video-to-video #gen3. Специально не занимался черрипикнгом, потому что галлюцинации здесь прекрасны. Не о чем не жалею.

Читать полностью…

Derp Learning

06 октября 2024 13:06

What is this flounder mode everyone keeps talking about

Читать полностью…

Derp Learning

04 октября 2024 08:24

Flux 1.1 + dalle3 style prompt enhancer - мое увожение, конечно.

Lain34/runs/kulqj5t2omc5o47kv9h8c8o5">Глиф

@derplearning

Читать полностью…

Derp Learning

03 октября 2024 23:28

Карпатыч внезапно запилил подкаст с темами, которые обычно обсуждают на вписке, сидя на кухне в 5 утра

(В ролях: Chatgpt, Claude, Gemini, notebookLM)

Tweet
Spotify

@derplearning

Читать полностью…

Derp Learning

02 октября 2024 17:28

К тому моменту дум уже запустят на всем нашем таймлайне

Читать полностью…

Derp Learning

02 октября 2024 11:06

Пика жжот. Буквально. Эффектами.

По ходу видегенераторов скоро будет (или уже есть) больше, чем генераторов картинок.
Ну и когда мы говорим "генератор" - мы имеем в виду код со своей foundation model, а не нашлепки над Stable Diffusion или Flux типа Leonardo или Mystic (ну ок, Леонардо недавно натренили свою модель, хорошо бы знать, сколько их юзеров пользуют ее, а сколько файнтюны SD).

Короче, всеми позабытая PIKA бахнула обновление до версии 1.5

И вместо того, чтобы делать упор на фотореализьм или монтажные фичи, они сделали акцент на .. производство VFX! Ну то есть на видосы с разными эффектами типа взрывов, дымов и "разорви-мои-мозги сейчас".

Демо из их твиттора выглядит слишком нарядным и явно обработанным на посте, чтобы его постить тут. А я вам привалю реальных генераций из новой Пики 1.5.
Ну и две новости

Хорошая. У них такие есть бесплатные кредиты на попробовать (негусто)
Плохая. Все намертво висит. Как писал Денис, халявные кредиты выжигают железо и, к сожалению, бюджет.

Но в целом новость отличная. Ибо конкуренция - это отлично!

P.S. Смотрите ролик про унитаз. Работа с физикой просто поражает. И меня у Пики не особо трясет качество, а именно работа с "пониманием" пространства. Ну и B-movie типа "смерть в унитазе" не знают что делать, плакать или радоваться. Вот оно дешевое производство, как оно есть.

P.P.S. Теперь точно за эфыксеров, не чокаясь.
@cgevent

Читать полностью…

Derp Learning

01 октября 2024 22:29

Ютубер запилил кибердек на полноценной ноутбучной материнке от framework

github c 3д принтами и списком запчастей
youtube

Читать полностью…

Derp Learning

01 октября 2024 16:48

https://coub.com/view/cfwlk

Читать полностью…

Derp Learning

01 октября 2024 16:08

YC, когда увидел форк форка vscode

Читать полностью…

Derp Learning

01 октября 2024 14:05

Роболапки в каждый дом!

Котаны с huggingface & therobotstudio запили новый DIY-набор для роборук, за треть стоимости предыдущей версии.

Одна рука теперь обойдется в 125$, но нужен 3д принтер.

Не могу нарадоваться тренду на опенсорс роботикс и это вот все

Git с моделями и списком деталей
Git lerobot (soft для рук)
Lerobot discord

@derplearning

Читать полностью…

Derp Learning

01 октября 2024 10:01

Никто не застрахован, распространите!

Читать полностью…

Derp Learning

01 октября 2024 08:17

На (в) теплотрассе теперь тоже больше не спрятаться

Читать полностью…

Derp Learning

01 октября 2024 04:53

Only 6 spots left in the next yc batch

Читать полностью…

Derp Learning

29 сентября 2024 19:40

LVCD: Reference-based Lineart Video Colorization with Diffusion Models

А вот и код подвезли!

Под капотом SVD + sketch temporal controlnet + всякие хаки с аттеншеном.

Осталось только сделать depth controlnet, и "runwayml vid2vid gen2 есть у нас дома" готов!

Code
Paper
Project

@derplearning

Читать полностью…

Derp Learning

29 сентября 2024 15:58

Ctrl-X: Controlling Structure and Appearance for Text-To-Image Generation Without Guidance (NeurIPS 2024)

И такой еще подход зарелизили.
Берем две референсных картинки: одну для стиля, другую для структуры, шатаем ими аттеншен, и получаем контролируемые генерации без гайданса, тюна, или контролнетов.

Похоже на reference controlnet (который контролнетом назвали видимо потому, что было лень объяснять)

code
paper
reddit
project

@derplearning

Читать полностью…