Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Слухи подтвердились, используют DC-AE, официальное репо sana это подтверждает!
Код ещё не подьехал, но уже есть градио демка. Генерит быстро, 1-2с на 1024х1024 картинку.
В принципе, даже если качество самой модели будет неоч, DC-AE отдельно уже очень крут.
DC-AE project
DC-AE paper
DC-AE code
Sana repo
Sana gradio demo (1.6b 1024)
Paper
@derplearning
efficientvit
TLDR; на реддит пишут что это исходный код того самого эффективного VAE (жмет в 32 раза), который заюзан в Sana
https://github.com/mit-han-lab/efficientvit
Вот держите список open-source-ных генераторов картинок. Которые можно развести локально.
Не у всех хорошие лицензии, например, Хуньянь только что обновили свое лицензионное соглашение вот так:
You must not use, reproduce, modify, distribute, or display the Tencent Hunyuan Works, Output or results of the Tencent Hunyuan в Европейском Союзе. Еще раз "показывать работы!!!!".
Ну да ладно. Вернемся к списку.
Список неполный, но Влад его постоянно обновляет.
https://github.com/vladmandic/automatic/wiki/Models
Только что добавил неведомых зверух типа MeissonFlow или Thu-ML или IDKiro.
Есть даже динозавры типа Дипфлойда.
Дико полезно, что вы можете в одном месте поглядеть и сравнить вот такие параметры:
Size
Diffusion Architecture
Model Params
Text Encoder(s)
TE Params
Auto Encoder
Еще раз, это то, для чего есть код. Для Flux 1.1 кода нет.
В общем сразу хочется все попробовать, целюсь в MeissonFlow.
Пишите, кто пробовал разную дичь из этого списка.
И кто вообще юзает SD.Next.
p.s. Тут все постят про SANA от Нвидия.
https://nvlabs.github.io/Sana/
Пока кода нет, сложно что-то сказать. Упор на скорость. Я не впечатлился и не стал постить. Странная ответочка на Flux Turbo от Алимамы, но меня зацепило, что там вся команда из Пиксарт Сигмы, которую сманили из Хуавея в Нвидию.
@cgevent
The Man Who Sold The World
Тем временем WorldCoin от Scam'a Альтмана ребренднулся в World и запилил более кошерный девайс для скана сетчатки. Его можно будет юзать как для себя, так и сканировать соседей за небольшой гешефт.
На данный момент сетчатку уже сдали более 7млн человек.
Намерения на бумаге, конечно, благие - в эпоху ии-агентов важно знать, что ты общаешься с реальным человеком, скан сетчатки которого и будет его уникальной электронной подписью. Ну и UBI каждому даром, и пусть никто не уйдет обиженным.
Однако, зная способности к переобуванию данного персонажа, а также подментованность опенаи, я бы относился к этому с опаской 😅
Подробнее
@derplearning
Ah yes the man from the famous
sissy themed of ad lawn
Adobe показал новую АИ-фичу от которой уже на самом деле дизайнеры напряглись – для такой работы в иллюстраторе раньше приходилось тратить кучу времени 🌚
Читать полностью…Один из крутейших инструментов, которые есть сейчас в Photoshop, — это возможность генерировать 3D-сплаты и на их основе дополнять 2D-генерациями (диффузиями). Проще говоря, генерить модельки и догенерировать окружение.
Конечно, в продакшене это будет не так быстро, как на видео (оно ведь ускорено в 10 раз 🤡). Всегда захочется что-то домоделить, поменять форму, угол, добавить более зеленой травы и прочей маркетинговой дрочи. Мы ведь мечту продаём не меньше!
Но всё равно это в десятки раз быстрее, чем когда я занимался дизайном лет 10 назад.
Вопрос к дизайнерам: напишите, как часто пользуетесь сейчас генеративными тулзами и спасает ли это вас от менеджмента с их комментариями?)))
Чтоб вы понимали, эта бандура 20 этажей в высоту (70м) и 200 тонн чистой массы (без топлива)
Просто представьте как пьяный дед сажает вашу многоэтажку.
Произошло первое в истории возвращение сверхтяжёлого ускорителя ракеты Starship на стартовую площадку с захватом.
Это ещё один серьёзный шаг в освоении космоса. Только посмотрите, насколько круто выглядит
r/#BeAmazed
⚡ FAA выдали лицензию на пятый полёт системы Starship!
SpaceX:
— Нацеливаемся на 5-й испытательный полёт системы Starship в воскресенье, 13 октября. 30-минутное стартовое окно открывается в 15:00 МСК
Британские ученые решили проводить научные опыты вместо мышей на стажерах.
Во-первых, стажеров больше. Во-вторых, мышей жалко. И в-третьих, есть вещи, которые мыши отказываются делать
Больше мемов про Нобеля седня не будет...
Наверное
В Minimax теперь есть image2video.
И Minimax начинает мне нравиться все больше. Других генераторов.
Ну, за Пиксар.
@cgevent
У мега-ультра-супербыстрого генератора картинок от Nvidia под названием SANA появился репозитарий на Гитхабе. Но кода пока нет, а Readme обновилось 3 часа назад. Ждем-с...
https://github.com/NVlabs/Sana
Когда хотел сгенерить картинку 1910*1080, но вместо * написал ^
Хватит ли сферы Дайсона и нашего солнышка, чтобы запитать кластер на 1 эксабайт (1 млн терабайт)?
Ну наконец-то для is-odd обнова вышла!
Теперь можно узнать четное число или нечётное с помощью гпт3.5!
Еще одна классная фича нового Adobe Illustrator, это когда вы загружаете 2D векторную картинку, и можете ее "повернуть" в объеме – на видео понятно как работает
Фича называется Project Turntable
Все же придется уходить с Corel Draw, чуваки 😮
Mistral выкатил пару новых моделей для edge девайсов: Ministral 3B & 8B, 128k context.
Подвох в том, что они доступны по API, опенсорсная 8B - с рисерч лицензией, а за коммерческой писать в им лс :D
Announcement
Ministral 8B - Research License
😮 А вот подъехала и первая публичная цена на DGX B200. За него придётся отдать чуть больше полумиллиона долларов.
Серваки с H100, для сравнения, стоят где-то в районе 300к (для больших компаний явно дешевле, но они покупают их десятками или даже сотнями тысяч).
@ai_newz
SpaceX lands Starship's rocket booster in the arms of massive metal pincers, marking a huge success in its fifth test flight.
Читать полностью…- Men want one thing and it's fucking disgusting.
The thing men (and laida) want:
Дадут ли Илье Суцкеверу Нобелевскую премию мира за увольнение Семена Альтманова?
Читать полностью…Mistral выкатили пейпер Pixtral 12b.
Не на торренте, стареют!
Arxiv
Chaos: в публичной бете V-Ray 7 добавлена поддержка сплатов. Пока только в 3ds Max, но скоро должны завезти и в Maya. А там подоспеет интеграция и в другой софт с поддержкой V-Ray.
Можно размещать 3D объекты в сканы окружения (выглядят как точки во вьюпорте) с просчётом освещения и отражений.
V-Ray GPU теперь более оптимизирован для полной загрузки видюхи, и поддерживает рендеринг каустиков.
Также в экспериментальном режиме есть поддержка рейтрейсинга для сплатов (второе видео). Не Nvidia единой.
Сайт
YouTube
Так, это уже слишком хорошо, чтобы быть поводом для шуток.
Это уже два миллиметра до:
рекламы провинциального масштаба
синематика инди игрушки
марвеловская или комиксовидная жвачка от некрупной студии
форсаж - 11 и вИИн дИИзель
креатив на игровых сторах
перебивки на тв
Под красным капотом:
Flux 1.1
Luma Labs' Dream Machine
CapCut - монтаж и пост
Udio - ИИ-музика
И все.
Хотя нет, не все, вот промпты:
Флюкс: Close-up/high angle/low angle], [front view/rear view], photo of a red and black [interior/exterior] of a futuristic car, led lights, high contrasts dynamic shadows, organic, night, highway, shallow depth of field
Luma Labs: пустой промпт на все входные картинки
Udio: energetic, garage rock, revival dance-rock about wanting a futuristic car
Забрал отсюда, люто сделано
@cgevent