derplearning | Неотсортированное

Telegram-канал derplearning - Derp Learning

12278

Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.

Подписаться на канал

Derp Learning

Как выглядит интерфейс DDOS-атаки на сервер в 2025 году

👏

Читать полностью…

Derp Learning

Забавно, в этом пейпере указали стоимость обучения 1890$ (2.6 8xH100 дней), т.е. 3.7$/gpu/час
Сейчас несложно найти 8xH100 за 2.99$/gpu/час
Т.е. с момента обучения до выхода статьи процесс подешевел до 1492$, почти на 20%!
Пишем новый пейпер "waiting for a few months is all you need"

Читать полностью…

Derp Learning

Вот вам пример видеогенерации, от которого у меня немного закипел мозг.

Мы тут извращаемся в промптах, пытаясь заставить двигаться камеру или персонажа.
Но.
Оказывается, можно попросить ИИ добавить на видео гринскрин (этим я вас не удивлю) и, внимание, маркеры для трекинга камеры (а вот этим удивлю). Для того, чтобы потом оттрекать камеру в AE или Нюке, восстановить движение объектов в 3Д, убрать фон и навалить сверху нормальной графики или футажа.
В общем все, как на съемках с парой супервазеров, мешком маркеров, тейпов, рулеток, далее по списку. Только промптом!

И судя по этому примеру у Veo2 (пока крайней мере у него, но думаю и у остальных) в голове есть реальная модель 3Д мира и вполне себе эвклидово пространство, ибо это работает и условная фотограмметрия не ломается.

Я в шоке. А вы не поленитесь, почитайте нехилый такой промпт, где написано про маркеры, гринскрин и прочую супервайзерскую требуху (тут есть момент, чтобы писать такой промпт, надо как бы быть в супервайзерской теме, но об этом в другой раз).

Я уж не знаю, на чему учили Veo2, но то, что это вообще работает, приводит меня в восторг.

Подробности тут.

Кто совсем ничего не понял: здесь только девушка (см. промпт). Среднее видео демонстрирует добавление созданной человеком модели (андроид, G) в сцену, созданную ИИ, а нижнее - объединение созданного ИИ персонажа (девушки) в созданную человеком сцену (сакура и небесное пространство). В обоих случаях необходимы данные с камеры, полученные в результате работы ИИ.

Попробуйте в Клинге что ли...

@cgevent

Читать полностью…

Derp Learning

Ахахахаха напомнило мне как на какой-то конфе по wearables я встретил Филипп Кана, фаундера Borland

Я рассказал ему, как ещё школьником писал на борланд си в 91 году в компьютерной лабе у папы в институте, и студент, который там подрабатывал, был для меня прям начальник, инженеры - магами, а начальник лабы - богом

И тут я говорю с фаундером бля борланда, если бы тридцать лет назад мне кто-то такое сказал я б не поверил

А он мне рассказывает как в 90 он поехал делать бизнес в Москве, и как всё накрылось во время путча и как они с помощью бандитов получили свою инвестицию назад вагоном икры и вагоном водки

Читать полностью…

Derp Learning

Программист провёл расчёты, чтобы выяснить, насколько эффективно дарить инженерам из компании конкурентов Factorio, чтобы саботировать их работу. В качестве примера он взял стартап Палмера Лаки Anduril, который работает на армию США.

Автор расчётов взял данные о доходах сотрудников компании и раскидал их на три категории: 20% тех, у кого уже есть Factorio, 60% неиграющих и 20% тех, кто будет проводить 1-5 часов в день после того, как внезапно получит Factorio.

Каждый инженер из последней категории будет в среднем приносить убыток компании в $84 в неделю. При этом Factorio с DLC обойдётся в $70.

@zavtracast

Читать полностью…

Derp Learning

Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos

К Sam2 прикрутили llava, и теперь можно сегментировать картинки и видео по текстовому запросу, как было в sam+grounding dino.

Трекает тоже хорошо, даже с перекрытием объектов.

X
Demo
Paper

@derplearning

Читать полностью…

Derp Learning

Тем временем SANA стала ваистену опенсорсной (правда, только код :D)
https://github.com/NVlabs/Sana

Читать полностью…

Derp Learning

Очень занимательная и наглядная эволюция видео-моделей за два года (нашел в Твиттере). Для большего контраста можно было взять и китайский modelscope, но и так годно.

Читать полностью…

Derp Learning

На реддите тип под ником ai_happy собрал сборку Trellis с пониженными требованиями к памяти. С 16Gb до 8Gb и однокликовым установщиком, как у A1111. Не требует cuda toolkit, powershell и admin'ских прав. Говорит, потери в качестве нет.

Добавил api support + documentation.
Как вернусь домой к компу, буду тестить, если кто-то развернет раньше, кидайте сюда свои результаты!❤️

Git тут

@CGIT_Vines

Читать полностью…

Derp Learning

https://doom-captcha.vercel.app/

Читать полностью…

Derp Learning

https://www.youtube.com/watch?v=beTuZ0mlkn4

а пик был тут если что (уберите себя от экрана если у вас синдром быстрого отвала п*)

Читать полностью…

Derp Learning

С Новым Годом, друзья!🎄

АйЛетов - Звенит январская вьюга (AI Cover)

https://youtu.be/0Ho2y_139RM

#айгитарист #нейрокавер #aicover

Читать полностью…

Derp Learning

SLYAKOT-TO-ART

Читать полностью…

Derp Learning

Ai video composer
теперь и с deepseekv3
Demo

Читать полностью…

Derp Learning

Одна из задач которую o3 не смогла решить, а вы сможете – 2025 жду с нетерпением, очень интересно где мы будем через год в плане АИ-гонки

Все еще жду AGI к 2027

Читать полностью…

Derp Learning

Good Things Go (Official Audio Visualizer) - Linkin Park
Внезапно, На правах замедления ютуба
сорс

Читать полностью…

Derp Learning

Пожалуй, хватит интернета на сегодня

@derplearning

Читать полностью…

Derp Learning

Тем временем в SpaceX устроили незапланированный салют памяти Дэвида Линча

Читать полностью…

Derp Learning

А ещё vp vlc делал nginx 😅

Читать полностью…

Derp Learning

MicroDiT;
Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget

Внезапно, Sony Research выкатили фреймворк для обучения 1.16b DiT до уровня StableDiffusion 1.5 за 2k$ с нуля.

Если мне не изменяет память, sd1.x обошелся в 130000$ :D

В целом, давно хотелось какого-то text2img бенчмарка вроде llm.c от Карпатыча, но при этом не на основе непонятного претрена, и с результатом, который можно оценить не только по метрикам, но и визуально.

Чтобы тестить разные архитектурные фишки с понятным бейзлайном.
Например, натренить эту модель с DC-AE и другими фишками из EfficientViT\SANA

Т.к. модель тренят в 4 этапа (256+маска, 256, 512+маска, 512), вполне можно гонять тесты на 256х256.

Ура товарищи!

paper
code
models

@derplearning

Читать полностью…

Derp Learning

Llamav-o1

Файнтюн 11b llama-vision-inctruct на chain of thought неплохо вкатился в бенчи - где-то показывает себя па уровне gpt40k gpt4o-mini

Model
Paper

Читать полностью…

Derp Learning

Real World Photography Experimenter

Рубрика крутые подписчики.

Саша Мелентьев прислал мне очень годный Workflow в ComfyUI для комбинирования трех изображений в одну фотореалистичную фотографию. Доступен в облаке по ссылке ниже.

Очень хорош для создания "ювелирки", продуктовой фотографии, для портретов людей, а также для генерации концептов окружения. И, наверное, много чего еще...

Для примера. Берем подводный 3D рендер в Style, фотографию улицы в Env, кольцо с камнем в Obj - получаем кольцо на коралле в затопленном городе.

Тест здесь. Real World Photography Experimenter

Вообще, этот пост, судить если по картинкам в генерации, можно назвать "Девушка или ваза".

@cgevent

Читать полностью…

Derp Learning

Сегодня, конечно, день Нвидия.

Они опенсорснули код Cosmos, и это, конечно, космос!

Developer-first world foundation model platform designed to help Physical AI developers build their Physical AI systems better and faster

Долго писать, это опенсорсная World Model.

Выглядит очень круто, го тестировать. Там и video search, и 3Д, и метаверсищще.

Pre-trained Diffusion-based world foundation models for Text2World and Video2World generation where a user can generate visual simulation based on text prompts and video prompts.
Pre-trained Autoregressive-based world foundation models for Video2World generation where a user can generate visual simulation based on video prompts and optional text prompts.
Video tokenizers for tokenizing videos into continuous tokens (latent vectors) and discrete tokens (integers) efficiently and effectively.
Post-training scripts to post-train the pre-trained world foundation models for various Physical AI setup.
Video curation pipeline for building your own video dataset.

https://github.com/NVIDIA/Cosmos

Ссылки:

https://www.nvidia.com/en-us/ai/cosmos/
https://huggingface.co/nvidia/Cosmos-1.0-Guardrail

@cgevent

Читать полностью…

Derp Learning

Юмор.

Когда после НГ обнулился салатный кэш и решил потестить GPT на бытовуху.

Читать полностью…

Derp Learning

Прикручивание LLM-систем к классическим способам моделирования, например CAD-системам проектирования.

Я тоже поначалу подумал, как же это тупо, неудобно и неэффективно — писать текстом то, что можно сделать руками по классике. Тем более если мы говорим про сложные сопряжения и неравномерные фаски.

Но если в вашей схеме под 500 деталей, и вам нужно вносить изменения в узлы, сдвинув на 0.032 mm отверстия, а потом запустить каждую деталь в симуляцию, чтобы ракета или корабль не отклонялся от курса или детали меньше изнашивались, то текст, как дополнение, будет увеличивать скорость ваших итераций в 10, а в некоторых моментах — в 50 раз. Так, по крайней мере, заявляет разработчик этого решения, Джордан Нун, исполнительный директор Zoo Creates — инфраструктуры для hardware design.

Читать полностью…

Derp Learning

oчень хорошо, но конечно не заменит маэстро

Читать полностью…

Derp Learning

С новым годом, дорогие читатели моих saved messages!
Выпьем же за то, благодаря чему мы несмотря ни на что!

Читать полностью…

Derp Learning

тем временем в pika кто-то сделал модный показ для мемов

src

Читать полностью…

Derp Learning

Оказывается, муравьи умеют отлично маневрировать. И теперь вы знаете, как это выглядит

r/#nextfuckinglevel

Читать полностью…

Derp Learning

новогодний триллер в духе позднего СССР как напоминание о том что новый год подкрался незаметно

автор мрачного гиперреалистичного видео Aleksej Lotkov, ему также помогали Aleksei Olenchenko и Leo Erdman

В этой супер-короткометражке я хотел обыграть западный имидж СССР и нестандартный нарратив. Стиль под пленку 80-ых помог скрыть пару косяков и разгуляться воображению.
Использовали самые новые/передовые тулзы по типу Flux 1.1 pro ultra и Sora (процентов 20 анимации - сора), ну и все, что есть из видеогенераторов.


оригинальное видео в inst

@тоже_моушн

Читать полностью…
Подписаться на канал