13017
Используем ИИ строго не по назначению. Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
https://downdetectorsdowndetectorsdowndetectorsdowndetector.com/
Modern problems require modern solutions
я пожалуй оставлю тут видео с роботом unitree g1 которые в свободной продаже + имеют открытый апи
Читать полностью…
Ладно, ради этого я готов быть порабощен машинами
Читать полностью…
Продолжение тестов Nano Banana Pro
Модель здорово работает с большим количеством персонажей (в тестах перечислял по 30 штук), с героями наших мультфильмов справилась не идеально, зато с диснеевскими вообще никаких проблем (результат в комментах).
Знает Васю Ложкина, но не особо знает Альберто Мьельго (причем, сгенерированные картины Ложкина больше похожи на Ложкина, чем сам Ложкин. Еще пара примеров в комментах).
Steam machine в восточной Европе через секунду после покупки
Читать полностью…
О хоспади, аниме покусало NotebookLM.
В новом NotebookLM уже был стиль "аниме" для создания презентаций в соответствующем стиле.
Выяснилось, что этот стиль НАИБОЛЕЕ востребован (куда катится мир), но пользователям не хватает анимешности.
В ответ на это Google выкатил новый kawaii-стиль - настоящее анимеаниме для вот этих вот всех пользователей.
P.S. "Твое имя", конечно, хорошая работа, но аниме-помешательство меня сильно удивляет.
@cgevent
Адоб со своими продуктами превратился в нейрокомбайн и фичи которые показывали на конференции реально сильно меняют индустрию, фото и видео. Продукты адоб с нейронками и без это, как компьютер с интернетом и без.
1. Сегментация звука и разбивка по источникам звука которые можно редактировать.
2. Транскрибция голоса и редактирование отдельных слов с сохранением консистентности голоса говорящего 🤌
3. Изменение наративного повествования с добавлением эмоции в голос (шепот, грусть, уверенность и т.д.)
4. Релайт сцены с предварительным переводом сцены в драфт 3D.
5. Выделение некоторых объектов на видео и перевод их в 3D с текстурами, объекты можно вращать, менять перспективу под ракурс и потом апскейлить, если текстурки немного пожались при искажениях ☠️
6. Удаление источника света который дает засвет в кадр, с изменением самого кадра!
Там еще много чего, и так будете опять на меня орать, что видео много качать 😭
Всю трех часовую конфу можно посмотреть на YT
@CGIT_Vines
- Let’s move on, what types of trees do you know?
- Out of my mind it will be maple, ash, larch. My favorite one is baobab 🌚
#news
https://blog.google/technology/ai/google-gemma-ai-cancer-therapy-discovery/
Ну, за драматургов!
Королевская опера Версальского дворца в 2026 году представит спектакль по пьесе, написанной искусственным интеллектом. Она будет создана в стиле французского драматурга Мольера.
Пьеса «Астролог, или Ложные предсказания» находится на стадии написания. Взяли Mistal и ну учить его на пьесах Мольера. Премьера ожидается 5 и 6 мая 2026 года.
@cgevent
Полезный сервис (не очень), который добавляет вотермарки Sora на любое видео что вы туда загрузите:
https://soramarker.t3.gg
Потому что мы живем в мире пост иронии, ее нужно множить ☕️
Пользователи выяснили, что Sora 2 генерирует очень реалистичные видео, но при этом совершенно не может показать человека, который садится в машину.
Видеографы могут спать спокойно. Пока могут
r/#OpenAI
We surely have a timeline where this is real
Читать полностью…
/channel/NeuralShit/7008
Вспомнился анекдот:
- вот наш новый робот парикмахер, идеально стрижет
- но ведь у всех людей разная форма головы
- да, но только до первой стрижки
Вышел релиз кандидат transformers v5
C этой репы начался huggingface, который до этого делал тамагочи с ллм.
Вот это я понимаю, пивот здорового человека.
github
- Has a nose ring
- Goes to therapy
Wow, I guess this really is hyper realism
Built with Nano Banana Pro + Google Veo 3.1
Китайцы выпустили игру года — в их новой рпг Where Winds Meet можно использовать хаски в качестве быстрого передвижения. Собаки будут просто тянуть вас за собой.
Гениально
r/#Asmongold
Китайские братушки в очередной раз побили рекорд: в городе Лиюян около 16 000 дронов одновременно приняли участие в световом шоу.
надеюсь, что когда-нибудь увижу подобное шоу вживую (и желательно не на фронте).
видео отсюда
Когда анекдоты перестают быть анекдотами
Новости технологий: изобретен аппарат автоматического бритья:
- Бросаешь рубль, суешь голову в прорезь
и он тебя автоматически бреет.
- Но ведь у всех разные лица!?!?
- В первый раз да ...
@cgevent
Китайцы используют робо-собак по максимуму.
Просто посмотрите насколько счастливы дети
видео отсюда
https://www.cnbc.com/2025/10/04/sora-openai-video-app.html
vibe infringement
F9K2DM
Если вы хотели попробовать Sora 2, но не знали где взять инвайт, то вот вам код от исследователя из команды Sora, для первых 10.000 человек
Новости от Хуньяньского
HunyuanImage 3.0
Тут есть две пачки новостей, хорошая и плохая.
Хорошая:
Open Source - https://github.com/Tencent-Hunyuan/HunyuanImage-3.0
Мазохисты могут попробовать тут: https://hunyuan.tencent.com/image/en?tabIndex=0 (чорная кнопка справа от huggingface)
Я уже пробую тут: https://fal.ai/models/fal-ai/hunyuan-image/v3/text-to-image/playground
Есть на репликейт и вейвспид.
HunyuanImage 3.0 это крупнейшая и самая мощная (если брать голые цифры параметров) на сегодняшний день модель преобразования текста в изображение с открытым исходным кодом, имеющая более 80 миллиардов параметров, из которых 13 миллиардов активируются на каждый токен во время вывода.
В отличие от традиционных моделей генерации изображений с архитектурой DiT, архитектура MoE HunyuanImage 3.0 использует подход на основе Transfusion для глубокой связи обучения Diffusion и LLM в единой системе. Построенная на Hunyuan-A13B, HunyuanImage 3.0 была обучена на огромном наборе данных: 5 миллиардах пар изображений и текстов, видеокадрах, чередующихся данных изображений и текстов и 6 триллионах токенов текстовых корпусов. Это гибридное обучение, охватывающее мультимодальное генерирование, понимание и возможности LLM, позволяет модели беспрепятственно интегрировать несколько задач.
Итого:
На борту ризонинг с использованием мирового знания
Понимание огромных промптов на тысячи слов
Убойная работа с текстами
Трушная мультимодальность
Все это я проверил на ОДНОМ примере.
Вместо промпта написал ей:
solve this:
8x + 10 = 18
and make picture with soulution