Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
🔥 Кого читать в X (Twitter), чтобы не отставать от ИИ?
Топ‑инфлюенсеры 2025 года по версии Feedspot — от CEO OpenAI до авторов Keras и DeepMind.
🔹 Lex Fridman
Исследует ИИ, сознание и технологии. Ведёт подкаст с учёными, инженерами, философами.
📍 https://x.com/lexfridman — 4.2M подписчиков
🔹 Sam Altman
CEO OpenAI. Делится мыслями о будущем AGI, стартапах и рисках ИИ.
📍 https://x.com/sama* — 3.1M
🔹 Kai‑Fu Lee
Эксперт по ИИ и инновациям в Китае. Автор «AI 2041».
📍 https://x.com/kaifulee — 1.5M
🔹 John Carmack
Легенда геймдева и VR, сейчас работает над AGI. Много пишет о технике.
📍 https://x.com/ID_AA_Carmack — 1.1M
🔹 Andrew Ng
Курс ML на Coursera, сооснователь DeepLearning.ai. Пишет просто и по делу.
📍 https://x.com/AndrewYNg* — 1.1M
🔹 Andrej Karpathy
Бывший AI-директор Tesla, один из создателей GPT, автор обучающих туториалов.
📍 https://x.com/karpathy — 1M
🔹 Yann LeCun
AI-директор Meta, лауреат премии Тьюринга. Делится исследованиями и мемами.
📍 https://x.com/ylecun — 804K
🔹 Demis Hassabis
CEO DeepMind. AlphaGo, AlphaFold и фокус на AGI.
📍 https://x.com/demishassabis — 370K
🔹 Fei‑Fei Li
Основательница AI4ALL, профессор Стэнфорда. Промоутер этичного ИИ и AI‑образования.
📍 https://x.com/drfeifei — 470K
🔹 François Chollet
Создатель Keras, автор книги по deep learning. Кратко, но глубоко.
📍 https://x.com/fchollet — 489K
https://x.feedspot.com/artificial_intelligence_twitter_influencers/
🖥 Дженсен Хуанг заявил: NVIDIA превращается в инфраструктурную компанию, стоящую во главе новой промышленной революции.
Рань\ше мы строили электросети. Потом появился интернет.
Теперь на сцену выходит инфраструктура интеллекта — ИИ‑фабрики, производящие токены, новую единицу экономического роста.
«Очень скоро мы будем измерять эффективность не в киловаттах и байтах, а в токенах в час.»
@vistehno
🎭 "Клуни" обманул на миллион: дипфейк актёра развёл фанатку из Аргентины
Аргентинская женщина стала жертвой мошенников, которые в течение шести недель выдавали себя за Джорджа Клуни. Используя дипфейк-ролики, они вели с ней переписку, убеждая, что это настоящий актёр.
💬 "Клуни" якобы собирался разводиться и обещал устроить её на работу — но сначала попросил денег. Обещания продолжались, а переводы не прекращались.
💸 Когда женщина поняла, что её обманывают, было уже поздно: она потеряла более 10 000 фунтов (около 1 млн рублей).
🧠 Напоминание: в эпоху нейросетей и дипфейков не всё, что выглядит реалистично — настоящее.
No money — no honey.
📌 Google AI-поиск: компания запустила экспериментальный AI-режим поиска — бесплатный аналог Perplexity, но с характерной гугловской подачей. Пока функционал доступен только для англоязычных запросов: при попытке спросить что-то на русском система вежливо откажется отвечать.
Пока что фича доступна только в США. Для тех кто хочет опробовать ее самым первым, вот что нужно делать:
1️⃣ Подключите качественный VPN с американским IP (европейские не подойдут)
2️⃣ Переключите язык аккаунта Google на английский я
3️⃣ Перейдите в Google Labs и нажмите на кнопку «AI Mode: TRY IT NOW», затем переведите переключатель «Try this experiment on or off» в положение ON и нажмите кнопку «Try AI Mode»
Возможно, уже скоро традиционные методы оптимизации могут уступить место подобным адаптациям под нейросетевой поиск.
@vistehno
🪲 Tumro — робот, вдохновлённый механикой движения насекомых.
Он ползает и прыгает на высоту, превышающую его собственную в 40 раз, а затем продолжает движение.
Отличный маленький робот для работы в сложных ландшафтах.
Как разобраться в нейросетях раз и навсегда?!
🚀 Хотите понять, как искусственный интеллект может упростить вашу жизнь или вывести ваш бизнес на новый уровень?
🤖 Авторский канал "ИИчко" — место, где ИИ становится доступным, понятным и невероятно полезным для всех, кто интересуется технологиями.
🔍 Что вас ждет:
• Образовательный контент;
• Простые объяснения сложных тем ИИ;
• Инсайты для профессионалов;
• Практические советы;
• Тренды и вдохновение;
Подписывайтесь на "ИИчко" и откройте для себя ИИ с новой стороны!
👉 /channel/+ZTRi8Q-tw4Y2Mjhi
Anthropic проводит испытания безопасности новой модели под названием «Клод-Нептун».
Не удивлюсь, если мы скоро увидим Claude 4.
Дарио Амодей в своём последнем интервью говорил, что Claude 4 будет готов через шесть месяцев. Похоже, это время уже подходит.
#Claude
@data_analysis_ml - подписаться
🎁 РАЗЫГРЫВАЕМ MacBook Air!
Майские праздники продалжаются! Разыграем новенький 13-дюймовый MacBook Air !
Условия участия максимально простые:
🔸Подписаться на телеграм-канал Machine Learning
🔸Подписаться на телеграм-канал Vistehno
🔸Нажать кнопку "Участвовать" ниже.
ВСЁ! Вы участник!
Итоги подведём 14 июня. Доставка приза осуществляется на территории РФ.
Всем удачи!
⚠️ Если бот подвис — не беспокойтесь, вас все равно зарегистрирует, просто выполните условия и нажмите «Участвовать».
Тра файл: мужик через GPT-4o составил текст извинения своей девушке, но слишком сильно доверился ИИ — забыл удалить одну строчку.
Комментарий очень красноречив 😂
🪰 Исследователи из Пекинского авиационного университета разработали микроробота длиной всего 2 сантиметра с ультрабыстрой скоростью передвижения.
Результаты работы опубликованы в исследовании под названием «Беспроводной робот-насекомое с ультрабыстрой автономной скоростью движения» в журнале Nature Communications.
#микроробот #локомоция #биомимикрия #робототехника #технологии #инженерия #инновации
🧩 LegoGPT: Генерация физически устойчивых и пригодных к сборке моделей LEGO по текстовому промету
https://huggingface.co/papers/2505.05469
🚀 Olmo 2 1B — компактная ИИ-модель, которая удивляет. Институт AI2 представил новую языковую модель с 1 млрд параметров, которая обходит решения от Google в тестах на арифметику и точность фактов.
Что делает Olmo 2 1B особенной?
— Полная прозрачность: исследователи выложили не только модель под открытой лицензией Apache 2.0, но и все обучающие данные с кодом обучения. Это редкий случай, когда можно буквально "заглянуть под капот" ИИ.
🔗 Ссылка - *клик*
@vistehno
Видео создано HunyuanCustom
Читать полностью…Киберпанк стал реальностью: в Японии вырастили мозг, управляющий роботом
Учёные создали цереброид — миниатюрный мозг, выращенный из стволовых клеток. Его подключили к специальному чипу, превратив в настоящего киборга.
Этот мозг уже учится, выполняет команды и управляет роботом — словно кадр из научной фантастики.
Он функционирует почти как настоящий, хотя пока и обладает ограниченными возможностями.
Хотите оказаться там, где бизнес и технологии пересекаются не на слайдах, а в реальности?
Конференция Data&ML2Business — это не просто витрина фич, а внутренняя кухня внедрения реальных технологий. 28 мая в Москве или онлайн расскажем, как компании реально применяют ML, BI и аналитические платформы.
В программе:
– выступления CTO и архитекторов Яндекса
– кейсы по генеративным моделям, речевой аналитике и аналитике видео
– гибридные data-решения в фарме и индустриальных компаниях
– что происходит с ML-процессами, когда они выходят за пределы одной команды
Событие подходит тем, кто строит системные решения и работает на стыке бизнеса и технологий.
Присоединяйтесь офлайн в Москве или онлайн — будет полезно.
✔️ Tencent представила Hunyuan Game — мощный ИИ‑движок для создания графики в играх
Hunyuan Game — это первая в индустрии платформа на базе ИИ, которая помогает гейм‑студиям создавать игровые ассеты в 10 раз быстрее.
Работает на основе Hunyuan AI — нейросети от Tencent, специально обученной для задач геймдева.
✨ Что умеет Hunyuan Game:
🔹 AI Art Pipeline
Полный цикл создания арта — от идеи до финальной 3D‑проекции — в одном окне, без переключений и лишних шагов.
🔹 Реальное время = реальный холст
Ты рисуешь — ИИ сразу показывает, как будет выглядеть финальная версия.
Быстрая визуализация набросков прямо во время рисования.
🔹 Генератор 2D‑графики
ИИ точно понимает, что ты хочешь — без искажённых промптов.
Подходит для создания UI, иконок и концептов.
🔹 Мультиракурсы персонажей
ИИ автоматически создаёт вид спереди, сбоку, сзади + 360°‑просмотр.
Подходит для анимации — без правок и доработок.
🔥 Попробуй прямо сейчас:
https://hunyuan.tencent.com/game/home
#TENCENT #Hunyuan #AI
🆘 Антиплагиат VS ChatGPT: битва алгоритмов с точностью 98%.
Студенты, бьем тревогу
🚀 Вышел Tencent Hunyuan Image 2.0
Новая модель генерации изображений с ИИ — теперь с по-настоящему кинематографическим качеством и мгновенной скоростью.
⚡️ Что умеет:
✅ Мгновенная генерация картинок по тексту:
Создаёт изображение за доли секунды — быстрее в 15 раз, чем другие ИИ. Пишешь или говоришь — и сразу видишь результат.
✅ Картинки как из фильма:
Никакой "пластиковой" графики. Новый подход к обучению делает текстуры и свет реалистичными — как в кино.
✅ Умная работа с холстами:
Можно работать сразу на двух холстах, синхронизируя композицию, свет и перспективу. Плюс поддержка многослойности — идеально для художников и дизайнеров.
Быстро, красиво и удобно.
👉 Попробовать: https://hunyuan.tencent.com
#TencentHunyuan #AI
Tехнологии, которые управляют будущим
Вы знали, что современные технологии позволяют управлять автомобилями, техникой и даже промышленными объектами на расстоянии?
На канале Galileosky | как заехать в телематику раскрывают секреты:
✅ Как следить за транспортом и оборудованием в режиме реального времени?
✅ Как снизить расходы на топливо и обслуживание?
✅ Какие технологии уже работают в логистике, строительстве и сельском хозяйстве?
Будущее за цифровыми решениями – разберитесь в них первыми!
@Galileosky_channel – подпишитесь и узнайте, как использовать технологии с выгодой!
#реклама
О рекламодателе
🚀 10 GitHub-репозиториев, чтобы изучить большие языковые модели (LLM)
Если вы хотите всерьёз разобраться в работе с LLM — от инженерии запросов до создания собственных агентов — KDnuggets собрали отличную подборку 10 репозиториев, которые помогут вам прокачаться.
📚 brexhq/prompt-engineering
Практическое руководство по инженерии запросов: стратегии, паттерны, ошибки и советы для работы с LLM (ChatGPT, Claude и др.)
https://github.com/brexhq/prompt-engineering
🎓 mlabonne/llm-course
Полноценный курс по большим языковым моделям: теория, код, проекты — всё, что нужно для старта
https://github.com/mlabonne/llm-course
🧠 Hannibal046/Awesome-LLM
Курируемый список лучших статей, туториалов, фреймворков и репозиториев по LLM
https://github.com/Hannibal046/Awesome-LLM
🤖 WooooDyy/LLM-Agent-Paper-List
Подборка научных работ и статей о LLM-агентах и архитектурах на их основе (AutoGPT, LangGraph и др.)
https://github.com/WooooDyy/LLM-Agent-Paper-List
📊 avvorstenbosch/Masterclass-LLMs-for-Data-Science
Электронная книга с упражнениями по применению LLM в анализе данных и автоматизации рабочих процессов
https://github.com/avvorstenbosch/Masterclass-LLMs-for-Data-Science
🛠️ Shubhamsaboo/awesome-llm-apps
Сборник реальных приложений на базе LLM, с кодом и открытыми API
https://github.com/Shubhamsaboo/awesome-llm-apps
🖼️ BradyFU/Awesome-Multimodal-Large-Language-Models
Ресурсы по мультимодальным LLM: модели, которые работают с текстом, изображением и звуком
https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models
📘 HandsOnLLM/Hands-On-Large-Language-Models
Официальный репозиторий к книге “Hands-On LLM” — с кодом, проектами и понятными объяснениями
https://github.com/HandsOnLLM/Hands-On-Large-Language-Models
🧠 Эти репозитории охватывают всё: от базового понимания до создания сложных LLM-систем.
🤖 ИИ в офисе: недавнее исследование проверило, как современные нейросети справляются с реальными рабочими задачами — от написания кода до управления проектами. В виртуальной компании с GitLab, чатами и CRM семь ИИ-агентов выполняли 175 заданий.
Лучший результат показал Claude-3.5, решивший 24% задач полностью, но даже он споткнулся на финансовых отчётах и админработе. Интересно, что модели чаще всего ошибались в элементарном: не распознавали документы, игнорировали советы коллег, путались в интерфейсах.
Пока ИИ эффективен только для рутинных операций с чёткими инструкциями. До полноценной замены сотрудников еще довольно далеко, но гибридный формат связки человека + ИИ уже выглядит неизбежным будущим офисной работы.
🔗 Ссылка - *клик*
@vistehno
🧠 ИИ предсказывает выживаемость при раке точнее, чем врачи — заявляют исследователи
Британские учёные разработали новую ИИ-систему, которая предсказывает выживаемость пациентов с раком точнее, чем врачи. Она обучена на реальных медицинских данных и демонстрирует лучшую точность в оценке долгосрочных прогнозов.
💡 Система помогает:
• Индивидуализировать лечение
• Определять риски на ранней стадии
• Поддерживать врачей в принятии критически важных решений
Этот прорыв — пример того, как ИИ усиливает человеческий интеллект, особенно в высокоответственных задачах. Вместо замены врачей — он становится надёжным партнёром.
🔬 Более точные прогнозы = более персонализированная и эффективная терапия.
📌 Яркий пример ИИ "во благо".
https://www.pymnts.com/news/artificial-intelligence/2025/ai-system-can-predict-cancer-survival-prognosis-better-than-doctors-researchers-say/
Создавай мобильные приложения — без единой строки кода!
Забудьте про сложные IDE и запутанные мануалы. Теперь за вас всё делает ИИ.
AppAlchemy — это сервис, который превращает текстовое описание в полноценный UI-дизайн для iOS и Android.
Просто опишите, что вы хотите — нейросеть соберёт экраны, предложит варианты редизайна и всё покажет вживую.
🛠 Возможности платформы:
💬 Генерация дизайна по описанию
✨ Автоматические идеи по улучшению интерфейса
🧩 Редактирование макета прямо в браузере
📱 Экспорт проектов под Android и iOS
🆓 Бесплатный базовый тариф
🔮 Попробуй магию —http://appalchemy.ai/
⚡️Создаём свою нейросеть в PyTorch
Хотите быстро разобраться в PyTorch и написать свою нейросеть? Мы подготовили для вас вебинар, где на практике разберём все этапы создания ML-модели.
Вебинар проведет Владислав Агафонов — ML-инженер, ранее работал в Yandex и Huawei.
Что будет на вебинаре?
🟠Установим PyTorch в Google Colab и настроим работу на бесплатном GPU;
🟠Поймём, что такое тензоры и почему они — фундамент всех нейросетей;
🟠Скачаем готовый датасет, разберём его структуру и подготовим для обучения;
🟠Научимся использовать DataLoader для эффективной загрузки данных;
🟠Пошагово соберём облегчённую версию классической свёрточной нейронной сети (CNN);
🟠Обучим и протестируем модель.
🕗 Встречаемся 14 мая в 18:30 по МСК, будет много практики, ответы на вопросы и полезные инсайты от эксперта.
😶Зарегистрироваться на бесплатный вебинар
🤖 Джеффри Хинтон: человек, который научил машины думать — и пожалел об этом
*В 1986 году он написал статью, которую никто не хотел читать.
В 2012 — создал модель, которая изменила всё.
А в 2023 — ушёл из Google, заявив:*
> "Я больше не могу участвовать в этом."
🧠 Глава 1 — Изгнанник
Джеффри Хинтон — потомственный логик. Его прадед, Джон Хинтон, был соратником Бертрана Рассела.
Но сам Джеффри выбрал путь нейросетей — странной идеи, что машины можно обучать, как мозг.
В 80-х это считалось ересью.
ИИ умер.
Финансирование ушло к экспертным системам.
Профессора смеялись. Он был "тот, кто возится с биомоделями".
Его идеи отвергали. Но он продолжал.
> _"Если никто не верит в твои идеи, это может значить, что они плохие.
> Или… что ты слишком рано."_
> — Джеффри Хинтон
🔁 Глава 2 — Возвращение
В 2006 году он публикует работу о глубоких нейросетях.
А в 2012 — вместе с двумя студентами, Алексом Крижевским и Ильёй Суцкевером — создаёт AlexNet.
Она уничтожает конкурентов в ImageNet.
Ошибка распознавания изображений падает почти вдвое.
Мир меняется.
Facebook, Google, Microsoft — все бросаются нанимать тех, кто "знает про нейросети".
Джеффри Хинтон становится иконой нового ИИ.
🌐 Глава 3 — Все используют, никто не понимает
На его идеях строится:
- Google Translate
- Siri
- AlphaGo
- ChatGPT
- Рекомендательные алгоритмы YouTube и TikTok
Но сам Хинтон начинает ощущать:
мы создаём не инструмент — мы создаём силу, которую не контролируем.
🛑 Глава 4 — Отход
В мае 2023 года Хинтон покидает Google.
Он больше не может молчать.
> _"Я хочу говорить открыто о рисках ИИ.
> О том, что мы можем потерять контроль над разумом, который сами породили."_
Он сравнивает ИИ с оружием, которое может быть использовано как во благо, так и во зло.
Говорит о:
- дезинформации
- автономном оружии
- потере доверия к реальности
🎯 Финал
Джеффри Хинтон — не Стив Джобс. Он не сделал миллиардов.
Он не устраивал презентации.
Но он изменил мир глубже, чем любой техно-стартап.
Он придумал, как научить машину видеть, слышать и "думать".
И первым из всех признал:
> _"Может быть, мы сделали нечто слишком сильное.
> И слишком рано."_
📌 Джеффри Хинтон — учёный, который задал самый главный вопрос:
> *А не зашли ли мы слишком далеко зашли?*
✔️ Тенденция регулирования ИИ меняется: техгиганты переходят от «стремления к регулированию» к «отказу от регулирования».
Сэм Альтман, генеральный директор OpenAI, на слушаниях в Сенате заявил, что государственное одобрение для запуска мощных ИИ-систем губительно для технологического лидерства США. Это резкий разворот позиции после его же призывов к созданию регуляторного агентства два года назад. Теперь акцент сместился: вместо предупреждений об «экзистенциальных рисках» ИИ топ-менеджеры и власти требуют ускорить разработки, чтобы обогнать Китай.
OpenAI не одинока в резком смене курса: Google DeepMind отказался от запрета на военные ИИ-проекты, а Microsoft и компания Марка Цукерберга сняли ограничения на сотрудничество с армией.
washingtonpost.com
✔️ Nvidia адаптирует чип H20 для Китая, чтобы обойти экспортный контроль США.
Nvidia планирует выпустить упрощенную версию чипа H20 для китайского рынка уже в июле. Модификация связана с ужесточением экспортных ограничений США, которые заблокировали поставки оригинального чипа без специальной лицензии. Новый вариант H20 получит значительно урезанную память и другие технические ограничения, но позволит Nvidia сохранить позиции на ключевом рынке, где за прошлый год компания заработала $17 млрд.
По данным инсайдеров, китайские клиенты Tencent, Alibaba и ByteDance уже активно интересовались чипом, нарастив заказы до $18 млрд только с начала года. Глава Nvidia Дженсен Хуанг недавно посетил Пекин, подчеркнув стратегическую важность региона для компании.
reuters.com
✔️ Google инвестирует в 3 площадки для развития ядерной энергетики в США.
Google расширяет свое участие в энергетическом секторе, выделив финансирование стартапу Elementl Power для подготовки 3 площадок под современные ядерные проекты в США. Каждый объект планируют оснастить реакторами мощностью от 600 МВт, что должно помочь корпорации обеспечить стабильное энергоснабжение для своих дата-центров. Сумма вложений не раскрывается, но цель партнерства — ускорить ввод новых мощностей до 2035 года.
Elementl Power, основанная в 2022 году, позиционирует себя как разработчика «под ключ», предлагающего решения для клиентов, которые хотят доступ к чистой энергии.
world-nuclear-news.org
✔️ LegoGPT генерирует конструкции LEGO по текстовым описаниям.
Исследователи из Университета Карнеги-Меллон представили LegoGPT — нейросеть, которая превращает текстовые запросы в рабочие схемы сборки LEGO. Модель обучалась на 47 тысячах структур, что позволяет ей создавать оригинальные дизайны с нуля.
Система поэтапно подбирает блоки, проверяя их совместимость и устойчивость. Если деталь пересекается с другими или «висит в воздухе», LegoGPT откатывается к стабильному шагу и продолжает сборку. Результат всегда можно собрать руками или роботом. Код проекта доступен на GitHub.
tomshardware.com
✔️ Google создала Gemini Nano для защиты от мошенничества в реальном времени.
Google усилила борьбу с онлайн-мошенничеством, интегрировав модель Gemini Nano в браузер Chrome. Технология работает прямо на устройстве, анализируя сайты в режиме реального времени и блокируя фишинговые страницы до того, как пользователь успеет ввести данные.
В Android-версии Chrome появились ИИ-уведомления: если система заподозрит спам в push-сообщениях, предложит отписаться или заблокировать. Аналогичные алгоритмы теперь сканируют звонки и SMS — Gemini Nano распознает подозрительные шаблоны, даже если схема новая.
blog.google
@ai_machinelearning_big_data
#news #ai #ml
⚡️ HunyuanCustom: консистентная видеогенерация c инпейнтом и липсинком.
Tencent выпустила HunyuanCustom, фреймворк, который не только генерирует видео по заданным условиям, но и умеет сохранять консистентность субъектов, будь то человек, животное или предмет. Модель справляется даже с мультисубъектными сценами: в демо-роликах люди естественно взаимодействуют с предметами, а текст на упаковках не плывет между кадрами.
В основе модели лежит улучшенный механизм слияния текста и изображений через LLaVA. Например, если вы загружаете фото женщины в платье и текст «танцует под дождем», система анализирует оба инпута, связывая описание с визуальными деталями.
Но главное - это модуль временной конкатенации: он «растягивает» особенности изображения вдоль временной оси видео, используя 3D-VAE. Это помогает избежать «прыгающих» лиц или внезапных изменений фона, проблемы, которая характерна даже для топовых моделей видеогенерации.
Tencent переработали и пайплайн аудио. Для синхронизации звука с движениями губ или действиями в кадре HunyuanCustom использует AudioNet, модуль, который выравнивает аудио- и видеофичи через пространственное кросс-внимание.
Фреймворк поддерживает возможность замены объекта в готовом ролике (скажем, подставить новую модель кроссовок в рекламу), модель сжимает исходное видео в латентное пространство, выравнивает его с шумными данными и встраивает изменения без артефактов на границах.
Экспериментальные тесты показали, что HunyuanCustom обходит конкурентов по ключевым метрикам. Например, Face-Sim (сохранение идентичности лица) у Tencent — 0.627 против 0.526 у Hailuo, а с Keling, Vidu, Pika и Skyreels разрыв еще больше.
⚠️ Для работы модель требует минимум 24 ГБ видеопамяти для роликов 720p, но чтобы раскрыть все возможности, разработчики рекомендуют 80 ГБ VRAM.
Код и чекпоинты уже доступны в открытом доступе, а в репозитории есть примеры запуска как на нескольких GPU, так и в экономном режиме для потребительских видеокарт.
📌Лицензирование кода : Tencent Hunyuan Community License.
🟡Страница проекта
🟡Модель
🟡Arxiv
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #Video #HunyuanCustom #Tencent
🚀 ✔️ LTX Studio выпустила открытую видео-модель с рекордной скоростью и качеством.
LTX Studio представила новую модель для генерации видео, которая сочетает скорость, детализацию и контроль. Свыше 13 млрд. параметров и технология multiscale rendering позволяют добиться плавного движения, четкой картинки и минимума артефактов даже в динамичных сценах.
Суть multiscale rendering — анализ сцены на разных уровнях детализации, который сохраняет крупные объекты стабильными, не теряя мелких элементов. Результат: реалистичная анимация и согласованность между кадрами.
Модель работает до 30 раз быстрее аналогов при том же качестве и позволяет управлять ключевыми кадрами и камерой — можно буквально «режиссировать» каждый момент. Она доступна бесплатно на платформе LTX Studio или для локального инференса, веса опубликованы на HuggingFace.
LTX в сети Х (ex-Twitter)
▪Попробовать можно тут→ https://app.ltx.studio/ltx-video
▪Code → https://github.com/Lightricks/LTX-Video
▪Weights → https://huggingface.co/Lightricks/LTX-Video
🤖 История нейросетей: от мечты до революции
Когда-то идея создать «машину, похожую на мозг», звучала как фантастика. Сегодня нейросети распознают лица, переводят тексты, управляют роботами и пишут код. Как мы дошли до этого?
1) 🧠 Все началось… с нейрона на бумаге
✨ 1943 год.
Два учёных — Уоррен МакКаллок и Уолтер Питтс — публикуют статью, где описывают математическую модель нейрона. Они показали: нейроны можно представить как простые логические элементы, способные передавать сигналы.
Это была первая попытка описать работу мозга через математику.
👉 Но… компьютеры тогда только зарождались, а про обучение моделей никто не думал.
2) 🔍 Появляется перцептрон — первая нейросеть
✨ 1958 год.
Американский психолог Фрэнк Розенблатт создаёт перцептрон — устройство, которое могло «учиться» распознавать простые образы (например, различать круг и квадрат).
📝 Перцептрон обучали на карточках с рисунками: показывали примеры, корректировали ошибки. Машина сама подбирала веса связей между нейронами, чтобы давать правильный ответ.
Это был первый шаг к обучаемым моделям, но… были ограничения.
3) 💤 Застой: «нейросети не могут»
✨ 1969 год.
Книга Марвина Мински и Сеймура Паперта «Перцептроны» разбила мечты: учёные доказали, что односвязный перцептрон не способен решать задачи, требующие нелинейных разделителей (например, XOR).
👉 Многие поверили, что нейросети — тупиковая ветвь.
Финансирование упало. Интерес угас.
4) 🚀 Второе дыхание: обратное распространение ошибки
✨ 1986 год.
Джеффри Хинтон, Дэвид Румельхарт и Рональд Уильямс открывают метод backpropagation (обратного распространения ошибки).
Теперь нейросеть могла автоматически корректировать все свои слои, а не только первый. Это позволило строить глубокие нейросети и обучать их на сложных задачах.
💥 Революция? Почти. Компьютеров всё ещё не хватало, чтобы обучать большие сети.
5) 📷 Практическое применение: сверточные сети
✨ 1990-е.
Янн Лекун создаёт LeNet — сверточную нейросеть (CNN), которая распознавала рукописные цифры на чеках. Это была первая успешная коммерческая нейросеть.
👉 LeNet работала медленно, но точнее, чем любые предыдущие методы.
6) 💥 Большой взрыв: глубокое обучение
✨ 2012 год.
На конкурсе ImageNet сеть AlexNet (созданная студентами Хинтона — Крижевским и Суцкевером**) разгромила соперников, улучшив точность классификации изображений на **10% сразу.
Почему получилось?
• Были большие данные (ImageNet — 1,2 млн изображений)
• Были мощные GPU
• Были методы dropout, ReLU и хорошее понимание backpropagation
С этого момента deep learning стал мейнстримом.
Компании вроде Google, Facebook, Microsoft начали инвестировать миллиарды.
7) 🤯 Нейросети сегодня: GPT, Stable Diffusion, AlphaFold
Сейчас нейросети умеют:
• писать тексты (GPT)
• рисовать картины (Stable Diffusion, Midjourney)
• предсказывать белковые структуры (AlphaFold)
• водить машины (Tesla Autopilot)
Размер моделей растёт: от 10 нейронов в перцептроне — до 500 миллиардов параметров в GPT-4.
8) 🏁 Что дальше?
Мы прошли путь от искусственного нейрона — до машин, которые иногда ведут себя пугающе «человечно».
И это — только начало.
Кто знает, где мы окажемся через 10 лет?
👉 А нейросети продолжают учиться.
И, возможно, скоро они напишут продолжение этой истории сами.
🎉 Если понравился рассказ — поделись с друзьями, чтобы они тоже узнали, как всё начиналось!
🔍 Хочешь отдельную статью про GPT, CNN или AlphaFold? Пиши!
🔥 Калифорнийский стартап объявляет о прорыве в области робототехники для повседневных задач с помощью ИИ π0.5 — модели «зрение-язык-действие».
Все, что видит робот, он видит впервые.
🧪 В экспериментах Робот успешно справился с уборкой посуды, застиланием постели и мытьем пола в незнакомых домах, демонстрируя полное понимание задачи, её разбиение на шаги и адаптацию к новым условиям.
➡️ Робот воспринимает команды от абстрактных ("убери посуду") до пошаговых ("подними кружку", "поставь в раковину"), демонстрируя потенциал обобщения для сложных роботизированных навыков.
Модель анализирует семантику задачи, разбивает её на шаги и генерирует команды для моторных систем. π0.5 умеет реагировать и на голосовые команды разной детализации — от «убери посуду» до точечных указаний
✔️ Подробнее про π0.5