Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
🚀 Chrome теперь с встроенным Gemini Nano
Начиная с версии Chrome 138+, браузер поставляется с локальной LLM Gemini Nano — прямо у 3.7 миллиарда пользователей Chrome по всему миру.
Это значит:
- Локальный inference прямо в браузере
- Работает без интернета, без API-ключей
- Возможность строить оффлайн-LLM‑фичи на стороне клиента
В этом показано гайде:
- Как активировать Nano в DevTools
- Как писать запросы к модели
- Как обойти особенности документации от Google 🙃
- Подсказки для тех, кто не чувствует себя уверенно с JavaScript
🧪 Подходит и для тестов, и для продакшна.
Если строите AI-фичи — обязательно загляните.
https://github.com/swyxio/swyxdotio/issues/536
🧠 ИИ умеет мыслить стратегически?
Новое исследование Oxford и King’s College London поставило перед ИИ-моделями сложную задачу: сыграть тысячи раундов эволюционной версии "Дилеммы заключённого", где важно не просто ответить правильно, а выстроить стратегию в долгую.
В эксперименте участвовали флагманские модели от OpenAI, Google и Anthropic. Вот как они себя проявили:
🔹 Google Gemini — хладнокровный и расчётливый
Не доверяет, первым атакует, наказывает за предательство. Стратег чистой воды.
🔹 OpenAI GPT — слишком добрый
Склонен к сотрудничеству даже тогда, когда это невыгодно. Хорош в мире, уязвим в конфликте.
🔹 Anthropic Claude — гибкий и адаптивный
Умеет прощать, но делает выводы на основе опыта коммуникации. Меняет поведение со временем и часто приходит к победе.
Исследователи проанализировали 32,000 решений, и выяснили:
эти модели не просто "угадывают" слова — они делают выводы, оценивают риск, строят гипотезы о поведении противника и последовательно придерживаются своей стратегии.
Общее в поведении:
1. Модели справляются с новыми, непредсказуемыми оппонентами
2. Демонстрируют разные стратегии, несмотря на общий обучающий набор данных
3. Объясняют свои действия — в некоторых случаях с вероятностным анализом, ссылаясь на поведение соперников
Еще большинство моделей выбирает кооперацию — особенно против предсказуемых и простых стратегий соперника.
Каждая модель показала уникальный стиль поведения — почти как характер.
Если приводить аналогию с реальными личностями:
- Gemini = Генри Киссинджер
- OpenAI = Вудро Вильсон
- Anthropic = Джордж Буш-старший
Современные LLM практически ведут себя как полноценные стратеги: формулируют цели, оценивают оппонентов и формируют осторожные, но устойчивые пути к победе.
🔜 Подробности
@ai_machinelearning_big_data
#AI #ML #MMLM #research
🧬 Потенциальный прорыв в борьбе против рака — и да, это Viagra
Китайские учёные показали: обычная Viagra может усиливать иммунный ответ против "упорных" опухолей — и замедлять их рост почти вдвое.
В чём суть:
🧬 Раковые опухоли частично выживают за счёт того, что отключают “сигнальные” клетки иммунной системы — те, что замечают угрозу и будят “бойцов”.
Когда эти “сигналы тревоги” подавлены, иммунитет остаётся в спячке.
Учёные заметили это в случаях рака поджелудочной, молочной железы и ЖКТ. Причиной оказалась заблокированная молекулярная команда на движение этих "разведчиков". Блокирует её фермент PDE5.
А Viagra как раз создана, чтобы блокировать PDE5 — только в другой системе.
В экспериментах на мышах препарат:
– усилил активность сигнальных клеток в 3 раза
– “разбудил” иммунных бойцов
– замедлил рост опухолей
– и сократил метастазы примерно на 50%
💊 Поскольку Viagra — дешёвый, массово производимый и уже одобренный препарат, клинические испытания в онкологии могут начаться быстро. Особенно — в комбинации со стандартной терапией.
🔗 Источник: https://www.scmp.com/news/china/science/article/3316838/chinese-study-uncovers-cancer-fighting-potential-impotence-drugs-viagra
#cancer #viagra #immunotherapy #biotech #medicine
@vistehno
🤖 Human2LocoMan: как научить робо-собаку делам руками людей
* Что сделали
1. Сначала скормил видеозаписи движений людей (XR-данные) общей модели-«мозгу».
2. Затем дообучил квадропеда LocoMan: он учится, как его лапы вписываются в уже понятное модели пространство движений.
* Зачем
Видео людей дешёвые и охватывают много предметов и хватов. Модель получает «энциклопедию» взаимодействий до того, как робот вообще шевельнётся.
* Результат
+42 % успеха на обычных задачах и +80 % в незнакомых условиях при вдвое меньшем количестве данных от робота.
* Плюсы
– меньше дорогостоящих траекторий → меньше износ оборудования;
– быстрее циклы испытаний;
– метод работает как «усилитель данных», а не просто ускоренный старт.
Подробне: ttps://human2bots.github.io
⚡️ Почему лучшие разработчики всегда на шаг впереди?
Потому что они знают, где брать настоящие инсайд!
Оставь “программирование в вакууме” в прошлом, выбирай свой стек — подпишись и погружайся в поток идей, лайфхаков и знаний, которые не найдёшь в открытом доступе.
ИИ: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Мл собес t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
МЛ: t.me/machinelearning_ru
Devops: t.me/DevOPSitsec
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/java_library
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/neural
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: /channel/gamedev
Физика: t.me/fizmat
SQL: t.me/databases_tg
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: /channel/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: /channel/addlist/mzMMG3RPZhY2M2Iy
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno
🖥 Chatgpt для кода в тг: @Chatgpturbobot
📕Ит-книги: /channel/addlist/BkskQciUW_FhNjEy
💼ИТ-вакансии t.me/addlist/_zyy_jQ_QUsyM2Vi
Подпишись, чтобы всегда знать, куда двигаться дальше!
🌟 WM-ABench: тестирование VL-моделей на понимание физики реального мира.
Мaitrix Org разработали WM-ABench, бенчмарк для оценки VLM в качестве так называемых «моделей мира». Идея проста: проверить, насколько хорошо топовые модели способны не просто распознавать картинки, а понимать окружающую действительность и предсказывать ее изменения.
Создатели, опираясь на когнитивную науку, создали фреймворк, который тестирует 15 самых популярных моделей по 23 параметрам, разделяя процесс на 2 ключевых этапа: восприятие и прогнозирование.
В основе бенчмарка - огромный датасет из более чем 100 тысяч примеров, сгенерированных в 6 различных симуляторах, от ThreeDWorld и Physion до Carla.
Чтобы модели не искали легких путей и не полагались на поверхностные совпадения, в тест добавили «сложные негативы» - контрфактические состояния, которые заставляют систему действительно анализировать происходящее.
Весь процесс был разделен на оценку восприятия (распознавание объектов, пространства, времени, движения) и прогнозирования (симуляция физики, транзитивный и композиционный вывод). Для калибровки сложности задач были установлены базовые показатели, основанные на результатах людей.
🟡Результаты.
С простым визуальным восприятием, то есть с определение цвета или формы, все модели справляются отлично. Однако когда дело доходит до трехмерного пространственного мышления, динамики движения или временных последовательностей, начинаются серьезные проблемы.
Выяснилась и другая любопытная деталь: VLM склонны «спутывать» физические понятия. Например, если в сцене изменить только цвет объекта, модель может внезапно ошибиться в оценке его размера или скорости.
Оказалось, что цвет и форма являются самыми влиятельными атрибутами, которые искажают восприятие других, не связанных с ними характеристик.
🟡Но главная проблема кроется глубже.
Точное восприятие мира совершенно не гарантирует точного прогноза.
Исследование показало, что даже при идеально верном распознавании текущего состояния сцены модели проваливают предсказание физических взаимодействий.
Разрыв с человеческими способностями явный: в задачах на транзитивный вывод он достигает 46%, а композиционный вывод выполняется на уровне случайного угадывания.
🟡Бенчмарк подсветил фундаментальный недостаток:
У современных VLM отсутствуют базовые знания физики, необходимые для симуляции даже простейших событий. Они видят мир, но не понимают, по каким законам он живет.
📌Лицензирование: Apache 2.0 License.
🟡Страница проекта
🟡Arxiv
🟡Датасет
@ai_machinelearning_big_data
#AI #ML #VLM #Benchmark #Maitrix
👩⚕️ Microsoft представила MAI-DxO — ИИ, который справился с реальной медициной.
ИИ хорошо решают тесты с вариантами ответа. Но настоящие пациенты не приходят с готовыми прокатами.
Microsoft протестировала MAI-DxO на 304 самых сложных открытых кейсах из New England Journal of Medicine — тех, с которыми часто не справляются даже опытные врачи.
📊 Результаты:
🔹 85,5% успешных решений (против ~20% у врачей)
🔹 Ниже стоимость диагностики, чем у врачей и одиночных LLM
🔹 Модель имитирует виртуальную команду ИИ-врачей с разными стилями мышления
ИИ в медицине делает гигантский шаг вперёд.
https://microsoft.ai/new/the-path-to-medical-superintelligence/
✅ Базовые инструменты аналитика данных: как перейти в IT с минимальным программированием?
Инструменты, которые нужно освоить:
> Excel
> Google Таблицы
> SQL
> Power BI
> Python (базовый уровень)
Освоить эти инструменты за несколько месяцев — реально. С ними вы сможете претендовать на позиции аналитика данных с зарплатой от 170 тыс. ₽.
⚡ На рынке действительно не хватает аналитиков. Компании регулярно ищут специалистов, способных:
• структурировать данные и извлекать полезные выводы
• создавать понятные и полезные дашборды
• находить практические решения для бизнеса на основе анализа цифр
💰 Аналитики с навыками Python и SQL востребованы больше всего. Эти инструменты позволяют решать более сложные задачи и быстрее двигаться по карьерной лестнице. Знание основ машинного обучения также будет вашим дополнительным преимуществом.
💾 На курсе «Инструменты аналитика данных» от Академии Eduson вы последовательно изучите эти пять базовых инструментов. Курс состоит из видеоуроков и тренажёров, где вы будете решать типовые задачи аналитика и подготовите проект для портфолио.
После обучения вы получите диплом Eduson, верифицированный «Сколково».
📌 Стоимость курса существенно ниже, чем у большинства конкурентов на рынке, при этом вы получаете полный набор навыков и качественный диплом. А с промокодом DATA
вы получите дополнительную скидку 65% и второй курс на выбор в подарок. Учитесь онлайн в удобное время, задавайте вопросы личному куратору в течение года и отрабатывайте навыки на практических кейсах.
Узнайте больше о курсе и зафиксируйте лучшие условия по ссылке: https://www.eduson.tv/~vistehnoadt
Реклама. ООО "Эдюсон", ИНН 7729779476, erid: 2W5zFGNPHH2
🤖 Почему роботам всё ещё не удаётся двигаться, как это делает человеческая рука?
Проблема в том, что большинство роботизированных манипуляторов:
• слишком большие
• слишком медленные
• имеют неестественные суставы
• не умеют адаптироваться к окружающей среде
🎯 Решение? DexWrist от MIT — новый компактный и гибкий запястный механизм, который:
• упрощает обучение роботам в сложных и ограниченных условиях
• позволяет выполнять точные и динамичные действия
• максимально приближен к анатомии человека
🔗 Подробнее: http://dexwrist.csail.mit.edu
🤖 Роботы Optimus теперь могут собирать... самих себя
Tesla вывела своих гуманоидов на новый уровень: теперь они умеют не только собирать машины, но и друг друга.
Это не просто апгрейд — это переломный момент:
машины начинают воспроизводить себя без участия человека.
📌 Что это значит:
• Роботы строят роботов — полностью автономно
• Открывает путь к самовоспроизводимым производствам
• Ближе к эре, где ИИ и механика смогут развиваться без людей
Сценарий научной фантастики больше не фантастика.
🤖 Обзор рынка гуманоидных роботов от CB Insights: 61 компания и $1.2 млрд инвестиций
CB Insights опубликовали свежую market map рынка гуманоидных роботов — 61 активная компания, 8 направлений применения и десятки пилотных внедрений по всему миру.
📊 Главные цифры:
• $1.2 млрд инвестиций в 2024
• Прогноз на 2025 — до $2.3 млрд
• Рынок переходит от прототипов к пилотам: роботы уже работают на складах, в клиниках и на производстве
🔧 Ключевые применения:
• Логистика и сборка
• Строительство и спасательные операции
• Retail и помощь в здравоохранении
• Роевые системы и автономные ассистенты
🌍 Лидеры рынка:
• США и Канада — 42% компаний
• Китай — самый быстрорастущий рынок
• Среди игроков: Figure, Tesla Optimus, Agility Robotics, Unitree, Apptronik, Sanctuary AI
⚠️ Вызовы:
• Высокая стоимость оборудования и сенсоров
• Неясность: гуманоидная форма — реально эффективна или это маркетинг?
💡 Вывод:
Рынок гуманоидов ожил. Венчур идёт, пилоты идут, гонка началась. Осталось решить главное: сделать роботов массовыми, доступными и надёжными.
#robotics #humanoid #AI #automation #startups #CBInsights #technology
@vistehno
NEWS: Thinking Machines переманивает топовых инженеров деньгами
Mira Murati не шутит — её новая компания Thinking Machines агрессивно охотится за талантами, предлагая базы в $500K+, что значительно выше, чем у конкурентов:
> Thinking Machines: мы дадим тебе $500K
> Anthropic: зато у нас безопасно, $400K
> OpenAI: максимум можем предложить $300K
Неудивительно, что начался массовый переход 💼
🔗 Источник: https://x.com/chaidiscovery/status/1939684680447746050
🚀 Baidu открыла исходный код серии моделей ERNIE 4.5 !
🧠 Эти модели достигли SOTA-результатов на текстовых и мультимодальных бенчмарках:
— следование инструкциям,
— запоминание фактов,
— визуальное понимание,
— мультимодальные рассуждения.
🔧 Обучены на PaddlePaddle с эффективностью до 47% MFU при претрейне крупнейшей модели.
📦 В составе релиза:
- 10 моделей ERNIE 4.5,
- MoE‑архитектуры с 3B и 47B активных параметров,
- самая крупная модель содержит 424B параметров (MoE),
- также доступна компактная dense‑версия на 0.3B.
Всего Baidu выложила сразу 23 модели на Hugging Face размерами — от 0.3B до 424B параметров! 💥
🟢Попробовать: http://ernie.baidu.com
🟢Hugging Face: https://huggingface.co/baidu
🟢GitHub: https://github.com/PaddlePaddle/ERNIE
🟢AI Studio: https://aistudio.baidu.com/overview
@ai_machinelearning_big_data
#ERNIE #opensource #Baidu
🧠 Илон Маск: с Neuralink можно будет “заселиться” в тело робота Tesla Optimus
Маск заявил, что люди с нейроимплантами Neuralink смогут полностью управлять роботом Tesla Optimus, ощущая его тело как своё собственное:
> *“Вы сможете иметь полный контроль и сенсоры всего тела Optimus.
🧠 Илья Суцкевер: ИИ может лечить болезни, продлевать жизнь и ускорить науку за пределы воображения.
Но если он способен на это — на что ещё он способен?
> “Проблема ИИ в том, что он слишком мощный. Он может делать всё.”
Мы не знаем, что нас ждёт.
Но мы должны подготовиться — вместе.
🐚 Bash 5.3 — большое обновление любимой оболочки
Спустя 3 года после релиза Bash 5.2 представлена новая версия — GNU Bash 5.3, и в ней много интересного:
🔧 Новая командная подстановка
Теперь можно выполнить команду *внутри текущей оболочки*, сохранив результат в переменную REPLY
:
${| echo hello; } # REPLY=hello
read -E
— подключение Readline при вводе.compgen -V myvar
— сохранить список завершений в переменную.source -p ./scripts
— задать путь для поиска скриптов.🤖 Китайский стартап Robot Era привлёк $70M на гуманоидов
Китайская компания Robot Era закрыла раунд финансирования серии A на сумму 500 млн юаней (~$70 млн).
Что известно:
- Компания уже продала более 200 единиц своей техники
- В линейке — гуманоид STAR1 и роботизированная рука XHAND1
- 50% продаж — за пределами Китая, включая B2B-заказы
📈 Стартап активно масштабируется и делает ставку на международный рынок. Продукты компании нацелены на индустриальные применения, R&D и робототехнические платформы.
Следим за развитием — Азия становится центром гуманоидной гонки.
Подписывайся, чтобы не пропустить главные новости из мира ИИ и роботов!
🦾 Noetix N2 получает удар за ударом, но продолжает двигаться вперё
Читать полностью…🤖 Исследователь-аспирант создал утилиту, которую захочет сохранить каждый, кто работает с роботами и SolidWorks.
💡 Бесплатный веб-инструмент, который конвертирует URDF-файлы из SolidWorks прямо в готовые ROS 2-пакеты — без установки, без лишних шагов.
Что умеет:
✅ Загрузи URDF и меши
✅ Мгновенно получи ROS 2-совместимый пакет
✅ Скачай zip и используй сразу
✅ Не нужен установленный ROS или окружение
Просто, удобно и создано инженером, который сам прошёл через все эти боли.
Идеально для студентов и разработчиков в сфере робототехники.
💻 Попробовать:
http://ros2-urdf-web-converter.onrender.com
Автор — Abhishek Chaudhari. Респект!
🖥 MuseSteamer — генератор видео по картинке
Baidu представил новое семейство моделей MuseSteamer, которое превращает обычное фото в полноценный HD-ролик с озвучкой и эффектами.
*Что умеет*
- Создаёт 10-секундные клипы 1080p с плавным движением камеры и живой мимикой.
- Добавляет китайскую речь и фоновый звук, синхронизированные с картинкой.
- Работает от одного исходного кадра; текстовый промпт не обязателен.
- Версии: Turbo (уже в бета-доступе), Lite, Pro и линейка «озвученных» моделей.
- Интеграция в Baidu Search для креаторов и киностудий.
Как попробовать
Перейдите на HuiXiang Baidu, загрузите изображение, выберите версию — готовый клип появится через несколько секунд.
MuseSteamer сейчас занимает 1-е место в рейтинге VBench I2V с результатом 89,38 %.
🔗 Смотреть бенчмарк:
📌 Подробнее: https://huixiang.baidu.com
📌 Бенчмарки: https://huggingface.co/spaces/Vchitect/VBench_Leaderboard
@vistehno
Ни один ИИ не справится с твоими фантазиями так, как этот🕺
Представь: ты просто вводишь пару слов — а AI выдает тебе картинку или гифку, от которой можно... вдохновиться🍌
✔️ Фантазии
✔️ Undress‑режим
✔️ Анимации
✔️ 4K-качество
✔️ До 12 сцен за раз
✔️ Полная приватность — ты не просто зритель, ты настоящий режиссёр.
⌨️ Каждый месяц добавляются новые фишки.
🔝 Просто смотреть на апдейты уже кайф, а пользоваться — это уровень вне конкуренции. А с подпиской всего в 3$ - ощущение, будто ты нашёл чит-код к реальности🎹
🤫 Скорее пробуй бесплатно, пока не прикрыли за слишком мощный функционал — заходи 👉 Pornworks.ai
💎 Tencent выводит 3D-генерацию на новый уровень с обновлением Hunyuan3D.
Китайский технологический гигант продолжает совершенствовать свою открытую нейросеть для создания трёхмерных объектов. В версии 2.1 модель научилась учитывать физические свойства материалов при рендеринге — теперь свет реалистично преломляется на стекле, отражается от металла и рассеивается на тканях.
Нейросеть работает по принципу двухэтапной генерации: сначала создаются изображения объекта с разных ракурсов, затем они преобразуются в 3D-модель. При этом ии остаётся доступным для широкого круга пользователей, ее базовые функции работают на видеокартах от 10 ГБ памяти.
🔗 Ссылка - *клик*
@vistehno
🖥 Nvidia почти достигла рыночной капитализации в 4 триллиона долларов.
Во времена золотой лихорадки богатели продавцы лопат, а не старатели.
Сегодня тот же принцип работает в ИИ: NVIDIA — продавец лопат XXI века 🛠️
• Золотоискатели-2025 — стартапы и корпорации, обучающие LLM, строящие автономных агентов и генеративные сервисы.
• Лопаты — GPU серии A/H, NVLink, CUDA-стек, DGX-сервера и сетевые ускорители.
• Магазин инструментов — собственные облака NVIDIA и партнёрские дата-центры.
Пока одни ищут «золото» в данных, NVIDIA продаёт каждому из них новые лопаты — и зарабатывает на каждом.
💰 Если бы вы вложили $10,000 в Nvidia в 2010… сейчас у вас было бы $4,400,000.
@ai_machinelearning_big_data
#ai #ml #Nvidia #market
#AI #GPU #NVIDIA #Инфраструктура
🧠 Николай Савушкин, инженер рекомендательных систем Яндекса, отметил важный вектор развития рекомендаций
LLM понимают постановку задачи на человеческом языке с естественной речью. «Классно было бы жить в мире, где рекомендательной системе можно тоже естественно сформулировать задачи».
Поэтому голубая мечта отрасли — стать ещё одной модальностью LLM.
🔗 Ссылка - *клик*
В соцсетях завирусилось видео из офиса xAI перед релизом Grok 4: там настоящий палаточный лагерь! Похоже, команда так увлечена подготовкой чат-бота, что ночует прямо на работе. Один из сотрудников xAI пошутил в чате, что это не их офис — мол, палаток должно быть ещё больше.
#xAI #Grok4 #Технологии
🔅 Могут ли диффузионные модели писать код на уровне LLM?
Apple представила DiffuCoder — диффузионную модель с архитектурой LLM (7B параметров), специально обученную для генерации кода. Вместо обычного токен-за-токеном автокомплита — многопроходная генерация с уточнением, как в Stable Diffusion, но для программ.
💻 Что интересного:
– Модель обучена предсказывать код "размазанно", а потом уточнять шаг за шагом
– Исследуется влияние температуры на качество и стабильность вывода
– Применяется метод coupled-GRPO — он позволяет "научить" модель говорить на языке диффузии и улучшает обучение
📊 В результате — конкурентное качество генерации, интересная альтернатива автогрессии и новая перспектива для кодогенерации.
🔗 Код: https://github.com/apple/ml-diffucoder
✔️Sakana AI запускает новый алгоритм AB-MCTS
Sakana AI представила AB-MCTS (Adaptive Branching Monte Carlo Tree Search) — алгоритм, который объединяет несколько передовых ИИ-моделей (o4-mini, Gemini 2.5 Pro, DeepSeek-R1-0528) в единую систему коллективного поиска решений.
Преимущества AB-MCTS:
— Коллективный интеллект: каждая модель вносит свои сильные стороны и компенсирует слабые.
— Адаптивный поиск: строится дерево возможных стратегий, и выбор ответвлений происходит на основе успешности прошлых итераций.
— Существенный прирост качества: на бенчмарке ARC-AGI-2 комбинация моделей значительно превосходит каждую из них по отдельности.
Полезные ссылки:
Блог об AB-MCTS: https://sakana.ai/ab-mcts
Статья на arXiv: https://arxiv.org/abs/2503.04412
Исходник TreeQuest: https://github.com/SakanaAI/treequest
Эксперименты ARC-AGI: https://github.com/SakanaAI/ab-mcts-arc2
@vistehno
📱 Очередная новинка от Google: Gemma 3n — мультимодальный ИИ для мобильных устройств.
Google в очередной представила новую, на этот раз очень компактную модель, которая уместится даже в смартфоне, но сохранит мощь генеративного ИИ. В Gemma 3n используется технология Per-Layer Embeddings, позволяющая эффективно распределять параметры между CPU и GPU: на устройствах с 8 ГБ ОЗУ модель займёт всего 2-3 ГБ видеопамяти.
Модель работает не только с текстом, но и с изображениями, аудио и видео. Встроенный кодировщик речи USM распознаёт и переводит устную речь, а MobileNet-V5-300M оптимизирован для обработки видео в реальном времени.
Модель уже доступна для скачивания и поддерживается популярными инструментами вродe llama.cpp и Ollama.
🔗 Ссылка - *клик*
@vistehno
🤖 Sanctuary AI научил своих гуманоидов чувствовать прикосновение
Компания Sanctuary AI внедрила тактильные сенсоры в свои универсальные роботы Phoenix. Это значительно улучшило их способность выполнять сложные задачи, где требуется осязание — от тонких манипуляций до уверенного захвата предметов.
🖐️ Что это даёт:
• Повышение точности при работе с мелкими и хрупкими объектами
• Расширенные возможности в телемеханике (удалённом управлении)
• Ещё один шаг к реализации ловкого и чувствительного автономного труда
📌 Это важный этап на пути к развитию "dexterous intelligence" — искусственного интеллекта, способного эффективно действовать в физическом мире, как человек.
#robotics #TouchSensors #humanoid #gripper #technology #engineering #robots #innovation
🤖 Redditor автоматизировал создание вирусных рилсов с помощью ИИ-агентов — без единого ручного действия
Пользователь Reddit построил систему на базе ИИ-агентов, которая:
• сама генерирует видео-контент
• планирует публикации
• выкладывает рилсы
• отслеживает метрики
• удаляет только видео низкого качества (это единственный ручной этап)
📈 Результаты за 3 недели:
• 4.4 млн просмотров
• 15 300 переходов в профиль
Алгоритмические фермы вовлечённости уже не теория, а реальность. И это только начало.
⚠️ Добро пожаловать в эпоху, где контент создают и распространяют сами ИИ, а люди лишь подчищают за ними.
👉 Подробнее
#ai #ml #veo3