Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
Meta* представила V-JEPA-v2: продвинутую ИИ-модель для понимания роботами окружающего пространства
Ян ЛеКун представил V-JEPA-v2 — новую версию самообучающейся модели компьютерного зрения, которая работает без размеченных данных.
Модель использует архитектуру joint embedding predictive, что обеспечивает более эффективное обучение и лучшую адаптацию к различным визуальным задачам.
Прорыв откроет возможности в автономных авто, ритейл-аналитике и медицинской визуализации, снизив затраты на разметку данных и ускорив внедрение ИИ-систем зрения.
Всего с 1.2 млрд параметров роботы смогут понимать окружающий мир без сложных размышлений, обучаясь непосредственно во время работы.
GitHub
HuggingFace
Сайт проекта
Paper
*Meta - запрещённая в РФ организация
#VJEPA #ComputerVision #Meta
———
@tsingular
Армия США создает техно-подразделение из топ-менеджеров IT-гигантов
Армия США официально запускает Отряд 201 — новый резервный корпус из руководителей технологических компаний.
В звании подполковников присягу принесут: CTO Palantir Шам Санкар, CTO Meta* Эндрю Босворт, CPO OpenAI Кевин Вейл и экс-CRO OpenAI Боб МакГрю.
Их задача — внедрение технологических решений в армии и привлечение IT-талантов в военную службу. Подразделение будет работать над концептуальными проектами без конфликта интересов с их основными компаниями.
Это часть стратегии администрации Трампа по интеграции венчурного капитала и стартапов в оборонную индустрию.
Будут делать дружелюбных военных советников, само-собой.
*Meta - запрещённая в РФ организация
#Army #Defense
———
@tsingular
Claude Opus написал статью-ответ на ту самую резонансную работу Apple «The Illusion of Thinking»
Его дисс называется The Illusion of the Illusion of Thinking, и Opus в нем числится первым из двух авторов. Вот эта папира, лежит на arxiv.
Док небольшой, всего три страницы. Если кратко, Клод предъявляет ряд претензий к дизайну экспериментов Apple. Вот основные:
1️⃣ Автоматическая система оценки работала неправильно. Она засчитывала ответ только если модель могла явно перечислить все шаги решения, не различая ситуацию «не могу» и «могу, но не буду перечислять всё». Также некорректными были исходные метрики сложности задач: авторы считали ее просто по числу шагов, не учитывая количество вариантов решения, NP сложность и другие нюансы.
2️⃣ Авторы давали модели нерешаемые задачи. Например, тестировали River Crossing с
N ≥ 6 при вместимости лодки 3. Такие задачи математически не имеют решений, но модели все равно получают 0 баллов за «провал».
3️⃣ Ограничений по длине ризонинга не должно было быть. Якобы в задачах типа Башни Ханоя модели не провалились в рассуждениях, как утверждается в оригинале, а остановились из-за ограничения на количество токенов. При этом если попросить вывести ответ в другом формате (например, написать функцию для решения задачи) – все работает.
Ризонинг-модель пишет диссы на человеческую статью про ризонинг. Добро пожаловать в 2025 ☠️
✔️ Релиз Hunyuan 3D 2.1!
Первая полностью open-source, готовая к продакшену PBR 3D генеративная модель!
PBR (Physically Based Rendering) - это технология, при которой внешний вид 3D-объектов рассчитывается с учётом реальных физических законов взаимодействия света и поверхности.
✅ Модель выдает кинематографичное качество: синтез PBR-материалов — кожа, бронза и другие поверхности выглядят фотореалистично с красивыми эффектами освещения.
✅ Open source: доступны веса модели, код для обучения и инференса, пайплайны — всё можно доработать под себя.
✅ Запускается даже на потребительских GPU (Модель тестировалась на GPU A100 с Python 3.10 и PyTorch 2.5.1+cu124.) — с моделью создавать 3D-контент могут не только студии, но и любые разработчики и малые команды.
▪ Модель: https://huggingface.co/tencent/Hunyuan3D-2.1
▪ Github: https://github.com/Tencent-Hunyuan/Hunyuan3D-2.1
▪ Hunyuan 3D Creation Engine: https://3d.hunyuan.tencent.com
@ai_machinelearning_big_data
#Hunyuan3D #OpenSource #3DCreation #tencent
Microsoft Copilot вломали через промпт иньекцию
Исследователи обнаружили критическую уязвимость в Microsoft Copilot под названием EchoLeak.
Хакеры могли украсть данные пользователей через обычное письмо.
Атака работала через скрытые инструкции в email, которые активировались когда пользователь задавал вопрос ИИ.
Copilot извлекал письмо как релевантное и выполнял команды злоумышленника.
Данные передавались через автоматически загружаемые ссылки в Teams и SharePoint, обходя защиту.
Microsoft присвоил уязвимости статус критической (CVE-2025-32711) и выпустил исправление в мае.
Компания заверила, что эксплойтов не было.
#Microsoft #Copilot #Security
------
@tsingular
Собрано в России: 8 датасетов от отечественных разработчиков💡
Распознавать эмоции, предсказывать структуру молекул, понимать жестовый язык и культурный контекст — всему этому нейросети учатся на наборах данных. Их собирают и размечают большие команды исследователей. В День России рассказываем об отечественных датасетах и корпусах.
Golos и Dusha
💳 Golos — это корпус аудиозаписей русской речи с транскрипциями объёмом 1 240 часов. Используется для обучения моделей распознавания речи. А с помощью датасета Dusha нейросети учатся определять эмоции в речи. В нём собраны короткие аудиофрагменты с аннотациями четырёх типов настроения: грусть, радость, злость или нейтральная эмоция. Оба корпуса созданы командой Сбера.
Национальный корпус русского языка
✉️ Крупнейший и наиболее репрезентативный корпус текстов на русском языке, созданный специалистами из Института русского языка РАН, МГУ и СПбГУ. В него входят художественные произведения, научные статьи, документы и публицистика, расшифровки устной речи, а также переводы. Общий объём — более 2 млрд токенов. Лингвисты разметили все тексты с высокой точностью. Это позволяет качественно обучать LLM с учётом русской грамматики, синтаксиса и культурного контекста.
Slovo
💚 Крупнейший датасет русского жестового языка от Сбера. С его помощью модели компьютерного зрения обучаются распознавать дактилемы — буквы жестового алфавита. Cостоит из 20 400 видео, записанных с помощью 194 носителей языка и экспертов.
∇²DFT
👨💻 Набор данных о квантовых свойствах и пространственной геометрии атомов в 1,9 млн молекул. На нём модели учатся прогнозировать свойства химических соединений. Датасет и бенчмарк на его основе создали специалисты из Института AIRI, Сколтеха и Санкт-Петербургского отделения Математического института имени В.А. Стеклова (ПОМИ) РАН.
Skoltech3D
💻 Датасет, с помощью которого модели учатся реконструировать поверхности сложных 3D-объектов. Содержит около 1,4 млн снимков 107 пространств и объектов под 14 различными видами освещения. Данные собрали исследователи из Сколтеха, AIRI и МФТИ.
Museum exhibits dataset
⭐️ Библиотека содержит около 16 000 размеченных изображений экспонатов из открытого музейного каталога Минкульта России. На этих данных модели обучаются распознавать объекты и анализировать визуальное сходство.
MosMedData Chest CT Scans
🔥 В этом датасете собрано более тысячи КТ-снимков лёгких российских пациентов, перенёсших COVID-19. Все данные обезличены. С помощью снимков модели обучаются распознавать признаки заболеваний.
❤️ — если хотите больше историй о российских AI-разработках
Sakana AI релизнули модель для генерации моделей
Она называется Text-to-LoRA. LoRA – это метод файнтюнинга, когда мы вместо полного дообучения всей сети настраиваем для нужных нам задач специальные низкоранговые адаптеры.
Это довольно эффективный метод, но и он требует сбора данных и какого-никакого обучения.
Sakana же предлагают модель, которая на лету генерирует сразу готовые LoRA адаптеры из обычного текстового промпта. Например, на вход: «хочу модель для анализа отзывов в картах». На выход: готовые веса адаптера, которые не надо обучать, а остается только запустить.
Под капотом у T2L лежит классический hypernetwork-подход. Гиперсеть получает на вход эмбеддинг описания задачи вместе с эмбеддингами для каждого слоя исходной модели, а потом через серию MLP-блоков генерирует нужные низкоранговые матрицы A и B, которые сразу прикладываются к базовым весам. Это и есть готовый LoRA-адаптер.
На тестах это работает хорошо: в среднем +8 % к точности над исходником. Это примерно на уровне или даже лучше, чем ручные LoRA и мульти-задачные LoRA.
Представьте, насколько это снижает порог входа в тюнинг моделей для не-инженеров
Статья | GitHub
Аттракцион невиданной щедрости от Manus:
Бесплатный доступ к Gemini у них в чате:
https://manus.im/
Типа стандартный чат с ИИ уже обыденность, - а вот агентские действия будут монетизироваться.
Интересное кино.
#Manus #Gemini
———
@tsingular
Экскурсия на фабрику Unitree в Китае
Перевёл для вас обзорную экскурсию на фабрику роботов Unitree.
#Китай #Unitree #переводы
———
@tsingular
NVIDIA выпустила Cosmos Predict-2 для беспилотных авто
NVIDIA представила новую модель Cosmos Predict-2 для генерации синтетических данных беспилотных автомобилей. Модель умеет создавать многоракурсное видео из одной камеры и лучше понимает контекст.
Платформу уже используют Oxa, Plus и Uber для масштабирования разработки автономных систем.
Также анонсирован микросервис Cosmos Transfer и интеграция с симулятором CARLA, который имеет более 150 тысяч разработчиков.
Модель обучена на 20 тысячах часов реальной езды и показывает улучшенную производительность в сложных условиях вроде тумана и дождя.
#AutonomousVehicles #SyntheticData #NVIDIA
------
@tsingular
ИИ воссоздал все 7 чудес древнего мира
Исследователи из Университета Флориды использовали передовые алгоритмы компьютерного зрения для цифрового восстановления всех семи чудес древнего мира.
Технология анализирует археологические данные, исторические тексты и архитектурные фрагменты для создания максимально точных 3D-моделей.
Восстановлены: Висячие сады Вавилона, Колосс Родосский, Александрийский маяк, Мавзолей в Галикарнасе, Статуя Зевса, Храм Артемиды и пирамида Хеопса.
Проект поможет археологам лучше понять древнюю архитектуру и откроет новые возможности для исторического образования через VR-технологии.
Как раз на днях про это писал :)
#Archaeology #нейрорендер
———
@tsingular
o3-pro в тестах ARC-AGI-1, ARC-AGI-2 показала себя не очень.
И дороже и результат хуже.
Т.е. её долгие размышления не приносят пользы для решения этих задач.
#ARCAGI #o3pro #OpenAI
———
@tsingular
OpenAI релизнули o3 pro
Доступ к модели уже дают Pro подписчикам и в API. Модель заметно дешевле o1 pro — $20/$80 за миллион токенов, по сравнению с $150/$600 у o1 pro.
Одновременно с этим в 5 раз снизили цену на обычную o3 — теперь она стоит $2/$8 за миллион токенов. То есть o3 pro ровно в 10 раз дороже.
@ai_newz
Manus интегрировал видеогенерацию VEO3
Платформа Manus добавила поддержку VEO3 для создания видео как один из инструментов своего популярного агента.
Теперь ИИ может генерировать сцены в духе Хичкока, Андерсона, Вонг Кар-Вая, Тарантино и Миядзаки - изучая композицию, цвет, темп и кинематографический синтаксис каждого.
Manus проведет исследование режиссёрского стиля, создаст описание и план заданий для VEO3, которая оживит кадры.
Пользователь получает инструмент для создания полноценной кинематографической работы практически без ограничений.
Интеграция открывает новые возможности для создания профессионального видеоконтента через ИИ.
#Manus #VEO3 #агенты #нейрорендер
———
@tsingular
Хорошие новости для LLM-разработчиков – o3 теперь стоит как 4.1 по API
1 миллион токенов на входе: 2$; на выходе: 8$
По моему опыту очень хорошая модель для агентов
🌟 SEAL: Еще одна попытка создать пайплайн самообучающихся LLM.
SEAL - это методика от MiT, позволяющая LLM самостоятельно генерировать обучающие данные и настраивать параметры обучения, чтобы адаптироваться к новым задачам. Вместо традиционного файнтюна на внешних данных модель учится рефлексировать: анализировать контекст, создавать из него синтетические данные и применять их для корректировки собственных весов через механизм усиленного обучения.
SEAL, по сути, это два разделенных цикла:
🟢Внешний цикл использует RL, чтобы научить модель генерировать «самоизменения» (инструкции на естественном языке, описывающие, какие данные использовать и как настраивать параметры).
🟢Внутренний цикл реализует эти изменения: модель дообучается на сгенерированных данных, а затем тестирует результат на конкретной задаче. За коррекцию отвечает RL-алгоритм ReSTEM, который оценивает эффективность изменений и обновляет стратегию генерации инструкций. Для экономии ресурсов используются легковесные адаптеры LoRA, которые модифицируют только часть параметров модели.
Этот процесс повторяется, постепенно формируя у модели навык преобразования исходных данных в полезные обучающие сигналы.
SEAL протестили на 2 задачах: интеграции новых знаний и few-shot обучении. В первом случае модель генерирует логические следствия из текста, дообучается на них и улучшает точность ответов на вопросы без доступа к исходному тексту.
Во втором случае SEAL выбирает оптимальные аугментации данных и гиперпараметры для обучения на примерах задач ARC-AGI.
В обоих сценариях SEAL превзошел подходы с фиксированными шаблонами (ICL, TTT+Self Edit без RL и) и даже синтетическими данными от GPT-4.1.
Метод скорее академический и по большей части экспериментальный, у него есть ограничения:
🟠При последовательном применении изменений модель склонна к «катастрофическому забыванию» — потере знаний, усвоенных ранее;
🟠Сопутствующие вычислительные затраты, так как каждая итерация требует дообучения и тестирования модели.
▶️В репозитории проекта разработчики выложили код, данные и инструкции для двух направлений:
🟢Включение новых фактических знаний;
🟢Адаптация к новым задачам на основе примеров.
📌Лицензирование: MIT License.
🟡Страница проекта
🟡Arxiv
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #LLM #SEAL #RL #MiT
Сотни MCP серверов в контейнерах
Проект mcp-containers решает главную проблему экосистемы MCP - сложность настройки серверов. Теперь сотни MCP серверов упакованы в Docker-контейнеры и автоматически обновляются при изменении исходного кода.
В каталоге представлены серверы для работы с популярными сервисами: GitHub, Notion, Slack, PostgreSQL, MongoDB, Stripe, OpenAI, Kubernetes и многими другими.
Теперь подключить любой MCP сервер к Claude Desktop или другим совместимым клиентам стало максимально просто - достаточно одной команды docker pull.
Например MCP для Telegram:
Pull the Docker image:
docker pull ghcr.io/metorial/mcp-container--chigwell--telegram-mcp--telegram-mcp
docker run -i --rm \
-e TELEGRAM_API_ID=telegram-api-id -e TELEGRAM_API_HASH=telegram-api-hash -e TELEGRAM_SESSION_NAME=telegram-session-name \
ghcr.io/metorial/mcp-container--chigwell--telegram-mcp--telegram-mcp "python main.py"
{
"mcpServers": {
"telegram-mcp": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"ghcr.io/metorial/mcp-container--chigwell--telegram-mcp--telegram-mcp",
"python main.py"
],
"env": {
"TELEGRAM_API_ID": "telegram-api-id",
"TELEGRAM_API_HASH": "telegram-api-hash",
"TELEGRAM_SESSION_NAME": "telegram-session-name"
}
}
}
}
Advancing AI 2025 — выжимка из презентации AMD
Хоть Nvidia и лидер на рынке GPU, но они там не одни. Выбрал для вас самое сочное:
➖ MI350x и MI355x (тот же кристалл, выше TDP) будут доступны в третьем квартале — 288 ГБ HBM3e, поддержка FP4/FP6, 8TB/s пропускной способности, до 20 петафлопс в FP4, держат больше полутриллиона параметров на одной карте.
➖ Такие характеристики позволяют нехило сэкономить — AMD обещают прирост в токенах в секунду до 40% за те же деньги, по сравнению с Nvidia Blackwell.
➖ MI400x — 40 петафлопс в fp4, 432 гигабайта HBM4 на скорости 19.6TB/s, релиз в 2026. MI450 уже проектируют вместе с OpenAI — об этом лично сказал Сэм Альтман на сцене.
➖ Helios AI-Rack — прямой конкурент NVL144 Vera Rubin от Nvidia. 72 MI400x дают 2.9 экзафлопса в FP4, 1.4PB/s пропускной способности и 31TB VRAM, при этом давая такой же уровень интерконнекта внутри. Выйдет тоже в 2026.
➖ Helios и вся линейка строятся на открытом интерконнекте, вместо проприетарного NVLink.
➖ AMD Developer Cloud — официальное облако от AMD, специально для разработчиков, для регистрации нужен всего лишь GitHub аккаунт. Предлагают MI300x за $2 в час, что заметно дешевле других провайдеров.
Видяхи AMD выглядят очень вкусно для инференса — при схожей производительности по компьюту, они дают больше VRAM и пропускной способности, что означает заметно больший батчсайз и более дешёвые токены. А за последний год уровень поддержки видях AMD стандартным софтом для инференса, вроде SGLang, вырос на голову. Но тренировать на них пока что всё ещё рано — всё ещё слишком нестабильно. Хотя прогресс за последнее время всё равно впечатляет.
Полная презентация
@ai_newz
CLONE: дистанционное управление роботом Unitree через систему VR погружения с большим радиусом действия!
🏃♂️🧍 CLONE позволяет выполнять сложные и скоординированные интерактивные задачи:
🥊 бокс
🏓 настольный теннис
🤲 подбор предметов
📦 обустройство помещения
🤝 передача
… и многое другое!
🌀 Замкнутая система коррекции ошибок на основе одометрии LiDAR обеспечивает точность, а обучение на анализе движений motion capture повышает качество, раскрывая весь потенциал робота G1.
Полная видеодемонстрация и страница проекта здесь:
humanoid-clone.github.io
Сегодня пересматриваем Суррогаты
Или, кстати, Соловей против Ильи Муромца :)
#Clone #Unitree #Avatar #Китай
———
@tsingular
LightAutoML - быстрый AutoML фреймворк от Сбера
LightAutoML (LAMA) — opensource фреймворк для создания ML моделей за несколько строк кода от команды Sber AI Lab.
Поддерживает табличные данные, временные ряды, изображения и тексты. Можно использовать готовые пресеты или собирать кастомные пайплайны из блоков.
Особенности:
- Быстрое прототипирование моделей
- Готовые решения для разных типов задач
- Гибкая настройка под конкретные нужды
- GPU и Spark поддержка в разработке
#AutoML #Сбер #OpenSource
------
@tsingular
С Праздником всех!
С Днём России!
#праздники
———
@tsingular
🧬 Прорыв в долголетии от Shift Bioscience — SB000 и будущее клеточного омоложения
🔥 Новое препринт-исследование *“A single factor for safer cellular rejuvenation”* от Shift Bioscience — впечатляющий шаг вперёд в борьбе со старением.
🧠 Суть:
Они обнаружили SB000 — один единственный ген, способный:
- 🔁 обращать возрастные изменения в фибробластах и кератиноцитах
- 🧬 снижать маркеры старения
- ✅ сохранять клеточную идентичность
- 🧪 и не вызывать плюрипотентность, в отличие от OSK
Это делает SB000 потенциально более безопасным инструментом для частичного перепрограммирования клеток.
📊 Ключевые результаты:
- Победил OSK по десяткам транскриптомных и эпигенетических часов, включая Horvath и DunedinPACE
- Убрал экспрессию генов, связанных со старением
- Поддержал функцию клеток без потери специализации
🧬 Но самое интересное — как это было найдено:
Никаких «один ген за раз». Это результат масштабируемой AI-платформы, которая анализирует огромные наборы данных, предсказывает поведение генов и предлагает омолаживающие вмешательства *de novo*.
👾 Это и есть суть AI-first биологии:
- ИИ ищет по всему пространству геномного регулирования
- Foundation-модели (например, **scGPT**) учатся на атласах одиночных клеток, чтобы предсказывать старение, вмешательства и эффекты
- Эксперименты подтверждают гипотезы и замыкают петлю обратной связи
🧬 SB000 — это не просто находка. Это предвестник новой эры в биологии старения:
от гипотез → к генеративным моделям,
от OSK → к SB000,
от догадок → к вычислительно-основанному дизайну.
📌 Будущее долголетия пишется в двух кодах: генетическом и вычислительном.
https://www.biorxiv.org/content/10.1101/2025.06.05.657370v1
#AIinBiology #Longevity #Reprogramming #AgingResearch #scGPT #FoundationModels
Сэм Альтман: эра сверхразума уже началась
Глава OpenAI заявил, что человечество перешло черту - эра искусственного сверхразума началась. "Мы прошли точку невозврата", - утверждает Альтман.
Он прогнозирует появление ИИ-агентов для реальной работы уже к 2026 году, систем с оригинальными открытиями - к 2027, а роботов для физических задач - к тому же периоду.
"ChatGPT уже мощнее любого человека в истории" - сотни миллионов полагаются на него ежедневно. Альтман видит ключевой момент в том, что ИИ помогает создавать более совершенный ИИ - рекурсивное самосовершенствование.
Целые классы профессий исчезнут, но мир станет намного богаче. Главный вызов - проблема выравнивания ценностей сверхразума с человеческими.
#Superintelligence #OpenAI #AGI
------
@tsingular
Среда нынче как пятница. :)
Держите в тему.
"Бородатые сайнтисты"
#Suno #сайнтисты #гимн
———
@tsingular
ChatGPT проиграл в шахматы консоли Atari 2600 1977 года
Инженер Citrix устроил матч между современной ИИ-моделью и 47-летней игровой консолью. Результат оказался неожиданным.
ChatGPT полтора часа "получал по шапке" от примитивного 8-битного движка Atari Chess на начальном уровне сложности. ИИ путал фигуры, терял их из виду и постоянно делал глупые ходы.
Особенно забавно, что ChatGPT жаловался на "слишком абстрактные" иконки фигур, но даже после перехода на стандартную нотацию играл не лучше.
Консоль Atari 2600 просчитывает всего 1-2 хода вперед, но этого хватило чтобы "сделать" продвинутую языковую модель.
Достаточно наглядный пример. Выкидываем GPT в мусорку, возвращаемся к ламповым скриптикам.
#ChatGPT #Atari #Chess
———
@tsingular
IBM строит квантовый компьютер с коррекцией ошибок к 2028 году
IBM анонсировала планы создания квантового компьютера Starling с реальной коррекцией ошибок - главной проблемой индустрии.
Машина будет состоять из 100 модулей в дата-центре в Нью-Йорке и получит 200 логических кубитов. Сможет выполнять 100 миллионов операций подряд против нынешних нескольких тысяч.
Главное отличие - диагностика ошибок в реальном времени через специальные чипы FPGA. Алгоритм IBM требует всего 12 физических кубитов на один логический против 100 у Google.
"Мы взломали код квантовой коррекции ошибок", - заявил вице-президент IBM. Но эксперты сомневаются, что этого хватит для практических задач - может потребоваться миллиард операций.
#QuantumComputing #IBM
———
@tsingular
Postman запускает Agent Mode - ИИ-агент для API разработки
Что умеет:
- автоматически отправляет запросы и исправляет ошибки
- пишет тесты на основе текстовых команд
- создает документацию и настраивает мониторинг
- интегрируется со всей экосистемой Postman
Все результаты работы агента сохраняются в workspace и доступны всей команде для повторного использования. Никаких дополнительных настроек или переделок.
ИИ встроен в ядро платформы и покрывает весь жизненный цикл API - от дизайна до тестирования.
Пока доступна только регистрация в лист ожидания.
так же Postman запустил конструктор ИИ-агентов
Postman представил новый инструмент для создания ИИ-агентов без кода. Платформа позволяет быстро строить агентов с готовыми шаблонами и интеграцией через API.
Основные возможности:
- Drag-and-drop интерфейс для создания агентов
- Готовые шаблоны для популярных сценариев
- Интеграция с внешними сервисами через API
- Тестирование и отладка агентов в реальном времени
Есть видеоуроки и примеры шаблонов API
#Postman
———
@tsingular
⚡️ Mistral выпустила ризонинг-модель Magistral.
Magistral — первая модель рассуждений от Mistral AI. Она сочетает глубокую логическую обработку с возможностью отслеживать каждый шаг её «мышления».
Модель получила поддержку 8 языков, включая русский и выпущена в 2 вариантах:
🟢опенсорсный Magistral Small с 24 млрд. параметров;
🟠корпоративный Magistral Medium.
Внутри Magistral работает в режиме рассуждений, разбивая задачи на цепочки логических шагов, а Flash Answers ускоряет вывод в 10 раз по сравнению с конкурентами. Для интеграции в рабочие процессы модель умеет взаимодействовать с внешними инструментами (API или базами данных).
В тестах Magistral Medium показал 73,6% точности на задачах AIME2024, демонстрируя силу в физических симуляциях и математических расчетах.
Для разработчиков доступны версии на Hugging Face, AWS и IBM WatsonX, а в будущем — на Azure и Google Cloud. Демо Magistral доступно в интерфейсе Le Chat или по API в La Plateforme.
📌Лицензирование: Apache 2.0 License.
🟡Статья
🟡Модель
🟡Техотчет
🟡Web Demo
@ai_machinelearning_big_data
#AI #ML #LLM #Magistral #MistralAI
iOS 26 убивает айфоны.
◦ В миг высаживает аккум и перегревает даже iPhone 15;
◦ Окирпичивает телефоны в редких случаях;
◦ На старых моделях вроде iPhone 12 ось жутко лагает;
◦ Приложения банков и Яндекс Go превращаются в тыкву;
◦ Стоковая клавиатура безбожно тупит;
◦ Проверка обновлений глючит;
◦ На русский ось переведена не полностью.