359493
Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml
🔥 Kling Omni (O1) только что вышел - и первые тесты впечатляют.
Это как nano-banana pro, только для видео: бери любой материал и превращай его во что угодно.
Модель:
- удаляет объекты,
- меняет стиль сцен,
- перерисовывает ролик целиком,
- и при этом держит персонажей одинаковыми в любых ракурсах.
OpenArt включили безлимит - можно спокойно экспериментировать.
Главное отличие: больше не нужно править каждый кадр вручную. Меняешь целое видео одним промптом — экономишь время и не тратишь кредиты на повторные генерации.
O1 ощущается как живой креативный напарник:
- удаляет объекты,
- меняет стиль сцен,
- перерисовывает ролик целиком,
- и при этом держит персонажей одинаковыми в любых ракурсах.
Новый стандарт AI-видео.
https://app.klingai.com/global/omni/new
@ai_machinelearning_big_data
#Kling #KlingO1 #KlingOmni #AIvideo #AIGeneration
🚀 GELab-Zero - первый полноценный open-source стек “Model + Infra” для GUI-агентов.
Это открытая альтернатива закрытым системам уровня GUI Agent MCP: готовая модель, готовая инфраструктура и новый бенчмарк, собранный под реальные задачи.
Что внутри:
• SOTA-модель 4B - лёгкая, быстрая, запускается локально.
• One-Click инфраструктура - без ADB и сложных зависимостей.
• AndroidDaily - новый бенчмарк, основанный на рабочих пользовательских сценариях.
Производительность:
• Лучшие результаты на открытых тестах - модель обходит гораздо более крупные системы вроде GUI-Owl-32B на ScreenSpot, AndroidWorld и OSWorld.
• 73.4% точности на AndroidDaily - существенно выше, чем UI-TARS-1.5 (47%), Gemini-2.5-pro-thinking (36.6%) и GPT-4o (19.6%).
Идея простая: скачивайте, запускайте локально, ломайте, улучшайте.
Открытый стек для GUI-агентов наконец доступен.
🟠HuggingFace: https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview
🟠GitHub: https://github.com/stepfun-ai/gelab-zero
🟠Blog: https://opengelab.github.io/index.html
@ai_machinelearning_big_data
#AI, #Agents, #GUIAgents, #GELabZero, #OpenSource, #MachineLearning, #DeepLearning
🤖 Unitree R1 и G1 демонстрируют свои навыки на одной сцене
Выбери своего БОЙЦА:
❤️ Новый, более доступный и компактный R1
или
🔥 Мощный и уже зарекомендовавший себя на рынке G1, который остаётся флагманом линейки.
@ai_machinelearning_big_data
#ai #robots
Как обеспечить себе успешное игровое будущее?
Стоимость привлечения пользователей растёт на 20–40% каждый год, и достичь точки прибыльности становится всё сложнее. Сегодня даже отличные игры часто не могут выйти в плюс: платформы забирают до 30% в виде комиссий.
Как в этом может помочь построение прямого канала взаимодействия с пользователем — разбираем в канале @d2cgamechangers D2C Game Changers: собираем лучшие практики, кейсы и проверенные решения.
💡 Джек Кларк, сооснователь Anthropic, о современном ИИ
«Мы похожи на детей в тёмной комнате.
А то, что мы замечаем в темноте, — это мощные и непредсказуемые ИИ-системы.
Кто-то утверждает, что ИИ - всего лишь инструмент,
просто куча одежды на стуле.
Но если убеждать себя, что “существо не настоящее”,
проигрыш неизбежен».
@ai_machinelearning_big_data
📌This Is How We Are Going to Build AGI: CAIA Google рассказал о состоянии ИИ.
Логан Килпатрик из команды DeepMind беседует с Кораем Кавукчуоглу, CTO DeepMind и по совместительству новым главным архитектором Google по искусственному интеллекту.
Корай Кавукчуоглу рассказал о своих взглядах на текущее состояние ИИ, архитектуру Gemini и стратегию Google по достижению AGI. Он считает, что это «новая эра», где технологии стремительно меняются, и что ближайшие 6 месяцев обещают быть такими же захватывающими, как и предыдущие.
Основные темы интервью:
🟡Успех Gemini 3 и подход к AGI
Недавний запуск Gemini 3 получился суперпозитивным. Но прогресс не замедляется, и Gemini 3, подобно 2.5, снова «отодвинула рубеж по ряду измерений». Центральная философия Google в том, что AGI будет «совместно создаваться с нашими клиентами». Это не чисто исследовательская работа, проводимая в изоляции, а совместное усилие с миром, требующее инженерного мышления.
🟡Новый взгляд на прогресс и бенчмарки
Несмотря на то, что модели Google достигают лидирующих позиций на бенчмарках, истинное мерило прогресса в реальном применении. Старые бенчмарки перестают определять текущий рубеж, и новая мера успеха — это предоставление большей ценности в реальном мире, где модели используют ученые, студенты, юристы и инженеры.
🟡Планы на будущее
Приоритеты для улучшения в будущих версиях Gemini Pro:
🟢Следование инструкциям: Модель должна уметь понимать и выполнять запрос пользователя, а не просто отвечать так, как считает нужным.
🟢Интернационализация: Google сосредоточен на языках, где исторически производительность была невысокой.
🟢Функциональные и инструментальные вызовы: Это критически важные технические области, поскольку они позволяют моделям естественно использовать существующие инструменты.
🟢Код и агентские действия : Код - это база для создания чего угодно в цифровом мире. Корай считает, что агентские действия и код — это наиболее перспективные области роста, в которых еще есть много возможностей для совершенствования.
🟡Интеграция с продуктами и инновации
Интеграция- важная тема для сбора фидбэка от пользователей, который необходим для понимания того, как нужно улучшать модели. Риск для Gemini заключается не в отсутствии масштабирования, а в исчерпании инноваций. Поэтому Google DeepMind и Google Research должны постоянно заниматься исследованиями, чтобы находить новые идеи, которые будут питать «двигатель ИИ» Google.
🟡Единство моделей и генеративные медиа
Генеративные медиа-модели сходятся с текстовыми моделями. Яркий пример - Nano Banana Pro, которая показала, как слияние понимания мира из текста с пониманием из изображений позволяет модели создавать более детализированные и концептуально связные изображения, например, инфографику на основе сложных документов.
Фоном идет история о личном пути Корая Кавукчуоглу : от исследователя Deep Learning в DeepMind в 2012 году до текущей руководящей роли.
🔜 Смотреть полное интервью на Youtube
@ai_machinelearning_big_data
#news #ai #ml
🔥 Наши любимые петы: собственный инструмент для передачи файлов по Сети
Когда-то интернет был другим. Возможно, более медленным и нестабильным, но куда более камерным и очаровательным. А его недостатки старались исправить разработчики-энтузиасты, которым было не всё равно.
👩⚕️ Александр Лукьянов, старший разработчик в Бригаде разработки функций и интеграций в Алисе и Умных устройствах, — один из таких первопроходцев. В 1996 году он начал работу над LFTP. Это прорывной для своего времени командно-строчный и скриптовый инструмент для передачи файлов по Сети.
🔶 Ссылка на гитхаб
Этим постом мы запускаем спецпроект «Наши любимые петы». В следующие недели мы продолжим рассказывать про личные проекты яндексоидов. Оставайтесь на связи!
🖥 Картина маслом - Nvidia продает свои лопаты работягам ⛏
@ai_machinelearning_big_data
📊 Google стала главным двигателем роста S&P 500 в 2025 году
Alphabet в одиночку дала 19.4% всего роста S&P 500, это около $1.3 трлн рыночной капитализации.
Nvidia добавила 16.0% еще $1.05 трлн, индекс теперь почти напрямую следует за AI гигантами.
Broadcom и Microsoft внесли 7.8% и 5.7%, а остальные компании из топ 10 еще 10.6%.
Итог: топ 10 компаний показывают 59.4% всего роста рынка тогда как остальные 490 лишь 40.6%.
S&P 500 все меньше отражает состояние экономики и все больше коррелирует с узким сегментом крупнейших AI корпораций.
https://x.com/KobeissiLetter/status/1993359777062436902
@ai_machinelearning_big_data
Новое семейство моделей от Яндекса Alice AI теперь доступно для бизнеса
✔️ Yandex B2B Tech открыла доступ к Alice AI — линейку генеративных моделей, которые лежат под капотом у Алисы. Первая модель, Alice AI LLM, уже доступна на платформе Yandex AI Studio и предназначена для корпоративных задач: анализа документов, работы с текстами, она также лучше поддерживает диалог и справляется с креативной генерацией.
По результатам тестов, Alice AI в 60% случаев показала более высокое качество ответов, чем DeepSeek V3.1 и Qwen3-235B. Модель прошла полный цикл обучения от претрейна до SFT. Благодаря оптимизированному под русский язык токенайзеру в один токен “помещается” 4-5 символов на кириллице, а в опенсорсных моделях в среднем – 2-3 символа. При равной тарификации стоимость работы с Alice AI LLM будет в 1,5-2 раза дешевле зарубежных.
@ai_machinelearning_big_data
#news #ai #ml
AI&ML в деле на AI DevTools Conf
4 декабря команда Cloud.ru проводит практическую конференцию — AI DevTools Conf.
В программе доклады о создании AI-агентов, защите AI-систем и работе с DevOps-агентом.
А тех, кто посетит конференцию офлайн ждут воркшопы, где вы научитесь:
😶🌫️внедрять AI-инструменты в процесс разработки
😶🌫️оценивать LLM-агентов
😶🌫️тестировать безопасность AI
😶🌫️и не только
✔️ OpenAI входит в сложный период, а Google стремительно усиливается
The Information опубликовала внутреннее письмо Сэма Альтмана, и его тон сильно отличается от привычного оптимизма OpenAI.
CEO прямо предупреждает команду: впереди могут быть серьёзные вызовы.
1. Google сделал резкий рывок
Альтман признаёт, что Google заметно ускорился в области ИИ.
Теперь OpenAI - не компания с комфортным отрывом от конкурентов, а участник гонки, которому снова нужно догонять.
2. Рост OpenAI может существенно замедлиться
По данным источников, к 2026 году рост выручки может уменьшится в разы.
Для компании, которая только что росла взрывными темпами, это серьёзный сигнал.
3. Внутри OPENAI ощущается напряжение
Атмосферу описывают как *«rough vibes»*: меньше уверенности в своих силах, больше осторожности.
Команда впервые за долгое время чувствует давление и неопределённость.
Фаза бурного роста заканчивается, начинается период конкуренции и стратегической выносливости.
OpenAI остаётся сильнейшим игроком, но теперь марафон важнее спринта.
https://www.theinformation.com/articles/openai-ceo-braces-possible-economic-headwinds-catching-resurgent-google
@ai_machinelearning_big_data
#AI #OpenAI #Google #TechNews
🚀 Маск: в будущем работать станет необязательно
Илон Маск на форуме U.S.– Saudi Investment Forum заявил, что через 10–20 лет работа может стать делом выбора.
По его мнению, тотальная автоматизация и распространение роботов приведут к миру, где дефицита больше нет, а деньги перестанут играть ключевую роль.
Понятно, что вопрос стоит не в том, наступит ли эпоха полной автоматизации, а в том, сколько времени на это уйдёт.
https://fortune.com/2025/11/20/elon-musk-tesla-ai-work-optional-money-irrelevant/
@ai_machinelearning_big_data
#ai #future #elonmusk
🚀 Облачный провайдер Cloud.ru запустил среду для работы с искусственным интеллектом Evolution AI Factory в коммерческую эксплуатацию
Теперь все сервисы предоставляются по доступным тарифам с гарантированным уровнем сервиса (SLA), круглосуточной поддержкой и возможностью масштабирования нагрузки.
🔥 Главное
• Средняя цена на доступ к открытым большим языковым моделям составит 35 рублей за входной и 70 за выходной миллион токенов.
• Пользователям Evolution AI Factory доступно 20+ опенсорс-моделей, включая GigaChat, Qwen, ChatGPT.
• AI Factory состоит из шести взаимосвязанных сервисов, необходимых для полного цикла работы с AI. Это сервис ML Inference, который позволяет быстро развернуть и модели из каталога Hugging Face или собственные модели. Также: Evolution Notebooks для работы и экспериментов с машинным обучением, запуска и тестирования ML-гипотез, ML Finetunung — для дообучения моделей под задачи бизнеса, RAG для повышения точности ответов моделей, Foundation Models с популярными LLM и AI Agents для создания агентов.
С запуском Evolution AI Factory компании получают не просто доступ к современным AI-инструментам, а возможность быстрее и понятнее превращать свои идеи в рабочие решения.
В МТС Live Холл вот-вот стартует финальный этап всероссийского чемпионата по программированию True Tech Champ. А пока участники готовятся программировать роботов и решать алгоритмические задачи, гости и зрители онлайн-трансляции слушают лекцию Тони Янга, директора по североамериканскому бизнесу Unitree Robotics.
Он выступает с докладом «Будущее человекоподобных роботов» и обсудит с участниками, как человекоподобные роботы помогут решить проблему нехватки рабочей силы.
Ссылка на трансляцию : https://truetechchamp.ru/guests
🚀 Релиз DeepSeek-V3.2 и DeepSeek-V3.2-Speciale - модели нового поколения, созданные в первую очередь для reasoning и работы в агентных системах.
Что нового:
- DeepSeek-V3.2 - официальный преемник V3.2-Exp. Доступна в приложении, на сайте и через API.
- DeepSeek-V3.2-Speciale - улучшенная версия с акцентом на продвинутое многошаговое рассуждение. Пока что работает только через API.
Обе модели делают упор на глубокие цепочки рассуждений и поведение, нацеленное на агентные сценарии: планирование, решение задач, сложные выводы и работу со структурированными данными.
🏆 Производительность
• V3.2 - баланс скорости и качества, уровень примерно GPT-5
• V3.2-Speciale - топовый reasoning, конкурирует с Gemini-3.0-Pro.
• Speciale - лидер на IMO, CMO, ICPC.
🤖 Новый подход к обучению агентов
• Синтезированы большие тренировочные данные для 1800+ сред и 85k сложных инструкций.
• V3.2 - первая модель DeepSeek, у которой мышление встроено прямо в tool-use.
💻 API
• V3.2 использует тот же интерфейс, что V3.2-Exp.
• Speciale доступна через временный endpoint, работать будет до 15 декабря 2025.
📦 DeepSeek-V3.2 Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2
📦 DeepSeek-V3.2-Speciale Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
📄 Tech report: https://huggingface.co/deepseek-ai/DeepSeek-V3.2/resolve/main/assets/paper.pdf
@ai_machinelearning_big_data
#deepseek, #deepseekv3, #ai, #нейросети, #искусственныйинтеллект, #llm
⚡️ Как линейная регрессия помогает решать задачи в AI и аналитике
Недавно увидел крутой разбор линейной регрессии — и наконец понял, что она нужна не только тем тем, кто работает с большими данными. Метод применяется в реально жизненных кейсах. Например, с ним можно:
✔️ прогнозировать спрос и цены на продукты
✔️ измерять эффект от запуска фич
✔️ быстро собирать базовые ML-модели
Эти карточки я взял в канале «Зачем мне эта математика». Там такие темы разбирают наглядно: показывают графики, раскладывают формулы по шагам и связывают всё это с кейсами из аналитики и разработки.
А ещё там рассказывают много неожиданных фактов и каждую неделю публикуют задачи. В комментах можно обсудить вопросы и задать вопросы редакции.
Так что если хотите влюбиться в математику и понять, как устроены технологии вокруг нас — подписывайтесь и следите.
Реклама. ООО «ФРОМ СКРЭТЧ», ИНН 9724205560, erid: 2Vtzqxf17nH
✔️ ШАД Яндекса начал обучать ученых.
В Школе анализа данных, где готовят специалистов по ИИ, началось обучение по применению ИИ в естественно-научных исследованиях. На программу подали заявки ученые из 37 регионов - больше всего запросов получили от экспертов в областях физики, медицины и химии. В итоге зачислили 50 молодых исследователей: от магистрантов до кандидатов наук из Москвы, Петербурга, Уфы, Иркутска, Владивостока и Екатеринбурга.
Участники изучают основы ИИ и сразу применяют инструменты в своих задачах. С каждой командой работает эксперт ШАДа: помогает выбрать методы и спланировать эксперимент. Если проекту нужны тяжелые вычисления, подключаются мощности Yandex Cloud.
✔️ ИИ научили считывать активность скрытых мышц кисти по видео.
Команда из Institute of Science Tokyo анонсировала фреймворк PianoKPM Net, способный с высокой точностью определять активность мышц рук без использования нательных датчиков. Обычно для этого требуется инвазивная и дорогая электромиография, но новая архитектура реконструирует паттерны мышечных сокращений, анализируя только видеозапись.
В основе системы - уникальный датасет, собранный на базе 12 часов игры профессиональных пианистов, где визуальные данные синхронизированы с реальными сигналами мышц. Технология превращает обычную камеру в диагностический инструмент, что важно для реабилитационной медицины, спортивной аналитики и создания продвинутых интерфейсов «человек-компьютер». Авторы планируют выложить датасет и модель в открытый доступ.
techxplore.com
✔️ ИИ-проект Джеффа Безоса купил стартап General Agents.
Project Prometheus поглотил разработчика агентного ИИ General Agents. Сделка прошла в закрытом режиме еще летом и сопровождалась переходом команды инженеров из DeepMind и Tesla в структуру Prometheus. Цель Prometheus: создание ИИ-систем для поддержки сложных производств автомобилестроения и космической отрасли.
Главный актив General Agents - технология Ace для автономного управления интерфейсами и приложениями. Хотя изначально Ace создавался для автоматизации рутинны на ПК, в рамках Prometheus эти наработки, судя по всему, будут масштабированы для индустриальных сценариев.
wired.com
✔️ OpenAI и Google резко ограничили лимиты в Sora и Nano Banana Pro.
Глава направления Sora в OpenAI Билл Пиблз сообщил, что бесплатные аккаунты теперь ограничены всего 6 видеогенерациями в сутки, так как текущие графические процессоры буквально плавятся от запросов. Это ограничение не выглядит временным: компания прямо предлагает докупать генерации по мере необходимости, хотя условия для подписчиков ChatGPT Plus и Pro пока остались прежними.
Google приняла аналогичные меры, урезав бесплатный доступ к инструменту Nano Banana Pro до 2 изображений в день. Техгигант предупредил, что лимиты могут меняться динамически и без уведомлений. Кроме того, под ограничения попал и доступ бесплатных пользователей к модели Gemini 3 Pro.
theverge.com
✔️ Perplexity добавила функцию долгосрочной памяти.
ИИ-поисковик получил функцию "persistent memory", которая позволяет запоминать предпочтения, интересы и детали предыдущих диалогов. Теперь система автоматически создает "постоянный контекст" пользователя, а ответы становятся персонализированными и требуют меньше уточняющих запросов.
Perplexity извлекает факты из хранилища памяти и напрямую использует их при формировании ответа. Этот контекстный слой работает поверх любой выбранной модели без потери накопленных знаний о пользователе. Функция полностью управляема: сбор данных можно отключить в настройках, а в режиме инкогнито история не сохраняется.
perplexity.ai
@ai_machinelearning_big_data
#news #ai #ml
⏬ Привет, это Yandex for Analytics
Предлагаем размяться и проверить свои навыки. Ответы есть, но подглядывать во время решения — неспортивно ⬇️
🔵 Задача 1. Вспоминаем теорию вероятностей
🔵 Задача 2. Теорема Байеса
🔵 Задача 3. Базовая база теории игр
🔵 Задача 4. Тренируем SQL
🔵 Задача 5. Честная математическая статистика
🔵 Задача 6. Что-то на бизнесовом
💠 Скоро вернёмся с новыми задачами. А пока делитесь своими решениями в комментариях!
Подписывайтесь:
💬 @Yandex4Analytics
10 декабря — код, архитектура, AI в деле
Сбер открывает двери в мир AI: 10 декабря — в Москве и онлайн.
Что вас ждет?
⬩На сцене — доклады о развитии нейросетевых моделей GigaChat и Kandinsky, о ключевых этапах их разработки, практических достижениях и дальнейших перспективах развития;
⬩Гига Город — демо-стенды, постеры, инженерные споры, вопросы и тестирование архитектур;
⬩Воркшопы — повторяем решения инженеров, разбираем пайплайны и инструменты;
⬩Карьерный блок — разговоры с командами и открытые роли в AI-направлениях Сбера.
Зачем идти?
Чтобы увидеть, как строят AI-системы, задать вопросы инженерам и понять, куда движется AI в Сбере — и найти свое место в этом движении.
Регистрируйтесь и проверьте AI-технологии в деле.
Реклама. ПАО Сбербанк. ИНН 7707083893
✔️ INTELLECT-3 - новая мощная открытая модель от Prime Intellect
Prime Intellect выкатили INTELLECT-3 - 106B Mixture-of-Experts модель, обученнfz на GLM-4.5 Air Base с двумя этапами: SFT и масштабным RL-дообучением.
Это первая модель такого масштаба, где асинхронный RL - не эксперимент, а основа обучения. В результате модель демонстрирует сильный перформанс в математике, коде и reasoning.
Фокус модели - долгие цепочки действий и агентные задачи, а не просто генерация текста.
Главное:
- Модель показывает топ-результаты для своего размера в математике, коде и reasoning.
- Обучение шло на 512×H200 в течение ~2 месяцев.
- Использован собственный стек: PRIME-RL, Verifiers, Environments Hub и sandbox-инфра.
- Всё открыто: код, среды, инструменты.
🟠Technical Report: https://storage.googleapis.com/intellect-3-paper/INTELLECT_3_Technical_Report.pdf
🟠Hugging Face: https://huggingface.co/PrimeIntellect/INTELLECT-3
🟠PRIME-RL: https://github.com/PrimeIntellect-ai/prime-rl
🟠Verifiers: https://github.com/PrimeIntellect-ai/verifiers
🟠Environments Hub: https://hub.primeintellect.ai
@ai_machinelearning_big_data
#ai #intellect3 #primeintellect #glm45
🍌 Awesome Nano Banana - лучшие промпты, стили, приёмы и полезные материалы для визуальных экспериментов.
Всё собрано в одном репозиториит и аккуратно структурировано.
Что внутри
• промпты, которые реально дают сильные и выразительные результаты
• коллекция визуальных стилей для разных задач
• примеры, разборы и ресурсы, помогающие глубже понять механику Nano Banana
• удобный набор ссылок, если хочешь расширять свой набор техник
https://github.com/ZeroLu/awesome-nanobanana-pro
@ai_machinelearning_big_data
⚡️ NVIDIA выложила DeepSeek V3.1 FP4 на Hugging Face
Это квантованная версия DeepSeek V3.1, которая дает заметную экономию памяти и ускоряет работу при использовании TensorRT LLM.
При этом модель сохраняет высокое качество генерации текста.
https://huggingface.co/nvidia/DeepSeek-V3.1-NVFP4
@ai_machinelearning_big_data
✔️ США запускают национальный проект для искусственного интеллекта.
Президент США подписал указ о создании единой государственной ИИ-платформы. Проект, реализация которого поручена Министерству энергетики, должен радикально ускорить научные исследования и сократить циклы открытий в биотехнологиях и энергетике с нескольких лет до дней.
Инициатива мобилизует инфраструктуру 17 федеральных исследовательских центров. Их суперкомпьютеры и накопленные за десятилетия массивы научных данных будут использованы для обучения специализированных моделей. Новая платформа позволит ИИ-агентам автономно планировать эксперименты, проверять гипотезы и генерировать прогнозы в области химии, биологии и инженерии.
whitehouse.gov
✔️ OpenAI объединила голосовой и текстовый режимы в ChatGPT.
ChatGPT получил обновление, которое устраняет барьер между способами ввода: голосовой чат теперь интегрирован непосредственно в основное окно переписки. Это позволяет пользователям бесшовно переключаться между речью и набором текста, не переходя в отдельный режим.
Теперь во время голосовой сессии можно свободно просматривать историю сообщений, сгенерированные изображения или карты, а ответы ассистента автоматически дублируются в текстовом виде.
Функция уже доступна в мобильных приложениях и веб-версии. Для тех, кто хочет пользоваться голосовым интерфейсом отдельно, OpenAI оставила возможность вернуть его через настройки в разделе Voice Mode.
OpenAi в сети Х
✔️ Microsoft выпустила модель для управления компьютером.
Fara-7B — компактная агентная модель от Microsoft Research на базе Qwen2.5-VL для автономной работы с интерфейсами. Модель умеет анализировать скриншоты, генерировать команды для мыши и клавиатуры, предсказывая точные пиксельные координаты.
В бенчмарках Fara-7B обошла существующие решения и выполняет задачи в разы дешевле крупных моделей - средняя стоимость сессии составляет меньше 3-х центов. Веса модели опубликованы на Hugging Face под лицензией MIT.
microsoft.com
✔️ В Гарварде разработали модель для диагностики редких генетических заболеваний.
Гарвардская медшкола представила popEVE - нейросеть, способную с высокой точностью выявлять патогенные мутации в геноме для решения проблем диагностики редких наследственных болезней, причины которых врачи зачастую не могут найти годами.
PopEVE объединяет генеративный ИИ с языковой моделью для белков и статистикой человеческих популяций. Система умеет корректно сравнивать опасность мутаций, расположенных в абсолютно разных генах, и выдавать унифицированный клинический рейтинг риска. Предыдущие модели не справлялись с такой кросс-генной калибровкой.
Эффективность системы подтвердили на выборке из 30 000 пациентов. Модель успешно определила причину болезни в трети случаев и попутно обнаружила 123 гена, ранее не связывавшихся с развитием патологий.
harvard.edu
✔️ Grok 5 сразится с чемпионами League of Legends в 2026 году.
Илон Маск анонсировал амбициозный эксперимент: в 2026 году следующая версия модели xAI бросит вызов сильнейшим киберспортивным командам мира. Матч планируется не просто как шоу, а как критический тест на пути к AGI.
Для чистоты эксперимента инженеры введут жесткие технические ограничения, уравнивающие шансы. Модель не будет подключаться к API игры — она должна «смотреть» на монитор через камеру с имитацией обычного человеческого зрения. Скорость реакции и частоту кликов также лимитируют до физических возможностей человека. Предполагается, что Grok 5 освоит сложные механики MOBA-стратегии с нуля, опираясь только на чтение документации и самостоятельные эксперименты в ходе игры.
Elon Musk в сети Х
@ai_machinelearning_big_data
#news #ai #ml
⚡️ HunyuanOCR: открытая OCR-модель, которая рвёт бенчмарки при размере всего 1B
Tencent выложила в open-source новую модель HunyuanOCR.
Это компактная, быстрая и полностью готовая end-to-end система для OCR, построенная на мультимодальной архитектуре Hunyuan.
Главное - при размере только 1 миллиард параметров она показывает результаты уровня крупных моделей и стоит в разы дешевле в запуске.
⚡ Топ по бенчмаркам
• 860 на OCRBench среди всех моделей до 3B
• 94.1 на OmniDocBench - лучший результат в задачах распознованяисложных документов
🌐 Что умеет HunyuanOCR
Модель закрывает практически все типы OCR задач
• текст на улицах, витринах, табличках
• рукописный текст и художественные шрифты
• сложные документы: таблицы, формулы, встроенный HTML и LaTeX
• субтитры в видео
• перевод текста на фото end-to-end сразу на 14 языков
Это не каскадный пайплайн, а единое решение
Один запрос и одно инференс-прогон дают готовый результат.
Это быстрее, надёжнее и удобнее, чем традиционные OCR-цепочки.
📌 Project Page
web: https://hunyuan.tencent.com/vision/zh?tabIndex=0
mobile: https://hunyuan.tencent.com/open_source_mobile?tab=vision&tabIndex=0
🔗 GitHub
https://github.com/Tencent-Hunyuan/HunyuanOCR
🤗 Hugging Face
https://huggingface.co/tencent/HunyuanOCR
📄 Technical Report
https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCR_Technical_Report.pdf
@ai_machinelearning_big_data
#HunyuanOCR #TencentAI #OCR #VisionAI #DeepLearning #Multimodal #AIModels #OpenSourceAI #ComputerVision #DocumentAI
⚡️ Claude Opus 4.5.
Anthropic выпустила Claude Opus 4.5, которую назвала «лучшей в мире».
Модель по тестам выбивает топовые результаты в программировании и работе с агентами. Говорят, что она даже превзошла всех кандидатов-людей на внутреннем тесте.
Модель подешевела. Цена за 1 млн. токенов теперь составляет $5 на вход и $25 на выход.
Для разработчиков добавили новый параметр (low, high и medium), позволяющий балансировать между скоростью ответа и качеством генерации.
@ai_machinelearning_big_data
#news #ai #ml
⚡️ Nano Banana Pro в LMArena.
Еще одно место, где можно бесплатно попробовать топовую модель.
LMArena добавила в список моделей Nano Banana Pro, у них она называется gemini-3-pro-image-review(nano-banana-pro) .
Выбор модели доступен в режимах Direct Chat (генерация на одной выбранной модели) и Side-by-Side (генерация на 2-х выбранных моделях для сравнения результата).
Поддерживается как text-to-image, так и загрузка рефересных картинок.
Единственный минус - нет выбора разрешения (1К, 2K или 4K) и соотношения сторон.
Про лимиты на количество запусков информации нет, запускайте, пока запускается.
🔜 Пробуем лучшую модель тут
@ai_machinelearning_big_data
GPT-5 Pro смогла решить задачу о симметрии чёрной дыры, с которой не справились даже те, кто придумал эту задачу.
После короткого «разогрева» модель вывела правильную структуру симметрий - и физик, наблюдавший за процессом, был в шоке.
Он понял, что ИИ показывает уровень понимания, который раньше даже трудно было представить:
модель не угадывала, не перебирала случайно, а пришла к решению так, как это сделал бы специалист по теории гравитации.
Когда ИИ решает задачу, над которой мучаются эксперты - это не просто прогресс в моделях.
Это момент, когда становится ясно: научные границы начинают реально сдвигаться.
@ai_machinelearning_big_data
#chatgpt #ai
💡Внедрение ИИ полностью меняет разработку кода — Т-Технологии представили свою экосистему AI for SDLC
Главное:
• уже 30% всего кода в компании генерирует ИИ. Это не пилот и не эксперимент — это рабочий масштаб
• команда запустила новый сценарий агентского режима — end-to-end генерацию кода. Агент сам понимает задачу, проходит весь цикл, работает со структурой репозитория, создает файлы, запускает утилиты и снимает рутину с инженера
• прогнозируется сокращение time-to-market на 20–40%, а новые модели будут специально обучены под агентские сценарии
• на AIJ объявили, что открывается ранний доступ к агентскому режиму разработчиков
Внутри экосистемы:
•единая AI-архитектура, которая покрывает все этапы SDLC — от анализа и разработки до тестирования, внедрения и SR
•набор специализированных ИИ-решений: от AI Search и генерации SQL до анализа изменений MR, генерации тестов и мониторинга аномалий
•полноценная интеграция в VS Code
Благодаря такому внедрению ИИ в процессы, разработчик теперь фокусируется на важных этапах, а рутинную работу выполняют агенты.
@ai_machinelearning_big_data
#news #ai #ml
Не кодь — вайбкодь. Бесплатно 🚀
Сбер представил бесплатный агентный режим GigaCode — нового цифровой разработчика, который берет на себя рутину, чтобы вы могли сосредоточиться на крутых задачах!
Что умеет GigaCode в агентном режиме?
⏩Сам находит и открывает нужные файлы
⏩Вносит изменения в код, запускает тесты, собирает проекты и оформляет коммиты в Git
⏩Работает в вашей любимой среде: JetBrains IDE, GigaIDE Desktop, а скоро еще и в VS Code
Плюс, в GigaCode появилась новая модель автодополнения кода — GigaCode Inline 4.0. Она мгновенно предлагает нужные фрагменты кода для Python, Java, JavaScript и других языков. Подсказки стали еще точнее, а работа с контекстом — еще лучше.
🖱 Хотите ускорить разработку? Обновленный GigaCode уже доступен на GitVerse.
Начать вайбкодить — по ссылке