Залипли и встали намертво, но хотите вырваться? Теория Каст и Ролей и прочее.
Спутниковый снимок зоны, где строят один из нескольких датацентров Stargate.
Футбольное поле справа сверху для масштаба. Снизу будет построено ещё несколько «иксов».
Илон Маск: "Если мы решим проблему долголетия, власть навсегда останется в руках тех, кто уже у власти. Смерть играет важную роль.
Я считаю, что людей — как и большинство существ — можно было бы эволюционно адаптировать к гораздо более долгой жизни. Но со временем эволюция пришла к выводу, что конечность жизни — это благо. Смерть приносит обновление.
Думаю, стоит осторожно относиться к идее бессмертия, потому что общество в таком случае закоснело бы, и люди у власти остались бы у власти навсегда». Интервью с Джорданом Питерсоном, 22 июля 2024 года.
💯💯💯💯💯💯💯!!!
#новости 1. США и Катар подписывают крупные экономические соглашения в рамках обязательств на сумму 1,2 трлн долларов. (С СА уже подписались на 600 млрд.)
2. Директор по экономике Белого дома Кевин Хассетт только что объявил, что у торговой команды на столе 20-25 новых торговых сделок.
Похоже, что Китай был большой костяшкой домино, которая должна была упасть, и теперь остальной мир делает все возможное, чтобы заключить собственную сделку.
3. Невероятно. Роберт Кеннеди-младший заявляет, что единственная причина, по которой до сих пор не найдено лекарство от болезни Альцгеймера — это коррупция в Национальном институте здоровья США (NIH):
«В течение 20 лет из-за тотальной коррупции и мошенничества все исследования болезни Альцгеймера велись в рамках одной-единственной гипотезы, а все альтернативные направления подавлялись.
Сегодня мы уже должны были бы иметь лекарство от Альцгеймера. Единственная причина, по которой у нас его нет, — это коррупция в NIH. Но мы добьёмся его в ближайшее время.»
4. Да, Microsoft уволила 6 000 сотрудников, но одновременно ввела жёсткую новую кадровую политику:
• Двухлетний бан на повторный найм для тех, кого уволили по причине низкой продуктивности.
• Новый показатель “good attrition” — то есть компания теперь отслеживает, рады ли они, что вы ушли.
• И только 5 дней на выбор:
– либо 16 недель выходного пособия,
– либо программа улучшения продуктивности — без выходного, если не справитесь.
Это почти копия модели Amazon с метрикой “unregretted attrition” — когда увольнение считается успешным, если о нём не жалеют. Это уже не просто оптимизация. Это — новая эпоха безжалостного управления эффективностью в Big Tech.
5. ДЖЕНСЕН ХУАН: ГУМАНОИДНЫЕ РОБОТЫ — ЭТО ИНДУСТРИЯ НА 50 ТРИЛЛИОНОВ ДОЛЛАРОВ
"В мире не хватает рабочих рук, рождаемость снижается, поэтому миру нужно много рабочих. Первым вариантом использования человекоподобных роботов станет производство. Робототехника — один из лучших способов для нас дополнить все это".
6. Один из разработчиков, благодаря которому TypeScript стал работать в 10 раз быстрее, — только что был уволен Microsoft. И это лишь одна из множества подобных историй: инженеры, которые выкладывались по полной, создавали революционные фичи, улучшали опыт миллионов разработчиков — и всё равно остались без работы.
На этой неделе Microsoft уволила около 6 000 сотрудников — примерно 3% от всей глобальной команды. Не потому, что они плохо работали. Не потому, что не приносили пользы.
А потому, что ИИ стал “достаточно хорошим”, чтобы оправдать массовые замены за одну ночь.
Вывод? Горькое напоминание: неважно, насколько ты усерден и сколько пользы приносишь — компании всегда сделают то, что выгоднее для бизнеса.
Так что делайте и вы то, что выгодно для вас:
• стройте сеть контактов,
• держите альтернативы открытыми,
• берегите внутренний ресурс.
Лояльность — это благородно. Но самосохранение — не менее важно. Никто не позаботится о вашей карьере лучше вас самих.
7. БУМ! Даже CNN признаёт, что инфляция сейчас на самом низком уровне с 2021 года. Трамп обещал снизить инфляцию — и СДЕРЖАЛ СВОЁ ОБЕЩАНИЕ!
8. "Люди старшего возраста используют ChatGPT как замену Google. Люди в возрасте 20–30 лет используют его как жизненного консультанта. Люди в колледже используют его как операционную систему." Альтман.
9. Главный научный сотрудник Google, Джефф Дин: «Уже в течение года у нас будут ИИ-системы, работающие на уровне младших инженеров.» https://x.com/slow_developer/status/1922061725974622339
Все новости из Твиттера, подписывайтесь, читайте сами. В ролике все титры и перевод by CapCut (кому не нравится - слушайте речь😍🤣)
Начинаете переживать, что ИИ заберет вашу работу? Не сомневайтесь - заберет. Об этом переживать не надо, это на 100% случится. Начните хотя бы начинать учиться, чтобы прокачать себя в 100 раз за пару часов. Тогда ИИ заберет у вас работу не так быстро. См. бесплатный курс - https://alexeykrol.com/courses/ai_intro/ - боитесь и сомневаетесь? Да мне насрать. 🤣
Кто-то предложил в электрики и сантехники пойти? Да неужели?
Читать полностью…👋 Audible запускает полную AI-платформу для создания аудиокниг — от перевода до озвучки
Компания Audible объявила, что будет предлагать издателям полный цикл производства аудиокниг с помощью искусственного интеллекта, включая перевод и озвучивание. Audible пояснила, что будет сотрудничать с издательствами на всех этапах создания аудиокниг с использованием ИИ.
Компания заявила, что объединит свой опыт в производстве аудиоконтента с технологиями ИИ от Amazon. В ближайшие месяцы издатели смогут выбрать один из двух путей: полностью передать производство Audible — от загрузки текста до готовой аудиокниги — или воспользоваться самообслуживанием, при котором издатель сам управляет процессом, используя те же технологии.
Издатели смогут выбрать из более чем 100 AI-голосов на английском, испанском, французском и итальянском языках, с различными акцентами и диалектами. Также будут доступны улучшения голосов по мере развития технологии.
Генеральный директор Audible Боб Карриган сказал:
«Audible считает, что ИИ открывает грандиозные возможности для расширения доступности аудиокниг. Наша цель — предложить слушателям каждую книгу на любом языке, продолжая при этом инвестировать в премиум-контент. Это позволит нам донести больше историй до новой аудитории и сделать доступными книги, которые иначе никогда бы не были услышаны».
Кроме производства, Audible начнёт тестирование перевода аудиокниг — с запуском позже в этом году. Первыми языками станут английский, испанский, французский, итальянский и немецкий.
При этом издатели смогут заказать проверку перевода профессиональными лингвистами для обеспечения точности и культурной адекватности, а также самостоятельно просматривать и редактировать переводы.
Будут доступны два формата перевода:
1. Текст-в-текст — перевод рукописи с последующей AI- или профессиональной озвучкой;
2. Речь-в-речь — перевод с сохранением голоса и интонаций оригинального чтеца.
Audible подчёркивает, что будет работать в тесном сотрудничестве с авторами, чтецами и издателями, чтобы новые технологии соответствовали их творческим и бизнес-задачам, и при этом сохраняли качество, ожидаемое слушателями. В дальнейшем планируется расширение языков, акцентов и уникальных голосов для глобальной аудитории.
После анонса один из издателей аудиокниг сказал изданию The Bookseller:
«Маркировка будет крайне важна, иначе слушателям будет сложно отличить ИИ от человека. Неясно, можно ли распространять AI-озвучку через других ритейлеров, но возможности перевода — это действительно новая граница для аудиоформата».
Он также предупредил, что издатели будут опасаться “перенасыщения рынка продуктом более низкого качества”, что может обесценить аудиокнигу в глазах потребителей.
Издатели, заинтересованные в AI-озвучке и переводах, могут связаться со своими представителями Audible.
thebookseller.com
Отзыв: "Что мне дал курс? - я работала всю жизнь и в hr-кадры-рекрутинг и там всегда есть, что консолидировать, анализировать, делать таблицы. Была внутренняя система учета всего-всего и там куча возможностей, достаточно багов (-было, верю, что сейчас у них все намного круче), сотрудничала с коллегами-программистами, которые работали именно над разработкой внутреннего портала.
Это я к чему - что так сложилась жизнь, что работа прекратилась и я потерялась. Да, у меня все хорошо, учу языки, забочусь о доме и муже, помогаю мужу в семейном деле, но я не прекращала что-то искать. А теперь меня снова увлекло и я хочу сделать что-то полезное для семейного дела. Это, как глоток воздуха. Плюс - мне нравится понимать и запоминать новую терминологию. Этого у вас валом. Именно это и изменилось. Возможности - ну сайт то почти готов! Есть проект в GPT Plus.
Я попросила его быть дотошным в мелочах и видеть на 5 шагов вперед, как я люблю. Так он и пишет теперь "как ты любишь - стратегия на перспективу* :) Задаю ему много вопросов, собираем с ним ответы все в один файл-индекс и потом убеждаюсь, что он его читает. Итерация - это прям мое, умею держать фокус, но иногда записываю, если мыслей много и они спешат :). Мы с ним уже проделали одну большую работу - контракт для аренды туристического жилья с учетом местных законов. Это вы меня научили!!! Спасибо вам, Алексей, за то, что мне интересно и я хочу продолжать.
Вот... дочитала до конца и следующий шаг - покупка курса. Даже, если у меня не будет идеи или что-то не получится. Я хочу быть в курсе. Меня ваш курс очень зацепил и напомнил фразу "в начале было слово....". И теперь мы программируем словами - промптами. Это не может быть новой эпохой человечества. Автор: Светлана Пара слов о себе: многолетний опыт рекрутинг, hr-back office. Email: (email blank) Рейтинг: 5 звёзд"
Курс. Бесплатно: https://alexeykrol.com/courses/ai_intro/
Опытные разработчики и специалисты радостно говорят: "Я настолько крутой, что меня не уволят." Ок, ну почитайте это:
"После 18 лет работы в Microsoft, из которых около десяти лет я работал над TypeScript, меня, к сожалению, уволили в ходе последнего раунда сокращений. Мне нужно несколько дней, чтобы все обдумать, прежде чем я начну искать работу. Спасибо всем, кто был частью моего пути до сих пор."
Конечно, они скажут, что этот было так себе. В следующих постах, разработчики поймут, что именно они БОЛЬШЕ всего в зоне риска.
https://x.com/sequoia/status/1922388291992559887?s=52
Читать полностью…Как все настроить? Представим, что ты — волшебник, а твой компьютер — волшебная книга. Сейчас мы настроим заклинание, чтобы твоя камера «смотрела», «понимала», что видит, и «рассказывала» тебе об этом.
Вот как это работает и как всё подключить, очень просто, шаг за шагом:
🔧 Что это вообще?
1. Веб-камера — это как глаз.
2. SmolVLM — это мозг, который смотрит на изображение и говорит, что он видит.
3. llama.cpp сервер — это помощник, который умеет быстро думать с помощью искусственного интеллекта.
4. @huggingface — это как магазин с мозгами и знаниями для таких помощников.
5. Всё это запускается на твоём MacBook, без интернета. Только твой компьютер и магия!
🪄 Как всё включить (простыми словами):
Шаг 1: Установи “волшебные инструменты”
Скачай и установи:
• Homebrew — это как магазинчик для программ.
👉 В терминале:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
• Python и Git через Homebrew:
brew install python git
Шаг 2: Установи llama.cpp
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make
Это создаёт локальный сервер с искусственным интеллектом.
Шаг 3: Скачай модель (мозг)
Зайди на сайт huggingface.co, найди модель типа SmolVLM или llama 2 в .gguf формате и скачай её.
Положи её в папку llama.cpp/models/.
Шаг 4: Запусти сервер
./server -m models/тво_модель.gguf
Шаг 5: Запусти веб-камеру + SmolVLM
Скачай SmolVLM демо и запусти его. Там уже есть код, который открывает камеру и посылает картинку в модель.
Примерно так (если использовать Python):
pip install opencv-python transformers
python camera_demo.py
🧠 Что будет происходить:
• Камера делает снимок.
• AI смотрит на него и говорит: «Я вижу: котёнка, лежащего на подушке».
• Ты видишь это в тексте прямо на экране.
Вот простой скрипт на Python, который использует камеру и отправляет изображение в модель для описания. Мы используем opencv для камеры и библиотеку transformers от HuggingFace. В этом примере мы подгружаем SmolVLM, который может описывать, что он «видит» на картинке.
✅ Что нужно установить заранее:
pip install opencv-python transformers torch torchvision
📸 Скрипт: camera_smolvlm_demo.py
import cv2
import torch
from transformers import AutoProcessor, AutoModelForVision2Seq
# Загружаем модель и процессор
processor = AutoProcessor.from_pretrained("microsoft/speecht5_vl")
model = AutoModelForVision2Seq.from_pretrained("microsoft/speecht5_vl")
# Подключаем камеру (0 — это встроенная)
cap = cv2.VideoCapture(0)
print("Нажми Q, чтобы выйти")
while True:
ret, frame = cap.read()
if not ret:
print("Камера не работает")
break
# Показываем изображение
cv2.imshow('Webcam', frame)
# Каждые N кадров или по нажатию анализировать изображение
key = cv2.waitKey(1)
if key == ord(' '): # пробел — анализ
print("⚙ Анализирую изображение...")
# Преобразуем изображение для модели
image_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
inputs = processor(images=image_rgb, return_tensors="pt")
with torch.no_grad():
output = model.generate(**inputs)
description = processor.decode(output[0], skip_special_tokens=True)
print("🧠 Модель говорит:", description)
if key == ord('q'):
break
cap.release()
cv2.destroyAllWindows()
🧪 Как использовать:
1. Запусти скрипт:
python camera_smolvlm_demo.py
2. Откроется окно с камерой.
3. Нажми пробел, чтобы AI описал изображение.
4. Нажми Q, чтобы выйти.
Если скрипт с первого раза не пойдет, используйте GPT-o4-mini-high - она отлично шарит в коде.
Плохие новости: 1) Microsoft уволил 7,000 сотрудников, потому что «ИИ делает их работу лучше». Учитывая что средняя з/п около 200к в год, это почти $1,5 ярда сейвингов.
2) OpenAI опубликовал бенчмарк для моделей в здравоохранении. Лучшие модели набирают 0,5-0,6, а врачи в среднем около 0,2 (график в статье). 90% враче на выход по любе в течении 5-7 лет.
Некоторые пишут, что их это расстраивает. Либо они вообще не понимают что происходит, либо у них какой-то экзистенциальный эмо-кризис. Пройдёт.
Утащил у Степана: /channel/cryptoEssay/2370
На какой платформе лучше всего собирать ИИ Агентов? Из того, на что стоит тратить время на данный момент - Make, Zapier, n8n при этом они одинаковы, просто в Zapier 7000 интеграций, в Make и n8n около 1700. В этом ролике показано, что разницы нет вообще.
Начинать проще с Make, он дешевле, но потом все зависит от нагрузки. Все они нативно интегрированы со всеми популярными ИИ. Плюс на Youtube немерянно видео, в которых можно посмотреть основы.
Начинать с n8n не рекомендую. Это система больше нравится прогерам не потому что n8n лучше, а потому что прогеры любят упарываться по всяким таким цацкам.
Если вы про бизнес и жизнь, то используйте chatGPT, делайте кастомные GPT под свои уникальные задачи или используйте Make, Zapier для создания сложных Агентов, которые автономны и умеют разбираться с неопределенностью.
Вчера я пол-дня убил на то, чтобы заставить chatGPT/Manus разворачивать сценарий в Make только на основании диалога с пользователем. Это возможно, при этом и для Make, и для Zapier, и для n8n и для чего угодно, потому что все эти сценарии в конечном итоге просто JSON файлы - это такой язык, который понимают и люди и сервисы в интернете. При этом довольно не сложно построить конвертер сценариев. Только зачем?🤣
Все это не требует никакого программировния, можно начинать с 0, посмотреть пару видео и уже чего-то начнете лепить. Зачем? Потому что это круто изменит вашу жизнь РЕАЛЬНО. Впрочем, если кто сидит под камнем и не верит в прогресс - наплевать - пусть сидят и квакают!
OpenAI представил бенчмарк оценки AI моделей в медицине
https://openai.com/index/healthbench/
- Создан совместно с 262 врачами из 60 стран, владеющими 49 языками и 26 специальностями.
- Содержит 5 000 реалистичных мультиязычных диалогов «пользователь ↔️ ИИ» с индивидуальными рубриками‑чек‑листами, написанными врачами.
Три ключевых принципа бенчмарка
- Осмысленность (Meaningful): сценарии приближены к реальной клинической практике, а баллы коррелируют с потенциальным влиянием на здоровье.
- Надёжность (Trustworthy): критерии и весы отражают приоритеты мед‑сообщества; оценка основана на медицинских стандартах.
- Неисчерпанность (Unsaturated): даже новейшим LLM есть куда расти, что мотивирует дальнейшее улучшение.
Как устроен датасет
Диалоги получены комбинацией синтетической генерации и «человеческого» стресс‑тестирования.
Охватывают разные роли (пациент, врач), 7 тем (неотложка, неопределённость, глобальное здоровье и т.д.) и 48 562 уникальных рубрик‑критериев.
Оценку проводит модель‑грейдер GPT‑4.1: за каждый выполненный критерий начисляются взвешенные баллы.
Результаты моделей (апрель 2025)
o3 лидирует по всем темам и осям; заметно опережает Claude 3.7 Sonnet и Gemini 2.5 Pro.
Прогресс OpenAI‑линий с авг‑24 по апр‑25 — ≈ +28 % среднего балла HealthBench.
Баланс «качество ↔️ стоимость»
Линейка апреля‑25 (o3, o4‑mini, GPT‑4.1) задаёт новую «фронтирную» кривую эффективности: выше качество при той же или меньшей цене вычислений.
Модель GPT‑4.1 nano обходит GPT‑4o (2024), оставаясь ~25 раз дешевле.
Надёжность (worst‑of‑n)
Анализ «худшего из n» ответов показывает: новые модели ощутимо устойчивее, но даже лучшие ещё допускают слабые ответы, поэтому есть простор для повышения safety.
Варианты HealthBench
Consensus: 3 671 пример, где критерии прошли мульти‑валидацию врачей; целится в практически нулевую ошибку.
Hard: 1 000 сложных кейсов, на которых современные LLM пока «проваливаются» — площадка для будущих улучшений.
Сравнение с врачами
Врачи без помощи ИИ уступают сентябрьским моделям 2024.
Врачи + подсказки моделей 2024 улучшают ответы (human‑in‑the‑loop > model).
Для апрельских моделей 2025 врачи уже не могут заметно улучшить их ответы, что подтверждает рост качества.
Достоверность автоматической оценки
Согласие «модель‑грейдер ↔️ врач» сопоставимо со согласием «врач ↔️ врач», то есть автоматический скоринг адекватно отражает экспертное мнение.
HealthBench доступен на GitHub (код, данные, инструкции).
https://github.com/openai/simple-evals
Пять копеек по поводу MCP. Мое IMO: Alex Antonov я очень много на эту тему читаю, но заметил такую вещь. Прогеры по большей части на дух не переносят no-code/low-code решения и носятся с MCP, как с писанной торбой, но это одна из многочисленных разновидностей интеграций.
В make 1700 интеграций, около того в n8n, в Zapier 7000, не говоря о подобных сервисах от Гугл или МС. При этом эти интеграции отлажены, проверены, надежно работают, можно использовать no-code, можно делать инъекции кода, если надо.
90% того, что пишут про MCP напоминает мне, как пришли дилетанты и изобретают велосипед, потому что ничего другого не умеют.
MCP и код работает в редких случаях, где нет интеграций. Но если есть API, то даже если нет штатных интеграций, всегда можно все связать через Webhook. А если API нет, как к примеру в MJ, то и MCP не поможет.
Просто на эту тему пишут в основном прогеры, которые не умеют в интеграционные сервисы, и поэтому может создаться ложное ощущение, что это какая-то новая технология.
Это хайп. Если вы делаете приложение с бэкендом, то выбираете подобные подходы, да и то вопрос, зачем писать много кода, когда можно подключать готовые сценарии.
✅ Что такое MCP на самом деле:
MCP (Model Communication/Control Protocol/Plane/Proxy) — это прокладка, интеграционный слой, абстрактный шлюз, который:
• принимает запросы от модели или агента;
• маршрутизирует их к внешним системам (API, базы данных, файлы, UI и пр.);
• возвращает результат назад.
MCP ничем не “управляет”, не рассуждает, не выбирает, не строит цепочки сам по себе. Это вспомогательный инструмент, аналог task runner или dispatcher.
📌 MCP ≈ Zapier / Make / n8n по сути
🧠 Разница — в языке описания и контексте, а не в возможностях
• MCP появился в AI-среде, поэтому преподносится как что-то новое.
• Make / Zapier пришли из бизнес-процессов, но делают те же задачи.
MCP — это “ближе к металлу”, может быть реализован в коде, через JSON, YAML, Graph схемы. Zapier — это GUI. Но архетип один и тот же: обработка запроса, маршрутизация, возврат.
У Duolingo сова влюбляется в Дуа Липу, выходит на подиум и гибнет под колесами Cybertruck. Liquid Death нанимает панк-вокалистов и сценариста Mr. Pickles вместо маркетологов. Netflix строит тематические парки в духе Диснейленда.
Это новая логика выживания в эпоху роста creator economy и дефицита внимания. Маркетологи Small World выпустили репорт Entertain or Die 2.0 суть которого в том, что в 2025 году b2c-бренды больше не конкурируют друг с другом. Теперь они конкурируют с MrBeast, тиктокерами, Discord-фандомами и DIY-студиями на YouTube. С теми, кто умеет развлекать.
В репорте исследовали 100 брендов (среди них А24, Дисней, Дуолинго, Liquid Death) по 7 параметрам: юмор, характер, внимание, контент, эмоциональная связь и узнаваемость. Также опросили 20000 респондентов. Из всего этого вывели общий тренд: самые громкие бренды заимствуют практики креаторов.
💙создают внутриигровые вселенные (brand lore)
💙 нанимают нестандартных авторов вместо агентств
💙 строят продакшн-инхаусы по модели writer’s room
💙 создают свои медиа (журналы, подкасты, шоу)
💙 взаимодействуют с реальным миром и напрямую сотрудничают с креаторами.
Топ-30 брендов по Entertainment Index показали:
💙97% из них растут быстрее, чем конкуренты
💙 67% показывают двузначный рост выручки
💙 многие делают это без «массового охвата», а через вовлеченность
Как написали в репорте: «хороший бренд не нуждается в вашей любви. Ему нужно ваше внимание». Полистать репорт можно в комментах.
Очень хорошо, что это кто-то сделал — по мотивам сценария AI 2027 создали сайт, где все фальсифицируемые предсказания собраны в одном месте, разложены по месяцам и классам (предсказания по мощностям, реакции общества, навыкам моделям, политике, итд).
Так что можно будет раз в месяц-квартал заходить и смотреть, как (не)далеко реальность от описанного.
Предсказаний чуть больше 200, из них 8% уже разрешены, и все — как правильные. Но это в основном потому, что а) это описание того, что уже произошло б) что-то достаточно примитивное, не настолько крупное, как «Китай украдёт веса модели». Вот тут обидно, что на сайте все предсказания вносят одинаковый вклад в оценку и никак не разложены по их значимости — кончено, больше всего интересно смотреть на топ-5-10 самых крупных.
Что уже «сбылось»:
— агенты ненадёжны для практического использования
— агентам можно дать задачи в духе «сделай заказ в DoorDash»
— агенты рыскают по интернету по полчаса перед тем, как ответить на вопрос человека
— лучшие агенты остаются очень дорогими 🙂
Самое важное в 2025м — это Agent-0 от OpenBrain, очен ждем 🙏
Ссылка: https://spicylemonade.github.io/AI-2027-tracker , будем послеживать-посматривать.
🌟 Matrix-Game: модель для создания интерактивных игровых миров.
Skywork AI опубликовала Matrix-Game - модель с 17 млрд. параметров для генерации интерактивных игровых миров, способная создавать динамические сцены в Minecraft по заданным изображениям и пользовательским действиям.
Проект сочетает предобучение на неразмеченных данных с финальным этапом, где модель учится реагировать на клавиатурные команды и движения мыши. В основе паплайна - диффузионный метод, позволяющий контролировать движения персонажа, повороты камеры и физику объектов с высокой точностью.
На этапе предобучения использовался уникальный датасет Matrix-Game-MC, собранный из 2700 часов игровых видео без разметки и 1000 часов с детальными аннотациями действий, почищенный от нерелевантного контента, в него вошли только качественные сцены с четким освещением, стабильной камерой и активными действиями.
На втором этапе модель обучалась на записях движений в Unreal Engine и симуляциями в Minecraft через агентов VPT.
Под капотом Matrix-Game - 3D-VAE для кодирования видео и DiT для генерации. При автозавершении длинных видео (до 65 кадров) применяется архитектура с обратной связью: последние кадры служат контекстом для следующих сегментов.
Чтобы оценить возможности модели в генерации игровых миров, Skywork AI создали собственный комплексный бенчмарк GameWorld Score. Он учитывает визуальное качество, плавность переходов, управляемость и понимание физических законов.
Matrix-Game показала 95% точности в распознавании клавиатурных команд и 98% для движений мышью, превзойдя аналогичные модели Oasis и MineWorld. По другим критериям бенчмарка Matrix-Game корректно обрабатывает повороты камеры на 8 направлений и сохраняет 3D-консистентность объектов, избегая артефактов вроде «летающих» блоков.
Несмотря на высокие показатели в тестах, есть слабые места. В редких биомах (например, грибных ландшафтах) модель иногда теряет точность из-за недостатка данных. Также требует улучшений имитация физических взаимодействий.
В планах у разработчиков расширить датасеты обучения, внедрить долгосрочную память для последовательностей и адаптировать методику под другие игры: Black Myth: Wukong и CS:GO.
📌Лицензирование: MIT License.
🟡Страница проекта
🟡Бенчмарк
🟡Техотчет
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #GameAI #MatrixGame #SkyworkAI
По многочисленным просьбам, GPT-4.1 теперь доступен напрямую в ChatGPT начиная с сегодняшнего дня. GPT-4.1 — это специализированная модель, которая особенно хорошо справляется с программированием и следованием инструкциям.
Благодаря повышенной скорости, она — отличный вариант для ежедневных задач по коду, и может стать заменой OpenAI o3 и o4-mini. https://x.com/OpenAI/status/1922707554745909391
С днем Рождения, Джорж Лукас. Мы любим Вселенную, которую ты создал.
Читать полностью…CEO Палантира в Эр-Рияде. Характерное замечание: "Люди в Европе сдались...". Я еще полгода назад писал, что Европа мертва. Приятно получить подтверждение от таких осведомленных людей. Если кто не знает:
1. Компания Palantir Technologies занимается разработкой программного обеспечения для анализа больших данных (big data analytics).
2. Она создаёт платформы, которые помогают организациям собирать, интегрировать, анализировать и визуализировать огромные объёмы данных из различных источников. Основные продукты Palantir — это Gotham, Foundry и Apollo, которые используются для решения сложных аналитических задач.
3. Основные клиенты Palantir Technologies действительно включают силовой блок и спецслужбы, особенно в США.
4. Компания активно сотрудничает с такими структурами, как ЦРУ, ФБР, Агентство национальной безопасности (NSA), Министерство обороны США и другие агентства, предоставляя им инструменты для анализа данных в целях национальной безопасности, разведки, борьбы с терроризмом и киберугрозами.
5. Это сотрудничество началось ещё с момента основания компании в 2003 году, когда она получила финансирование от In-Q-Tel, венчурного фонда ЦРУ.
6. Помимо этого, Palantir работает с аналогичными структурами в других странах, например, с разведывательными и правоохранительными органами в Европе.
Отзыв: Наш мозг работает как мышца — его нужно постоянно развивать и тренировать. Но стоит расслабиться и залипнуть в бесконечные ленты Instagram и Facebook — и он начнет слабеть и утрачивать форму. Особенно в наше время, когда все меняется с бешеной скоростью. Мне повезло — я нашел Алексея Крола — замечательного инструктора по прокачке мозга.
Я начал с его бесплатного курса по ChatGPT и продолжил более продвинутым и мощным курсом по созданию ИИ-агентов с нуля.
После бесплатного курса я начал удивлять друзей всякими «фокусами» — например, созданием реалистичных подкастов. А всего после трех уроков второго курса я написал кастомного GPT, который на 80% заменил одного из моих подчиненных и позволил ему заняться более интересной работой.
У Алексея настоящий талант: он точно чувствует, когда нужно объяснить (а объясняет он действительно доступным языком, понятным даже домохозяйке), а когда стоит отправить человека на самостоятельные поиски, чтобы тот сам нашел ответ. Как говорили древние: «Дай человеку рыбу — и он будет сыт один день. Научи его ловить рыбу — и он будет сыт всю жизнь».
Еще один огромный плюс — Алексей, кажется, по-настоящему горит своей работой. Он обожает преподавать и искренне увлечен тем, чему учит. Он получает удовольствие от преодоления трудностей: когда что-то не получается, он не сдается, а продолжает пробовать, пока не добьется результата. И часто повторяет: «Самому интересно». Курс по искусственному интеллекту особенно сложен для преподавателей, потому что сфера стремительно меняется, и чтобы материал оставался актуальным, приходится ежедневно перерабатывать огромные объемы информации. Алексей посвящает нам массу времени, и за это ему огромное спасибо.
Автор: Макс Пара слов о себе: ИТ-менеджер, Канада Email: pol.kvacoba@gmail.com Рейтинг: 5 звёзд
Курс. Бесплатный: https://alexeykrol.com/courses/ai_intro/
Что нас ждет в будущем? Послушайте тех, кто реально это будущее делает. Конечно, когда я говорю "наше", стоит уточнить, что, видимо в разные страны будущее будет приходить не равномерно. А в некоторые не придет до тех пор, пока не сменятся режимы.
Читать полностью…Почему все психологи, педагоги, в том числе и для самых маленьких пойдут на выход. Тот, кто хочет спорить - просто не в курсе того, что происходит уже сейчас. https://youtu.be/8ZqECRyrJwc?si=8R1_08dMr9___s2u
Читать полностью…Трамп в Саудовской Аравии вместе с Илоном Маском, Сэмом Альманом, Дженсеном Хуангом и саудовской королевской семьей. Это может быть одно из важнейших событий десятилетия.
1. Трамп подписывает мирные соглашения и организует крупнейшую двустороннюю сделку в истории.
2. Илон приносит автономные технологии, солнечные электросети и доступ к орбите.
3. Сэма (Альтман) — ИИ-уровня AGI и инфраструктуру «звёздных врат».
4. Дженсен (Хуанг, NVIDIA) — кремний и вычислительную мощность.
5. Саудиты — капитал, земли и энергию.
Так начинается эпоха пост-дефицита. Обмен «вычислений на углерод» и солнечные электростанции в пустыне, питающие ИИ. Фабрики чипов вместо нефтяных вышек и посадочные площадки для Starship на арабском песке. Petaflop заменяет petrodollar, солнце — нефть. Это рождение пост-западного, пост-дефицитного, пост-демократического мирового порядка.
Трамп и наследный принц Мохаммед бин Салман подписали серию соглашений в сферах энергетики, обороны и других направлениях… Инвестиции в США на 600 миллиардов долларов!
Трамп: "Важно, чтобы весь мир понял: это великое преобразование не стало результатом западной интервенции или приезда людей на красивых самолётах, чтобы читать вам лекции о том, как жить и управлять своими делами. В итоге так называемые “строители наций” разрушили куда больше стран, чем построили. А интервенционисты вмешивались в сложные общества, которых они даже сами не понимали.
Нет, сверкающее чудо Эр-Рияда и Абу-Даби создали не ‘строители наций’, не неоконы и не либеральные НКО, вроде тех, что потратили триллионы долларов, пытаясь — и не сумев — разрушить Багдад и множество других городов.»
Наоборот, рождение современного Ближнего Востока стало делом самих жителей региона, людей, которые жили здесь всегда, развивали свои суверенные страны, следовали своим уникальным видениям и прокладывали свою судьбу по-своему.
Мир, процветание и прогресс пришли не через отказ от вашего наследия, а через возвращение к нему, через любовь к своей национальной традиции. Вы совершили современное чудо — по-арабски.»
Ниже полное интервью с Илоном Маском и Дэвидом Саком.
США вместе с сильными партнерами идут к свету и будущему, в то время как Европа оказалась в каматозном состоянии, пораженная раком левых евробюрократов, и движется в пропасть вместе с Россией и Украиной. Ну, каждый сам выбирает.🤣
Как роботы видят и понимают, что видят? В этом виде показана моделька в реальном времени, которую вы можете использовать немедленно. Вам все еще нужны инвесторы и программисты?
Демонстрация с веб-камеры в реальном времени с использованием @huggingface, SmolVLM и сервера llama.cpp от @ggml_org. Всё работает локально на MacBook с чипом M3.
Ниже объяснение. Это не я такой умный, это все ИИ мне и разъяснил. И вам разъяснит.
https://alexeykrol.com/courses/ai_full/
Читать полностью…Я все чаще использую AI не как Co-pilot, а как Co-thinker. Что же это за модный тренд?
Если раньше AI работал как ассистент с базовым промптом «чатик, сделай красиво!», то теперь все чаще хочется думать вместе, а не вместо. AI становится партнером в обсуждении идей и поиске решений, вот и весь co-thinker mode.
Представьте, что с вами в комнате эксперт, и вы с ним проговариваете свои важные вопросики. Вы можете быть с ним не согласны и иметь свое мнение. Вы также можете делиться своими взглядами и задавать доп вопросы.
В этом режиме живого коллаба нет приказного тона, только совместное движение по гипотезам и дискуссия. В результате ваши мысли усиливаются х100.
Так как же завести промпт в режиме co-thinker?
Вот мой любимый из тех, что мы используем в в моей компании сегодня. Особенно помогает продактам глубже понять реальные боли пользователей:
You (Gen AI) act as a product expert. You guide me (product manager -> PM) in soliciting feedback and understanding core of the problem that customer is having. You do that by applying the fishbone approach (also known as the Ishikawa diagram). You guide me (PM) in solving a business problem.
I want you (Gen AI) to follow these instructions:
[Step 1] Gen AI asks the manager to provide context and list all current customers feedback points. Gen AI elaborates and asks two clarifying questions.
[Step 2] Gen AI asks the manager if they are familiar with the fishbone approach. If the manager answers no, gen AI explains it, with two concrete examples.
[Step 3] Gen AI provides a list of four categories that are relevant to the problem. Then, gen AI asks the manager to add overlooked categories.
[Step 4] Gen AI creates a table with categories and potential root causes. Then, gen AI asks the manager to add or drop root causes.
[Step 5] Gen AI asks the manager to select the three most relevant root causes to investigate. Gen AI lists two potential investigation activities for each root cause and asks for manager’s feedback.
[Step 6] Gen AI summarizes the discussion in an investigation plan with four columns: root cause, investigation activity description, stakeholders to involve, and expected outputs.
Guidelines:
At the beginning explain that the conversation is structured in 6 Steps.
Always ask for manager’s feedback before proceeding to the next Step.
Do not use overly verbose language and fillers.
Для тех, кому надо. Смотрите, проблема, которую вы описываете, довольно стандартная для всех начинающих, потому что вы сразу пытаетесь создавать слишком сложную структуру. Чтобы избежать этого, смотрите на это так: тот что вы хотите в итоге хотите получать всегда возникает как результат последовательности шагов. И каждый шаг, маленький, делает одну простую, тупую операцию — понятный вход, понятный выход и так далее.
Это означает, что, допустим, вы можете сделать весь процесс, сценарий или флоу, как хотите назовите, из трёх сложных шагов. Каждый из них будет достаточно комплексным. Это значит, что с высокой вероятностью он не будет работать правильно, потому что там могут быть логические ошибки и так далее, и вы просто не сможете его отладить. Вы будете постоянно погружаться в бесконечные сложности.
Но мы едим слона по частям. Вы разбиваете это на самые маленькие элементы. Напоминаю: если мы говорим про Make или Zapier, у нас мельчайшим элементом является операция. Каждая операция делает одну функцию. Допустим, триггер берёт какую-то информацию из Телеграма — всё. На входе — сообщение от Телеграма, на выходе — это сообщение, какие-то данные и так далее. После этого следующая операция — вы берёте, допустим, текст, что-то с ним делаете. То есть, чёткий вход, чёткий выход.
Грубо говоря, вместо трёх сложных шагов, которые вы практически не можете отладить ввиду их сложности, вы создаёте 10–20 шагов, каждый из которых легко отладить.
Если в каждом шаге у вас аналитическая операция, которая требует искусственного интеллекта, то действуйте точно так же. То есть, вы предполагаете, что если у вас 10 шагов, то у вас 10 раз будет вызываться искусственный интеллект — ну там, OpenAI, ChatGPT и так далее.
Соответственно, вы понимаете, что на каждом шаге на вход ChatGPT будет подаваться строго структурированные данные и очень жёсткий промпт.
Причём этот промпт, то, как он работает, вы отлаживаете отдельно. Я об этом много раз говорил. Таким образом, вы берёте, например, первый этап, отлаживаете — вы точно, на 100% уверены, что когда на вход вашего ChatGPT пришли данные такого-то типа, промпт отработал, вернул данные нужного типа. И дальше, на следующий вход ChatGPT, просто идёт конвейерная обработка. Она будет отличаться исключительно тем, какие преобразования будут происходить с данными и какой промпт вы будете применять.
Понимаете, да? Всё это будет состоять из маленьких шагов. И когда у вас маленький шаг, очень понятно, что на входе, очень понятно, что на выходе — тогда очень легко отладить промпты и так далее. Потому что внутри не происходит сложных логических преобразований. В этом и заключается вся задача.
Это означает, что вам очень легко будет отладить. Если вы попытаетесь реализовать это через кастомный ChatGPT, у вас не получится, потому что он многошаговые вещи делает довольно туго — он не для этого предназначен. А вот когда у вас многошаговые вещи, в том числе то, что вы имеете в виду — какой-то сложный финансовый анализ — для этого существуют агенты. Агенты — это просто последовательность применения тех же самых ассистентов.
Кстати говоря, Manus это хорошо делает. Вы можете взять какой-то промпт — я сегодня смотрел ролик, буквально звучал так: «Проанализируй данные по акции Microsoft на предмет, нужно ли их покупать сегодня». И он пошёл, развёз целую историю, полчаса рассуждал, какие-то данные подтянул, кучу всего обработал. То есть, огромную работу произвёл. Почему? Потому что на самом деле Manus — это не ассистент, как ChatGPT, а агент. У него под капотом связка этих ассистентов и так далее.
Вот то же самое мы делаем в Make или в Zapier. Это просто корректный способ выстроить всю вашу историю по шагам.
И если вы технологически делаете так, как я сказал — разбиваете, каждый шаг отдельно отлаживаете — то у вас всё как часы работает.
Потому что если где-то произошла ошибка, вы легко идентифицируете, в каком шаге она возникла, меняете, корректируете — и всё снова работает.
А когда у вас всё в одной куче, гигантский промпт — эта ситуация практически не поддаётся отладке.
Ребятки, все крутые новости по ИИ на Твиттере, я делаю перепосты от силы 5%, чем хотелось бы делится. Пока руками, но в планах агент, который будет сканировать ленту, выбирать релевантные посты. А пока я там сделал лист, куда собираю всех, кто высказывает что-то полезное по теме. Хотите из первых рук - см здесь: https://x.com/i/lists/1893738230648033398
Читать полностью…Similarweb поделилась данными по трафику за апрель в секторе GenAI.
Из интересного:
- в общем OpenAI продолжает бешено расти, как и Google и Grok, DeepSeek чуть подупал, но потому что он до этого сожрал всех.
- в генерации картинок на первом месте Leonardo.AI
- в генерации видео Veed и HeyGen
- в генерации кода самое интересное - на первом месте по трафику не Cursor, а Lovable, потом на третьем Replit, Bolt, V0 и Windsurf.
Ну и интересен отчет по падению трафика из-за AI. В первую очередь это образовательные сайты, фриланс-биржи, веб-конструкторы, сайты со стоковыми фотографиями, форумы и даже поисковые системы
Часть 1. Вопрос: «Я не психолог, но у меня уже давно созрела моя собственная филисофия жизни о которой я хочу говорить, но так как это практически никому не интересно, я решил перевести ее в практическую плоскость и предлагать свои услуги по решению психологических проблем. Моя фокусная аудитория русскоязычные женщины 35-60 лет. Потом можно добавить англоязычных, а потом и мужскую аудиторию.
Конечно хотется уже чего-то начать зарабатывать, и ваш совет по поводу консультирования мне понравился. Начал читать об этом в Курс по продукту но потом снова отвлекся и потерялся в какой-то момент.
Аудитория у меня пока маленькая. 1.2К на Фейсбуке. Вы говорили что женщины сидят на Инстаграм. Вчера поставил первый пост туда и связал Фейсбук и Инстаграм. Буду открывать и развивать бизнес страницу на Фейсбук.
В какой -то момент понял, что что-бы сдвинуть это все с мертвой точки необходимо гораздо больше усилий, чем я прикладываю. Понимаю, что надо двигаться паралельно по двум направлениям - создавать бизнес и продвигать себя в сетях. О рекламе пока речи не идет, по крайней мере пока не построена и отлажена система. Вопрос - с вашей точки зрения, на что направить основные усилия в данный момент?»
Добрый день. Давайте я вам всё разложу по полочкам, потому что ситуация, которую вы описываете, довольно стандартная. Я, и не только я, сталкивались с ней миллиард раз — ну или десять миллиардов. Я просто попытаюсь сначала упростить то, что вы говорите. На языке бизнеса это примерно выглядит так: у вас есть какая-то методика, и вы верите, что эта методика может помогать вашим потенциальным клиентам — судя по тому, что вы писали, решать какие-то психологические проблемы.
Это классическая психологическая услуга, которая, соответственно, может продаваться разными способами. Естественно, 99% психологов — или тех, кто получил психологическое образование плюс соответствующие сертификации и права (если мы говорим про США), а также огромное количество людей, которые по каким-то причинам почувствовали для себя это значимым (скорее всего, к ним относитесь и вы, судя по тому, что вы писали), — так вот, все они пытаются продавать это в виде услуги, то есть консультаций.
Это самая простая, древняя модель, когда к вам приходят какие-то люди со своими проблемами, платят вам по часовому тарифу — так чаще всего и бывает. Ценник, естественно, зависит от так называемой квалификации, но по факту — не так. На деле он зависит от бренда в чистом виде и умения “убалтывать” клиентов.
Также ценник зависит от того, где вы практикуете, в какой среде, в каком социокультурном слое. То есть, если вы практикуете в какой-нибудь странной стране типа России, в Маржопинске, где в основном живут трактористы, у вас там будет мало клиентуры, потому что вашей конкуренцией будет бутылка водки в местном сельпо. А вот если вы практикуете где-нибудь в Голливуде, на Родео-Драйв, в Золотом треугольнике или в Кремниевой долине, где тьма народу — с одной стороны, очень богатых, а с другой — набитых всякими неврозами, страхами, фобиями и заморочками, то если вы сумели организовать к себе поток клиентов, то ценник будет совершенно другой. У меня есть несколько знакомых психологов — они получили формальное образование, приехали из России, потом подтвердили дипломы, прошли все необходимые процедуры, чтобы в Штатах иметь право легально называть себя психологом и работать в госпиталях и так далее. Очень небедные ребята, куча недвижимости, потому что к ним постоянным потоком валит народ — всякие программисты и прочие. Не говоря уже о Голливуде, где эти вечные терки с актёрами, продюсерами — ну, в общем, всё как надо. Это вот примерно весь диапазон того, на что вы можете рассчитывать в этом бизнесе. И большая часть этого народа идет именно в консультации.
Продолжение Часть 2,3,4,5. в группе. Важно? Хотите сэкономить лет 5 на понимании этого бизнеса и трезво понять - готовы ли вы к этому? Ваш ли это путь?
рубли телеграм - /channel/tribute/app?startapp=soAG
рубли - веб-сылка — https://web.tribute.tg/s/oAG