alexkrol | Криптовалюты

Telegram-канал alexkrol - Квест Теория Каст и Ролей

7787

Залипли и встали намертво, но хотите вырваться? Теория Каст и Ролей и прочее.

Подписаться на канал

Квест Теория Каст и Ролей

Спутниковый снимок зоны, где строят один из нескольких датацентров Stargate.

Футбольное поле справа сверху для масштаба. Снизу будет построено ещё несколько «иксов».

Читать полностью…

Квест Теория Каст и Ролей

Кто-то предложил в электрики и сантехники пойти? Да неужели?

Читать полностью…

Квест Теория Каст и Ролей

👋 Audible запускает полную AI-платформу для создания аудиокниг — от перевода до озвучки

Компания Audible объявила, что будет предлагать издателям полный цикл производства аудиокниг с помощью искусственного интеллекта, включая перевод и озвучивание. Audible пояснила, что будет сотрудничать с издательствами на всех этапах создания аудиокниг с использованием ИИ.

Компания заявила, что объединит свой опыт в производстве аудиоконтента с технологиями ИИ от Amazon. В ближайшие месяцы издатели смогут выбрать один из двух путей: полностью передать производство Audible — от загрузки текста до готовой аудиокниги — или воспользоваться самообслуживанием, при котором издатель сам управляет процессом, используя те же технологии.

Издатели смогут выбрать из более чем 100 AI-голосов на английском, испанском, французском и итальянском языках, с различными акцентами и диалектами. Также будут доступны улучшения голосов по мере развития технологии.

Генеральный директор Audible Боб Карриган сказал:
«Audible считает, что ИИ открывает грандиозные возможности для расширения доступности аудиокниг. Наша цель — предложить слушателям каждую книгу на любом языке, продолжая при этом инвестировать в премиум-контент. Это позволит нам донести больше историй до новой аудитории и сделать доступными книги, которые иначе никогда бы не были услышаны».

Кроме производства, Audible начнёт тестирование перевода аудиокниг — с запуском позже в этом году. Первыми языками станут английский, испанский, французский, итальянский и немецкий.

При этом издатели смогут заказать проверку перевода профессиональными лингвистами для обеспечения точности и культурной адекватности, а также самостоятельно просматривать и редактировать переводы.

Будут доступны два формата перевода:
1. Текст-в-текст — перевод рукописи с последующей AI- или профессиональной озвучкой;
2. Речь-в-речь — перевод с сохранением голоса и интонаций оригинального чтеца.

Audible подчёркивает, что будет работать в тесном сотрудничестве с авторами, чтецами и издателями, чтобы новые технологии соответствовали их творческим и бизнес-задачам, и при этом сохраняли качество, ожидаемое слушателями. В дальнейшем планируется расширение языков, акцентов и уникальных голосов для глобальной аудитории.

После анонса один из издателей аудиокниг сказал изданию The Bookseller:
«Маркировка будет крайне важна, иначе слушателям будет сложно отличить ИИ от человека. Неясно, можно ли распространять AI-озвучку через других ритейлеров, но возможности перевода — это действительно новая граница для аудиоформата».

Он также предупредил, что издатели будут опасаться “перенасыщения рынка продуктом более низкого качества”, что может обесценить аудиокнигу в глазах потребителей.

Издатели, заинтересованные в AI-озвучке и переводах, могут связаться со своими представителями Audible.


thebookseller.com

Читать полностью…

Квест Теория Каст и Ролей

Отзыв: "Что мне дал курс? - я работала всю жизнь и в hr-кадры-рекрутинг и там всегда есть, что консолидировать, анализировать, делать таблицы. Была внутренняя система учета всего-всего и там куча возможностей, достаточно багов (-было, верю, что сейчас у них все намного круче), сотрудничала с коллегами-программистами, которые работали именно над разработкой внутреннего портала.

Это я к чему - что так сложилась жизнь, что работа прекратилась и я потерялась. Да, у меня все хорошо, учу языки, забочусь о доме и муже, помогаю мужу в семейном деле, но я не прекращала что-то искать. А теперь меня снова увлекло и я хочу сделать что-то полезное для семейного дела. Это, как глоток воздуха. Плюс - мне нравится понимать и запоминать новую терминологию. Этого у вас валом. Именно это и изменилось. Возможности - ну сайт то почти готов! Есть проект в GPT Plus.

Я попросила его быть дотошным в мелочах и видеть на 5 шагов вперед, как я люблю. Так он и пишет теперь "как ты любишь - стратегия на перспективу* :) Задаю ему много вопросов, собираем с ним ответы все в один файл-индекс и потом убеждаюсь, что он его читает. Итерация - это прям мое, умею держать фокус, но иногда записываю, если мыслей много и они спешат :). Мы с ним уже проделали одну большую работу - контракт для аренды туристического жилья с учетом местных законов. Это вы меня научили!!! Спасибо вам, Алексей, за то, что мне интересно и я хочу продолжать.

Вот... дочитала до конца и следующий шаг - покупка курса. Даже, если у меня не будет идеи или что-то не получится. Я хочу быть в курсе. Меня ваш курс очень зацепил и напомнил фразу "в начале было слово....". И теперь мы программируем словами - промптами. Это не может быть новой эпохой человечества. Автор: Светлана Пара слов о себе: многолетний опыт рекрутинг, hr-back office. Email: (email blank) Рейтинг: 5 звёзд"

Курс. Бесплатно: https://alexeykrol.com/courses/ai_intro/

Читать полностью…

Квест Теория Каст и Ролей

Опытные разработчики и специалисты радостно говорят: "Я настолько крутой, что меня не уволят." Ок, ну почитайте это:

"После 18 лет работы в Microsoft, из которых около десяти лет я работал над TypeScript, меня, к сожалению, уволили в ходе последнего раунда сокращений. Мне нужно несколько дней, чтобы все обдумать, прежде чем я начну искать работу. Спасибо всем, кто был частью моего пути до сих пор."

Конечно, они скажут, что этот было так себе. В следующих постах, разработчики поймут, что именно они БОЛЬШЕ всего в зоне риска.

Читать полностью…

Квест Теория Каст и Ролей

https://x.com/sequoia/status/1922388291992559887?s=52

Читать полностью…

Квест Теория Каст и Ролей

Как все настроить? Представим, что ты — волшебник, а твой компьютер — волшебная книга. Сейчас мы настроим заклинание, чтобы твоя камера «смотрела», «понимала», что видит, и «рассказывала» тебе об этом.

Вот как это работает и как всё подключить, очень просто, шаг за шагом:

🔧 Что это вообще?
1. Веб-камера — это как глаз.
2. SmolVLM — это мозг, который смотрит на изображение и говорит, что он видит.
3. llama.cpp сервер — это помощник, который умеет быстро думать с помощью искусственного интеллекта.
4. @huggingface — это как магазин с мозгами и знаниями для таких помощников.
5. Всё это запускается на твоём MacBook, без интернета. Только твой компьютер и магия!

🪄 Как всё включить (простыми словами):

Шаг 1: Установи “волшебные инструменты”

Скачай и установи:
• Homebrew — это как магазинчик для программ.
👉 В терминале:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

• Python и Git через Homebrew:

brew install python git

Шаг 2: Установи llama.cpp

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make

Это создаёт локальный сервер с искусственным интеллектом.

Шаг 3: Скачай модель (мозг)

Зайди на сайт huggingface.co, найди модель типа SmolVLM или llama 2 в .gguf формате и скачай её.

Положи её в папку llama.cpp/models/.

Шаг 4: Запусти сервер

./server -m models/тво_модель.gguf

Шаг 5: Запусти веб-камеру + SmolVLM

Скачай SmolVLM демо и запусти его. Там уже есть код, который открывает камеру и посылает картинку в модель.

Примерно так (если использовать Python):

pip install opencv-python transformers
python camera_demo.py

🧠 Что будет происходить:
• Камера делает снимок.
• AI смотрит на него и говорит: «Я вижу: котёнка, лежащего на подушке».
• Ты видишь это в тексте прямо на экране.

Вот простой скрипт на Python, который использует камеру и отправляет изображение в модель для описания. Мы используем opencv для камеры и библиотеку transformers от HuggingFace. В этом примере мы подгружаем SmolVLM, который может описывать, что он «видит» на картинке.

✅ Что нужно установить заранее:

pip install opencv-python transformers torch torchvision

📸 Скрипт: camera_smolvlm_demo.py

import cv2
import torch
from transformers import AutoProcessor, AutoModelForVision2Seq

# Загружаем модель и процессор
processor = AutoProcessor.from_pretrained("microsoft/speecht5_vl")
model = AutoModelForVision2Seq.from_pretrained("microsoft/speecht5_vl")

# Подключаем камеру (0 — это встроенная)
cap = cv2.VideoCapture(0)

print("Нажми Q, чтобы выйти")

while True:
ret, frame = cap.read()
if not ret:
print("Камера не работает")
break

# Показываем изображение
cv2.imshow('Webcam', frame)

# Каждые N кадров или по нажатию анализировать изображение
key = cv2.waitKey(1)
if key == ord(' '): # пробел — анализ
print("⚙ Анализирую изображение...")

# Преобразуем изображение для модели
image_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
inputs = processor(images=image_rgb, return_tensors="pt")

with torch.no_grad():
output = model.generate(**inputs)

description = processor.decode(output[0], skip_special_tokens=True)
print("🧠 Модель говорит:", description)

if key == ord('q'):
break

cap.release()
cv2.destroyAllWindows()

🧪 Как использовать:
1. Запусти скрипт:

python camera_smolvlm_demo.py

2. Откроется окно с камерой.
3. Нажми пробел, чтобы AI описал изображение.
4. Нажми Q, чтобы выйти.

Если скрипт с первого раза не пойдет, используйте GPT-o4-mini-high - она отлично шарит в коде.

Читать полностью…

Квест Теория Каст и Ролей

Плохие новости: 1) Microsoft уволил 7,000 сотрудников, потому что «ИИ делает их работу лучше». Учитывая что средняя з/п около 200к в год, это почти $1,5 ярда сейвингов.

2) OpenAI опубликовал бенчмарк для моделей в здравоохранении. Лучшие модели набирают 0,5-0,6, а врачи в среднем около 0,2 (график в статье). 90% враче на выход по любе в течении 5-7 лет.

Некоторые пишут, что их это расстраивает. Либо они вообще не понимают что происходит, либо у них какой-то экзистенциальный эмо-кризис. Пройдёт.

Утащил у Степана: /channel/cryptoEssay/2370

Читать полностью…

Квест Теория Каст и Ролей

На какой платформе лучше всего собирать ИИ Агентов? Из того, на что стоит тратить время на данный момент - Make, Zapier, n8n при этом они одинаковы, просто в Zapier 7000 интеграций, в Make и n8n около 1700. В этом ролике показано, что разницы нет вообще.

Начинать проще с Make, он дешевле, но потом все зависит от нагрузки. Все они нативно интегрированы со всеми популярными ИИ. Плюс на Youtube немерянно видео, в которых можно посмотреть основы.

Начинать с n8n не рекомендую. Это система больше нравится прогерам не потому что n8n лучше, а потому что прогеры любят упарываться по всяким таким цацкам.

Если вы про бизнес и жизнь, то используйте chatGPT, делайте кастомные GPT под свои уникальные задачи или используйте Make, Zapier для создания сложных Агентов, которые автономны и умеют разбираться с неопределенностью.

Вчера я пол-дня убил на то, чтобы заставить chatGPT/Manus разворачивать сценарий в Make только на основании диалога с пользователем. Это возможно, при этом и для Make, и для Zapier, и для n8n и для чего угодно, потому что все эти сценарии в конечном итоге просто JSON файлы - это такой язык, который понимают и люди и сервисы в интернете. При этом довольно не сложно построить конвертер сценариев. Только зачем?🤣

Все это не требует никакого программировния, можно начинать с 0, посмотреть пару видео и уже чего-то начнете лепить. Зачем? Потому что это круто изменит вашу жизнь РЕАЛЬНО. Впрочем, если кто сидит под камнем и не верит в прогресс - наплевать - пусть сидят и квакают!

Читать полностью…

Квест Теория Каст и Ролей

OpenAI представил бенчмарк оценки AI моделей в медицине
https://openai.com/index/healthbench/

- Создан совместно с 262 врачами из 60 стран, владеющими 49 языками и 26 специальностями.
- Содержит 5 000 реалистичных мультиязычных диалогов «пользователь ↔️ ИИ» с индивидуальными рубриками‑чек‑листами, написанными врачами.

Три ключевых принципа бенчмарка
- Осмысленность (Meaningful): сценарии приближены к реальной клинической практике, а баллы коррелируют с потенциальным влиянием на здоровье.
- Надёжность (Trustworthy): критерии и весы отражают приоритеты мед‑сообщества; оценка основана на медицинских стандартах.
- Неисчерпанность (Unsaturated): даже новейшим LLM есть куда расти, что мотивирует дальнейшее улучшение.

Как устроен датасет
Диалоги получены комбинацией синтетической генерации и «человеческого» стресс‑тестирования.

Охватывают разные роли (пациент, врач), 7 тем (неотложка, неопределённость, глобальное здоровье и т.д.) и 48 562 уникальных рубрик‑критериев.

Оценку проводит модель‑грейдер GPT‑4.1: за каждый выполненный критерий начисляются взвешенные баллы.

Результаты моделей (апрель 2025)
o3 лидирует по всем темам и осям; заметно опережает Claude 3.7 Sonnet и Gemini 2.5 Pro.

Прогресс OpenAI‑линий с авг‑24 по апр‑25 — ≈ +28 % среднего балла HealthBench.

Баланс «качество ↔️ стоимость»
Линейка апреля‑25 (o3, o4‑mini, GPT‑4.1) задаёт новую «фронтирную» кривую эффективности: выше качество при той же или меньшей цене вычислений.

Модель GPT‑4.1 nano обходит GPT‑4o (2024), оставаясь ~25 раз дешевле.

Надёжность (worst‑of‑n)
Анализ «худшего из n» ответов показывает: новые модели ощутимо устойчивее, но даже лучшие ещё допускают слабые ответы, поэтому есть простор для повышения safety.

Варианты HealthBench
Consensus: 3 671 пример, где критерии прошли мульти‑валидацию врачей; целится в практически нулевую ошибку.

Hard: 1 000 сложных кейсов, на которых современные LLM пока «проваливаются» — площадка для будущих улучшений.

Сравнение с врачами
Врачи без помощи ИИ уступают сентябрьским моделям 2024.
Врачи + подсказки моделей 2024 улучшают ответы (human‑in‑the‑loop > model).

Для апрельских моделей 2025 врачи уже не могут заметно улучшить их ответы, что подтверждает рост качества.

Достоверность автоматической оценки
Согласие «модель‑грейдер ↔️ врач» сопоставимо со согласием «врач ↔️ врач», то есть автоматический скоринг адекватно отражает экспертное мнение.

HealthBench доступен на GitHub (код, данные, инструкции).
https://github.com/openai/simple-evals

Читать полностью…

Квест Теория Каст и Ролей

Пять копеек по поводу MCP. Мое IMO: Alex Antonov я очень много на эту тему читаю, но заметил такую вещь. Прогеры по большей части на дух не переносят no-code/low-code решения и носятся с MCP, как с писанной торбой, но это одна из многочисленных разновидностей интеграций.

В make 1700 интеграций, около того в n8n, в Zapier 7000, не говоря о подобных сервисах от Гугл или МС. При этом эти интеграции отлажены, проверены, надежно работают, можно использовать no-code, можно делать инъекции кода, если надо.

90% того, что пишут про MCP напоминает мне, как пришли дилетанты и изобретают велосипед, потому что ничего другого не умеют.

MCP и код работает в редких случаях, где нет интеграций. Но если есть API, то даже если нет штатных интеграций, всегда можно все связать через Webhook. А если API нет, как к примеру в MJ, то и MCP не поможет.

Просто на эту тему пишут в основном прогеры, которые не умеют в интеграционные сервисы, и поэтому может создаться ложное ощущение, что это какая-то новая технология.

Это хайп. Если вы делаете приложение с бэкендом, то выбираете подобные подходы, да и то вопрос, зачем писать много кода, когда можно подключать готовые сценарии.

✅ Что такое MCP на самом деле:

MCP (Model Communication/Control Protocol/Plane/Proxy) — это прокладка, интеграционный слой, абстрактный шлюз, который:

• принимает запросы от модели или агента;
• маршрутизирует их к внешним системам (API, базы данных, файлы, UI и пр.);
• возвращает результат назад.

MCP ничем не “управляет”, не рассуждает, не выбирает, не строит цепочки сам по себе. Это вспомогательный инструмент, аналог task runner или dispatcher.

📌 MCP ≈ Zapier / Make / n8n по сути

🧠 Разница — в языке описания и контексте, а не в возможностях
• MCP появился в AI-среде, поэтому преподносится как что-то новое.
• Make / Zapier пришли из бизнес-процессов, но делают те же задачи.

MCP — это “ближе к металлу”, может быть реализован в коде, через JSON, YAML, Graph схемы. Zapier — это GUI. Но архетип один и тот же: обработка запроса, маршрутизация, возврат.

Читать полностью…

Квест Теория Каст и Ролей

У Duolingo сова влюбляется в Дуа Липу, выходит на подиум и гибнет под колесами Cybertruck. Liquid Death нанимает панк-вокалистов и сценариста Mr. Pickles вместо маркетологов. Netflix строит тематические парки в духе Диснейленда.

Это новая логика выживания в эпоху роста creator economy и дефицита внимания. Маркетологи Small World выпустили репорт Entertain or Die 2.0 суть которого в том, что в 2025 году b2c-бренды больше не конкурируют друг с другом. Теперь они конкурируют с MrBeast, тиктокерами, Discord-фандомами и DIY-студиями на YouTube. С теми, кто умеет развлекать.

В репорте исследовали 100 брендов (среди них А24, Дисней, Дуолинго, Liquid Death) по 7 параметрам: юмор, характер, внимание, контент, эмоциональная связь и узнаваемость. Также опросили 20000 респондентов. Из всего этого вывели общий тренд: самые громкие бренды заимствуют практики креаторов.

💙создают внутриигровые вселенные (brand lore)
💙 нанимают нестандартных авторов вместо агентств
💙 строят продакшн-инхаусы по модели writer’s room
💙 создают свои медиа (журналы, подкасты, шоу)
💙 взаимодействуют с реальным миром и напрямую сотрудничают с креаторами.

Топ-30 брендов по Entertainment Index показали:
💙97% из них растут быстрее, чем конкуренты
💙 67% показывают двузначный рост выручки
💙 многие делают это без «массового охвата», а через вовлеченность

Как написали в репорте: «хороший бренд не нуждается в вашей любви. Ему нужно ваше внимание». Полистать репорт можно в комментах.

Читать полностью…

Квест Теория Каст и Ролей

Очень хорошо, что это кто-то сделал — по мотивам сценария AI 2027 создали сайт, где все фальсифицируемые предсказания собраны в одном месте, разложены по месяцам и классам (предсказания по мощностям, реакции общества, навыкам моделям, политике, итд).

Так что можно будет раз в месяц-квартал заходить и смотреть, как (не)далеко реальность от описанного.

Предсказаний чуть больше 200, из них 8% уже разрешены, и все — как правильные. Но это в основном потому, что а) это описание того, что уже произошло б) что-то достаточно примитивное, не настолько крупное, как «Китай украдёт веса модели». Вот тут обидно, что на сайте все предсказания вносят одинаковый вклад в оценку и никак не разложены по их значимости — кончено, больше всего интересно смотреть на топ-5-10 самых крупных.

Что уже «сбылось»:
— агенты ненадёжны для практического использования
— агентам можно дать задачи в духе «сделай заказ в DoorDash»
— агенты рыскают по интернету по полчаса перед тем, как ответить на вопрос человека
— лучшие агенты остаются очень дорогими 🙂

Самое важное в 2025м — это Agent-0 от OpenBrain, очен ждем 🙏

Ссылка: https://spicylemonade.github.io/AI-2027-tracker , будем послеживать-посматривать.

Читать полностью…

Квест Теория Каст и Ролей

Продолжение. Если это сработает — это будет новая и мощная парадигма обучения. Правда, остаётся много нерешённых вопросов: как именно должны работать правки? можно ли (и нужно ли) обучать саму систему редактирования? как со временем переносить знания из текста системного промпта в “привычные” веса модели, как это делают люди? " (конец цитаты).

😍😍😍Перевод для 10-летнего ребенка:

Смотри. Большие языковые модели, вроде меня, учатся в основном двумя способами:

1. Они читают кучу всего — книги, сайты, статьи — чтобы знать много всего. Это называется предобучение.
2. Потом их немного доучивают, чтобы они себя вели определённым образом — быть вежливыми, отвечать правильно, не говорить плохое. Это называется дообучение.

Оба этих способа — это как если бы тебе вставляли новые мысли прямо в мозг. Но у людей обучение часто работает по-другому.

Представь, что ты столкнулся с какой-то задачей, например, не можешь решить сложный пример. Ты подумал, разобрался, и в следующий раз сам себе говоришь: “Ага! Когда такое вижу — лучше делать вот так!” И ты это как будто записал себе в голове, но не прямо в мозгу, а как памятку. В следующий раз ты это вспоминаешь и используешь.

Вот об этом и говорится в тексте: что у моделей не хватает такой “памятки” или “тетрадки для заметок”, где они могли бы сами себе записывать, как лучше решать задачи. Сейчас это делают люди-программисты, вручную, но это медленно и неэффективно.

Если бы модель могла сама писать себе такие подсказки, как «Когда меня просят посчитать буквы, я должен считать по шагам», — то она бы училась быстрее и умнее. Это как если бы она писала для себя инструкцию: “Когда так — делай вот это.” И потом вспоминала это, как ты вспоминаешь, как решать задачку, которую уже делал.

Это было бы как третий способ обучения — не просто “вбивать в мозг”, а “писать себе напоминалки”, которые можно менять, улучшать и использовать.

☠️💀🎃👹👿Мой коммент: Take attention on фразу: "Сейчас это делают люди-программисты, вручную, но это медленно и неэффективно." Намек ясен?

Читать полностью…

Квест Теория Каст и Ролей

Не потому, что мне жалко ответить на вопрос. Моя задача — научить вас, чтобы вы всё делали сами, а не бегали с мелочами. Допустим, если что-то с сайтом, проблема с доступом — это полностью моя ответственность, и мы, естественно, решаем.

Если вы не понимаете какое-то понятие, категорию — я всегда в вашем распоряжении. Но если это мелкая хрень — ищите. У меня есть целый список агентов, которые мы будем делать. Я всё буду детально показывать, но делать акцент на принципиальных, серьёзных вещах. А вот как подключить какое-то конкретное приложение — это вы способны найти сами.

Читать полностью…

Квест Теория Каст и Ролей

С днем Рождения, Джорж Лукас. Мы любим Вселенную, которую ты создал.

Читать полностью…

Квест Теория Каст и Ролей

CEO Палантира в Эр-Рияде. Характерное замечание: "Люди в Европе сдались...". Я еще полгода назад писал, что Европа мертва. Приятно получить подтверждение от таких осведомленных людей. Если кто не знает:

1. Компания Palantir Technologies занимается разработкой программного обеспечения для анализа больших данных (big data analytics).

2. Она создаёт платформы, которые помогают организациям собирать, интегрировать, анализировать и визуализировать огромные объёмы данных из различных источников. Основные продукты Palantir — это Gotham, Foundry и Apollo, которые используются для решения сложных аналитических задач.

3. Основные клиенты Palantir Technologies действительно включают силовой блок и спецслужбы, особенно в США.

4. Компания активно сотрудничает с такими структурами, как ЦРУ, ФБР, Агентство национальной безопасности (NSA), Министерство обороны США и другие агентства, предоставляя им инструменты для анализа данных в целях национальной безопасности, разведки, борьбы с терроризмом и киберугрозами.

5. Это сотрудничество началось ещё с момента основания компании в 2003 году, когда она получила финансирование от In-Q-Tel, венчурного фонда ЦРУ.

6. Помимо этого, Palantir работает с аналогичными структурами в других странах, например, с разведывательными и правоохранительными органами в Европе.

Читать полностью…

Квест Теория Каст и Ролей

Отзыв: Наш мозг работает как мышца — его нужно постоянно развивать и тренировать. Но стоит расслабиться и залипнуть в бесконечные ленты Instagram и Facebook — и он начнет слабеть и утрачивать форму. Особенно в наше время, когда все меняется с бешеной скоростью. Мне повезло — я нашел Алексея Крола — замечательного инструктора по прокачке мозга.

Я начал с его бесплатного курса по ChatGPT и продолжил более продвинутым и мощным курсом по созданию ИИ-агентов с нуля.

После бесплатного курса я начал удивлять друзей всякими «фокусами» — например, созданием реалистичных подкастов. А всего после трех уроков второго курса я написал кастомного GPT, который на 80% заменил одного из моих подчиненных и позволил ему заняться более интересной работой.

У Алексея настоящий талант: он точно чувствует, когда нужно объяснить (а объясняет он действительно доступным языком, понятным даже домохозяйке), а когда стоит отправить человека на самостоятельные поиски, чтобы тот сам нашел ответ. Как говорили древние: «Дай человеку рыбу — и он будет сыт один день. Научи его ловить рыбу — и он будет сыт всю жизнь».

Еще один огромный плюс — Алексей, кажется, по-настоящему горит своей работой. Он обожает преподавать и искренне увлечен тем, чему учит. Он получает удовольствие от преодоления трудностей: когда что-то не получается, он не сдается, а продолжает пробовать, пока не добьется результата. И часто повторяет: «Самому интересно». Курс по искусственному интеллекту особенно сложен для преподавателей, потому что сфера стремительно меняется, и чтобы материал оставался актуальным, приходится ежедневно перерабатывать огромные объемы информации. Алексей посвящает нам массу времени, и за это ему огромное спасибо.

Автор: Макс Пара слов о себе: ИТ-менеджер, Канада Email: pol.kvacoba@gmail.com Рейтинг: 5 звёзд

Курс. Бесплатный: https://alexeykrol.com/courses/ai_intro/

Читать полностью…

Квест Теория Каст и Ролей

Что нас ждет в будущем? Послушайте тех, кто реально это будущее делает. Конечно, когда я говорю "наше", стоит уточнить, что, видимо в разные страны будущее будет приходить не равномерно. А в некоторые не придет до тех пор, пока не сменятся режимы.

Читать полностью…

Квест Теория Каст и Ролей

Почему все психологи, педагоги, в том числе и для самых маленьких пойдут на выход. Тот, кто хочет спорить - просто не в курсе того, что происходит уже сейчас. https://youtu.be/8ZqECRyrJwc?si=8R1_08dMr9___s2u

Читать полностью…

Квест Теория Каст и Ролей

Трамп в Саудовской Аравии вместе с Илоном Маском, Сэмом Альманом, Дженсеном Хуангом и саудовской королевской семьей. Это может быть одно из важнейших событий десятилетия.

1. Трамп подписывает мирные соглашения и организует крупнейшую двустороннюю сделку в истории.
2. Илон приносит автономные технологии, солнечные электросети и доступ к орбите.
3. Сэма (Альтман) — ИИ-уровня AGI и инфраструктуру «звёздных врат».
4. Дженсен (Хуанг, NVIDIA) — кремний и вычислительную мощность.
5. Саудиты — капитал, земли и энергию.

Так начинается эпоха пост-дефицита. Обмен «вычислений на углерод» и солнечные электростанции в пустыне, питающие ИИ. Фабрики чипов вместо нефтяных вышек и посадочные площадки для Starship на арабском песке. Petaflop заменяет petrodollar, солнце — нефть. Это рождение пост-западного, пост-дефицитного, пост-демократического мирового порядка.

Трамп и наследный принц Мохаммед бин Салман подписали серию соглашений в сферах энергетики, обороны и других направлениях… Инвестиции в США на 600 миллиардов долларов!

Трамп: "Важно, чтобы весь мир понял: это великое преобразование не стало результатом западной интервенции или приезда людей на красивых самолётах, чтобы читать вам лекции о том, как жить и управлять своими делами. В итоге так называемые “строители наций” разрушили куда больше стран, чем построили. А интервенционисты вмешивались в сложные общества, которых они даже сами не понимали.

Нет, сверкающее чудо Эр-Рияда и Абу-Даби создали не ‘строители наций’, не неоконы и не либеральные НКО, вроде тех, что потратили триллионы долларов, пытаясь — и не сумев — разрушить Багдад и множество других городов.»

Наоборот, рождение современного Ближнего Востока стало делом самих жителей региона, людей, которые жили здесь всегда, развивали свои суверенные страны, следовали своим уникальным видениям и прокладывали свою судьбу по-своему.

Мир, процветание и прогресс пришли не через отказ от вашего наследия, а через возвращение к нему, через любовь к своей национальной традиции. Вы совершили современное чудо — по-арабски.»

Ниже полное интервью с Илоном Маском и Дэвидом Саком.

США вместе с сильными партнерами идут к свету и будущему, в то время как Европа оказалась в каматозном состоянии, пораженная раком левых евробюрократов, и движется в пропасть вместе с Россией и Украиной. Ну, каждый сам выбирает.🤣

Читать полностью…

Квест Теория Каст и Ролей

Как роботы видят и понимают, что видят? В этом виде показана моделька в реальном времени, которую вы можете использовать немедленно. Вам все еще нужны инвесторы и программисты?
Демонстрация с веб-камеры в реальном времени с использованием @huggingface, SmolVLM и сервера llama.cpp от @ggml_org. Всё работает локально на MacBook с чипом M3.
Ниже объяснение. Это не я такой умный, это все ИИ мне и разъяснил. И вам разъяснит.

Читать полностью…

Квест Теория Каст и Ролей

https://alexeykrol.com/courses/ai_full/

Читать полностью…

Квест Теория Каст и Ролей

Я все чаще использую AI не как Co-pilot, а как Co-thinker. Что же это за модный тренд?

Если раньше AI работал как ассистент с базовым промптом «чатик, сделай красиво!», то теперь все чаще хочется думать вместе, а не вместо. AI становится партнером в обсуждении идей и поиске решений, вот и весь co-thinker mode.

Представьте, что с вами в комнате эксперт, и вы с ним проговариваете свои важные вопросики. Вы можете быть с ним не согласны и иметь свое мнение. Вы также можете делиться своими взглядами и задавать доп вопросы.

В этом режиме живого коллаба нет приказного тона, только совместное движение по гипотезам и дискуссия. В результате ваши мысли усиливаются х100.

Так как же завести промпт в режиме co-thinker?

Вот мой любимый из тех, что мы используем в в моей компании сегодня. Особенно помогает продактам глубже понять реальные боли пользователей:


You (Gen AI) act as a product expert. You guide me (product manager -> PM) in soliciting feedback and understanding core of the problem that customer is having. You do that by applying the fishbone approach (also known as the Ishikawa diagram). You guide me (PM) in solving a business problem.
I want you (Gen AI) to follow these instructions:
[Step 1] Gen AI asks the manager to provide context and list all current customers feedback points.  Gen AI elaborates and asks two clarifying questions.
[Step 2] Gen AI asks the manager if they are familiar with the fishbone approach. If the manager answers no, gen AI explains it, with two concrete examples.
[Step 3] Gen AI provides a list of four categories that are relevant to the problem. Then, gen AI asks the manager to add overlooked categories.
[Step 4] Gen AI creates a table with categories and potential root causes. Then, gen AI asks the manager to add or drop root causes.
[Step 5] Gen AI asks the manager to select the three most relevant root causes to investigate. Gen AI lists two potential investigation activities for each root cause and asks for manager’s feedback.
[Step 6] Gen AI summarizes the discussion in an investigation plan with four columns: root cause, investigation activity description, stakeholders to involve, and expected outputs.
Guidelines:
At the beginning explain that the conversation is structured in 6 Steps.
Always ask for manager’s feedback before proceeding to the next Step.
Do not use overly verbose language and fillers.


Вуаля, никакой магии. Просто навык лучше формулировать вопросы и чаще включать любопытство вместо директив.

Читать полностью…

Квест Теория Каст и Ролей

Для тех, кому надо. Смотрите, проблема, которую вы описываете, довольно стандартная для всех начинающих, потому что вы сразу пытаетесь создавать слишком сложную структуру. Чтобы избежать этого, смотрите на это так: тот что вы хотите в итоге хотите получать всегда возникает как результат последовательности шагов. И каждый шаг, маленький, делает одну простую, тупую операцию — понятный вход, понятный выход и так далее.

Это означает, что, допустим, вы можете сделать весь процесс, сценарий или флоу, как хотите назовите, из трёх сложных шагов. Каждый из них будет достаточно комплексным. Это значит, что с высокой вероятностью он не будет работать правильно, потому что там могут быть логические ошибки и так далее, и вы просто не сможете его отладить. Вы будете постоянно погружаться в бесконечные сложности.

Но мы едим слона по частям. Вы разбиваете это на самые маленькие элементы. Напоминаю: если мы говорим про Make или Zapier, у нас мельчайшим элементом является операция. Каждая операция делает одну функцию. Допустим, триггер берёт какую-то информацию из Телеграма — всё. На входе — сообщение от Телеграма, на выходе — это сообщение, какие-то данные и так далее. После этого следующая операция — вы берёте, допустим, текст, что-то с ним делаете. То есть, чёткий вход, чёткий выход.

Грубо говоря, вместо трёх сложных шагов, которые вы практически не можете отладить ввиду их сложности, вы создаёте 10–20 шагов, каждый из которых легко отладить.

Если в каждом шаге у вас аналитическая операция, которая требует искусственного интеллекта, то действуйте точно так же. То есть, вы предполагаете, что если у вас 10 шагов, то у вас 10 раз будет вызываться искусственный интеллект — ну там, OpenAI, ChatGPT и так далее.

Соответственно, вы понимаете, что на каждом шаге на вход ChatGPT будет подаваться строго структурированные данные и очень жёсткий промпт.

Причём этот промпт, то, как он работает, вы отлаживаете отдельно. Я об этом много раз говорил. Таким образом, вы берёте, например, первый этап, отлаживаете — вы точно, на 100% уверены, что когда на вход вашего ChatGPT пришли данные такого-то типа, промпт отработал, вернул данные нужного типа. И дальше, на следующий вход ChatGPT, просто идёт конвейерная обработка. Она будет отличаться исключительно тем, какие преобразования будут происходить с данными и какой промпт вы будете применять.

Понимаете, да? Всё это будет состоять из маленьких шагов. И когда у вас маленький шаг, очень понятно, что на входе, очень понятно, что на выходе — тогда очень легко отладить промпты и так далее. Потому что внутри не происходит сложных логических преобразований. В этом и заключается вся задача.

Это означает, что вам очень легко будет отладить. Если вы попытаетесь реализовать это через кастомный ChatGPT, у вас не получится, потому что он многошаговые вещи делает довольно туго — он не для этого предназначен. А вот когда у вас многошаговые вещи, в том числе то, что вы имеете в виду — какой-то сложный финансовый анализ — для этого существуют агенты. Агенты — это просто последовательность применения тех же самых ассистентов.

Кстати говоря, Manus это хорошо делает. Вы можете взять какой-то промпт — я сегодня смотрел ролик, буквально звучал так: «Проанализируй данные по акции Microsoft на предмет, нужно ли их покупать сегодня». И он пошёл, развёз целую историю, полчаса рассуждал, какие-то данные подтянул, кучу всего обработал. То есть, огромную работу произвёл. Почему? Потому что на самом деле Manus — это не ассистент, как ChatGPT, а агент. У него под капотом связка этих ассистентов и так далее.

Вот то же самое мы делаем в Make или в Zapier. Это просто корректный способ выстроить всю вашу историю по шагам.

И если вы технологически делаете так, как я сказал — разбиваете, каждый шаг отдельно отлаживаете — то у вас всё как часы работает.

Потому что если где-то произошла ошибка, вы легко идентифицируете, в каком шаге она возникла, меняете, корректируете — и всё снова работает.

А когда у вас всё в одной куче, гигантский промпт — эта ситуация практически не поддаётся отладке.

Читать полностью…

Квест Теория Каст и Ролей

Ребятки, все крутые новости по ИИ на Твиттере, я делаю перепосты от силы 5%, чем хотелось бы делится. Пока руками, но в планах агент, который будет сканировать ленту, выбирать релевантные посты. А пока я там сделал лист, куда собираю всех, кто высказывает что-то полезное по теме. Хотите из первых рук - см здесь: https://x.com/i/lists/1893738230648033398

Читать полностью…

Квест Теория Каст и Ролей

Similarweb поделилась данными по трафику за апрель в секторе GenAI.
Из интересного:
- в общем OpenAI продолжает бешено расти, как и Google и Grok, DeepSeek чуть подупал, но потому что он до этого сожрал всех.
- в генерации картинок на первом месте Leonardo.AI
- в генерации видео Veed и HeyGen
- в генерации кода самое интересное - на первом месте по трафику не Cursor, а Lovable, потом на третьем Replit, Bolt, V0 и Windsurf.
Ну и интересен отчет по падению трафика из-за AI. В первую очередь это образовательные сайты, фриланс-биржи, веб-конструкторы, сайты со стоковыми фотографиями, форумы и даже поисковые системы

Читать полностью…

Квест Теория Каст и Ролей

Часть 1. Вопрос: «Я не психолог, но у меня уже давно созрела моя собственная филисофия жизни о которой я хочу говорить, но так как это практически никому не интересно, я решил перевести ее в практическую плоскость и предлагать свои услуги по решению психологических проблем. Моя фокусная аудитория русскоязычные женщины 35-60 лет. Потом можно добавить англоязычных, а потом и мужскую аудиторию.

Конечно хотется уже чего-то начать зарабатывать, и ваш совет по поводу консультирования мне понравился. Начал читать об этом в Курс по продукту но потом снова отвлекся и потерялся в какой-то момент.

Аудитория у меня пока маленькая. 1.2К на Фейсбуке. Вы говорили что женщины сидят на Инстаграм. Вчера поставил первый пост туда и связал Фейсбук и Инстаграм. Буду открывать и развивать бизнес страницу на Фейсбук.

В какой -то момент понял, что что-бы сдвинуть это все с мертвой точки необходимо гораздо больше усилий, чем я прикладываю. Понимаю, что надо двигаться паралельно по двум направлениям - создавать бизнес и продвигать себя в сетях. О рекламе пока речи не идет, по крайней мере пока не построена и отлажена система. Вопрос - с вашей точки зрения, на что направить основные усилия в данный момент?
»

Добрый день. Давайте я вам всё разложу по полочкам, потому что ситуация, которую вы описываете, довольно стандартная. Я, и не только я, сталкивались с ней миллиард раз — ну или десять миллиардов. Я просто попытаюсь сначала упростить то, что вы говорите. На языке бизнеса это примерно выглядит так: у вас есть какая-то методика, и вы верите, что эта методика может помогать вашим потенциальным клиентам — судя по тому, что вы писали, решать какие-то психологические проблемы.

Это классическая психологическая услуга, которая, соответственно, может продаваться разными способами. Естественно, 99% психологов — или тех, кто получил психологическое образование плюс соответствующие сертификации и права (если мы говорим про США), а также огромное количество людей, которые по каким-то причинам почувствовали для себя это значимым (скорее всего, к ним относитесь и вы, судя по тому, что вы писали), — так вот, все они пытаются продавать это в виде услуги, то есть консультаций.

Это самая простая, древняя модель, когда к вам приходят какие-то люди со своими проблемами, платят вам по часовому тарифу — так чаще всего и бывает. Ценник, естественно, зависит от так называемой квалификации, но по факту — не так. На деле он зависит от бренда в чистом виде и умения “убалтывать” клиентов.

Также ценник зависит от того, где вы практикуете, в какой среде, в каком социокультурном слое. То есть, если вы практикуете в какой-нибудь странной стране типа России, в Маржопинске, где в основном живут трактористы, у вас там будет мало клиентуры, потому что вашей конкуренцией будет бутылка водки в местном сельпо. А вот если вы практикуете где-нибудь в Голливуде, на Родео-Драйв, в Золотом треугольнике или в Кремниевой долине, где тьма народу — с одной стороны, очень богатых, а с другой — набитых всякими неврозами, страхами, фобиями и заморочками, то если вы сумели организовать к себе поток клиентов, то ценник будет совершенно другой. У меня есть несколько знакомых психологов — они получили формальное образование, приехали из России, потом подтвердили дипломы, прошли все необходимые процедуры, чтобы в Штатах иметь право легально называть себя психологом и работать в госпиталях и так далее. Очень небедные ребята, куча недвижимости, потому что к ним постоянным потоком валит народ — всякие программисты и прочие. Не говоря уже о Голливуде, где эти вечные терки с актёрами, продюсерами — ну, в общем, всё как надо. Это вот примерно весь диапазон того, на что вы можете рассчитывать в этом бизнесе. И большая часть этого народа идет именно в консультации.

Продолжение Часть 2,3,4,5. в группе. Важно? Хотите сэкономить лет 5 на понимании этого бизнеса и трезво понять - готовы ли вы к этому? Ваш ли это путь?

рубли телеграм - /channel/tribute/app?startapp=soAG
рубли - веб-сылка — https://web.tribute.tg/s/oAG

Читать полностью…

Квест Теория Каст и Ролей

"chatGPT тупой, не отвечает, лжет мне за мои же деньги!" - частая претензия, чтобы понять феномен, прочитайте рассуждение Эндрю Карпаты (экс создатель ИИ автопилота Теслы - шарит в теме).

Короткий спойлер:

Хорошая новость - ИИ еще в начале пути, и это ЕДИНСТВЕННАЯ причина, почему 98% из вас еще получают зарплату.

Плохая новость - когда проблемы ниже будет решены - 98% из вас потеряют свою работы без шанса найти новую.

Кстати, вчера на одном totally бесполезном мероприятии, организаторы которого обманом украли пол-дня моего времени, я объяснял успешному риэлтору, почему в течении 3 лет рынок недвиги в Долине ждет кровавая бойня.

Она бывший успешный разработчик с фундаментальным образованием, потом успешный риэлтор, потом успешный девелопер (в недвиге, не софте), т.е сечет.

Почему я уверен? Потому что кормовая база недвиги в Долине - прогеры 10 ведущих корпораций, перекормленные деньгами, как гуси на убой. И зная, что происходит в этих корпорациях сейчас, я понимаю, что 90% всех этих гусей на убой и пойдут. В том числе и когда ИИ справится с проблемами, о которых говорит г-н Карпаты.

После текста, в котором вы ничего не поймете, я привел перевод на языке 10-летнего ребенка. (можете скипать текст Карпаты и сразу читать для нормальных).

🥶"Нам не хватает (как минимум одной) важной парадигмы обучения для больших языковых моделей (LLM). Я не уверен, как её назвать — возможно, у неё уже есть название, например, обучение системному промпту?

Предобучение нужно для получения знаний.
Дообучение (с учителем или с подкреплением) — для формирования привычного поведения.

Оба этих процесса предполагают изменение параметров модели, но большая часть человеческого обучения больше похожа на изменение системного промпта. Ты сталкиваешься с проблемой, что-то осознаёшь, а потом “запоминаешь” это в довольно явной форме на будущее. Например: «Кажется, когда я сталкиваюсь с такой-то и такой-то проблемой, мне стоит попробовать такой-то и такой-то подход/решение». Это похоже на то, как будто ты записываешь себе заметку, — то есть, это нечто вроде функции “памяти”, но не для хранения случайных фактов о пользователе, а для общих знаний и стратегий решения задач.

LLM в буквальном смысле похожи на персонажа из фильма Memento, только мы ещё не дали им блокнот для записей. Заметь, эта парадигма потенциально намного более мощная и эффективная с точки зрения использования данных, потому что стадия “обзора знаний” предоставляет значительно более высокоразмерный канал обратной связи, чем скалярная награда.

На этот поток мыслей меня натолкнуло чтение системного промпта Claude, который, похоже, сейчас насчитывает около 17 000 слов. Там указано не только общее поведение и предпочтения (например, отказываться от определённых типов запросов, связанных с текстами песен), но и множество общих стратегий решения задач, например:

«Если у Claude просят посчитать слова, буквы или символы, он размышляет пошагово перед ответом. Он явно считает слова, буквы или символы, присваивая номер каждому. Он отвечает только после того, как выполнит этот явный этап подсчёта.»

Это помогает Claude, например, правильно решать задачи вроде “найди ‘r’ в strawberry”. По моему мнению, это не тот тип знаний для решения задач, который стоит встраивать в веса модели через обучение с подкреплением — по крайней мере, не сразу и не исключительно таким способом. И уж точно это не должно писаться вручную инженерами в системных промптах.

Это должно происходить через обучение системному промпту — процесс, похожий на RL по постановке задачи, но отличающийся по алгоритму обучения (редактирование текста вместо градиентного спуска). Большая часть системного промпта LLM может быть написана самими моделями через это обучение — по сути, как если бы модель писала для себя книгу о том, как решать задачи.

Читать полностью…

Квест Теория Каст и Ролей

Всем привет. Что я хочу сказать. Когда у вас возникают вот такие мелкие вопросы — зарубите себе на носу, на ухе, на пальце, повесьте в туалете: первым, к кому вы должны всегда обращаться с вопросом, — это вы сами. Это означает — лезьте в Google, в Яндекс, куда угодно, ищите. Потому что вот эти вопросы, которые вы задаёте, — они экстраэлементарные. Их до вас спрашивали сотни тысяч людей, и на них есть огромное количество ответов.

Ответов нет только на нетривиальные вопросы — про какие-то алгоритмы и так далее. Но поверьте мне, может быть, 10% из вас когда-нибудь дойдут до этих редких, сложных вопросов, где действительно появляется творчество. А пока всё, что вы будете делать — это то, что до вас в той или иной степени сделали уже тысячи людей. Они же и выложили всё это в виде схем, описаний, статей, видео и прочего.

Почему это так важно? Потому что, когда вы начинаете создавать свои приложения, автоматизации, сценарии — как угодно это назовите — у вас с самого начала возникает куча вопросов. И всегда будет много вопросов. У вас есть несколько способов получить на них ответы. Можно, конечно, спросить в каком-нибудь чате или на форуме. Но поверьте, это достаточно ненадёжно, потому что непредсказуемо. Допустим, есть у программистов известный форум Stack Overflow, который после появления ChatGPT сократил свой трафик в несколько раз — там сейчас полный дизастр и горе, потому что ChatGPT на огромное количество вопросов отвечает.

Да, ChatGPT часто ошибается в тонких моментах, особенно когда дело касается психологии, но в технологиях он отвечает очень хорошо. Почему? Потому что огромное количество приложений, сервисов, программ описаны с кодом, лежат на GitHub — и именно на этом всём такие модели, как ChatGPT, и обучались. Поэтому это — самый нормальный вариант.

Так что первое, куда вы смотрите — это Google, Яндекс, любой поисковик. Начинаете искать. Там Bing, там ChatGPT и так далее. Вы найдёте ответ в 100% случаев. В 100%! Не ленитесь. Потому что, если вы задаёте мелкие вопросы, это значит, что у вас пока нет навыка, который должен быть по жизни.

Да, конечно, общение, сотрудничество и так далее — это важно. Но я хочу сказать, что спрашивать нужно тогда, когда возникает концептуальное непонимание. Я много раз об этом говорил: моя задача — дать вам общее понимание подхода. Потому что, если вы один раз поняли, вы потом всегда разберётесь. Всегда сделаете. И вообще проблем не будет. Но да, будет какое-то количество мелочей. И здесь — навалом информации везде.

Все разработчики, все учёные работают именно так. Если кто-то не привык — привыкайте. Ничего страшного в этом нет. И почему этот путь правильный? Потому что, когда вы ищете сами — результат зависит от вас. Вы не ждёте. А иногда и нет возможности ждать. Вы не представляете, сколько раз у меня были ситуации, когда я находил какие-то форумы и так далее — и в итоге, в 100% случаев, найти что-то самому в интернете было в сто раз быстрее. Иногда мне приходили ответы через два месяца — а я уже давно всё решил.

Исключение — это поддержка коммерческих сервисов. Это одна из причин, почему я пользуюсь в основном только крупными коммерческими сервисами. Потому что, если что-то ломается, там всегда есть люди, которые помогают: они получают за это зарплату, несут ответственность и так далее.

А всякие бесплатные дребезделки — кажется, ты экономишь деньги, всё работает, всё круто. Проходит месяц — и в самый критический момент всё ломается, и вы вообще не понимаете, что с этим делать. И спросить не у кого. Это чистый опыт. Вы неизбежно с этим столкнётесь.

Как я уже говорил: когда вы начинаете делать свои сценарии, первая трудность — это подключение разных приложений. В Make их примерно 1700, в Zapier — 7000. Они все разные, но у всех примерно одна и та же схема: API, токены, секреты, какие-нибудь секретные ID и прочее.

Вы немного с этим помучаетесь — три-четыре раза. А потом уловите паттерн. Поймёте, что, какой бы ни был сервис, схема у всех похожая. Вы будете сразу понимать, где искать, какую интеграцию, куда читать и так далее. Это всё быстро делается, но нужно выработать навык.

Читать полностью…
Подписаться на канал