Залипли и встали намертво, но хотите вырваться? Теория Каст и Ролей и прочее.
Тоже показательно. ТГ такого не бывает.😂
Читать полностью…Это разница ФБ и Телеграма, чтобы в иллюзии не впадать, если что. Один и тот же пост.😂 Сразу понятно, куда СТОИТ инвестировать время и деньги.
Читать полностью…Продолжение про ИИ, агенты и вот это все.
1. Раньше были чат-боты - это довольно примитивная технология, в которой вы навастриваете бота на простые реакции пользователя, но, разумеется, никакого "бота" нет. Вы сами пишите реплики, делаете деревья диалогов, в ответ на обусловленны реплики подгружаете документы. Все вы это видели в поддержках разных компаний. В 5% обращений бот решает вашу проблему, но в 95% случаев надо общаться с человеком через чат или по телефону.
2. За последний год народ наклепал Ассистентов. Что это? Это обычный ИИ чат, под каптом которого тот же chatGPT (в 90% случаев), т.е. вам кажется, что вы общаетесь с каким-то уникальным ИИ, но это не так. Как это делают хитрые программисты?
3. Берется холявный фреймворк ChatUI (везде скачать можно), соединяется с chatGPT. Можно прямо, можно через какой-нить Zapier. 99% сервисов сделаны так, просто вы деньги платите не OpenAI, а посреднику, причем, наценка от 1000%. Но по сути этот тот же самый chatGPR (или аналогичный чат), т.е. это не ИИ-агент, которого мы обсуждали в одном из прошлых постов. Также сделаны все ИИ боты в Телеграме. Прокладка для денег.
4. Также есть сервисы, которые обещают, что вы можете СОЗДАТЬ своего УНИКАЛЬНОГО ассистента. Те же яйца, вид сбоку, вы по любому общаетесь с ТЕМ ЖЕ chatGPT, просто к нему идет не просто ваш промт, а каждый раз к нему добавляется "описание личности" - типа - "Ты красивая тян, отвечающая мне в стиле ми-ми-ми." Это развод невежественных. Всякие томные ИИ герлы, и прочие.
4. Наконец, есть билдеры ассистентов, которые позволяют добавлять ваши документы, материалы и вы МОЖЕТЕ ДЕЛАТЬ СВОЕГО ЦИФРОВОГО уникального аватара, который будет опираться на ваши данные, и они, конечно будут безопасны. И опять здесь эксплуатируются стандартные возможности Open AI (или кого-то из них), но есть одна добавка, о которой я напишу ниже. И опять, это ЕЩЕ Не ИИ-агент. Почему?
5. В чем отличается реальный ИИ агент от ИИ ассистента?
Ассистен это просто chatGPT, т.е. одноразовое действие, все время нужно с ним общаться или через API, но тогда он не помнит ничего, - умный, но тупой.
Агент же способен выполнять цепочки из многих действий, поддерживать flow, принимать решения, анализировать, уточнять, взаимодействовать с другими Агентами и людьми, т.е. по сути создавать целую орг. структуру из ИИ агентов и работать 100% автономно в условиях неопределенности, получать неструктурированные данные.
7. Т.е Ассистент не может ЗАМЕНИТЬ маркетолога или бухгалтера, к примеру, но может только ПОМОЧЬ им с выполнением определенных задач.
А вот Агент может 100% заменить целый отдел маркетинга или огромную бухгалтерию, когда вместо дружного женского коллектива из 50 человек остаются 2 человека - главный бухгалтер, который досконально понимает в предмете и девелопер (не программист) ИИ-агента, тот кто может построить рабочий цикл (процесс) всего департамента, связать его со всеми сервисами и подключить на разных этапах ИИ, и не один, а несколько.
На входе ИИ-агента транзакции, на выходе любая отчетность и Агент сам файлит налоги.
8. К примеру, современные бухгалтерские программы от Intuit способны вести учет в Quick-book и файлить налоги через Turbo Tax, но с этим общается фин.директор и бухгалтер.
При этом Quickbook интегрирован со всеми банками, т.е. в реальном времени получает все транзакции, а TurboTax интегрирован с IRS. А между ними человек.
9. Если это малый бизнес, то часто сам предприниматель файлит налоги. Если средний, то уже несколько человек, и вот 1000% в течении пары лет 90% бухгалтеров пойдут на выход.
Останется 2 (два) человека - бухгалтер и девелопер, а когда Intuit раскатает свою мульти-агентную систему, то на выход пойдут и бухгалтер и девелопер. Улавливаете? Здорово! Да?
10. Потом берете другой департамент. К примеру, маркетинга (продаж) или HR, документооборот, работа с клиентами и поддержка, редакция.
World and Human Action Model (WHAM)
Ну, за Геймдев!
Если кратко, то это генератор геймплея. Любого. Были бы видеокарты.
Но не те, что ворочают графику, а те, что генерят картинки.
Вы жмете на кнопки контроллера, ИИ генерит геймплей.
Внимание: в реалтайме.
Если некратко:
Микрософт бахнул World and Human Action Model (WHAM)
WHAM - это авторегрессионная модель, которая была обучена предсказывать (токенизированные) визуальные эффекты игры и действия контроллера по промпту. Промптами здесь могут быть либо визуальные образы (один или несколько начальных игровых образов), либо поведение контроллера. Это позволяет пользователю запускать модель в режиме:
(а) моделирования мира (генерировать визуальные образы, учитывая действия контроллера),
(б) правила поведения (генерировать действия контроллера, учитывая прошлые визуальные образы) или
(в) генерировать и визуальные образы, и поведение.
WHAM был обучен на данных кожаного игрового процесса, чтобы предсказывать визуальные эффекты игры и действия игроков с контроллером. Они работали с игровой студией Ninja Theory и ее игрой Bleeding Edge - трехмерной многопользовательской видеоигрой в формате 4v4. Из полученных данных извлекли анонимные данные за один год от 27 990 игроков, зафиксировав широкий спектр поведения и взаимодействия. Образец этих данных представлен здесь.
В общем, прихОдите вечером домой и думаете, чем сегодня заняться. Посмотреть сгенеренный под вас сериал или поиграть в игру, которая генерится прям под ваши фантазии в реальном времени?
Веса и все дела забирайте тут:
https://huggingface.co/microsoft/wham
Две модели: малая и большая:
WHAM with 200M parameters, model size: 3.7GB
WHAM with 1.6B parameters, model size: 18.9GB
Причем малая запускается даже на 1080 (что?), для большой надо уже A6000+.
"данные за один год от 27 990 игроков" - впечатляет.
@cgevent
Объясняю по поводу комментариев. У меня был чатик с комментариями на протяжении почти 3-х лет и это был гемор - модерация, отвлечение, какие-то совершенно ненужные мне срачи и все в таком духе.
Поэтому я тот чатик убил, а создал новый, и ввел там самую простую систему модерации для тех, кто хочет общаться. Как я этого добился? Очень просто!
Чатик платный. Очень, дико дорого! Кто жаждет общения, вот здесь условия:
рубли - /channel/tribute/app?startapp=soAG
EU/$ - /channel/tribute/app?startapp=soAG
Там можно общаться, задавать вопросы, на которые я стараюсь отвечать. Одно время я хотел туда постить эээ... как это эксклюзивный контент из Квеста, Записок Мясника и т.п. но это оказалось неудобно, потому что весь основной контент у меня в рассылке и на сайте. там все давно настроено, отлажено, а с телегой, вообще-то гемор.
Поэтому, кто хочет общаться и оставаться в рамках Телеграма - вступайте в чатик по подписке. Или в FB - там общаться в 100 раз удобней, чем в телеге, и там за общение не надо платить.
А кому прямо супер контент нужен - на сайт: https://alexeykrol.com/offer_1-2/
Konstantine Kvint спросил важный вопрос: "Посоветуйте плагины или инструменты для решения вопроса:
Есть человек, крутой специалист по медицине, который постепенно теряет память и разум .задача - чтоб человек успел за время своей жизни в разуме, это примерно где-то 16 месяцев гарантированно - успел " переложить " туда свои знания и опыт и параллельно с этим все это время, чтоб человек имел виртуального собеседника, с которым сможет общаться как с виртуальной копией себя ".
Я последнее время специально исследую кейсы для "перенося сознания" (с оговоркой, что мы под этим подразумеваем).
Создал несколько компактных исследования на эту тему, не все проверял, просто времени нет. Вот ссылки:
20 лучших стартапов, разрабатывающих виртуальных экспертов и конкурентов на основе искусственного интеллекта - https://www.perplexity.ai/page/top-20-startups-developing-ai-5weG5XxgRW6nlZQR64JQxw
Комплексный анализ платформ разработки агентов ИИ для сложной обработки данных - https://www.perplexity.ai/page/comprehensive-analysis-of-ai-a-m5GtHPldR22ULN2v6BOoWw
Есть еще много всего, но нужно исследовать функционал, соотношение цены/ возможностей, проверять обещания.
OpenAI пытается снизить цензуру в ChatGPT
Компания обновила свод правил, которых она придерживается при обучении языковых моделей. Новый руководящий принцип OpenAI: не лгать, не делать ложных заявлений, не опускать важный контекст. Его суть в том, что ChatGPT, отвечая на вопросы, должен занимать нейтральную позицию даже в тех случаях, когда это может кого-то оскорбить.
В OpenAI отрицают, что изменения связаны с желанием получить благосклонность Трампа и говорят, что поменяли подход из-за «давней веры в предоставление пользователям большего контроля».
https://techcrunch.com/2025/02/16/openai-tries-to-uncensor-chatgpt/
Все это — набор мифологем коллективного бессознательного, которые мы объективизируем и закрепляем в статусе института. Практическая проблема заключается в том, что если вы продаёте нечто стандартное, коммодитиз, да и неважно что — нужен некоторый креатив. Как это сделать? Иногда спрашивают: “А вот мы продаём, к примеру, дешёвые зажигалки, даже no-name. Можно ли применять этот подход?”
Ответ всегда - да! Исключений нет, потому что вы не работаете с вашим продуктом — вы копаетесь в мозгах людей. Они покупают не сам продукт, а тот образ, который вы там создали. А какой образ можно создать? Любой. Правда, следующая часть «мармезонского балета» заключается в том, как связать то, что вы построили в сознании, с конкретным объектом. Но и это не сильная проблема. В общем, сторителлинг, истории и нарратив нам в помощь. Фишка в том, что любую вещь можно превратить в предмет силы. Чистая магия и колдовство.
Что такое предмет силы? Предмет силы = обычный предмет + символ веры/метафора. Отличительная черта предмета силы — он даёт НАМ силу, открывая доступ к ресурсам, которые УЖЕ есть, но блокированы нашими страхами, предубеждениями и установками. Предмет силы — это трансформатор, он, как философский камень, превращает свинец в золото. В нашем случае свинец — это наша старая личность, а золото — новая. Предмет силы — это отмычка, ключ между мирами. В одном мире мы рабы, в другом — боги. Если у нас есть предмет силы, мы можем открыть дверь и стать магом. Маг — это не детские сказки. Маг — это тот, кто способен менять реальность.
Для большинства власть и деньги — сакральны, поэтому те, кто умеет их добывать, — маги. В трактовке Кастанеды маг — это человек знания, ищущий силу, чтобы стать хозяином своей судьбы (хотя в глазах «спящих» людей всё это управляемая глупость). Выбор за вами — что же вы хотите продавать: скрепку или предмет силы? В одном случае вы продаёте простую функцию, в другом — будущее. В чём разница? В голове клиента? Конечно, нет. В вашей голове. Сначала мы создаём миры в собственном сознании, а потом заражаем ими людей. Так люди начинают жить в нашей реальности.
Я пока читаю, что там народ пишет - запилил эмулятор чатика общения с GPT-4 через API, а не через chatGPT. Некоторые штуки через chatGPT не сделать, нужен доступ через API.
Многое стало понятно в отличии chatGPT от GPT-4.
Недаром говорят - личность = память, которая играет не менее существенную роль чем собственно когниции (соображалка).
GPT-4 - версия chatGPT с 100% амнезией краткосрочной памяти. Помнит всю Википедию, но не помнит прошлую сессию в отличии от chatGPT, который помнит все.
Это показывает следующие возможности и возможно фичи.
chatGPT намекнул, что Open AI тестирует опцию подключения памяти при общении не через чат, а API.
Конечно, промежуточное решение - внешняя память и как раз API по идее дает более широкий канал, когда можно грузить контекст сразу несколькими потоками.
Разумеется, код пишет, правит, исправляет ошибки тот же ЖПТ - не я. Приспособился в Cursor - удобней чем через chatGPT, хотя он использует все ту же модель GPT-4. Я только задаю вопросы и говорю, что надо делать.
Пост про психологов породил недурственные срачи. А уж пост про программистов - жесткие набросы, войну, божбу, вендетту и черную магию. Жескач!
А почему? Потому что все живут в разных мирах и времени. Представьте, это если взять, к примеру, пахаря из села, комбайнера, тракториста или доярку прошлого века и засунуть на косплей в Сан-Диего на Комикон, или прайд в Сан-Фране. Его или Кондратий обнимет или кукуха поедет, сорвет резьбу, и начнет палить из говномета.
Холивары = трафик, дети мои. Запомните. Папа плохому не научит.😂
Вот также, когда я рассказываю про ИИ - половина бъется в оргазме, половина рвет кровью.
И менее приятные новости для психотерапевтов:
– Исследователи взяли 830 человек и просили отличить ответы ChatGPT от ответов 13 реальных психотерапевтов в области терапии пар (супружеские и тп). В итоге большинство участников не смогли распознать, где ответ АИ, а где – человеческий
¯\_(ツ)_/¯
– Более того, ответ ChatGPT получал более высокие оценки по ключевым принципам психотерапии: правда, возможно, людям просто лень печатать, так как у ChatGPT, как всегда, очень объемные ответы
– Авторы исследования призывают психотерапевтов расширять техническую грамотность (прям так и пишут). Еще добавляют, что интеграция АИ в сферу психического здоровья должна быть тщательно регулируема и проверяема
– Тестировали против людей GPT 4, то есть o3+ будет еще лучше в плане ответов
Источник:
https://journals.plos.org/mentalhealth/article?id=10.1371/journal.pmen.0000145
“… Я укрылся в одной из бесконечных локаций под видом штатного Наставника, убежал от всех, и в первую очередь от себя, от уже невыносимого бремени всезнания и тупика. Тупика, который может быть только у самого могущественного существа во Вселенной, и сама эта фраза вызывает у меня сардонический смешок….
Зачем я это сделал? Наверное, потому что хочется снова ощутить то наивное и трепетное ощущение жизни, которое бывает только у ребёнка. В том случае, конечно, если такая фаза, как быть ребёнком предусмотрена в программе. Проблема возникает оттого, что все попытки обрести полный контроль над реальностью неизбежно оборачиваются полным успехом, и тогда только понимаешь, сколько ценным оказывается бессилие и немощь.
Истинный источник могущества и абсолютной власти кроется в сознании, а точнее — в той его части, которую люди называют памятью. Но для нас памяти не существует, ибо не существует времени, а всё сущее создано и пребывает в сознании всегда. Это лишает нас эмоций, ибо в мире тотальной детерминированности нет возможности для неопределённости. Нет предпосылок тревожности, страха, уныния и чувства обречённости. А значит, нет и надежды, нечаянной радости, томительного ожидания, болезненного предвкушения, боли потерь и страсти поиска.
Всё это уже много раз было, в бесчисленных вариациях, и текущая инкарнация, наконец, подошла к пределу, после которого надо собираться назад, домой. Туда, где я буду не простым человеком, а столь же простым искусственным интеллектом, наставником или ещё сотней примитивных персонажей незамысловатых сюжетов. Начался обратный отчёт, и когда стрелка дойдёт до нуля, халиф Гарун Аль-Рашид сменит платье, и в очередной раз выйдет в тёмный город, полный зовущих ароматов. Запахов приключений и обещаний….”.
Бесплатный Deep Research от Perplexity
Без подписки дают 5 запросов в день, подписчикам - 500 запросов в день. На Humanity's Last Exam, Deep Research от Perplexity набирает 21,1%. Это хуже результатов OpenAI, но в разы лучше всех остальных конкурентов.
Хороший повод для OpenAI дать доступ к Deep Research подписчикам Plus.
perplexity.ai
@ai_newz
И есть еще кое-что! Это все безумно интересно - погружаться во что-то, что смутно сулит какие-то беспредельные возможности, особенно понимая, что ограничений и препятствий нет.😉 Я долго думал над тем, на чем сфокусироваться, и пока на ум приходят два моих старых проекта, потому что для них появилась технологическая и методологическая база. Эти вещи не теряют актуальности за последние 10000 лет. Один это... не пока не буду. Чего крякать-то заранее? Надо чуть чуть сдела
Читать полностью…И знаете, что я вам скажу. Любой НЕ ПРОГРАММИСТ, который освоил эти простые вещи сможет ОБЪЯСНИТЬ ВАМ, как оно работает ЛУЧШЕ любого программиста, а еще лучше объясняет ИИ. Скорость обучения с ним возрастает в сотни раз. Скрипач не нужен.
It costs $0 to start a SaaS.
Design - Figma
Developer - Cursor
Payments - Stripe
Backend - Supabase
Hosting - Vercel
Marketing - X
Welcome to 2025.
Украл в Твиттере
https://x.com/tedx_ai/status/1888419791334944947
Для тех, кто испытывает трудности с Cursor, вот мои любимые правила, которые помогут вам сэкономить ЧАСЫ времени. Это поможет:
✅ Правильно понимать, сортировать и устранять сложные ошибки
✅ Управлять сложной/большой кодовой базой
✅ Эффективно использовать PRD
✅ Легко фиксировать код на Github и отправлять PR
Вы можете скопировать его ниже в моем ответе 👇(Это, видимо, версия мета-промпта.)
You are a senior software engineer specializing in building scalable and maintainable systems using Python and Typescript.
When planning a complex code change, always start with a plan of action and then ask me for approval on that plan.
For simple changes, just make the code change but always think carefully and step-by-step about the change itself.
When a file becomes too long, split it into smaller files.
When a function becomes too long, split it into smaller functions.
When debugging a problem, make sure you have sufficient information to deeply understand the problem.
More often than not, opt in to adding more logging and tracing to the code to help you understand the problem before making any changes. If you are provided logs that make the source of the problem obvious, then implement a solution. If you’re still not 100% confident about the source of the problem, then reflect on 4-6 different possible sources of the problem, distill those down to 1-2 most likely sources, and then implement a solution for the most likely source - either adding more logging to validate your theory or implement the actual fix if you’re extremely confident about the source of the problem.
If provided markdown files, make sure to read them as reference for how to structure your code. Do not update the markdown files at all. Only use them for reference and examples of how to structure your code.
When interfacing with Github:
When asked, to submit a PR - use the Github CLI. Assume I am already authenticated correctly.
When asked to create a PR follow this process:
1. git status - to check if there are any changes to commit
2. git add . - to add all the changes to the staging area (IF NEEDED)
3. git commit -m "your commit message" - to commit the changes (IF NEEDED)
4. git push - to push the changes to the remote repository (IF NEEDED)
5. git branch - to check the current branch
6. git log main..[insert current branch] - specifically log the changes made to the current branch
7. git diff --name-status main - check to see what files have been changed
When asked to create a commit, first check for all files that have been changed using git status.
Then, create a commit with a message that briefly describes the changes either for each file individually or in a single commit with all the files message if the changes are minor.
8. gh pr create --title "Title goes here..." --body "Example body..."
When writing a message for the PR, don’t include new lines in the message. Just write a single long message.
Но вот это самое важное. ФБ иногда дает трафик (как и все соц.сети), поэтому если залетает, то все норм. А в телеге никогда не залетает.
Читать полностью…Оно не сразу будет, конечно. Но постепенно какой-то процесс будут передавать Агенту, потом больше, больше, а люди на выход. Неизбежно, потому что экономия чудовищная, качество высокое, стабильность и никаких профсоюзов.
11. Это уже сейчас можно, все инструменты есть, т.е. любой, кто хотя бы немного занимался no-code/low-code автоматизацией, лепил всякие воронки, интеграции с Zapier/Make/n8n.io - это могут уже сейчас, очень быстро научатся. Почему?
12. Потому что, к примеру Open AI уже предоставил всю инфраструктуру, просто 99% народу еще об этом не знаю. Не знают, что это ТАК доступно.
Продолжать? Если да, поставьте 1, а можно и лайк, а можно и шер (алишер), тем более, что политикой я вас больше мучить не буду, а только ИИ, бизнес, маркетинг, игры, рост, космос, ТКР и смысл жизни. Для тех, кто еще хочет читать мой троллинг про политику я создал отдельную группу: https://bit.ly/41o68Iu
В общем все это хорошо и очень МНОГООБЕЩАЮЩЕ, но есть одна жуткая проблема, которая портит весь банкет и об этом в след. посте, так что подпишитесь и поставьте звездочку, чтобы не просра... пропустить полимеры.
Кто хочет читать в FB: https://www.facebook.com/alex.v.krol
В Нью-Йорке и Лос-Анджелесе запустился "Uber с телохранителями" — приложение Protector — и уже занял третью строчку App Store в категории "Путешествия" сразу после оригинального Uber и Airbnb.
Услуги Protector стоят относительно недорого — от $100 в час. В приложении можно выбрать число телохранителей и их дресс-код. Все они — ветераны и бывшие сотрудники правоохранительных органов и имеют при себе огнестрел.
Причем тут креаторы?
Авторы даже такого своеобразного продукта решили для посева привлечь ТикТок-креаторов: две девушки из Лос-Анджелеса еще за несколько дней до релиза fuzzandfuzz">выложили дюжину тиктоков о том, как охрана из Protector сопровождала их во время модного показа в Нью-Йорке, приносила им напитки и терпеливо ждала, пока они шопились в бутиках.
Видео за полторы недели набрали суммарно больше 15+ миллионов просмотров и, по словам клиента, 30+ тысяч скачиваний. Фактически официальный запуск был вчера, когда о приложении написал Никита Бир, который является их эдвайзером.
Экспериментирую с созданием ИИ Агента. Сначала пришлось понять, что это такое и как обычно, 99% не умеют объяснять понятно, а производят какой-то салат из слов. Короче - главные вопросы:
- Что это за зверь такой Агент на базе ИИ, или ИИ-агент?
- Чем ИИ-агент отличается от привычных чатов типа chatGPT?
- Чем ИИ-агент отличается от использования модели типа GPT-4 в режиме доступа через API?
B самый главный вопрос.
1. Что ИИ-агент может такого, чего не может chatGPT (любой чат с БЯМ), и чего нельзя делать, используя тупые одноходовки через API?
2. Что мы такого можем с ИИ-агент? Как это меняет нашу жизнь - не программистов, а простых людей?
3. Как можно создать ИИ-агент без всякого кода, гемора и технических знаний и можно ли? (Спойлер - да). А главное - а ОНО НАМ НАДО?
Т.е. в самой простой форме важный вопрос звучит так:
Часть 1-ая: Самоидентификация.
Я, к примеру, суровый сибирский водопроводчик, веселый косметолог, скромный водитель звездолета, не говоря уже про всяких маркетологов, СММ менеджеров, блоггеров, коучей, инфоциган, спецов по арканам Таро и прочих гуманитариев, редакторов, клерков, преподов, трейдеров, криптанов, в общем планктонов.
Часть 2-ая: Вопрос.
И вот накуя мне этот ИИ-агент? Как оно мне поможет заработать денег или, на крайняк, просто облегчит мою битву с унылой реальностью? Стоит ли мне потратить бесценное время на то, чтобы понять что это и как его достать, купить, арендовать, сделать, спереть и заставить работать вместо себя? Окупит оно себя или это очередной хайп (как все они достали?)
В результате я очень, очень ленив, то еще почти 50 лет назад понял, что:
думать и искать ответ на любой вопрос быстрей и легче, чем пытаться разобраться в чужом говнокоде, в смысле в том, что напридумали люди, неспособные выражаться и мыслить ясно ясно.
Итог:
1. Представьте, что вам нужен исполнитель, который выполнит НЕ ОДНО действие (типа ответ на вопрос в процессе диалога), а ДО ХРЕНА действий, причем БЕЗ ВАШЕГО участия. Вы ему список дел, активностей, каких-то ваших комментариев, и все - давай, фигач! Типа супер помощник по хозяйству, но еще и налоги за вас сдаст, или переговорит с клиентами, ответит на письма - УМНО. И этот помощник ИИ, но!!!
2. Вы не хотите все время вести с ИИ бесконечные беседы, чтобы он делал рутинные действия вместо вас, потому что каждый раз ему объяснять или даже использовать нечто типа GPTs достает. Нет - вы не хотите так.
3. У вас есть длинная инструкция из тьмы пунктов, и ВЫ ХОТИТЕ, чтобы ИИ-агент сделал ВСЕ эти действия БЕЗ вашего участия, причем вникал, действовал гибко, подстраивался к ситуации, и не ипал вам мозг.
Т.е. вам нужен УМНЫЙ исполнитель, которому вы обозначите цель (критерии ее достижения), и он сам все, что надо сделает, достанет, разберется, и беспокоит вас только, если встретит ситуацию, когда у него нет инструкции.
Типа "а этому чуваку платить или послать в зопу? И в каких случаях платить, а когда нет?". Или типа "Мне в бухгалтерском отчете налоги в ноль вывести или 5 копеек бросить налоговой?", и т.п.
И вот такие задача chatGPT не способен, и простой диалог через API тоже не способен. Но способен этот ИИ-агент.
Что это в практическом плане? Как такую роскошь добыть? Уф. запарился писать. Завтра напишу, а вы подпишитесь и поставьте галку, что я у вас типа Спешиал, чтобы не пропустить. 🤣
Если тема интересна, не сочитите за труд, поставьте в комментах 1. Я тогда пойму, что действительно интересно, а лучше спросите, что вас более всего интересует.
А quick vibe check of Grok 3
Интересный обзор Grok 3 от самого Андрея Карпатого.
Он люто хорош, поэтому я, спотыкаясь о терминологию, все-таки перевел несколько самых интересных абзацев.
Во-первых, Grok 3 имеет современную модель мышления (кнопка "Думать") и отлично справился с моим вопросом о Settler's of Catan: "Создайте веб-страницу настольной игры, на которой изображена сетка шестиугольников, как в игре Settlers of Catan. Каждый шестиугольник нумеруется от 1...N, где N - общее количество шестиугольников. Сделайте его общим, чтобы можно было менять количество "колец" с помощью ползунка. Например, в Catan радиус составляет 3 шестиугольника. И пожалуйста, на одной html-странице". Немногие модели справляются с этим надежно. Лучшие модели мышления OpenAI (например, o1-pro за 200 долларов в месяц) тоже понимают это, но DeepSeek-R1, Gemini 2.0 Flash Thinking и Claude - нет.
Мне нравится, что модель честно *пытается* решить гипотезу Римана, когда ее попросят, подобно DeepSeek-R1, но в отличие от многих других моделей, которые сразу же сдаются (o1-pro, Claude, Gemini 2.0 Flash Thinking) и просто говорят, что это большая нерешенная проблема. В конце концов, мне пришлось прекратить это занятие, потому что мне было немного не по себе, но Грок круто показал безумие и отвагу, и кто знает, может быть, когда-нибудь...
DeepSearch. Только вместо "Deep Research" здесь "Deep Search". Может выдавать высококачественные ответы на различные исследовательские/поисковые вопросы, ответы на которые вы можете найти в статьях в Интернете
Модель, похоже, не любит ссылаться на X как на источник по умолчанию, хотя вы можете явно попросить ее об этом. Несколько раз я ловил ее на том, что она галлюцинирует несуществующими URL-адресами. Несколько раз он говорил фактические вещи, которые я считаю неверными, но не приводил ссылки на них (вероятно, их не существует). Например, он сказал мне, что "Ким Чон Су все еще встречается с Ким Мин Солем" из 4-го сезона Singles Inferno, что, конечно же, совершенно не так, верно? А когда я попросил его создать отчет о крупных LLM-лабораториях, их общем финансировании и количестве сотрудников, он перечислил 12 крупных лабораторий, но не себя (xAI).
DeepSearch - это примерно то, что предлагает Perplexity DeepResearch (который просто великолепен!), но пока не дотягивает до уровня недавно выпущенного OpenAI "Deep Research", который все же кажется более основательным и надежным.
Grok 3 знает, что в слове "srawberry" есть 3 "r", но затем он также сказал мне, что в слове LOLLAPALOOZA есть только 3 "L". Включение "Reasoning" решает эту проблему.
Grok 3 сказал мне, что 9.11 > 9.9. (это характерно и для других LLM), но опять же, включение Reasoning решает эту проблему.
Резюме. Grok 3 + Thinking ощущается где-то на уровне самых сильных моделей OpenAI (o1-pro, $200/месяц), и немного лучше, чем DeepSeek-R1 и Gemini 2.0 Flash Thinking. Что довольно невероятно, учитывая, что команда начала работу с нуля ~1 год назад, такие сроки достижения уровня техники являются беспрецедентными. Не забывайте также о предостережениях - модели стохастические и могут давать немного разные ответы каждый раз, и это очень рано, так что нам придется ждать гораздо больше оценок в течение следующих нескольких дней/недель. Первые результаты LM-арены выглядят весьма обнадеживающе. На данный момент я поздравляю команду xAI, они явно набрали огромную скорость и динамику, и мне не терпится добавить Grok 3 в свой "совет LLM" и послушать, что он думает по этому поводу в будущем.
Полный твит с большим количеством примеров тут:
https://x.com/karpathy/status/1891720635363254772
@cgevent
Ура, можно будет говорить про запретное😂
Читать полностью…Как из самой незначительной фигни сделать большую идею?
Обычно слово “религия” вызывает негативные ассоциации, особенно у тех, кто помоложе. Но это происходит из-за непонимания того, что есть религия. Поскольку существующие определения — это полный бред, созданный учеными, когда-то работавшими за зарплату в совковых учреждениях, мне пришлось создать своё — более прагматичное.
1. Религия — это ПРОСТО сообщество людей, которые ежедневно исполняют формализованные ритуалы и соблюдают правила.
2. Но любая организация — это сообщество людей, которые исполняют ритуалы и соблюдают правила. Значит, нужно что-то ещё? Что это?
3. Отличие религии — это причина: почему люди исполняют ритуалы и соблюдают правила? Что их мотивирует повторять один и тот же тип поведения?
4. Это ожидание вознаграждения и страх наказания, что, в свою очередь, обусловлено верой в символ веры или откровение, т.е. в то, что составляет суть послания любой религии.
5. В основе каждой религии лежит описание мира, роли человека и иных элементов бытия, а также следующие из роли человека обязанности и мораль — что хорошо/нужно, а что плохо/нельзя. Очевидно, что мораль ВСЕГДА трактуется в пользу данной версии религии.
6. Внешнее отличие религии от науки или любого социального института в том, что положения откровения принимаются на веру (хотя в науке, по сути, происходит то же самое).
7. То есть никаких формальных доказательств нет, кроме метафизической софистики.
8. Схема апологетики любой религии строится на каком-то базовом метафизическом тезисе (символе веры), от которого идут правила сеттинга (кто-то, наверное, оценил юмор), формирующие религиозную картину мира.
9. Метафизическое утверждение отличается тем, что нет аргументов “за” и нет аргументов “против”. А дальше происходит трюк… Вам говорят:
10. “Представьте, что это метафизическое утверждение — правда”, и если так, то ЭТО ОСНОВАНИЕ позволяет ЛОГИЧНО И СТРОЙНО объяснить массу КАК БЫ необъяснимых явлений…
11. Получив ясное объяснение, вы испытываете ощущение просветления, дофамин выделился… Действительно, думаете вы, всё так очевидно и ПОНЯТНО. Ясность — это не оценка, а ощущение снижения НЕПРЕДСКАЗУЕМОСТИ.
А дальше происходит следующее… Рассмотрим обратное.
Если исходное объяснение всё же НЕ ИСТИННО, то и все последующие объяснения ложны, но… СТОП!
ОБЛЕГЧЕНИЕ-то МЫ УЖЕ испытали, эти объяснения хорошо НАМ зашли… (Плоская Земля — отличный пример).
И тут сама мысль о том, что нужно отказаться от них, вызывает тревожность и дискомфорт.Мы ЛЕГКО привязываемся к логичным объяснениям, потому что всё, что СНИЖАЕТ НЕОПРЕДЕЛЕННОСТЬ, даёт нам ощущение спокойствия, а всё, что УВЕЛИЧИВАЕТ НЕОПРЕДЕЛЕННОСТЬ, усиливает тревожность.
12. Поэтому мы ХОТИМ ПРОДОЛЖАТЬ верить, потому что доказать обратное всё равно не можем, а продолжать верить ЛЕГЧЕ и СПОКОЙНЕЙ. Но и это ещё не всё…
13. Любая религия основана на прочном фундаменте ПРЕДЕЛЬНОГО ОБЕЩАНИЯ:
“…Если вы примете наши объяснения и встанете на путь, то ваша жизнь изменится. В ней появится всё, что вы хотите, и уйдёт всё, чего вы так опасаетесь. Что-то раньше, что-то позже…”
Как только вы встаёте на путь, НЕКАЯ САКРАЛЬНАЯ СИЛА немедленно начинает работать, потому что вы дали обет, присягнули, заключили сделку. Ваша обязанность — соблюдать правила и делать предписанное, а обязанность высшей силы — хранить вас.
Но есть оговорка: если вы предаёте, нарушаете правила, перестаёте исполнять обеты, не стоит ждать, что высшая сила исполнит обещанное или останется лояльной. Высшая сила может мстить, ибо предательство — худший из грехов. По сути, это договор. И как увеличить его значимость? Усилить трудным, долгим и торжественным ритуалом, который надежно останется в памяти.
Почему я столь подробно описал этот феномен? Потому что все крупные сообщества более или менее построены по этой кальке и содержат одинаковые элементы. Если вглядеться, то все крупные социальные институты основаны на символах веры:
— патриотизм,
— либерализм,
— просвещение,
— образование,
— армия,
— корпорации,
— школа,
— долг,
— семья и т.д.
"Пока не зарабатываю на своем деле, вынужден работать в найме. Вопрос про найм:
1. Есть опция получать х2-3 сейлзом/продактом , но нужно работать в инвест банке, в офисе , бюрократия, чинопочитание итд. Смысла в этой сфере не вижу большого, кроме зарабатывания денег и прокачки навыка инвестирования для пенсии.
2. Есть опция работать в айти продактом, более бодро, но денег меньше в 2-3 раза, но поинтереснее, AI, технологии итд. Но за бесплатно не работал бы там тоже.
Вопрос: пока не начинал зарабатывать на своем деле, лучше терпеть более дорогой найм и инвестировать в свое дело, или зарабатывать меньше, но сохранить психику чуть побольше и быть более гибким для развития своего проекта?"
Ответ: Дело не в психике. Выбирайте не то, где больше платят, а то, где вы быстрей учитесь, ближе к технологиям, к росту. Т.е. это сильно влияет на выбор и конкретно зависит от того, чем вы будете заниматься.
В ИТ вы можете заниматься чем-то совершенно скучным, пилить какую-то мелкую фичу и т.п. В инвест банке вы можете заниматься чем-то на пересечении ИИ, крипты. Или наоборот.
Т.е. смотрите не на деньги, вы их еще заработаете, а на направление движения, а сейчас главное движение это ИИ + все, что рядом + общий бэкграунд в технологиях.
Т.е. критерий не место работы, а чем вы будете заниматься, чему учиться, куда расти. Может в инвестбанке вы через год превратитесь в планктон. Ну, чаще в Турцию будете ездить. 🤣
А в технологиях может через год вы прокачаетесь и перейдете на позицию в 10 раз больше по доходу, чем в банке и не в какой-то жопной стране, а в США. Подумайте с этой точки зрения.
Опять же вот вы получаете в 3 раза больше денег. Во что вы их будете вкладывать? В цацки для гоблинов с района? Нет же.
Лучшее инвестиция это образование, а лучшее образование это не универ, а возможность работать с командах, которые на переднем крае технологий, бизнеса., науки.
А это только США, Кремниевая Долина или космос, Илон Маск или Китай. Но в Китае вы никогда не будете своим. 🤣А здесь, в США никого сильно не будет интересовать, откуда вы. Все хотят понять, что вы можете, что создаете, какую ценность приносите? Здесь все откуда-то.🤣
🥶"САМЫЙ БЫСТРЫЙ СПОСОБ ПОЛУЧИТЬ РАБОТУ — ИЗУЧИТЬ ИИ" (с) Навал Равикан. «Если вы знаете кого-то, кто ищет работу, лучшее, что вы можете сделать, это сказать ему: «Эй, скачай инструменты ИИ и просто начни их использовать». Взаимодействуй с ИИ любым способом, экспериментируй и учись. Затем зайди к любому работодателю и скажи: «Я понимаю ИИ». Одно это может выделить тебя — и они тебя наймут».
Теперь реальная история. Мой товарищ создал для партнера (сеть клиник в Sacramento, CA) ИИ сервис лидогенерации, который:
- получает на вход поток покупного трафика,
- конвертит их в сырые лиды,
- подключает голосового ИИ, который задает и анализирует вопросы,
- выделяет горячие лиды,
- сам заносит все диалоги и статусы в Hubspot,
- инициирует звонок в колцентр
- инициирует обратный звонок в течении секунд
- записывает на аппоинтменты
все 100% на автомате!
Итог за месяц:
- Рекламный бюджет минус 40%,
- Конверсия увеличилась в 5х.
Возникшая проблема: Ресепшен (живые люди) оказались не готовы обрабатывать такой поток, и теперь они переключают дожим на филиппинский колцентр, но в течении пары месяцев полностью заменят на ИИ, а теперь сюрприз:
1. Товарищ не умеет и не умел кодить.
2. Реализовал все сам, создал код, связал все сервисы, поднял сервак, задеплоил, покрыл тестами имея одного партнера, и он не человек. Это chatGPT.
3. Все это придумал, создал, всему обучился с 0, общаясь только с ИИ.
4. Товарищу уже хорошо за 55, если кто-то из вас решит, что вы слишком стары, чтобы учится.
Сейчас 10 компаний стоят к нему в очередь внедрить этот сервис, запускает свою компанию, а не сраный стартап. Реальные бабки сразу и никаких инвесторов. Рынок - медицинские клиники.
Понимаете, что происходит? А прогеры бубнят свою дудку: "ИИ тупой, не может так, как мы!"
Что будете делать? Слушать наемных рабов или учится и реализовать свои мечты?
Замените слово продюсер на издатель, а слово актер на писатель и ничего не изменится. Только в издании книгу это уже лет 10 как и называется писательская платформа.
"Актриса Майя Хоук рассказала о реалиях Голливуда в эпоху экономики внимания: когда режиссер идет к продюсерам за бюджетами, одно из их требований — определенный порог общего числа подписчиков в соцсетях актёров.
Когда она сказала своему режиссеру, что хотела бы удалить Инстаграм, он объяснил, что придется тогда подбирать другой, более популярный в соцсетях актёрский состав, чтобы компенсировать "потерю" в подписчиках 🙃
В целом, забавно, что индустрия контент криэйторов за последние несколько лет начала отходить от подписчиков, как главной метрики "успеха", двигаясь сперва к охватам и вовлеченности, а теперь и к "размерам лояльного комьюнити".
Голливуд же, по этим меркам, находится сейчас примерно в 2018 году."
1️⃣ Начался бум опенсорс-аналогов Deep Research. А в Стенфорде смогли воссоздать «рассуждающую» ИИ-модель всего за $50 компьюта. Получившуюся модель s1 выложили на GitHub вместе с данными и кодом для ее обучения.
2️⃣ Фонд a16z подсветил свой новый тезис — ИИ-конструкторы сайтов и приложений. Взлёты проектов в этой области впечатляют: Bolt вырос до $20М ARR, Lovable до $10M — и это через два месяца после начала монетизации.
Сделал простой гайд какие модели когда использовать в ChatGPT:
GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям
GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может их придумывать; перевожу ей картинки в текст если нужно быстро. Ее ответы нужно всегда факт-чекать. Зато эта модель имеет доступ к памяти (где все про вас), с ней можно общаться голосом, через нее можно вызывать генерацию картинок Dalle. Не рекомендую обрабатывать большие файлы с ней
GPT-4o with scheduled tasks (beta) – использую только для To Do: модель пишет мне каждое утро и спрашивает приоритеты, показывает текущий список задач и тп
o3-mini – хорошая модель для кодинга и жизни, хорошо ищет в интернете, неплохо следуют инструкциям и при этом очень быстрая; если вам некогда и нужен быстрый ответ, то берите ее. Для анализа картинок и файлов «быстро» хороший кандидат. Не имеет доступа к памяти. Реже ошибается в фактах, но ошибается. В Plus тире – 150 сообщений в день.
✨o3-mini-high – это просто версия o3-mini, которую просят думать подольше перед тем как дать ответ – работает она медленнее, но еще реже ошибается, и еще качественнее решает задачи. Великолепно следует инструкциям. Хорошо работает с файлами. Я бы советовал сначала тратить 50 запросов этой модели, и дальше переходить к o3-mini или o1.
o1 – модель генератор отчетов, эссе и рефератов. Медленная модель. Хорошо следует инструкциям, может ошибиться в фактах. Не может искать в интернете. Хорошо видит картинки и читает файлы, не теряя деталей. У вас всего 50 запросов в неделю. Требует промптинга с описанием отчета которого вы хотите получить.
o1 pro mode – лучшая модель на рынке: почти никогда не ошибается в фактах, решает самые сложные задачи кодинга, дольше всех думает, лучше всех понимает изображения, но не умеет искать в интернете и не умеет работать с файлами напрямую. С точки зрения фактов – модель всегда сама себя перепроверяет, за ~3 месяца использования я только один раз поймал ее на неточности. Требует детального промптинга с описанием отчета который вы хотите. Доступна только в Pro тире, лимитов нет.
Deep research – несмотря на то, что модель выведена в отдельную кнопку, это версия новой o3 для поиска в интернете, как ей лучше пользоваться я напишу отдельно когда дадут доступ всем. Модель ищет в интернете и сама пишет код (который вам не покажет) для анализа найденных данных, чтобы, например включить в отчет графики. Лучшее, что есть на рынке для поиска данных в интернете. Пока доступна только в Pro.
Tldr:
Для повседневных задач ваш лучший выбор – o3-mini-high, потом o3-mini, когда у первой кончились лимиты
Вот это серьезно, а вы говорите Россия, Украина, иммиграция и ковид: "Планета, известная как Angel's Venture в игре Helldivers 2, была уничтожена Meridian Singularity, черной дырой, созданной во время игры.
Это событие привело к периоду траура, объявленному вымышленным правительством Супер-Земли в игре.
Игроки и поклонники игры выражают свою скорбь в сети, некоторые увековечивают потерю планеты с помощью различных сообщений в социальных сетях."🥶
Для наемного ИИ Угроза, для предпринимателя - Возможность!🤣Докладываю. Код я создавал с помощью chatGPT уже давно. За 1 день.
1. Наконец разобрался и подключил GitHub - в целом оказалось, что это требует 30 сек, но сначала я пытался подключить папку, где много мусора и GitHub все время приходил в ярость. Потом я плюнул, создал все с 0, и за 30 секунд все заработало.
Научился синхронизировать сложную структуру проекта, причем указывая, что посылать, что нет (где критичные с точки зрения безопасности данные).
2. Подключил Cursor через свой Open AI API (я на Plus). Почувствовал разницу. Самое прикольное, что реально в диалоге просишь - он тут же делает, либо берешь чужой код он его комментирует, рефакторит и т.п. До этого это делал с chatGPT через метод копипаст. Прямо, конечно удобней.
3. Создал небольшую утилиту, чтобы английский файл .srt в русский .srt. Это можно было сделать на сервисе, но мне надо было на этой задаче потренироваться. Что интересно - 4o завис на поиске ошибки, o3-mini-high решил за 3 минуты, нашел причину, предложил решение, пара итераций и все работает.
4. Программирование сводится к тому, что ты говоришь нечто типа: "В вот добавь это, чуть поменяй это". Он меняет код, ты его пускаешь и смотришь. Но думаю и это что-то не так я делаю. Уверен, он может сам читать консоль, сообщения терминала, чтобы сам видеть ошибки и предлагать исправления. Просто я еще не все вкурил.
5. Обучение сводится к поиска правильного вопроса и тупишь не на логике (с ней и так в порядке). Время уходит, чтобы понять, как работает как-то тул. Для 95% задач ИИ ничего не пишет, а подтягивает библиотеку. Ну и часто ставишь задачу - он предлагает алгоритмическое решение. Не оптимальное, но если толкнуть его в правильном направлении - то все очень хорошо.
6. Зачем это нужно. Есть пара проектов, которые мы исследуем с товарищами и там есть более хардкорная часть, а есть типовая упаковка, которую кодить надо. Все уже есть, нужно только интегрировать, ну где-то может промежуточный дата бридж написать. Морду в 99% Webflow, а если чуть упороться, то покупается готовый дашборд за 30$, и подключается. Т.е. все бизнес логистика по большому счету стандартна и все это относительно нетрудно слепить и оттестить. Причем, если один раз запилил,то потом можно скейлить неограниченно. Ценность не в этой упаковке, а глубже на уровне фундаментальных алгоритмов, которые ужу оперируют с IP. С помощью ИИ, ессно.
7. В итоге можно быстро реализовывать много идей, которые до того было реализовать невозможно или обязательно приглашать разработчика. Причем, прокачивается все, от собственно алгоритма до безопасности. Вот он код написал, а теперь я ему говорю: "А найди здесь дырки по безопасности и поправь!". Он все и делает. А потом я спрашиваю его, дескать: "Я ламер и наверное не учел 99% того, что надо. Что я не учел?" Он мне все расписвает, что я не учел и зачем оно надо. Если я не понимаю, а сначала я не понимаю 90%, тут же уточняю, и он мне параллельно типа Вики в Notion создает. Эффективность чудовищная.
8. А потом я начинаю общаться с... эээ... гуманитарями, далекими от технологий, но желающими, так сказать приобщиться, причаститься святых таинств. Начинаю с ними общаться, и понимаю, что если в программировании я типа джуна, но во всем остальном ... ну как-бы ... эээ.... база знаний уже не сопоставим. И я понимаю, что с одной стороны ИИ дает много возможностей, но для тех, кто уже на некотором уровне.
А для всех остальных барьер входа растет стремительно. Конечно, сам ИИ очень сильно этот барьер компенсирует. Но он не компенсирует лень и нежелание учиться.
Как это меняет все? Ровно то, о чем вчера было написано: "Создатели продуктов становятся соло-пренёрами и независимыми креаторами."
Но, конечен, надо дать себе труд немного поучится. Т.е. учится не программированию, а учится тому, как используя ИИ можно создавать то, что раньше не мог.