LLM-модели пока не всесильны.
Согласно недавнему исследованию, проведенному учеными из Суперкомпьютерного центра Юлиха, Бристольского университета и лаборатории LAION, даже самые продвинутые модели искусственного интеллекта для обработки естественного языка (LLM) демонстрируют серьезные проблемы с простейшими логическими задачами.
В своей работе "Алиса в Стране чудес: простые задачи, выявляющие полный крах рассуждений в современных крупных языковых моделях" исследователи обнаружили "резкое нарушение функций и способностей к рассуждению" у тестируемых LLM. Они предполагают, что хотя у моделей есть потенциал для базовых рассуждений, они не могут стабильно его реализовать.
Авторы призывают научное сообщество срочно пересмотреть заявленные возможности современных LLM и разработать новые стандартизированные тесты для выявления недостатков в их базовых навыках рассуждения.
Исследование сосредоточилось на простой задаче, названной "проблемой AIW": "У Алисы N братьев и M сестер. Сколько сестер у брата Алисы?". Несмотря на простоту задачи, которую легко решит ребенок младшего школьного возраста, языковые модели справлялись с ней лишь эпизодически.
Модели часто давали неверные ответы, сопровождая их псевдологичными объяснениями. Даже попытки исследователей побудить ИИ пересмотреть свои ответы не приводили к улучшению результатов.
В среднем частота правильных ответов у LLM была значительно ниже 50%. Более крупные модели, такие как GPT-4, показывали лучшие результаты (около 60% правильных ответов), но все равно недостаточные для модели с надежными базовыми навыками рассуждения.
Исследователи отмечают, что многие протестированные модели, несмотря на высокие результаты в стандартных тестах на рассуждение, не справились с простой задачей AIW. Это ставит под сомнение адекватность существующих методов оценки возможностей языковых моделей. Оригинальная статья
«Роль корпоративного архитектора в продуктовой трансформации бизнеса» – тема нового вебинара от OTUS.
В программе занятия:
– гибкое управление корпоративной архитектурой;
– актуальные подходы к управлению изменениями;
– экосистемные модели бизнеса и платформы.
Спикер: Петр Подымов — руководитель курса и лидер продуктовой трансформации в СПАО «Ингосстрах».
👉 Бесплатное участие
Вебинар пройдёт 15 августа в 19:00 мск в преддверии старта курса «Enterprise Architect». Все участники вебинара получат специальную цену на обучение.
Расширяем кругозор с GOAP (Goal-Oriented Action Planning) – методикой и фреймворком проектирования ИИ в играх, при котором цепочки поведений и действий агентов (NPC, абстрактных сущностей, "живых" препятствий) моделируют игровые миры и события в режиме live.
+ Часть 2: Непредсказуемый ИИ: интеллект толпы
Погружение в GOAP:
– Extending Behavior Trees with Classical Planning
– Three States and a Plan: The A.I. of F.E.A.R.
– AI in Games: Automated Planning (lecture 5)
Если ИИ растёт и обучается "как человек", то значит ей пора в универ 📚🍻
Шутки-шутками, но механики ИИ мне чем-то напоминают написание научной диссертации (только вот кто её пишет?).
Наткнулся на эти мысли, изучая схемы, подсказки, карты и модели по организации и работе с любыми научными Знаниями, Данными и Информацией.
Продолжаем разбираться в особенностях UX при работе с ИИ.
Главная проблема работы с интерфейсами ИИ — людям сложно излагать идеи в письменной форме и половина населения просто не может этого сделать – (с) Jakob Nielsen
Ключ к эффективному взаимодействиию с ИИ — баланс между запросами пользователя и предположениями ИИ
Оптимизация размышлений ИИ на примере мультиагентного фреймворка MindSearch.
MindSearch: Mimicking Human Minds Elicits Deep AI Searcher наглядно демонстрирует работу многоагентной LLM-структуры, которая объединяет "ИИ + Web Search" для обработки запросов и расширенного поиска данных.
Мультиагентные связки структурируют работу ИИ и распределяют задачи "рассуждения-поиска" между специализированными ИИ-агентами (привет, социальные сети для ИИ):
1) WebPlanner моделирует многошаговый поиск информации как процесс построения динамического графа: он разбивает запрос пользователя на атомарные подвопросы в качестве нод в графе и постепенно расширяет этот граф на основе результатов поиска от WebSearcher.
2) WebSearcher, которому поручен каждый подвопрос, выполняет иерархический поиск информации с помощью Google и собирает ценную информацию для WebPlanner.
Подобные ИИ-конструкции не только повышают качество и релевантность ответов ИИ, но и позволяют всей Сети ИИ-Агентов искать и обрабатывать информацию параллельными и масштабируемыми потоками.
Больше деталей: https://arxiv.org/abs/2407.20183
Мета анонсировала Segment Anything Model 2 (SAM2) — ИИ-модель, разработанную для обнаружения, сегментации, трекинга и покадровой обработки изображений-объектов внутри любого видео (Q&A о технологии).
Как быстро "снять" 3D-кино-сиквел в эпоху ИИ?
1. Скармливаем старое кино SAM2, распознаем и собираем всех главных героев и объекты.
2. Новый сценарий с безумными ответами пишет ChatGPT, образы новых персонажей генерим в Midjourney.
3. Быстренько анимируем всё с Animate Anyone AI.
4. Новые сцены и декорации доснимаем на коленке с дрона/LiDAR SLAM и генерим в 3D с Luma AI.
5. Необходимый киношный 3D-инвентарь генерим с помощью ИИ в Point-E.
6. По сценам скармливаем материал Sora, которая будет собирать из этого новый фильм.
7. Заливаем готовое кино в Apple Vision и смотрим новый 3D-"фильм" в VR/AR.
👓🍿🥤
Дэвид Линч на этих выходных рассказывает о том, как размышлять, исследовать и становиться лучше.
✨
🕳️
Продакт-менеджмент – это Бизнес
"Тем, кто наверху" всегда будет нужен сотрудник, ответственный за их бизнес-решения и который и будет создавать их продукт от имени их бизнеса.
Одновременно с этим, этот сотрудник "будет подотчётным" ... бизнесу, которым он сам же и создаёт. Фактически – сам себе.
Простыми словами: сам себе генерировать идейки; сам ставить цели-задачки; сам трекать прогресс; сам анализировать свои же циферки; и ходить, говорить и показывать на это всё на совещаниях и т.п.
...
Продакт-менеджмент – это и есть БизнесЧитать полностью…
Образец детального Product Requirements Document (PRD) на фичу на примере описания механик финальной цены бронирования в Airbnb
Содержание:
1. Introduction
2. Stakeholders
3. Functional Requirements
3. Non-Functional Requirements
4. User Interaction and Design
5. Risks and Mitigations
6. Dependencies
7. Timeline and Milestones
8. Evaluation and Metrics
9. Conclusion
📃 Образец в Notion
– The Lifecycle of a PRD
– PRD: A Modern Guide
– How to Write a PRD
Ivan Zhao (основатель Notion) отмечает успех:
На прошлой неделе Notion преодолел 100,000,000 пользователей.
У меня есть фотография дня, когда мы достигли 1,000 пользователей. Я также помню тот день, когда мы преодолели 1 млн. в 2020 году прямо перед ковидом.
И оглядываясь назад, я чувствую благодарность и интроспективность. Мы многому научились, но многое осталось неизменным...
В первые годы мы были довольно потеряны. Мы начали в 2013 году, но только в 2018 году с Notion 2.0 мы увидели признаки реальной тяги.
У нас также не было деловой хватки, мы боролись с созданием горизонтального продукта и... идея Notion почти умерла (спасибо за мост, мама!) и мы перестраивали Notion 4 раза за эти «потерянные годы».
У нас также был правильный продукт, но неправильный технологический стек, поэтому я поехал в Японию, чтобы переписать его (поэтому наш основной репозиторий git называется "notion-next").
Я рад, что мы не сдались и не изменили нашу миссию, построеную на видении 70-х годов, что ПО может «дополнить человеческий интеллект».
Забавно, что наша первоначальная презентация все еще описывает компанию которую мы строим сегодня!
В мире более миллиарда человек живут и работают либо в продуктах Microsoft или Google и море узких SaaS. Миру нужен «LEGO для ПО».
С нашими "блоками LEGO" сообщество непрограммистов теперь продает инструменты, созданные в Notion и некоторые заработали почти $1 млн только в 2023 году. Мы мечтали об этом, но я не был до конца уверен, что это сбудется.
Помимо миссии, наша любовь к ремеслу не изменилась. Мы попробовали 30 оттенков теплого белого цвета для стен нашего офиса.
Мы также не смогли найти товары, которые нам нравятся, поэтому сшили свой собственный мерч, заботясь о мастерстве и красоте, которые мы хотим привнести в этот мир.
Мы делаем всё это, потому что не хотим создать «ПО»
ПО может и должно усилить человеческий интеллект и быть прекрасным!
🟦 Happy International Blue Screen Day!
На видео: 12-часовой таймлапс сегодняшнего движения в авиапространстве над США
🚨Глобальный киберсбой
Платформа кибербезопасности CrowdStrike «отключилась» по всему миру, что привело к глобальным проблемам с IT, сбоям в работе Microsoft, отключениям 911 в нескольких штатах США и неполадках в работе софта авиакомпаний, а также больниц, банков и СМИ.
"Largest IT outage in history" (FT)
Ммм, релизы по пятницам 🍿✨
Как определить фичи с наибольшей ценностью для пользователей?
Простой шаблон аудита функций поможет расставить приоритеты в соответствии с частотой использования функций среди ваших пользователей.
Шаблон аудита имеет два измерения:
– На шкале X сколько людей используют фичу (несколько человек, некоторые люди, большинство людей и все люди).
– На шкале Y частота использования фичи (никогда, некоторое время, большую часть времени и всё время).
В идеале, все функции продукта должны быть расположены в правом верхнем углу шаблона (все пользователи постоянно ими пользуются).
1) Определите функции, которые, по вашему мнению, представляют ценность для ваших пользователей.
2) Отслеживайте использование функций с течением времени, чтобы понять частоту и скорость их принятия.
3) Используйте качественные и количественные данные, чтобы понять, как пользователи на самом деле используют ваш продукт и какие функции они считают ценными.
4) Размещайте функции в нужные квадраты в шаблоне.
5) Систематически анализируйте и актуализируйте этот шаблон.
🩻 Шаблон в Miro
Есть два(?) момента:
1) Каждое состояние должно реализовывать метод «Evalute», который оценивает себя относительно мира и/или агента;
2) Каждое действие должно реализовывать метод Execute, который занимается своим выполнением в игровом мире.
Обо всём остальном должен заботиться фреймворк.
7 августа (уже завтра) OTUS проводит открытый вебинар "Выбор инструментов для команды и проекта" на котором расскажут:
– как выбирать DevOps инструменты для реализации задач;
- как избегать избыточности/недостаточности инструментов;
– каким образом готовить команду к изменениям.
👉 Регистрация
Занятие проходит в рамках курса "DevOps Lead", на котором студенты смогут обучиться управлению DevOps-процессами. При поступлении в группу обучения возможны разные способы оплаты и рассрочка платежа.
😰 Сталкиваетесь с огромным бэклогом идей и не знаете как расставить приоритеты задач?
7 августа разберут методы приоритизации задач и проверки гипотез и как выделять из этого самое главное и необходимое.
👉 Бесплатное участие
Спикер Денис Богданов — системный и бизнес-аналитик, руководитель проектов и product owner.
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
🌞 Июльский дайджест лучших постов для продактов и их команд уже готов:
– Грейды продакт-менеджера
– Где у руководителей точки роста
– Подборка обучалок по GPT
– Скорость – стратегия и оружие
– Синтетические... пользователи
– Кросс-функциональные метрики
– Product Requirements Document (PRD)
– Для кого мы работаем
– Фреймворки для анализа стейкхолдеров
– «Вернусь, когда сделаю» — хреновый принцип
– Чек-лист оценки онбординга
– Продакт-менеджмент – это Бизнес
– Как измерять Качество
– Счастье — делать важное
– Сегментация клиентов по психологическим особенностям
– Найм методом погружения
– Шапка для вашей документации
– Типы болей пользователей
– Holdout в A/B-тестах
– Product Architecture Framework
– Модель управления сложными изменениями
– Как синхронить CJM
– Работа с исследовательским бэклогом
Cказочной пятницы и выходных ✨
Как эффективно моделировать бизнес-архитектуру?
OTUS приглашает на открытый урок, где расскажут о методах и техниках создания моделей бизнес-процессов с применением стандарта ArchiMate.
– Что такое ArchiMate;
– ключевые аспекты моделирования бизнес-архитектуры;
– использование ArchiMate для оптимизации и улучшения бизнес-процессов.
👉 Бесплатное участие
6 августа в 19:00 мск
Спикер Максим Рогоза — разработчик и корпоративный архитектор с большим опытом в крупнейших компаниях.
Реклама. ООО «Отус онлайн-образование»
RIP поиск Google – OpenAI на прошлой неделе анонсировал "поисковик" SearchGPT.
1) Быстрые ответы на поисковые запросы.
2) Информация в режиме "реального времени" с указанием источников.
4) Интуитивный поиск через уточняющие вопросы (чат-разговор).
5) Визуальные результаты для более глубокого понимания контекста и ответов.
То, как пользователи ищут (и находят), становится всё сложнееЧитать полностью…
Stand UP от опытных CTO — открытый микрофон.
31 июля в 20:00 мск 3 спикера курса от OTUS "СTO/Технический директор"— Илья Утов, Александр Ткаченко и Андрей Литвиненко честно расскажут о своих самых эпичных фейлах на пути становления руководителями.
На вебинаре разберут:
– на чем спотыкаются все новички: bus factors, костыли предшественников;
– как не разорваться среди задач, которые нужны здесь и вчера;
– типичные ошибки и как точно не надо делать;
– уроки из ошибок.
👉 Регистрация
Открытый урок приурочен к старту курса "CTO/Технический директор". 5 месяцев обучения. Преподаватели-практики из ведущих отраслевых компаний. Выпускной проект - детальный план развития технического подразделения на один год, на три года и на пять лет.
Для ввода новичков в IT-команду есть несколько быстрых рабочих стратегий. Причем таких, чтобы хорошо было всем: и новеньким, и стареньким, и тимлидам.
Хотите узнать как? Подключайтесь к вебинару 25 июля в 12:00!
Два экспертных взгляда на комфортную интеграцию в IT-команду:
🔹 Екатерина Комарова, руководитель разработки платформы для управления знаниями и совместной работы TEAMLY;
🔹 Ксения Школа, проджект-менеджер в крупнейшей в РФ бирже грузоперевозок ATI.SU.
На вебинаре поговорим о том, как:
– эффективно интегрировать новых сотрудников в IT-команду;
– выбрать стратегию быстрой адаптации к проектам и процессам;
– оптимизировать время на обучение и достижение результатов;
– снизить стресс и увеличить комфорт для новичков.
🚀 Зарегистрируйтесь, чтобы не пропустить!
Реклама. ООО "Кьюсофт", ИНН:7714594610
Устали от бесконечных изменений и неопределенности в разработке программных продуктов?
Хотите научиться эффективно управлять изменениями и создать свою структуру в разработке?
Узнайте об артефактах, возникающих на стадиях анализа и проектирования, и о том, как управлять и отслеживать изменения в требованиях, моделях и решениях.
Программа вебинара OTUS:
– какие бывают типы требований и как их выявлять и фиксировать;
– какие модели и решения разрабатываются на стадии анализа и проектирования;
– какие зависимости между артефактами, и почему важно отслеживать их изменения;
– как эффективно управлять изменениями и соблюдать требования;
👉 Принять участие
24 июля (уже завтра) в 20:00 мск в преддверии старта курса «Системный аналитик. Advanced». Спикер Ирина Гертовская — руководитель подразделений IT-аналитиков. Реклама. ООО «Отус онлайн-образование»
Получить доступ к сообществу экспертов в технологиях и бизнесе и готовый к инвестированию стартап? Изи!
МФТИ и Сколково помогут в своей онлайн-магистратуре «Технологическое предпринимательство».
Программа охватывает все составляющие создания и ведения бизнеса — от системного мышления до разработки продукта, маркетинга, управления проектами и привлечения инвестиций.
После обучения вы получите:
— реальный бизнес-проект или ускорение уже имеющегося проекта;
— инвесторов, партнёров и клиентов для своего проекта;
— международное сообщество единомышленников Физтеха;
— диплом государственного образца ведущего технического университета страны.
Будет ли конкретно в вашей ситуации польза от сообщества ТехПреда МФТИ? Можно обсудить с преподавателями, а заодно получить полезные контакты студентов и выпускников.
Пишите в Telegram и воплощайте свои проекты!
Реклама, МФТИ, Физтех, ИНН: 5008006211, erid: LjN8KUZSt
Главным ресурсом в IT являются люди и именно их мотивация решает будет ваш проект успешным или нет.
24 июля в 20.00 мск OTUS приглашает на открытый урок "Как Delivery Manager'у решать проблему мотивации сотрудников?
В программе занятия:
– как определить уровень мотивации сотрудников;
– чем характеризуются разные уровни лояльности;
– как сделать мониторинг лояльности честным;
– что побуждает сотрудников делиться своим состоянием.
👉 Зарегистрироваться
Бонус: инструменты и примеры создания форм мониторинга лояльности.
Вебинар приурочен к старту курса "Delivery Manager", на котором научат управлять большими командами и портфелями проекто. Возможны разные способы оплаты и рассрочка платежа. Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
Марк Цукерберг желает всем нам успешной рабочей недели с борта своей новой 87-метровой мегаяхты LAUNCHPAD.
По слухам, новая игрушка обошлась Зуку примерно в $300M, что делает её одной из самых дорогих яхт в мире.
Морская архитектура – De Voogt Naval Architects. Внешний дизайн – Espen Øino International. Внутренняя эстетика – Zuretti Interior Design.
LAUNCHPAD вмещает до 24 гостей в аналогичном количестве кают, поддерживаемых большой командой, которая заботится об эксплуатации судна и комфорте гостей, обеспечивая роскошный образ жизни на борту.
P.S. Launchpad – дополнение к яхте Wingman (обе на последнем фото), на которой есть подлодка, барокамера и вертолётная площадка.
P.S.2 Кто-то мутит Launchpad на Авито, кто-то на верфи.
Всем удачной недели ☕️✨
Хотите узнать, как справиться с высокой нагрузкой и обеспечить максимальную производительность вашего продукта?
OTUS приглашает на вебинар «Роль Tarantool в высоконагруженной архитектуре», где разгадают все секреты использования Tarantool в high-load проектах:
На занятии обсудят:
– как Tarantool может стать ключом к эффективной работе в условиях высокой нагрузки;
– примеры использования Tarantool в реальных проектах и его основные особенности;
– шаблоны архитектуры и примеры использования Tarantool для оптимизации производительности и отказоустойчивости систем.
👉 Бесплатное участие
24 июля в 20:00 мск.
Реклама. ООО «Отус онлайн-образование»
Стив Джобс рассказывает на WWDC '97 как определять Смыслы, держать Фокус команды на самом главном, создавая Великие Продукты и... себя.
P.S. И что делать, когда акции твоей компании шортятся Wall Street 🥰