Telegram-канал dealerai - Dealer.AI: Неотсортированное

Dealer.AI

07 мая 2025 12:43

Мы тут зацепились с @maharishiva в комментах. И это было полезно, советую почитать. Вынесу сюда дополнительно важную отсылку Федором чисто на ту же статью. Мне кажется, что однобоко была она выставлена в комментариях против моего пойнта.

Далее приведу ее перевод, сори, скопипастил с хабра.

Техника Chain-of-Thought (CoT), предложенная в работе "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" (Wei et al., 2022), стала важным инструментом в арсенале промпт-инженерии для повышения качества ответов LLM, особенно в задачах, требующих рассуждений. CoT возникла из наблюдения, что большие языковые модели, в отличие от моделей меньшего размера, демонстрируют эмерджентное свойство – способность значительно улучшать свои ответы при использовании подсказок, направляющих их на генерацию промежуточных шагов рассуждения. Это свойство становится заметным для моделей с количеством параметров от 100 миллиардов и выше.

Да для моделей PaLM 540B это работало помимо промпта еще и с фьюшотом. Но для уже GPT3 это работало чисто по просьбе "делай рассуждая", без дообучения на спец СОТ формат. Да еще надо отметить, что фьюшоты обращаются, как раз к тому, что уже было в модели в ее весах усвоено в рамках обучения, и если промптинг с фьюшотом и прочими хаками не сработал, то модель не усвоила что-то с этим на обучении. Она не может делать выводы. Является ли это паттерн матчем или логическим выводом? В комментариях считают, что это паттерн матч, или поиск, но не способность к логическому выводу по подсказкам.

Дядя считает иначе. Пример, мы можем спросить у модели: "кто правил раньше Петр 1 или Петр Великий"? Воспользоваться RAG, получив подсказки по личности и датам правления. И если модель с этими подсказками не может ответить это про что? Про не умение в поиск или паттерны или все же в логическое суждение? Если мы просим модель без дообучения на R like, отвечать рассуждая и получаем в сравнении с до и после лучше результат это про паттерны или поиск или про скрытые свойства к рассуждениям?

В общем, продолжаем бугурт.