Telegram-канал ru_python - Python: Unsorted - каталог телеграмм

ru_python | Unsorted

Subscribe to a channel

Telegram-канал ru_python - Python

14289

Уютный чат для профессионалов, занимающихся поиском питоньих мудростей. Как не получить бан: https://t.me/ru_python/1961404

Subscribe to a channel

Python

13 June 2026 00:02

Моё понимание (ллм, не всего мл) сформировано по материалам вот этого чувака. Конкретно курс на ютубе я не смотрел, но вроде как он там подробно про структуру рассказывает

https://youtu.be/wNsp1ZH-pyk

Читать полностью…

Python

12 June 2026 23:59

ну это как раз предсказанный токен

Читать полностью…

Python

12 June 2026 23:59

Насчёт t2 и t3 поверхностно не согласен, но глубоко в это погружаться сегодня не готов, ахах

Читать полностью…

Python

12 June 2026 23:56

по идее у нас модельки [t1, t2, t3] на входе, а на выходе [t2, t3, t4]

Читать полностью…

Python

12 June 2026 23:55

ну это не значит же что внимание больше уделяется концу промпта чем началу

Читать полностью…

Python

12 June 2026 23:54

Я удивлён что для Training-Inference Mismatch нету статьи на википедии

Читать полностью…

Python

12 June 2026 23:53

Мы же не предыдущий токен угадываем а следующий

Читать полностью…

Python

12 June 2026 23:52

А если вернуться к началу, то как это должно повлиять на общий ответ LLM

Читать полностью…

Python

12 June 2026 23:48

А, там о разнице перфа. Вот гайд, в котором он, ссылаясь на это, говорит, что надо следить за разницей между боевыми и учебными данными

https://developers.google.cn/machine-learning/crash-course/production-ml-systems/monitoring?hl=en#check_for_training-serving_skew

Читать полностью…

Python

12 June 2026 23:45

Логично, пытаюсь разобраться)

Читать полностью…

Python

12 June 2026 23:43

Ну сорян, а куда тут дать ссылку?

На вики мог бы, но статьи об этом нету

Читать полностью…

Python

12 June 2026 23:42

Не честно) я даю тебе инфу с указанием мест где можно посмотреть/прочитать а ты просто закидываешь фактами

Читать полностью…

Python

12 June 2026 23:39

Второй тейк был просто btw, это не аргумент особо. Отреагируй на первый как на аргумент, пожалуйста

Читать полностью…

Python

12 June 2026 23:37

Кроме того, на мой взгляд это нечто, очевидно следующее из самой идеи обучения чему-то

Читать полностью…

Python

12 June 2026 23:35

Ответь тем же, и мы найдем истину

Читать полностью…

Python

13 June 2026 00:00

Сколько раз бы я не брался разобраться в механизме работы llm-к каждый раз голова кипит

Читать полностью…

Python

12 June 2026 23:59

забавно просто как он ответил на этот вопрос

Читать полностью…

Python

12 June 2026 23:58

не понимаю, о чём хех

Читать полностью…

Python

12 June 2026 23:56

Вот тут подробно расписал эффект от этого

НО пример из того поста вообще-то не верен)
Он замечательно иллюстрирует смысл проблемы, но конкретно с ним никаких проблем не возникнет, потому как ллм эмерджентно изобрели себе вектора с "суперпозицией смысла". Но это уже совсем другая история..

Читать полностью…

Python

12 June 2026 23:54

Это влияет на то, как она интерпретирует смысл написанного

Читать полностью…

Python

12 June 2026 23:53

Вообще всё это время можно было просто закинуть промпт ниже в любую ллм, но ты меня тут итак попустил за отсутствие внятных источников)

LLM
при рассчёте корреляций для токена n, просчитывают ли его коррелирование с токеном n+1?

Читать полностью…

Python

12 June 2026 23:53

ну не знает первый токен о том в чем говориться во втором

Читать полностью…

Python

12 June 2026 23:51

маскировку используют всегда получается

Читать полностью…

Python

12 June 2026 23:46

https://developers.google.cn/machine-learning/glossary#training-serving-skew

Гугл вон в своём глоссарии по мл (не знал что у них такой есть) пишет об этом, называя training-serving skew

Читать полностью…

Python

12 June 2026 23:44

ты не согласен с тем, что это логично?

Читать полностью…

Python

12 June 2026 23:42

Да, спасибо. Я сонный и от этого в негатив чрезмерно воспринимаю

Читать полностью…

Python

12 June 2026 23:41

Ща дай пару минут, я воткну

Читать полностью…

Python

12 June 2026 23:38

Ну нет, это перенос. Ты сделал выводы исходя из собственных знаний.

Читать полностью…

Python

12 June 2026 23:36

Training-Inference Mismatch это общепринятый термин в сфере. Я не могу сослаться на один конкретный источник, но просто погуглив эти три слова это подтверждается

Читать полностью…

Python

12 June 2026 23:34

Ну я не могу принять твои умозаключения, мне нужны пруфы. Я свои пруфы тебе предоставляю

Читать полностью…

Subscribe to a channel