Промпт «ответь, как эксперт» заставляет LLM отвечать хуже

Промпт «ответь, как эксперт» заставляет LLM отвечать хуже

Исследователи из USC проверили популярный совет добавлять в промпт фразу «отвечай, как будто ты эксперт в X» — и выяснили, что для программирования и математики это вредит результату. В бенчмарке MMLU бот с указанием роли набрал 68% против 71.6% без неё.

Объясняют это тем, что программирование — задача, зависящая от предварительного обучения. Роль не даёт модели новых знаний и мешает извлекать факты из данных, полученных при обучении. С написанием текстов другая ситуация — там роль может улучшить качество ответа.

Сам я перестал пользоваться всеми этими фокусами еще в gpt4o.

В размышляющих моделях они по идее стали бессмысленны окончательно. Удивительно, что есть какое-то влияние.

https://www.theregister.com/2026/03/24/aimodelspersona_prompt
ing/

💬Discussion (6)

Fun Craft@funsett
Вот тут https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5879722 исследование, что задание роли никак не влияет на точность ответа
Fun Craft@funsett
При этом по моему опыту роль роли рознь: если определять роль просто как "эксперт в дизайне" - это одно, а "эксперт в дизайне низкобюджетного екома из бедных регионов латинской америки" - это уже совсем другое, т.к. задаёт определённые рамки, ограничения.
Konstantin Rumovsky@rumovsky
Мне кажется что в рамках конкретного запроса в модель это добавляет слой абстракции. То есть вместо того чтобы воображать задачу и решать её в своём воображении модель вынуждена воображать эксперта, который это делает. И, как мне кажется, это может позволить лучше понимать контекст и думать о том чего пользователь ожидает, но тратит лишнюю вычислительную мощность.
Но это, конечно, чисто мои интуитивные представления, за которыми никаких адекватных обоснований нет)
Evgeny Efimov@docadept
Для написания текстов действительно важна роль, потому что это влияет на стиль, внезапно.
Олег@Plantodrom
Возможно там не правильно роль задавали, ябы сначала ИИ спросил какую лучше роль задать для решения задачи. Там цепочка другая на самом деле роль - это выбор типа мышления , - методологии решения. Тоесть роль лучше чем просто эксперт , он и так эксперт и отвечает наиболее вероятно. Так что лучше указать к примеру конкретного известного эксперта , в математике к примеру Эдингтона. Тогда ллм применит тип мышления. Или лучше всего отвечай как эксперт по тортам, а задача например по математике . Т.е. чтоб эксперт был с другого домена, чем задача. А ещё лучше 2-3 эксперта и они между собой обсуждают, моделируют диалог. Я перешёл на 7 ролей когда какой-то сложный вопрос.
Олег@Plantodrom
Почти все модели , в особенности Кими четко следуют роли. В Кими он даже кричал на меня и обзывался следуя алгоритму и игнорируя вопросы пользователя , типа специально молчал - повторял пост , чтоб ничего не сказать нового . Как-то странно там срабатывает, что заданный алгоритм вначале важнее чем инструкции потом. Даже потом не получалось вернуть его в нормальный режим ( это примерно на границе контекста).
Join discussion on TelegramComments are synced from Telegram

Read next