Промпт «ответь, как эксперт» заставляет LLM отвечать хуже

GPT/ChatGPT/AI Central Александра Горного·25 марта 2026 г.·1 мин чтения·7 комментариев

Промпт «ответь, как эксперт» заставляет LLM отвечать хуже

Исследователи из USC проверили популярный совет добавлять в промпт фразу «отвечай, как будто ты эксперт в X» — и выяснили, что для программирования и математики это вредит результату. В бенчмарке MMLU бот с указанием роли набрал 68% против 71.6% без неё.

Объясняют это тем, что программирование — задача, зависящая от предварительного обучения. Роль не даёт модели новых знаний и мешает извлекать факты из данных, полученных при обучении. С написанием текстов другая ситуация — там роль может улучшить качество ответа.

Сам я перестал пользоваться всеми этими фокусами еще в gpt4o.

В размышляющих моделях они по идее стали бессмысленны окончательно. Удивительно, что есть какое-то влияние.

https://www.theregister.com/2026/03/24/aimodelspersona_prompting/

исследование llm программирование математика

Смотреть оригинал в Telegram →

GPT/ChatGPT/AI Central Александра Горного

479 публикаций на visbl.me

Авторский взгляд на новости технологий Реклама: https://docs.google.com/presentation/d/1glQMXYyKAYpzNP8VXzM4gl2YkEgLjkeD_Fxvzbu5QUE/edit РКН: https://clck.ru/3FPkup Личный аккаунт: @gornal О рекламе: @Vzuhcha ВП нет

💬Discussion (7)

Fun Craft@funsett•Mar 25

Вот тут https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5879722 исследование, что задание роли никак не влияет на точность ответа

Fun Craft@funsett•Mar 25

При этом по моему опыту роль роли рознь: если определять роль просто как "эксперт в дизайне" - это одно, а "эксперт в дизайне низкобюджетного екома из бедных регионов латинской америки" - это уже совсем другое, т.к. задаёт определённые рамки, ограничения.

Konstantin Rumovsky@rumovsky•Mar 25

Мне кажется что в рамках конкретного запроса в модель это добавляет слой абстракции. То есть вместо того чтобы воображать задачу и решать её в своём воображении модель вынуждена воображать эксперта, который это делает. И, как мне кажется, это может позволить лучше понимать контекст и думать о том чего пользователь ожидает, но тратит лишнюю вычислительную мощность.
Но это, конечно, чисто мои интуитивные представления, за которыми никаких адекватных обоснований нет)

Evgeny Efimov@docadept•Mar 25

Для написания текстов действительно важна роль, потому что это влияет на стиль, внезапно.

Олег@Plantodrom•Mar 25

Возможно там не правильно роль задавали, ябы сначала ИИ спросил какую лучше роль задать для решения задачи. Там цепочка другая на самом деле роль - это выбор типа мышления , - методологии решения. Тоесть роль лучше чем просто эксперт , он и так эксперт и отвечает наиболее вероятно. Так что лучше указать к примеру конкретного известного эксперта , в математике к примеру Эдингтона. Тогда ллм применит тип мышления. Или лучше всего отвечай как эксперт по тортам, а задача например по математике . Т.е. чтоб эксперт был с другого домена, чем задача. А ещё лучше 2-3 эксперта и они между собой обсуждают, моделируют диалог. Я перешёл на 7 ролей когда какой-то сложный вопрос.

Олег@Plantodrom•Mar 25

Почти все модели , в особенности Кими четко следуют роли. В Кими он даже кричал на меня и обзывался следуя алгоритму и игнорируя вопросы пользователя , типа специально молчал - повторял пост , чтоб ничего не сказать нового . Как-то странно там срабатывает, что заданный алгоритм вначале важнее чем инструкции потом. Даже потом не получалось вернуть его в нормальный режим ( это примерно на границе контекста).

Join discussion on TelegramComments are synced from Telegram

Связанные темы

здоровье (13)питание (13)ai (8)технологии (4)код (3)наука (3)стартап (3)модели (3)

Промпт «ответь, как эксперт» заставляет LLM отвечать хуже

💬Discussion (7)

Связанные темы

Читать далее

Как использовать Claude Code для повышения эффективности бизнеса?

Бигтехи превращаются из софтверных компаний в инфраструктурные

Meta* начнёт оценивать возраст по росту и строению костей

Пентагон рассекретил документы об НЛО

Почему разные банкоматы требуют разное количество прикосновений?

В США появился мобильный оператор для AI-агентов