Промпт «ответь, как эксперт» заставляет LLM отвечать хуже
Промпт «ответь, как эксперт» заставляет LLM отвечать хуже
Исследователи из USC проверили популярный совет добавлять в промпт фразу «отвечай, как будто ты эксперт в X» — и выяснили, что для программирования и математики это вредит результату. В бенчмарке MMLU бот с указанием роли набрал 68% против 71.6% без неё.
Объясняют это тем, что программирование — задача, зависящая от предварительного обучения. Роль не даёт модели новых знаний и мешает извлекать факты из данных, полученных при обучении. С написанием текстов другая ситуация — там роль может улучшить качество ответа.
Сам я перестал пользоваться всеми этими фокусами еще в gpt4o.
В размышляющих моделях они по идее стали бессмысленны окончательно. Удивительно, что есть какое-то влияние.
https://www.theregister.com/2026/03/24/aimodelspersona_prompting/
Исследователи из USC проверили популярный совет добавлять в промпт фразу «отвечай, как будто ты эксперт в X» — и выяснили, что для программирования и математики это вредит результату. В бенчмарке MMLU бот с указанием роли набрал 68% против 71.6% без неё.
Объясняют это тем, что программирование — задача, зависящая от предварительного обучения. Роль не даёт модели новых знаний и мешает извлекать факты из данных, полученных при обучении. С написанием текстов другая ситуация — там роль может улучшить качество ответа.
Сам я перестал пользоваться всеми этими фокусами еще в gpt4o.
В размышляющих моделях они по идее стали бессмысленны окончательно. Удивительно, что есть какое-то влияние.
https://www.theregister.com/2026/03/24/aimodelspersona_prompting/
GPT/ChatGPT/AI Central Александра Горного
393 публикаций на visbl.me
Авторский взгляд на новости технологий Реклама: https://docs.google.com/presentation/d/1glQMXYyKAYpzNP8VXzM4gl2YkEgLjkeD_Fxvzbu5QUE/edit РКН: https://clck.ru/3FPkup Личный аккаунт: @gornal О рекламе: @Vzuhcha ВП нет
Связанные темы
Читать далее
Google создаёт суперкоманду, чтобы догнать Claude Code
GPT/ChatGPT/AI Central Александра Горного·
Кто станет новым CEO Apple после ухода Тима Кука?
GPT/ChatGPT/AI Central Александра Горного·
Вышла Kimi K2.6
GPT/ChatGPT/AI Central Александра Горного·
Сбой в работе ChatGPT длится уже больше часа
GPT/ChatGPT/AI Central Александра Горного·
Как улучшить общение на португальском с бразильцами?
GPT/ChatGPT/AI Central Александра Горного·
Спамеры победили.
GPT/ChatGPT/AI Central Александра Горного·
💬Discussion (7)
Но это, конечно, чисто мои интуитивные представления, за которыми никаких адекватных обоснований нет)