Промпт «ответь, как эксперт» заставляет LLM отвечать хуже
Промпт «ответь, как эксперт» заставляет LLM отвечать хуже
Исследователи из USC проверили популярный совет добавлять в промпт фразу «отвечай, как будто ты эксперт в X» — и выяснили, что для программирования и математики это вредит результату. В бенчмарке MMLU бот с указанием роли набрал 68% против 71.6% без неё.
Объясняют это тем, что программирование — задача, зависящая от предварительного обучения. Роль не даёт модели новых знаний и мешает извлекать факты из данных, полученных при обучении. С написанием текстов другая ситуация — там роль может улучшить качество ответа.
Сам я перестал пользоваться всеми этими фокусами еще в gpt4o.
В размышляющих моделях они по идее стали бессмысленны окончательно. Удивительно, что есть какое-то влияние.
https://www.theregister.com/2026/03/24/aimodelspersona_prompting/
Исследователи из USC проверили популярный совет добавлять в промпт фразу «отвечай, как будто ты эксперт в X» — и выяснили, что для программирования и математики это вредит результату. В бенчмарке MMLU бот с указанием роли набрал 68% против 71.6% без неё.
Объясняют это тем, что программирование — задача, зависящая от предварительного обучения. Роль не даёт модели новых знаний и мешает извлекать факты из данных, полученных при обучении. С написанием текстов другая ситуация — там роль может улучшить качество ответа.
Сам я перестал пользоваться всеми этими фокусами еще в gpt4o.
В размышляющих моделях они по идее стали бессмысленны окончательно. Удивительно, что есть какое-то влияние.
https://www.theregister.com/2026/03/24/aimodelspersona_prompting/
GPT/ChatGPT/AI Central Александра Горного
677 публикаций на visbl.me
Авторский взгляд на новости технологий Реклама: https://docs.google.com/presentation/d/1glQMXYyKAYpzNP8VXzM4gl2YkEgLjkeD_Fxvzbu5QUE/edit РКН: https://clck.ru/3FPkup Личный аккаунт: @gornal О рекламе: @Vzuhcha ВП нет
Связанные темы
Читать далее
AI-пикник** **клуба
GPT/ChatGPT/AI Central Александра Горного·
Анонсирована нейросеть для генерации видео Seedance 2.5
GPT/ChatGPT/AI Central Александра Горного·
Проблемы с Claude по всему миру
GPT/ChatGPT/AI Central Александра Горного·
20 лет назад запасной поисковик всегда был лучше основного. Человек его запускал только в случае провала первого, и любо...
GPT/ChatGPT/AI Central Александра Горного·
AI-поиск стал новым каналом выбора компаний и сервисов. ChatGPT уже используют около 800 млн человек в неделю. Google A...
GPT/ChatGPT/AI Central Александра Горного·
Claude может потребовать паспорт
GPT/ChatGPT/AI Central Александра Горного·
💬Discussion (7)
Но это, конечно, чисто мои интуитивные представления, за которыми никаких адекватных обоснований нет)