Промпт «ответь, как эксперт» заставляет LLM отвечать хуже
Исследование USC показывает, что фраза «отвечай, как будто ты эксперт» ухудшает качество ответов LLM в программировании и математике.
3 публикаций во всех каналах
Исследование USC показывает, что фраза «отвечай, как будто ты эксперт» ухудшает качество ответов LLM в программировании и математике.
Mistral запустил Forge — платформу для обучения корпоративных LLM без зависимости от внешних API.
OpenAI рекомендует отказаться от SWE-bench Verified для оценки моделей LLM и предлагает использовать SWE-Bench Pro.