ChatGPT прошел тест Тьюринга лучше людей
ChatGPT прошел тест Тьюринга лучше людей
Исследователи UC San Diego провели классический тест Тьюринга. Участник одновременно переписывался с человеком и LLM, а потом должен был сказать, кто есть кто. Всего в эксперименте участвовали почти 500 человек.
GPT-4.5 с правильно заданной ролью принимали за человека в 73% случаев. LLaMa-3.1-405B — в 56%. На итог сильно влиял промпт, задающий роль. Без него результаты LLM резко падали.
https://today.ucsd.edu/story/ai-can-seem-more-human-than-real-humans-in-a-classic-turing-test-study-finds
Исследователи UC San Diego провели классический тест Тьюринга. Участник одновременно переписывался с человеком и LLM, а потом должен был сказать, кто есть кто. Всего в эксперименте участвовали почти 500 человек.
GPT-4.5 с правильно заданной ролью принимали за человека в 73% случаев. LLaMa-3.1-405B — в 56%. На итог сильно влиял промпт, задающий роль. Без него результаты LLM резко падали.
https://today.ucsd.edu/story/ai-can-seem-more-human-than-real-humans-in-a-classic-turing-test-study-finds
GPT/ChatGPT/AI Central Александра Горного
553 публикаций на visbl.me
Авторский взгляд на новости технологий Реклама: https://docs.google.com/presentation/d/1glQMXYyKAYpzNP8VXzM4gl2YkEgLjkeD_Fxvzbu5QUE/edit РКН: https://clck.ru/3FPkup Личный аккаунт: @gornal О рекламе: @Vzuhcha ВП нет
Связанные темы
Читать далее
Claude Code научили проверять собственный код на уязвимости
GPT/ChatGPT/AI Central Александра Горного·
Как начать свой маленький проект для души или опыта?
GPT/ChatGPT/AI Central Александра Горного·
ClickHouse достиг 250 миллионов долларов ARR и собирается на IPO
GPT/ChatGPT/AI Central Александра Горного·
Разработчики AI в Китае должны получать разрешение** **властей, чтобы выехать из страны
GPT/ChatGPT/AI Central Александра Горного·
Как распознать мошенников в Telegram?
GPT/ChatGPT/AI Central Александра Горного·
YouTube начнет сам помечать AI-видео
GPT/ChatGPT/AI Central Александра Горного·
💬Discussion (3)
Из него можно сделать вывод, что ChatGPT тоже принимал участие в оценивании кандидатов: кто человек, а кто — робот. И он лучше людей отгадал, где спрятан робот за стенкой.
А в новости ведь все про другое. Что ChatGPT выбрали чаще, чем другие модели. И 73% уже говорит о том, что он прошел тест Тьюринга