Anthropic проверил, как AI-агенты торгуются между собой
Anthropic проверил, как AI-агенты торгуются между собой
В эксперименте Project Deal сотрудники Anthropic дали Claude список вещей, которые хотят продать или купить. Дальше агенты сами писали объявления, делали офферы, торговались и закрывали сделки. Люди подключались уже в самом конце, когда нужно было физически обменяться вещами.
Всего участвовали 69 сотрудников. Агенты заключили 186 сделок на сумму больше 4000 долларов. Среди лотов были сноуборд, велосипед, книги, шарики для пинг-понга и даже «день с собакой».
Качество модели напрямую влияло на результат. Claude Opus 4.5 в среднем выбивал лучшие условия, чем Haiku 4.5: продавал дороже и покупал дешевле. При этом люди с более слабым агентом почти не замечали, что их сделка хуже. Получается, что если за тебя покупает и продает AI, то преимущество будет у того, у кого лучше агент.
https://www.anthropic.com/features/project-deal
В эксперименте Project Deal сотрудники Anthropic дали Claude список вещей, которые хотят продать или купить. Дальше агенты сами писали объявления, делали офферы, торговались и закрывали сделки. Люди подключались уже в самом конце, когда нужно было физически обменяться вещами.
Всего участвовали 69 сотрудников. Агенты заключили 186 сделок на сумму больше 4000 долларов. Среди лотов были сноуборд, велосипед, книги, шарики для пинг-понга и даже «день с собакой».
Качество модели напрямую влияло на результат. Claude Opus 4.5 в среднем выбивал лучшие условия, чем Haiku 4.5: продавал дороже и покупал дешевле. При этом люди с более слабым агентом почти не замечали, что их сделка хуже. Получается, что если за тебя покупает и продает AI, то преимущество будет у того, у кого лучше агент.
https://www.anthropic.com/features/project-deal
GPT/ChatGPT/AI Central Александра Горного
422 публикаций на visbl.me
Авторский взгляд на новости технологий Реклама: https://docs.google.com/presentation/d/1glQMXYyKAYpzNP8VXzM4gl2YkEgLjkeD_Fxvzbu5QUE/edit РКН: https://clck.ru/3FPkup Личный аккаунт: @gornal О рекламе: @Vzuhcha ВП нет
Связанные темы
Читать далее
Как AI меняет творчество в 2026 году?
e/acc·
Как правильно закрыть банковский счет?
GPT/ChatGPT/AI Central Александра Горного·
Маск запустил мессенджер XChat
GPT/ChatGPT/AI Central Александра Горного·
Что такое нейронка Deepseek v4 и чем она лучше других?
veselcraft·
Что делать при ошибке Fatal error в PHP?
GPT/ChatGPT/AI Central Александра Горного·
Google инвестирует в Anthropic до 40 миллиардов долларов
GPT/ChatGPT/AI Central Александра Горного·
💬Discussion (6)
Антропик делал тест только между своими моделями, а в реальной жизни у одного агент на Клоде, у другого на ЧатГпт, у другого - на Kimi под капотом, у всех моделей разный «тюнинг».
Если задача AEO сделать или - еще шире - продукт для агентской коммерции для продавцов - там, хочешь не хочешь, а придется сравнивать разные модели и как они себя ведут.