Anthropic проверил, как AI-агенты торгуются между собой
Anthropic проверил, как AI-агенты торгуются между собой
В эксперименте Project Deal сотрудники Anthropic дали Claude список вещей, которые хотят продать или купить. Дальше агенты сами писали объявления, делали офферы, торговались и закрывали сделки. Люди подключались уже в самом конце, когда нужно было физически обменяться вещами.
Всего участвовали 69 сотрудников. Агенты заключили 186 сделок на сумму больше 4000 долларов. Среди лотов были сноуборд, велосипед, книги, шарики для пинг-понга и даже «день с собакой».
Качество модели напрямую влияло на результат. Claude Opus 4.5 в среднем выбивал лучшие условия, чем Haiku 4.5: продавал дороже и покупал дешевле. При этом люди с более слабым агентом почти не замечали, что их сделка хуже. Получается, что если за тебя покупает и продает AI, то преимущество будет у того, у кого лучше агент.
https://www.anthropic.com/features/project-deal
В эксперименте Project Deal сотрудники Anthropic дали Claude список вещей, которые хотят продать или купить. Дальше агенты сами писали объявления, делали офферы, торговались и закрывали сделки. Люди подключались уже в самом конце, когда нужно было физически обменяться вещами.
Всего участвовали 69 сотрудников. Агенты заключили 186 сделок на сумму больше 4000 долларов. Среди лотов были сноуборд, велосипед, книги, шарики для пинг-понга и даже «день с собакой».
Качество модели напрямую влияло на результат. Claude Opus 4.5 в среднем выбивал лучшие условия, чем Haiku 4.5: продавал дороже и покупал дешевле. При этом люди с более слабым агентом почти не замечали, что их сделка хуже. Получается, что если за тебя покупает и продает AI, то преимущество будет у того, у кого лучше агент.
https://www.anthropic.com/features/project-deal
GPT/ChatGPT/AI Central Александра Горного
633 публикаций на visbl.me
Авторский взгляд на новости технологий Реклама: https://docs.google.com/presentation/d/1glQMXYyKAYpzNP8VXzM4gl2YkEgLjkeD_Fxvzbu5QUE/edit РКН: https://clck.ru/3FPkup Личный аккаунт: @gornal О рекламе: @Vzuhcha ВП нет
Связанные темы
Читать далее
Как успешно внедрить голосового бота для техподдержки?
GPT/ChatGPT/AI Central Александра Горного·
Как быстро научные работы успевают за развитием AI?
GPT/ChatGPT/AI Central Александра Горного·
Что изменилось в мире с появлением ChatGPT?
Оскар Хартманн·
Как роботы Unitree используются на детских праздниках в Китае?
GPT/ChatGPT/AI Central Александра Горного·
Прокуроры начали расследование в отношении OpenAI
GPT/ChatGPT/AI Central Александра Горного·
GlobalSign начал отзывать сертификаты у российских сайтов
GPT/ChatGPT/AI Central Александра Горного·
💬Discussion (6)
Антропик делал тест только между своими моделями, а в реальной жизни у одного агент на Клоде, у другого на ЧатГпт, у другого - на Kimi под капотом, у всех моделей разный «тюнинг».
Если задача AEO сделать или - еще шире - продукт для агентской коммерции для продавцов - там, хочешь не хочешь, а придется сравнивать разные модели и как они себя ведут.