Anthropic проверил, как AI-агенты торгуются между собой
Anthropic проверил, как AI-агенты торгуются между собой
В эксперименте Project Deal сотрудники Anthropic дали Claude список вещей, которые хотят продать или купить. Дальше агенты сами писали объявления, делали офферы, торговались и закрывали сделки. Люди подключались уже в самом конце, когда нужно было физически обменяться вещами.
Всего участвовали 69 сотрудников. Агенты заключили 186 сделок на сумму больше 4000 долларов. Среди лотов были сноуборд, велосипед, книги, шарики для пинг-понга и даже «день с собакой».
Качество модели напрямую влияло на результат. Claude Opus 4.5 в среднем выбивал лучшие условия, чем Haiku 4.5: продавал дороже и покупал дешевле. При этом люди с более слабым агентом почти не замечали, что их сделка хуже. Получается, что если за тебя покупает и продает AI, то преимущество будет у того, у кого лучше агент.
https://www.anthropic.com/features/project-deal
В эксперименте Project Deal сотрудники Anthropic дали Claude список вещей, которые хотят продать или купить. Дальше агенты сами писали объявления, делали офферы, торговались и закрывали сделки. Люди подключались уже в самом конце, когда нужно было физически обменяться вещами.
Всего участвовали 69 сотрудников. Агенты заключили 186 сделок на сумму больше 4000 долларов. Среди лотов были сноуборд, велосипед, книги, шарики для пинг-понга и даже «день с собакой».
Качество модели напрямую влияло на результат. Claude Opus 4.5 в среднем выбивал лучшие условия, чем Haiku 4.5: продавал дороже и покупал дешевле. При этом люди с более слабым агентом почти не замечали, что их сделка хуже. Получается, что если за тебя покупает и продает AI, то преимущество будет у того, у кого лучше агент.
https://www.anthropic.com/features/project-deal
GPT/ChatGPT/AI Central Александра Горного
618 публикаций на visbl.me
Авторский взгляд на новости технологий Реклама: https://docs.google.com/presentation/d/1glQMXYyKAYpzNP8VXzM4gl2YkEgLjkeD_Fxvzbu5QUE/edit РКН: https://clck.ru/3FPkup Личный аккаунт: @gornal О рекламе: @Vzuhcha ВП нет
Связанные темы
Читать далее
Как AI влияет на результаты собеседований программистов?
GPT/ChatGPT/AI Central Александра Горного·
GPT-5.6 выйдет в июне
GPT/ChatGPT/AI Central Александра Горного·
Google выпустил открытую диффузионную языковую модель DiffusionGemma
GPT/ChatGPT/AI Central Александра Горного·
Microsoft AI критикует Anthropic за разговоры о сознании Claude
GPT/ChatGPT/AI Central Александра Горного·
Google сделал ещё дешевле свою самую дешевую подписку на AI
GPT/ChatGPT/AI Central Александра Горного·
Мама, я опять в телевизоре!
Стартап дня. Александр Горный.·
💬Discussion (6)
Антропик делал тест только между своими моделями, а в реальной жизни у одного агент на Клоде, у другого на ЧатГпт, у другого - на Kimi под капотом, у всех моделей разный «тюнинг».
Если задача AEO сделать или - еще шире - продукт для агентской коммерции для продавцов - там, хочешь не хочешь, а придется сравнивать разные модели и как они себя ведут.