Почему ИИ модели не справляются с долгосрочными задачами?

e/acc··2 мин чтения·35 комментариев
Главная ошибка в ИИ сегодня — это то, что им кажется, что модели недостаточно умны. В реальности, модели имеют сверхчеловеческий интеллект и способности в большинстве задач, но ни люди, ни другие системы не умеют нормально планировать процессы под выполнение с помощью LLM.

Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,

то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.

Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой

__p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории ____AI-native organizations

p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: ____Glass____ / __Honk / Minions / Goose
e/acc
e/acc

140 публикаций на visbl.me

Пишу про будущее: AI, web3, технологии и общество. Ускоряемся. Автор: @sgershuni Инвестирую: cyber.fund Построил: Credentia, Deep Skills, Codex Town

💬Discussion (35)

Anonymous
А можешь, пожалуйста, показать пример? Было бы просто ахуенно
Anonymous
КАНКРЕТИКИ БЫ!!!!1111
Anonymous
извините
Anonymous
надеюсь, это была жесткая ирония
Anonymous
Не не, Я серьёзно, без насмешек. Пример кода или алгоритма. Мне просто сложно такое представить
Extropia@extropia_tyan
Тысячу раз да
Anonymous
господи ну наконец-то это кто-то сказал вслух

уже побешивают

но они правы наверное в своих травмах, когда ии действительно тупил, но это время ушло.. и это не ии тупит, а мы не то от него желаем получить не в тот момент
Anonymous
С постом согласен. Просто никогда не видел такого в деле. Само по себе уже выглядит как сильный продукт
Anonymous
GPT один из таких продуктов

а если более серьезно то любой Enterprise-grade харнес - Honk / Glass / Goose / Minion
Antonio 👨‍💻🧘‍♂️@AntBD
Если есть опыт управления людьми, то и с агентами вопросов нету, так как есть понимание как ставить правильно задачи и следить за их исполнением. И да, люди галюцционируют побольше чем агенты, еще и болеют, бухают и т.д. вместо работы 24/7 )
Anonymous
есть различия, но да, общего больше
Join discussion on TelegramComments are synced from Telegram

Связанные темы

Читать далее