Почему ИИ модели не справляются с долгосрочными задачами?
Главная ошибка в ИИ сегодня — это то, что им кажется, что модели недостаточно умны. В реальности, модели имеют сверхчеловеческий интеллект и способности в большинстве задач, но ни люди, ни другие системы не умеют нормально планировать процессы под выполнение с помощью LLM.
Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,
то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.
Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой
__p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории ____AI-native organizations
p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: ____Glass____ / __Honk / Minions / Goose
Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,
то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.
Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой
__p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории ____AI-native organizations
p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: ____Glass____ / __Honk / Minions / Goose
e/acc
140 публикаций на visbl.me
Пишу про будущее: AI, web3, технологии и общество. Ускоряемся. Автор: @sgershuni Инвестирую: cyber.fund Построил: Credentia, Deep Skills, Codex Town
Связанные темы
Читать далее
Как работает модель Mythos и почему она эффективна?
e/acc·
Как работает проверка возмущения пользователей в Claude Code?
Венчур Менна и Горного·
Что останется ценным в мире после искусственного интеллекта?
Оскар Хартманн·
К чему приведет использование LLM в повседневной жизни?
e/acc·
Как настроить чат-агента для лучшего взаимодействия?
e/acc·
Как ИИ меняет бизнес и продукты в 2026 году?
GPT/ChatGPT/AI Central Александра Горного·
💬Discussion (35)
уже побешивают
но они правы наверное в своих травмах, когда ии действительно тупил, но это время ушло.. и это не ии тупит, а мы не то от него желаем получить не в тот момент
а если более серьезно то любой Enterprise-grade харнес - Honk / Glass / Goose / Minion