Почему ИИ модели не справляются с долгосрочными задачами?
Главная ошибка в ИИ сегодня — это то, что им кажется, что модели недостаточно умны. В реальности, модели имеют сверхчеловеческий интеллект и способности в большинстве задач, но ни люди, ни другие системы не умеют нормально планировать процессы под выполнение с помощью LLM.
Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,
то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.
Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой
__p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории ____AI-native organizations
p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: ____Glass____ / __Honk / Minions / Goose
Если LLM
- голюцинирувает
- думает не в ту сторону
- не справляется с долгосрочными задачами
- достает не актуальный контекст,
то в 99% это проблема и ошибка пользователя модели и системы оркестрации / харнеса, которые выстроены вокруг модели. Каким бы гениальным не был бы ИИ, ему очень сложно побороть кривые руки пользователя.
Решение заключается в том, чтобы
- дать модели язык декомпозиции (рекурсия, циклы, планы как код, спеки процессов)
- расширить пространство действий - не только вызов инструментов, а полноценные программы (RLM-подход)
- тренировать через RL именно навык разбиения сложных задач на небольшие куски, а не решения задачи из серии "выведи мой бизнес на рынок Китая, не делай ошибок"
- строить харнесы и оркестраторы с пачкой и топологией субагентов, где модель управляет своей собственной оргструктурой
__p.s. и да, это ровно то, что мы делаем и изучаем как применять в масштабе команд и компаний в лаборатории ____AI-native organizations
p.p.s. хотите увидеть примеры где это работает, но не хотите на лабораторию? (зря) изучайте любой enterprise-grade харнес от топовых компаний: ____Glass____ / __Honk / Minions / Goose
e/acc
190 публикаций на visbl.me
Пишу про будущее: AI, web3, технологии и общество. Ускоряемся. Автор: @sgershuni Инвестирую: cyber.fund Построил: Credentia, Deep Skills, Codex Town
Связанные темы
Читать далее
Как найти CTO-кофаундера для AI-проекта в 2026 году?
GPT/ChatGPT/AI Central Александра Горного·
Как стать ИИ-нейтив и какие примеры успешных фаундеров?
e/acc·
Папа Римский призвал «разоружить» AI
GPT/ChatGPT/AI Central Александра Горного·
Хуанг нашёл для Nvidia новый рынок на 200 миллиардов долларов
GPT/ChatGPT/AI Central Александра Горного·
Как нанимать ИИ-нейтив специалистов в 2026 году?
e/acc·
OpenAI научила Codex работать на заблокированном Mac — задачи можно давать с телефона
GPT/ChatGPT/AI Central Александра Горного·
💬Discussion (73)
уже побешивают
но они правы наверное в своих травмах, когда ии действительно тупил, но это время ушло.. и это не ии тупит, а мы не то от него желаем получить не в тот момент
а если более серьезно то любой Enterprise-grade харнес - Honk / Glass / Goose / Minion