OKR для ИИ
OKR для ИИ
агенты в бизнесе страдают от тех же проблем, что и люди.
корпорации десятилетиями занимались одной задачей: превращать непредсказуемых, хаотичных людей в предсказуемые бизнес-результаты.
весь менеджерский стек существует ради этого. OKR, стендапы, performance review, регламенты, шаблоны отчетов, цепочки согласований, оргструктуры — все это костыли вокруг стохастических систем (людей), чтобы получать стабильный результат. бесполезная, очень нудная, безрезультатная работа по постоянному затыканию дыр, но без которой любая компания превращается в стадо.
у ИИ агентов ровно та же проблема — LLM по природе стохастичны. чтобы это починить, мы добавляем оркестрацию, валидацию, self-verification, гардрейлы, шаблоны, структурированный JSON на выходе. мы строим костыли вокруг стохастической системы, чтобы сделать ее предсказуемой.
параллель почти 1:1:
- OKR = определение целей агента
- стендапы = статус-чеки и чекпоинты
- регламенты = промпт-шаблоны и runbooks
- peer review = self-verification и кросс-валидация между агентами
- оргструктура = граф оркестрации
- performance review = evaluation бенчмарки
решения, однако, будут сильно отличаться. людям нужна мотивация, контекст, культура. агентам — детерминированная валидация, retry logic, структурированная память. failure modes тоже разные: люди срезают углы, агенты галлюцинируют. люди устают и теряют фокус, агенты не устают, но теряют контекст из-за лимитов context window.
если вы строите агентные системы — изучайте как организации управляют людьми. менеджмент как наука это недооцененный набор практик для оркестрации агентов. агенты точно не люди, но "сделать выпас котов предсказуемыми" — это задача с десятилетиями наработанных паттернов.
агенты в бизнесе страдают от тех же проблем, что и люди.
корпорации десятилетиями занимались одной задачей: превращать непредсказуемых, хаотичных людей в предсказуемые бизнес-результаты.
весь менеджерский стек существует ради этого. OKR, стендапы, performance review, регламенты, шаблоны отчетов, цепочки согласований, оргструктуры — все это костыли вокруг стохастических систем (людей), чтобы получать стабильный результат. бесполезная, очень нудная, безрезультатная работа по постоянному затыканию дыр, но без которой любая компания превращается в стадо.
у ИИ агентов ровно та же проблема — LLM по природе стохастичны. чтобы это починить, мы добавляем оркестрацию, валидацию, self-verification, гардрейлы, шаблоны, структурированный JSON на выходе. мы строим костыли вокруг стохастической системы, чтобы сделать ее предсказуемой.
параллель почти 1:1:
- OKR = определение целей агента
- стендапы = статус-чеки и чекпоинты
- регламенты = промпт-шаблоны и runbooks
- peer review = self-verification и кросс-валидация между агентами
- оргструктура = граф оркестрации
- performance review = evaluation бенчмарки
решения, однако, будут сильно отличаться. людям нужна мотивация, контекст, культура. агентам — детерминированная валидация, retry logic, структурированная память. failure modes тоже разные: люди срезают углы, агенты галлюцинируют. люди устают и теряют фокус, агенты не устают, но теряют контекст из-за лимитов context window.
если вы строите агентные системы — изучайте как организации управляют людьми. менеджмент как наука это недооцененный набор практик для оркестрации агентов. агенты точно не люди, но "сделать выпас котов предсказуемыми" — это задача с десятилетиями наработанных паттернов.
💬Discussion (26)
Да, такая система не подойдет под любой вид работы, но она показывает, что в целом агенты могут работать по другой логике. Что если текущая структура компаний нам нужна только из-за тех багов, что есть в людях: эго, понимают только в 1 домене и работают только в +- на одних профессиях, неорганизованны и тд.
Что если агентам не нужны менеджеры, на самом деле, потому что они смогут договариваться лучше, чем люди и без внешнего надзора?
но это не главная цель менеджмента и ops.
Одна из основных причин массового нераспространения «бирюзового» управления в том, что в теории люди в такой компании должны массово осуждать отступление друг друга от правил, а на практике люди более лояльны по отношению к равным себе, чем требуется.
Для всех остальных задач менеджмента есть заменяющие механизмы, но вот эту лояльность к нарушениям друг друга пока не победили)
Агенту же можно прописать полмпты, чтобы он строго контролировал соседних агентов?)
Суть примерно была такая, что создаётся 2 фонда премиальный и призовой.
Далее все сотрудники по одиночке заполняют анкету - кто на их взгляд какой вклад внес (распределение).
Далее это все усредняется.
И далее во втором раунде анкеты каждому нужно угадать усредненное распределение и тогда он получает какие-то бонусы. После чего вклады пересчитываются и получаем реальное распределение.
Там есть точные условия и соотношения фондов и бонусов.
В итоге получается, что никому не выгодно врать и завышать или занижать чей-либо вклад. На выходе честно получаем достоверно кто какой вклад внес без централизованного оценщика в виде менеджера. И такое распределение всех устраивает.
Кто напомнит, как называется алгоритм?
Адаптируйте, пользуйтесь для любой валидации чего угодно и когда угодно без начальников. Статей научных полно на эту тему)
Агенту можно поставить задачу, но важный вопрос, кто подготовит валидационные критерии и будет контролировать на старте? Без наличия эксперта, результат будет как у чувака, который попросил chatgpt заменить соль и пил бромид натрия ))
Все вроде бы ничего, но при адаптации и применении этой модели в российском менталитете столкнулись с вышеуказанными проблемами, что люди недостаточно осуждают нарушения других и потом сами становятся нарушителями)
Не работает бирюза в России, так же как и Agile, как только мы приходим к необходимости личной ответственности, большинство людей сливаются, считая, что бирюза это про права без ответственности. Поэтому сначала исполнительность, а потом уже всякая светотень.
А если посмотреть на Точку, Вскуссвилл, то может сложиться впечатление (как у меня сложилось), что там классические принципы менеджмента замаскированны под бирюзу)
С другой стороны, интересно, как себя ещё смогут показать не корпоративные методы построения агентных систем, а те что основаны на работе сообществ - open source и другие волонтерские форматы.
Здесь ещё важно понимать про то, какие задачи можно отдать ИИ, а какие оставить человеку. Разрабатываю сейчас как раз фреймворк для подобного делегирования