В погоне за эффективностью

В погоне за эффективностью

Серьезная проблема AI-агентов – контекст, а точнее его нехватка. AI хорошо работает, если задача поставлена формально, и в наличии есть все входные данные в структурированном виде. Учитывать пожелания Василия Васильевича, которые он высказал на прошлом корпоративе, Claude Code пока не обучен.

Американский #стартапдня SageOx борется с бедой с помощью общей базы знаний. Он складывает в одно место всё, из чего состоит работа: переписки, сессии общения с AI, решения со встреч, и держит это в виде, который агент может прочитать перед стартом. Новый чат с Claude Code или Codex начинается не с чистого листа, а уже зная, о чём команда договорилась вчера.

Вы скажете, что в этом ничего нового нет. И вы правы. Основатели стартапа с вами согласны – и они пошли дальше. SageOx собрал собственную железку – что-то типа стационарного диктофона. Устройство ставится в переговорках и, в идеале, на кухне и записывает то, что обычно не оцифровывается. Живое общение и принятые решения сразу попадают в базу знаний, контекст становится полным, агенты начинают работать хорошо и эффективно, люди становятся не нужны и на кухне больше нечего записывать – ладно, это уже мои фантазии.

Софт стартапа уже можно использовать, регистрация открыта. Купить железку пока нельзя. Она, кажется, реально существует, но пока тестируется у небольшого числа клиентов.

https://sageox.ai/

#же
лезо #ai #технология #сша #rounda
Стартап дня. Александр Горный.
Стартап дня. Александр Горный.

703 публикаций на visbl.me

Авторский канал о стартапах и интернет-бизнесе. Реклама на этом канале: https://docs.google.com/presentation/d/1BFSEj7FEQZpB4K83iBXo1yqIoPnwJaVGpsyKDHKSX0s/edit РКН: https://clck.ru/3FPm3j Личный аккаунт: @gornal Реклама: @Vzuhcha ВП нет

💬Discussion (13)

Pavel Goodwin@nasreddin777
У нас Яндекс давно придумал колонку с Алисой)

P.S. эпл и китайцы тоже в теме
WTFF.com@WTFF_com
Новый чат с Claude Code или Codex начинается не с чистого листа, а с огромного пожирания токенов.
А токены вынужден считать уже даже Microsoft.
Pavel Sergeev@Allyanz
Почему то прямо уверен что фуфло. У каждого дева работающего с корпами второй пет проект такой, на собирании контекста с конф зумов и тд. Будет абсолютного как всегда. 90% контекста мимо контекста. Тут даже в рамках хорошо сформулированной задачи Клод частенько путается, а там хаотичной структуры набор слов, который будет сперва неверно в контекст сформирован, а потом еще и не весь учтен. Короче какая то попытка попила и освоения денег коррумпированных корп. «А вот посмотрите какую железку мы принесли с подпиской!»
Илья@Ilia_corund_st
А RAG на что?
Вообще с подобной концепцией столкнулся давно: впервые в виде концепции OpenBrain от какого-то американского инженера.
Сейчас реализую под себя.
Хочу ещё мсп календаря подкрутить, чтобы он ещё и тайм-менеджмент фигачил.
А вообще очень приятно не объяснять одно и то же несколько раз.
Но пока ещё сильно в тестовом режиме, и рано о чём-то внятном говорить.
Возможно, спустя миллион лет вернусь, обновлю коммент и поведаю факт того, что ничего не получилось. 😇
Pavel Sergeev@Allyanz
не понял вопроса, раг на что где, в их проекте? или в пет проектах десятков тысяч разрабов делающих подобные решения "под себя"? раг применяется для ассоциативного обогащения ллм контекстом.
WTFF.com@WTFF_com
RAG ограничен. После определенного количества контекста начинает капитально галлюцинировать.
Илья@Ilia_corund_st
чтоб не было вот этого
Pavel Sergeev@Allyanz
так это просто пока-что несовершеннство своих ЛЛМ. Ты если в клода зальешь в виде контекста проект на 100 тыс строк он все-равно пропустит 90 процентов, и допустим правя не через скрипты функции а "руками", упустит много мест где их надо менять. "забудет". Вот оно так же и тут работает, оно контекстом "важным" обоготит нейронку, она из этого важного контекста выцепит 10 процентов (понятно что больше, это условно) и поедет дальше.
Илья@Ilia_corund_st
а ему зачем все 100к строк держать в контексте?
достаточно иметь карту к ним и искать к нужный момент
но в целом с идеей согласен
Pavel Sergeev@Allyanz
у тебя задача по каком нить большому рефакторингу может быть, там и не 100к может понадобиться. Он если в отрыве от общего контекста что то будет воротить то так себе закончится такой рефакторинг. А на большом объеме контекста задача так себе закончистя все-равно, потому-что он по объему не усвоит. И вот 2ух часовое совещание состоящие из воды и прострационных рассуждений, где "важное мнение Ивана Иваныча" это какая-то херня, уровня "ну там понимаешь то се это пятого десятоко в прод не запускайте пока лешка не глянет" может размазаться на те самые 100к строк, но не кода, а воздуха, где по мнению каждого второго вентилятора его мнение было важным, а ллм не учла. И не учтет. Потому-что даже если ты явно напишешь критерии важности, то они от совещания к совещанию меняться будут. А когда у тебя будет необходимость составлять вот такие вот "критерии" каждый раз, то окажется, что технически ты и сам ту самую работу за ллм уже и провел, пока разобрался что там надо учесть, перепрослушал записи на всякий случай, выписал эти все мнения, указал ллм как их учитывать и тд.
Павел Гурин@Guard_82
В компаниях проблема часто даже не в потере контекста, а в том, что даже на одном совещании пять человек потом по-разному пересказывают, о чём вообще договорились 😂😂
August@August_msk
Устройство ставится в переговорках и, в идеале, на кухне и записывает то, что обычно не оцифровывается. Живое общение и принятые решения сразу попадают в базу знаний,

И вся информация об офисных интригах, все сплетни и мнения о начальниках тоже собираются сразу 😂
Дмитрий Филиппов@AskFilippov
чисто архитектурный вопрос, количества инструкций, ссылочной массы которой они оперируют и поддержания данных up-2-date с текущими решениями

если речь не идет про ОЧЕНЬ большие массивы данных, то в целом там сложности нет, просто надо выкинуть мысль о том что это "можно сделать один раз и все будет хорошо работать" — что отрезает от технологии огромную часть пользователей 😁
Join discussion on TelegramComments are synced from Telegram

Связанные темы

Читать далее