Как работает модель Mythos и почему она эффективна?
Mythos является очень эффективной моделью в плане токенов. Причиной этому, скорее всего, является использование подхода похожего на LoopLM от ByteDance (в соавторстве с Бенжио).
Не вдаваясь в математику, это значит что модель вместо генерации chain-of-thought размышлений в виде текста, делает это в своем скрытом, латентном пространстве без какого-либо промежуточного аутпута. При тренировке, модель сама учится тому когда ей нужно делать несколько циклов инфренса для более сложных задач.
Если это так, то это дает большую экономию в токенах, и одновременно позволяет модели более «глубоко» думать над задачами, которые трудно решить обычной цепочкой рассуждений.
Не вдаваясь в математику, это значит что модель вместо генерации chain-of-thought размышлений в виде текста, делает это в своем скрытом, латентном пространстве без какого-либо промежуточного аутпута. При тренировке, модель сама учится тому когда ей нужно делать несколько циклов инфренса для более сложных задач.
Если это так, то это дает большую экономию в токенах, и одновременно позволяет модели более «глубоко» думать над задачами, которые трудно решить обычной цепочкой рассуждений.
e/acc
190 публикаций на visbl.me
Пишу про будущее: AI, web3, технологии и общество. Ускоряемся. Автор: @sgershuni Инвестирую: cyber.fund Построил: Credentia, Deep Skills, Codex Town
Связанные темы
Читать далее
Каковы цены на токены Google, OpenAI и Anthropic в 2026 году?
Венчур Менна и Горного·
Как стать ИИ-нейтив и какие примеры успешных фаундеров?
e/acc·
Как нанимать ИИ-нейтив специалистов в 2026 году?
e/acc·
Как компании контролируют бюджет на токены в 2026 году?
e/acc·
Mira**** — топ-1 AI-агент в Telegram ****💫**
e/acc·
Почему люди следуют религии и национальности?
e/acc·
💬Discussion (41)
Хотя смысл от этого, если нам все равно не дают пощупать)
Неужели реализовали?