OpenAI выпустила сверхбыструю GPT‑5.3‑Codex‑Spark

OpenAI выпустила сверхбыструю GPT‑5.3‑Codex‑Spark
OpenAI выпустила сверхбыструю GPT‑5.3‑Codex‑Spark

Spark — уменьшенная версия GPT-5.3-Codex. Создана в партнёрстве с Cerebras и работает на специальных чипах для быстрого инференса.

Скорость ответа — 1000 токенов в секунду. Контекстное окно — 128 тысяч токенов.

Предварительная версия доступна подписчикам Pro в Codex, CLI и расширениях VS Code.

https://openai.com/index/introducing-gpt-5-3-codex-sp
ark/

💬Discussion (4)

Leonid Khizetel@khizetel
Codex 5.3 в принципе приятно удивил. А тут ещё это
Илья К@iliakozha
Интересно, у них по чипам ограничение ? Почему так пришлось резать модель. Если бы они codex-5.3 сделали 300/сек для прошников это не больше эффекта было бы?
Александр Ж@skivbox
Да. Внутричиповая память (SRAM) — 44 ГБ
На самом процессоре WSE-3 размещено 44 ГБ сверхбыстрой памяти SRAM.
Ограничение: Это физический предел одного кристалла. Вся память распределена по 900 000 ядрам.
Alexey@aidigitalmarketer
Александру осталось только упомянуть, что эта оптимизация сильно порезала бенчи. А так да, годная статья.
Join discussion on TelegramComments are synced from Telegram

Read next