Как использовать ультра-быструю модель для генерации приложений?

Новый ультра-быстрый сервис LLM, с которым можно пообщаться тут.
15 тыс токенов в секунду - она может генерировать примерно десять next.js/react приложений в секунду.
это трехбитная квантизация ламы 3.1, поэтому каких-то супер умных вещей от нее ожидать не стоит, но модели поуменеют, а вот как использовать систему, которая пишет небольшую книгу за секунду еще предстоит осознать.
15 тыс токенов в секунду - она может генерировать примерно десять next.js/react приложений в секунду.
это трехбитная квантизация ламы 3.1, поэтому каких-то супер умных вещей от нее ожидать не стоит, но модели поуменеют, а вот как использовать систему, которая пишет небольшую книгу за секунду еще предстоит осознать.
e/acc
226 публикаций на visbl.me
Пишу про будущее: AI, web3, технологии и общество. Ускоряемся. Автор: @sgershuni Инвестирую: cyber.fund Построил: Credentia, Deep Skills, Codex Town
Связанные темы
Читать далее
Расходы на компьют для ИИ в США растут примерно на 140% в год, но если учесть прогресс алгоритмов, то эффективный рост п...
e/acc·
Как стать триллионером? 1. Поставить почти невозможные цели 2. Не сдаваться, пока ты их не достигнешь...
e/acc·
Давно хотел написать, но руки не доходили. Сейчас тоже не дошли, поэтому без контекста: Пакет вознаграждения Elon Musk ...
e/acc·
Где бесплатно получить доступ к модели GLM-5.2?
e/acc·
Как сэкономить на токенах для ИИ в 2026 году?
e/acc·
Как восстановить доступ к заблокированным каналам в Telegram?
e/acc·
💬Discussion (30)
Правда поменять модель после этого уже нельзя. Нужно делать новый чип
Ключевая идея Cerebras: вместо медленной внешней DRAM/HBM на чипе размещено 44 ГБ быстрой SRAM, распределённой по всем ядрам. Это устраняет узкое место по пропускной способности — данные никуда не «едут» по шине. Но Cerebras всё равно стримит веса, просто делает это очень быстро и по слоям. То есть веса всё ещё хранятся отдельно от логики вычислений.
Ключевая идея Taalas: веса не просто хранятся «рядом» с вычислениями — они физически закодированы в транзисторах, образуя структуру самой схемы. Доступа к памяти нет вообще — вычисление «уже знает» все веса на уровне схемотехники.
https://t.me/denissexy/11235?single