Как использовать ультра-быструю модель для генерации приложений?

e/acc·20 февраля 2026 г.·1 мин чтения·30 комментариев

Новый ультра-быстрый сервис LLM, с которым можно пообщаться тут.

15 тыс токенов в секунду - она может генерировать примерно десять next.js/react приложений в секунду.

это трехбитная квантизация ламы 3.1, поэтому каких-то супер умных вещей от нее ожидать не стоит, но модели поуменеют, а вот как использовать систему, которая пишет небольшую книгу за секунду еще предстоит осознать.

модель генерация приложения

Смотреть оригинал в Telegram →

e/acc

171 публикаций на visbl.me

Пишу про будущее: AI, web3, технологии и общество. Ускоряемся. Автор: @sgershuni Инвестирую: cyber.fund Построил: Credentia, Deep Skills, Codex Town

💬Discussion (30)

Anonymous•Feb 20

она не решает PhD задачи по квантовой физике, но такая скорость это что-то новое

Max Zemnevodow@zemnevodow•Feb 20

попросил сделать онлайн шахматы - послала на личес(

Evgeny Melnikov@evgeni_melnikov•Feb 20

Это Llama 3.1 8B

Evgeny Melnikov@evgeni_melnikov•Feb 20

Там вся фишка в том, что они "запекают" модель прямо в чип. У стадндартного подхода веса хранятся во внешней памяти (HBM, DRAM), а Taalas кодирует веса модели прямо в физическую топологию чипа (ROM-ячейки) на этапе производства.

Правда поменять модель после этого уже нельзя. Нужно делать новый чип

Artem@atmrkvot•Feb 20

а в чем отличие от cerebras? я так и не понял. типа такое же есть уже

Evgeny Melnikov@evgeni_melnikov•Feb 20

Поспрашивал у Perplexity:

Ключевая идея Cerebras: вместо медленной внешней DRAM/HBM на чипе размещено 44 ГБ быстрой SRAM, распределённой по всем ядрам. Это устраняет узкое место по пропускной способности — данные никуда не «едут» по шине. Но Cerebras всё равно стримит веса, просто делает это очень быстро и по слоям. То есть веса всё ещё хранятся отдельно от логики вычислений.

Ключевая идея Taalas: веса не просто хранятся «рядом» с вычислениями — они физически закодированы в транзисторах, образуя структуру самой схемы. Доступа к памяти нет вообще — вычисление «уже знает» все веса на уровне схемотехники.

Artem@atmrkvot•Feb 20

да я тоже уже у чатгпт спросил

Aleksey Andreyanov@wrewolf•Feb 21

Там вроде заявлены порты расширения, оно допускает себя файтюнить.

https://t.me/denissexy/11235?single

Aleksei Fediushin@FediushinAleksei•Feb 20

Нууу, такое)

Join discussion on TelegramComments are synced from Telegram

Связанные темы

бизнес (20)ai (12)стартап (9)технологии (7)видео (6)google (4)программирование (3)рост (3)

Как использовать ультра-быструю модель для генерации приложений?

💬Discussion (30)

Связанные темы

Читать далее

Какие качества важны у успешных фаундеров?

Куда движется рынок AI в 2026 году?

Какие стадии проходит компания, чтобы стать AI-native?

Вышла GPT‑5.5 Instant

Почему компаниям нужно объединяться с PE для оптимизации ИИ?

Почему инвестиции в софт больше не приносят прибыль?