Google выпустил открытую диффузионную языковую модель DiffusionGemma
Google выпустил открытую диффузионную языковую модель DiffusionGemma
DiffusionGemma построена на базе Gemma 4, Имеет 26 миллиардов параметров, из которых 4 миллиарда активны. В отличие от обычных LLM, она не пишет ответ слева направо по одному токену, а генерирует блоки текста параллельно и постепенно их уточняет.
Google обещает до 4 раз более быструю генерацию на выделенных GPU. Больше 1000 токенов в секунду на NVIDIA H100 и больше 700 токенов в секунду на RTX 5090.
Модель рассчитана на сценарии, где важна скорость: редактирование текста на лету или автодополнение кода. Там, где нужно качество, Google советует использовать традиционную LLM Gemma 4.
https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/
DiffusionGemma построена на базе Gemma 4, Имеет 26 миллиардов параметров, из которых 4 миллиарда активны. В отличие от обычных LLM, она не пишет ответ слева направо по одному токену, а генерирует блоки текста параллельно и постепенно их уточняет.
Google обещает до 4 раз более быструю генерацию на выделенных GPU. Больше 1000 токенов в секунду на NVIDIA H100 и больше 700 токенов в секунду на RTX 5090.
Модель рассчитана на сценарии, где важна скорость: редактирование текста на лету или автодополнение кода. Там, где нужно качество, Google советует использовать традиционную LLM Gemma 4.
https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/
GPT/ChatGPT/AI Central Александра Горного
616 публикаций на visbl.me
Авторский взгляд на новости технологий Реклама: https://docs.google.com/presentation/d/1glQMXYyKAYpzNP8VXzM4gl2YkEgLjkeD_Fxvzbu5QUE/edit РКН: https://clck.ru/3FPkup Личный аккаунт: @gornal О рекламе: @Vzuhcha ВП нет
Связанные темы
Читать далее
Microsoft AI критикует Anthropic за разговоры о сознании Claude
GPT/ChatGPT/AI Central Александра Горного·
Google сделал ещё дешевле свою самую дешевую подписку на AI
GPT/ChatGPT/AI Central Александра Горного·
Как перенести сайт с Bitrix на другую платформу?
GPT/ChatGPT/AI Central Александра Горного·
Почему элитные проститутки Кремниевой Долины стоят так дорого?
GPT/ChatGPT/AI Central Александра Горного·
Тысячи аккаунтов в Instagram* взломали через бота поддержки
GPT/ChatGPT/AI Central Александра Горного·
Вышел Claude Mythos
GPT/ChatGPT/AI Central Александра Горного·