2 Fast 2 AI

Google Research Division представила TurboQuant, новый алгоритм сжатия для LLMок, ускоряя скорость kv-Кеша (то есть краткосрочную память ИИ) как минимум в 6 раз, и скорость ответов до 8и раз с нулевой потерей информации. Это означает что и требования к ГПУ и памяти для запуска ИИшек значительно упадёт, а разработчики смогут вставлять больше данных в свои ИИшки чем раньше.
Сам анонс очень сильно падает в техническую часть, поэтому кому интересно можете почитать сами (я советую кстати, интересное чтиво)
После этого акции SanDisk, Micron, Samsung и SK Hynix рухнули аж до -30% (в среднем где-то 10%), но на вас с вами, к сожалению, это не сильно влияет, так как цены на память и ГПУ, пока что, не изменятся.
📼 **@veselcraft**
1107 публикаций на visbl.me
Канал YouTube-страницы «Veselcraft». Обсуждаем новости, информируем о новых видео, общаемся с аудиторией. Деловые предложения: veselcraft@icloud.com Реклама в Telegram: https://telega.in/channels/veselcraft/card Канал по Ж/Д: @traintovos
Связанные темы
Читать далее
**Переобуваюсь в воздухе — вероятно, это ранний iPhone 17, но есть нюанс... ** Меня тыкнули носом в метаданные про котор...
В сети, предположительно, **всплыли фотографии нового iPhone 18**, а также видео их сборки неизвестным китайским рабочим...
Постер организации FSF и движения Defective By Design против технологии DRM в iPod и iTunes #интересности **📼**** **...
кстати говоря про БПшники, вот вам таблица рекомендаций качества оных основано это всё на условиях тестов и жалоб людей...
SteamOS 3.8 официально добавляет поддержку GPU AMD, то есть, любой ПК или ваше наладонное устройство теперь можно официа...
Вкусно — и точка (неповторимый оригинал McDonalds) выпустили бокс с персонажами Line Friends из одноимённого японского м...
💬Discussion (3)