Google придумал как сжать «рабочую память» AI в 6 раз без потери качества
Google представил TurboQuant, алгоритм, который сжимает память AI в 6 раз без потери качества, снижая затраты на инференс.
1 post across all channels
Google представил TurboQuant, алгоритм, который сжимает память AI в 6 раз без потери качества, снижая затраты на инференс.