Google представила TurboQuant — новый алгоритм сжатия памяти для ИИ
Google Research анонсировала TurboQuant, инновационный алгоритм сжатия памяти для искусственного интеллекта, который обещает значительно повысить эффективность работы ИИ-систем. Новый метод, основанный на векторном квантовании, позволяет уменьшить объём оперативной памяти, необходимой для работы ИИ, без потери производительности.
TurboQuant решает одну из ключевых проблем современных ИИ-систем — высокие требования к памяти во время выполнения задач. Используя методы PolarQuant и QJL, алгоритм позволяет сократить объём рабочей памяти, KV-кэш, в шесть раз. Это открытие может сделать ИИ более доступным и менее затратным в эксплуатации.
По словам исследователей, TurboQuant не только уменьшает объём памяти, но и сохраняет точность работы ИИ. Это особенно важно для задач, требующих обработки больших объёмов данных в реальном времени.
Если TurboQuant будет успешно внедрён, то он может стать важным шагом в развитии ИИ. Снижение требований к памяти позволит использовать ИИ на менее мощных устройствах, а также снизить затраты на инфраструктуру. Однако на данный момент технология остаётся лабораторным достижением и ещё не получила широкого применения.
Некоторые эксперты уже сравнивают TurboQuant с вымышленным алгоритмом сжатия из сериала «Кремниевая долина», а также с китайской моделью DeepSeek, которая продемонстрировала высокую эффективность при низких затратах на обучение.
Google планирует представить TurboQuant на конференции ICLR 2026, где будут подробно описаны методы PolarQuant и QJL, лежащие в основе алгоритма.