Google TurboQuant:零成本实现6倍内存压缩,AI推理成本减半的革命性算法 📅 2026年04月02日 · ☕ 5 分钟 Google Research最新发布的TurboQuant算法通过PolarQuant和QJL技术,在不损失精度的情况下将AI模型KV Cache内存需求降低6倍,推理速度提升8倍,为企业AI部署带来颠覆性成本优化。