RotorQuant:基于旋子量化的10-19倍加速方案
RotorQuant 利用 Clifford 代数中的旋子替代 TurboQuant 的全局随机旋转矩阵,将计算量大幅降低,在 GPU 上实现显著加速,同时保持了与 TurboQuant 相近的量化精度。
TechFoco

共 1 篇文章,按时间倒序展示。
RotorQuant 利用 Clifford 代数中的旋子替代 TurboQuant 的全局随机旋转矩阵,将计算量大幅降低,在 GPU 上实现显著加速,同时保持了与 TurboQuant 相近的量化精度。
