dflash-mlx:为 MLX 框架实现无损 DFlash 推测解码
dflash-mlx 为 Apple Silicon 上的 MLX 框架提供了无损的 DFlash 推测解码方案,基于 Block Diffusion 论文,结合自定义 Metal 内核,在 Qwen3.5-9B...
TechFoco
共 1 篇文章,按时间倒序展示。
dflash-mlx 为 Apple Silicon 上的 MLX 框架提供了无损的 DFlash 推测解码方案,基于 Block Diffusion 论文,结合自定义 Metal 内核,在 Qwen3.5-9B...