LLM 优化指南 内存 计算 推理 技术LLM优化三大方向:显存优化(Flash Attention/激活检查点)、计算优化(序列打包/高效Transformer)、推理优化(KV缓存/量化技术)。涵盖训练与推理全流程关键技术。2025年10月07日•TechFocoLarge Language Model OptimizationMemory OptimizationCompute Optimization