LLM 优化指南 内存 计算 推理 技术LLM优化三大方向:显存优化(Flash Attention/激活检查点)、计算优化(序列打包/高效Transformer)、推理优化(KV缓存/量化技术)。涵盖训练与推理全流程关键技术。2025年10月07日•TechFocoLarge Language Model OptimizationMemory OptimizationCompute Optimization
AI 效率优化:打造绿色智能系统AI效率优化技术全景:量化、剪枝、蒸馏等降低能耗与成本,打造绿色智能系统。2025年09月07日•TechFocoModel CompressionInference OptimizationGreen AI