
MoE 专题
共 4 篇文章,按时间倒序展示。

LLM 优化指南 内存 计算 推理 技术
LLM优化三大方向:显存优化(Flash Attention/激活检查点)、计算优化(序列打包/高效Transformer)、推理优化(KV缓存/量化技术)。涵盖训练与推理全流程关键技术。
TechFoco


DeepSeek 模型架构与资源全解析:一站式宝藏库
DeepSeek-MoE-ResourceMap 提供 DeepSeek V3 架构解析、模型训练部署策略及相关论文文档,助力高效应用与学术研究。
TechFoco
