LLM 架构演进图谱:收敛还是分裂LLM架构设计趋同(MoE、QK-Norm成标配),但技术路线分裂(MLA、Mamba、线性注意力混搭),核心是优化长上下文计算成本。2026年03月19日•TechFocoLarge Language ModelsLLM ArchitectureAttention Mechanism