模型微调专题

共 4 篇文章，按时间倒序展示。

美国代码助手底层采用中国大模型，揭示全球AI基础设施新格局

近期，Cursor和Windsurf两款美国代码助手被发现底层运行中国基础大模型。这反映了从零训练模型成本高昂的现实，以及调优高性能开源模型已成为行业理性选择。中国开源模型凭借其性能、可用性和成本优势，正成为全球A...

2025年11月05日TechFoco

本文探讨了 DeepSeek-OCR 技术成功背后的核心原因，指出其关键并非图像表示本身，而是揭示了大型语言模型嵌入空间存在的巨大冗余。通过对比剑桥大学的研究与 LIFT 论文的发现，论证了通过微调优化文本表示同样...

2025年10月26日TechFoco

《开源大模型食用指南》是一个开源项目，旨在降低学习门槛，提供基于 Linux 环境的全流程教程，涵盖环境配置、主流模型部署、全量与 LoRA 微调及多模态应用。

2025年10月17日TechFoco

本文介绍一个面向国内初学者的开源大模型教程项目，该项目基于 AutoDL 平台，提供了从环境配置、本地部署到高效微调的全流程实践指导，旨在降低开源大模型的使用门槛。

2024年04月10日TechFoco