美国代码助手底层采用中国大模型,揭示全球AI基础设施新格局
近期,Cursor和Windsurf两款美国代码助手被发现底层运行中国基础大模型。这反映了从零训练模型成本高昂的现实,以及调优高性能开源模型已成为行业理性选择。中国开源模型凭借其性能、可用性和成本优势,正成为全球A...
TechFoco

共 4 篇文章,按时间倒序展示。
近期,Cursor和Windsurf两款美国代码助手被发现底层运行中国基础大模型。这反映了从零训练模型成本高昂的现实,以及调优高性能开源模型已成为行业理性选择。中国开源模型凭借其性能、可用性和成本优势,正成为全球A...

本文探讨了 DeepSeek-OCR 技术成功背后的核心原因,指出其关键并非图像表示本身,而是揭示了大型语言模型嵌入空间存在的巨大冗余。通过对比剑桥大学的研究与 LIFT 论文的发现,论证了通过微调优化文本表示同样...

《开源大模型食用指南》是一个开源项目,旨在降低学习门槛,提供基于 Linux 环境的全流程教程,涵盖环境配置、主流模型部署、全量与 LoRA 微调及多模态应用。

本文介绍一个面向国内初学者的开源大模型教程项目,该项目基于 AutoDL 平台,提供了从环境配置、本地部署到高效微调的全流程实践指导,旨在降低开源大模型的使用门槛。
