claude-context:给 Claude Code 接上整个代码库的语义搜索
Zilliz 开源 claude-context,通过 AST 分块、向量化存储和混合搜索,让 Claude Code 能语义检索整个代码库,减少约 40% token 消耗,支持多种编程语言和开发工具。
大模型的 context window 再大,也有上限。真正的工程项目动辄几十万行代码,无法一次性全部塞入。Zilliz 开源的 claude-context 正是为了解决这一问题:将代码库向量化存入数据库,让 Claude Code 在需要时按语义检索相关代码片段,而不是每次都把整个目录加载进 context。
核心内容
核心机制
代码不是以文件为单位存储,而是先用 AST(抽象语法树)做智能分块,再通过 OpenAI embedding 模型向量化,存入 Milvus 或 Zilliz Cloud 向量数据库。检索时使用混合搜索:BM25 关键词匹配 + 向量语义搜索,两种方式的结果合并排序,相关性比单纯向量搜索更准。
官方测评数据:在同等检索质量下,减少约 40% 的 token 消耗。代码库越大,节省越明显。
增量索引
利用 Merkle Tree 跟踪文件变化,只重新索引改动的文件,不需要每次全量跑一遍。
安装方式
对 Claude Code 来说,添加 claude-context 之后,在 Claude Code 里直接说「Index this codebase」,等索引完成,就可以用自然语言检索了。例如:「找所有处理用户认证的函数」。
兼容范围
不只 Claude Code,Cursor、Codex CLI、Gemini CLI、Windsurf、VS Code、Cline 全都支持,都是修改 MCP 配置文件,几行 JSON 即可完成。
支持的编程语言:TypeScript、Python、Java、Go、Rust、C++、C Sharp、Ruby、Swift 等主流语言。
Embedding 也可以替换:除了 OpenAI,还支持 VoyageAI(voyage-code-3,代码搜索效果更好)、Ollama 本地模型、Gemini。
价值与影响
本质上,Claude Code 默认的代码理解方式是:你告诉它看哪里,它看哪里。claude-context 将其升级为:你问它一个问题,它自己去整个代码库里找相关的部分,带上来给你用。对于中大型项目,这个差距很明显——不再需要手动 @file 指定文件,不用担心遗漏关键模块,Agent 的自主性和准确性都会提升。





