claude-context: 它是什么,解决了什么问题以及为什么它正受到关注
claude-context: 它是什么,解决了什么问题以及为什么它正受到关注
解决了什么问题
Claude Context 解决了在使用具有大型代码库的 AI 编程代理时遇到的“上下文窗口耗尽”和高成本问题。它不是将整个目录加载到 LLM 中——这既昂贵又经常超出 token 限制——而是允许代理从数百万行源代码中仅检索最相关的代码片段。
工作原理
它作为一个 Model Context Protocol (MCP) 插件运行,将 AI 助手(如 Claude Code、Cursor 或 Windsurf)连接到向量数据库。该系统使用以下流水线处理代码库:
- Indexing(索引):它使用抽象语法树 (AST) 分析代码以进行智能分块,并将生成的 embedding 存储在向量数据库(如 Milvus 或 Zilliz Cloud)中。
- Hybrid Search(混合搜索):它结合使用 BM25(关键词搜索)和稠密向量搜索(语义搜索)来根据自然语言查询查找代码。
- Incremental Updates(增量更新):它使用 Merkle trees 来仅对已更改的文件进行重新索引,从而确保索引保持最新,而无需进行完整重建。
- Integration(集成):它提供
index_codebase和search_code等工具,AI 代理可以调用这些工具将特定的、相关的代码直接拉取到其活动上下文中。
适用人群
使用 AI 编程代理并希望在减少 token 使用量和 API 成本的同时提高检索准确性的、从事大规模软件项目开发的人员。
亮点
- Broad Compatibility(广泛的兼容性):支持广泛的 MCP 客户端,包括 Claude Code、Cursor、Windsurf、VS Code 和 Gemini CLI。
- Multi-Language Support(多语言支持):支持 TypeScript、JavaScript、Python、Java、C++、C#、Go、Rust、PHP、Ruby、Swift、Kotlin、Scala 和 Markdown。
- Flexible Embeddings(灵活的 embedding):兼容多种 embedding 提供商,包括 OpenAI、VoyageAI、Ollama 和 Gemini。
- Efficiency(效率):与加载完整目录相比,在保持检索质量的同时,证明了约 40% 的 token 减少。
Sources
- undefinedzilliztech/claude-context