向量搜索专题

共 3 篇文章，按时间倒序展示。

Google TurboQuant：将 KV Cache 压缩至 3 比特

Google Research 发布 TurboQuant 压缩算法，通过 PolarQuant 和 QJL 两步，将大语言模型推理时的 KV cache 内存占用压缩至 3 比特，内存减少 6 倍以上，计算速度显...

2026年03月29日TechFoco

Gemini API 新推出的 File Search 是一个全托管的检索增强生成系统，能自动处理文件存储、分块、嵌入和检索，简化了基于文档的智能问答应用开发。其成本结构友好，支持多种文件格式，并已在多个实际场景中...

2025年11月09日TechFoco

Telegram Search 是一款功能强大的聊天记录搜索客户端，它通过向量搜索和语义匹配技术提升搜索精准度，并提供聊天记录备份功能。该工具基于 OpenAI 技术实现智能检索。

2025年05月30日TechFoco