构建生产级 RAG 系统:从 BM25 到本地 LLM
本文介绍一个为期 6 周的开源实战课程,旨在系统化地指导构建一个生产级的 RAG 系统。课程从 Docker、FastAPI 等基础设施搭建开始,强调先掌握 BM25 关键词检索,再结合向量语义进行混合检索,并集成...
TechFoco

共 3 篇文章,按时间倒序展示。
本文介绍一个为期 6 周的开源实战课程,旨在系统化地指导构建一个生产级的 RAG 系统。课程从 Docker、FastAPI 等基础设施搭建开始,强调先掌握 BM25 关键词检索,再结合向量语义进行混合检索,并集成...

本文汇总了 JAX 官方指南、性能瓶颈分析、AI 工程师指南和效率优化战术等 GPU 编程核心学习资源,并给出了聚焦 JAX 框架和利用实践平台的学习建议,旨在帮助初学者系统入门。

本文介绍了 Chip Huyen《AI Engineering》配套资源库,该库汇集了论文、博客等资料,覆盖 LLM 应用开发、提示工程、微调与 RAG 等关键技术,旨在帮助开发者构建系统化认知并提升工程效率。
