TechFoco

技术资讯焦点

每天精选科技领域的热点资讯
关注技术发展的最新动态

LLM 优化指南 内存 计算 推理 技术

LLM优化三大方向:显存优化(Flash Attention/激活检查点)、计算优化(序列打包/高效Transformer)、推理优化(KV缓存/量化技术)。涵盖训练与推理全流程关键技术。

LLM 优化指南 内存 计算 推理 技术
来源: TechFoco

Resumable Stream 实现 Web 流断点续传

resumable-stream:Web流断点续传开源库,支持多客户端同步,适配无状态架构,优化Redis性能。

Resumable Stream 实现 Web 流断点续传
来源: TechFoco

深度学习全息原理 揭秘张量网络

深度学习通过张量网络实现高维数据压缩,类似全息原理,提升计算效率与泛化能力。

深度学习全息原理 揭秘张量网络
来源: TechFoco

自建 AI 中转服务 解决多账号管理难题

开源AI中转服务解决多账号管理难题,统一API网关支持Claude/OpenAI/Gemini,保障数据隐私与费用分摊。

自建 AI 中转服务 解决多账号管理难题
来源: TechFoco

阿里 Logics Parsing 革新文档解析

阿里开源Logics-Parsing:基于视觉语言模型的端到端文档解析工具,支持图片直接转HTML,精准识别科学公式、化学结构等复杂内容。

阿里 Logics Parsing 革新文档解析
来源: TechFoco

本地 RAG 入门 轻松实现智能问答

本地RAG开源项目:PDF上传、向量检索、多模型推理一体化,支持混合检索与重排序,适合初学者快速上手。

本地 RAG 入门 轻松实现智能问答
来源: TechFoco

Agentic RAG 进阶指南 智能检索框架解析

Agentic RAG通过智能代理分析查询、动态检索、数据重排和答案评估,实现从理解意图到自动执行的闭环,适合复杂业务场景。

Agentic RAG 进阶指南 智能检索框架解析
来源: TechFoco

金融数据 MCP 服务器 一站式股票分析

开源MCP服务器集成股票财报、价格、新闻和加密货币数据,支持AI助手和开发者快速构建金融分析工具。

金融数据 MCP 服务器 一站式股票分析
来源: TechFoco

WailBrew 极简 Homebrew GUI 管理工具

WailBrew:macOS极简Homebrew GUI,支持包管理、Doctor诊断和实时刷新,提升操作效率。

WailBrew 极简 Homebrew GUI 管理工具
来源: TechFoco

RAG 系统实战:从关键词到智能问答

6周构建生产级RAG系统:从BM25关键词检索到本地LLM智能问答,集成OpenSearch混合搜索与Redis缓存,实现150~400倍性能提升。

RAG 系统实战:从关键词到智能问答
来源: TechFoco