本地大模型专题

共 3 篇文章，按时间倒序展示。

本地大模型调优指南：从跑通到跑爽的进阶地图

本地大模型调优的核心在于显存和内存带宽管理。本文详解了显存分配、KV Cache量化、CPU调度及投机采样等技巧，帮助用户在不升级硬件的情况下实现性能翻倍。

2026年06月24日TechFoco

Unsloth 发布教程，介绍如何通过 MCP 协议将 Qwen 或 Gemma 等本地大模型与外部工具（如本地文件、浏览器、Vercel、GitHub）连接，实现本地化、隐私安全的工具调用。

2026年06月04日TechFoco

本文探讨了LocalLLaMA社区中AI生成内容泛滥的现象，分析了其对社区信噪比和内容质量的负面影响，并引出了关于技术社区核心价值的讨论。

2026年02月22日TechFoco