Qwen 3.5 0.8B 模型在浏览器本地运行
一个 0.8B 参数的 Qwen 多模态模型现可在浏览器中完全本地运行,无需服务器。这标志着 AI 能力正从云端 API 服务转变为前端本地组件,为注重隐私、低延迟的应用场景提供了新可能。
TechFoco

共 5 篇文章,按时间倒序展示。
一个 0.8B 参数的 Qwen 多模态模型现可在浏览器中完全本地运行,无需服务器。这标志着 AI 能力正从云端 API 服务转变为前端本地组件,为注重隐私、低延迟的应用场景提供了新可能。

SmallClaw 是一个专为小型本地模型优化的 AI Agent 框架,通过简化架构设计,使其能在普通消费级硬件上运行,旨在降低使用门槛和成本。

ZeroClaw 是一个用 Rust 编写的全自主 AI 助手框架,其核心特点在于极低的资源占用与高度模块化的可插拔架构。内存占用低于 5MB,启动时间小于 10 毫秒,并能运行在树莓派等低成本硬件上。

Unsloth AI 与 PyTorch 合作推出新方案,支持在 iOS 和 Android 手机上微调并 100% 本地运行 LLM,实现移动端高效推理与隐私安全。

OpenPhone 是一个开源的 3 亿参数移动端视觉-语言基础模型,完全在手机本地运行,无需云调用,旨在解决 AI 手机应用的隐私、延迟和成本问题。