AI model 专题

共 2 篇文章，按时间倒序展示。

Gemma 3：谷歌新一代多功能AI模型发布

谷歌发布Gemma 3模型，支持图像与文本的多模态输入，上下文窗口达128k tokens，覆盖140多种语言，并提供1B至27B四种参数规模选择。

2025年03月17日TechFoco

olmOCR 是一款开源工具，专注于将 PDF 等文档高吞吐量转换为纯文本，同时保持自然阅读顺序。它支持表格、公式和手写体等复杂内容，并采用独特提示技术以提高准确性。

2025年02月28日TechFoco