Gemma 3:谷歌新一代多功能AI模型发布
谷歌发布Gemma 3模型,支持图像与文本的多模态输入,上下文窗口达128k tokens,覆盖140多种语言,并提供1B至27B四种参数规模选择。
TechFoco
共 2 篇文章,按时间倒序展示。
谷歌发布Gemma 3模型,支持图像与文本的多模态输入,上下文窗口达128k tokens,覆盖140多种语言,并提供1B至27B四种参数规模选择。
olmOCR 是一款开源工具,专注于将 PDF 等文档高吞吐量转换为纯文本,同时保持自然阅读顺序。它支持表格、公式和手写体等复杂内容,并采用独特提示技术以提高准确性。
