多模态AI 专题

3 篇文章,按时间倒序展示。

Nanonets-OCR2:开源图像转Markdown模型解析

Nanonets-OCR2是一款开源模型,可将图像文档智能转换为结构化的Markdown格式。它不仅能提取文本,还能精准识别LaTeX公式、复杂表格、图表、签名水印等多种元素,并支持多语言、手写文档及视觉问答功能。

TechFoco
Nanonets-OCR2:开源图像转Markdown模型解析