Chandra OCR 开源发布:功能、性能与对比
Chandra OCR 是一款开源文档解析工具,支持版面分析、手写体识别,兼容 transformers 和 vLLM,在基准测试中表现优异,但存在部分识别限制。
TechFoco

共 2 篇文章,按时间倒序展示。
Chandra OCR 是一款开源文档解析工具,支持版面分析、手写体识别,兼容 transformers 和 vLLM,在基准测试中表现优异,但存在部分识别限制。

阿里开源 Logics-Parsing,这是一个基于视觉语言模型的端到端文档解析模型,能准确解析科学论文、化学结构等复杂文档并生成结构化 HTML。
