Docling:为生成式 AI 准备文档数据
Docling 是一个文档处理工具,能够将 PDF、DOCX、XLSX 等多种格式的文档解析并转换为生成式 AI 可直接使用的结构化数据,支持本地执行以保障数据安全。
TechFoco

共 3 篇文章,按时间倒序展示。
Docling 是一个文档处理工具,能够将 PDF、DOCX、XLSX 等多种格式的文档解析并转换为生成式 AI 可直接使用的结构化数据,支持本地执行以保障数据安全。

AI reads books Page-by-Page 是一个利用 AI 逐页分析 PDF 书籍、提取知识点并生成阶段性总结的工具,支持 JSON 和 Markdown 格式输出。

本文介绍一个基于 Python 的 read_books.py 脚本,该工具利用 AI 技术逐页解析 PDF 文档,自动提取关键知识点并生成阶段性总结,所有笔记均以 Markdown 格式保存,旨在提升阅读与知识管...
