通用 PDF 文件流 OCR 到文本 API 接口解析
本文介绍了一款基于机器学习的通用 PDF 文件流 OCR 识别 API,支持多语言混合识别、HTTPS 安全协议、高可用架构,并输出纯文本以利于后续处理。

第 27 页,共 40 页
本文介绍了一款基于机器学习的通用 PDF 文件流 OCR 识别 API,支持多语言混合识别、HTTPS 安全协议、高可用架构,并输出纯文本以利于后续处理。

本文介绍一款基于 Cloudflare Workers 和 D1 构建的开源监控工具,它支持对服务端点进行可用性、延迟和状态码检查,并能通过 OpsGenie 发送告警,具有部署成本低和架构高效的特点。

Tinyopt 是一个高效的优化库,通过 Accumulation 函数减少内存使用,支持自动微分,并提供梯度下降、高斯-牛顿和莱文贝格-马夸特等多种迭代求解器。


Canine 是一个旨在简化 Kubernetes 集群部署的平台,通过提供一键部署、实时监控和团队协作功能,降低容器编排的使用门槛,尤其适合小团队。

Firebase Studio 是一个全栈开发平台,其核心特点是允许开发者使用自然语言来构建、修改和部署应用程序,无需编写传统代码。平台集成了 Gemini 以提供 AI 支持,并且免费使用,简化了配置流程。


BotBrowser 是一款基于修改版 Chromium 核心的隐身浏览器,旨在高成功率绕过 Cloudflare 等主流反爬虫检测,支持多平台并提供全面的指纹伪装功能。

open-webui/mcpo 是一个代理服务器,能够将任何 MCP 工具转换为兼容 OpenAPI 规范的 HTTP 服务器,实现即插即用和自动文档生成。

uniOCR 是一款支持 macOS、Windows 和 Linux 的原生 OCR 工具,通过集成各平台原生 API 与 Tesseract,提供统一接口并利用异步处理提升性能。

AWS MCP Servers 是一个专用服务器套件,旨在将 AWS 最佳实践直接融入开发工作流。它提供多种专业服务器,支持自然语言查询,并与 AWS 服务深度集成,助力云原生开发。

本文介绍了 MM_StoryAgent,一个用于生成沉浸式故事书视频的多智能体框架。该框架支持基于设定进行高质量故事创作,并整合图像、语音、音效和音乐等多模态内容生成,同时允许用户通过自定义工作流提升生成质量。

Fin-R1是一款专为金融领域设计的7B参数推理大模型,采用SFT和RL两阶段训练,在FinQA和ConvFinQA等金融推理任务上表现优异,旨在提升模型准确性与泛化能力。

fastapi_mcp 是一个零配置工具,能够自动将 FastAPI 应用中的所有接口转换为 MCP 工具,并完整保留请求与响应模型的 Schema,确保数据交互的准确性。

Awesome-Prompts 是一个为 Browser-Use Agent 精心策划的提示词库,覆盖电商、内容创作、数据提取等多种实用场景,提供可直接使用的模板和行业最佳实践,并由社区共建,资源持续更新。

本文介绍了 sooperset/mcp-atlassian 项目,这是一个为 Atlassian 的 Confluence 和 Jira 平台提供的集成工具,支持云版与服务器版,并提供了丰富的 API 与灵活的部署选项。

本文介绍了 Awesome MCP Servers 项目,这是一个为开发者提供的综合性 MCP 服务器资源列表,涵盖多种应用场景和开源实现,旨在加速 Agent 的开发与集成。

Plain 是一个基于 Django 改进的 Python Web 框架,提供用户认证、ORM 等扩展包,并支持 Tailwind CSS 等现代前端技术,旨在提升开发效率。

coredumpy 是一个 Python 工具,用于在程序崩溃时保存完整的执行现场,生成可移植的 core dump 文件。它支持 unittest、pytest 测试框架以及常规运行时异常,并能与 VSCode、...