pdf-extract-api

简介:

高精度将图片或PDF转换为Markdown文本或JSON结构化文档的API

功能:

高精度PDF到Markdown和JSON的转换

使用PyTorch基于Marker的OCR和Ollama模型进行本地处理

支持LLM改进OCR文本结果

去除PDF中的个人身份信息(PII)

分布式队列处理使用Celery

使用Redis缓存OCR结果

命令行工具用于发送任务和处理结果

需求人群:

"目标受众包括需要高精度文档转换服务的开发者和企业,特别是那些对数据隐私和安全性有高要求的用户。该API适合需要将大量文档转换为结构化数据的场合,如法律文件、医疗报告和财务发票等。"

浏览量:12

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图