LLM-Aided OCR

简介:

利用大型语言模型增强扫描PDF的OCR输出。

功能:

PDF到图像转换

使用Tesseract进行OCR

使用LLMs进行高级错误校正(本地或基于API)

智能文本分块以高效处理

Markdown格式选项

可选的页眉和页码抑制

最终输出的质量评估

支持本地LLMs和基于云的API提供商(OpenAI, Anthropic)

异步处理以提高性能

详细的日志记录用于过程跟踪和调试

GPU加速本地LLM推理

需求人群:

"目标受众为需要将扫描文档转换为可编辑和准确文本格式的个人或企业,如文档数字化、历史文档恢复、学术研究等。"

浏览量:49

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图