olmOCR-7B-0225-preview

简介:

olmOCR-7B-0225-preview 是一个基于 Qwen2-VL-7B-Instruct 微调的文档图像识别模型,用于高效转换文档为纯文本。

功能:

支持单页文档图像输入,最长边为 1024 像素

结合文档元数据生成高质量文本输出

提供手动提示生成方法,方便用户自定义使用

支持批量处理,可高效处理大规模文档

兼容多种文档格式,包括 PDF 和图像文件

需求人群:

"该模型适用于需要高效处理文档图像并提取文本内容的用户,如研究人员、教育工作者、数据分析师以及需要自动化文档处理的企业。它能够快速将扫描文档或图像转换为可编辑文本,提高工作效率。"

浏览量:83

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图