llama-ocr

简介:

免费 npm 库,用 Llama 3.2 Vision 进行 OCR,输出 markdown 文本

功能:

支持本地 图像 OCR

支持远程图像 OCR

计划支持单页 PDF 的 OCR

计划支持多页 PDF 的 OCR

将图像解析为 markdown 格式文本

提供免费和付费模型选项

未来可能支持 JSON 输出

需求人群:

"开发者和需图像文字识别的个人或企业,低成本免费,适合处理不同类型文档图像"

浏览量:36

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图