NVIDIA-Ingest

NVIDIA-Ingest是一个可扩展、高性能的文档内容和元数据提取微服务。它支持解析PDF、Word和PowerPoint文档,使用NVIDIA NIM微服务来查找、上下文化并提取文本、表格、图表和图像,可用于下游生成式应用。其主要优点包括高性能、可扩展性强、支持多种文档类型和提取方法等。目前处于早期访问阶段,代码库更新频繁。

需求人群:

"目标受众包括需要处理大量复杂非结构化PDF和其他企业文档,将其转换为可用于检索系统的元数据和文本的组织和个人,如企业数据分析师、研究人员等。因为它能高效、准确地从多种文档中提取有用信息,满足他们在数据处理和分析方面的需求。"

使用场景示例:

企业用于从大量业务文档中提取关键信息,构建知识图谱

研究机构从学术文献中提取数据,辅助科研工作

数据分析师将提取的文本数据用于后续的数据分析和挖掘

产品特色:

接受包含文档负载和摄取任务的JSON作业描述

允许检索作业结果,结果为包含提取对象元数据及处理注释的JSON字典

支持PDF、Docx、pptx和图像等多种文档类型

支持每种文档类型多种提取方法,如PDF支持pdfium、Unstructured.io和Adobe Content Extraction Services

支持预处理和后处理操作,包括文本分割、转换、过滤、嵌入生成等

使用教程:

1. 启动支持NIM微服务

2. 在Python环境中安装NVIDIA Ingest客户端依赖

3. 提交摄取作业

4. 检查和使用结果

5. 可选:直接部署库

浏览量:19

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
网站流量情况

最新流量情况

月访问量

4.91m

平均访问时长

00:06:18

每次访问页数

5.57

跳出率

37.92%

流量来源

直接访问

51.73%

自然搜索

32.88%

邮件

0.04%

外链引荐

13.01%

社交媒体

2.27%

展示广告

0

截止目前所有流量趋势图

地理流量分布情况

中国

13.81%

德国

3.69%

印度

9.16%

俄罗斯

4.47%

美国

18.04%

类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图