简介:

大规模图像描述数据集,提供超过16M的合成图像描述。

功能:

提供超过16M的图像-文本配对。

支持多种任务,如图像到文本和文本到图像。

包含多种模态,包括表格和文本。

数据格式为parquet,易于机器学习模型处理。

包含详细的图像描述,适用于训练复杂的视觉-语言模型。

数据集分为CommonPool、CC12M和RedCaps三个部分。

提供图像的EXIF信息和SHA256哈希值,确保数据完整性。

需求人群:

"目标受众为机器学习和人工智能领域的研究人员和开发者,特别是那些专注于图像识别、图像描述生成和视觉问答系统的专家。该数据集的规模和多样性使其成为训练和测试这些系统的理想资源。"

浏览量:29

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图