简介:

首个全面评估多模态大型语言模型在视频分析中的性能基准。

功能:

提供短、中、长视频的准确度评分

包含6个主要领域和30个子类别的视频类型

全面覆盖视频长度和任务类型

新收集并由人工标注的数据,非现有视频数据集

提供视频类别层级和视频时长及任务类型分布的统计信息

与其他基准测试进行比较,突出Video-MME的独特优势

需求人群:

"Video-MME的目标受众是人工智能领域的研究者和开发者,特别是那些专注于视频理解和多模态交互的专业人士。它为这些用户提供了一个标准化的测试平台,帮助他们评估和改进自己的MLLMs模型。"

浏览量:73

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图