简介:

多模态大型模型,处理文本、图像和视频数据

功能:

• 处理文本、图像和视频数据的多模态任务

• 在电子商务和短视频基准测试中取得最佳结果

• 在OpenCompass测试中表现出色,平均得分大于等于67.40

• 引入视觉编码器,增强极端场景下的性能

• 支持灵活调整视觉令牌数量

• 并行处理原始视觉令牌和新引入的视觉编码器

• 提供预训练模型Valley-Eagle-7B,方便用户直接使用

需求人群:

"Valley的目标受众是研究人员、开发者和企业,他们需要处理和分析大量的多媒体数据。由于Valley在多模态任务中表现出色,它特别适合需要进行图像和视频分析、内容理解以及多媒体交互的领域,如社交媒体分析、视频内容管理、智能监控等。"

浏览量:14

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图