简介:

LLaVA-Mini是可高效理解图像、视频的大型多模态模型。

功能:

仅用1个视觉令牌表示图像,提高图像和视频理解效率。

计算工作量减少77%,响应延迟降至40毫秒。

内存使用大幅降低,支持3小时视频处理。

1个视觉令牌下性能与LLaVA-v1.5相当。

可在24GB内存GPU硬件上处理超10000帧视频。

需求人群:

"目标受众为研究人员、开发者及相关企业。研究人员可探索潜力应用,开发者可构建视觉应用,企业可高效处理视觉数据提效。"

浏览量:40

打开站点

类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图