简介:

端到端MLLM,实现精准引用和定位

功能:

混合区域表示

空间感知视觉采样器

细粒度和开放词汇的引用定位

包含大规模GRIT数据集

Ferret-Bench多模态评估基准

需求人群:

"多模态学习、机器视觉、AI研究、数据分析"

浏览量:152

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图