简介:

小型语言模型结合增强视觉词汇

功能:

基于Qwen-1.8B的小型Vary模型

引入改进的视觉词汇

替换自然图像的负样本为目标检测驱动的正样本数据

高效编码与自然物体对应的视觉信息

在DocVQA、ChartQA、RefCOCO、MMVet上取得良好性能

需求人群:

"研究人员在资源有限的情况下在普通GPU上训练和部署LVLMs"

浏览量:129

打开站点

类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图