简介:

大型语言和视觉助手,实现多模态聊天和科学问答

功能:

将视觉编码器和Vicuna相结合,实现多模态聊天和科学问答

使用语言-only GPT-4生成多模态语言-图像指令跟随数据

通过两个阶段的指令调整过程,实现预训练和微调

在视觉聊天和科学问答方面取得了令人印象深刻的表现

提供数据、代码和检查点的开源

需求人群:

"LLaVA适用于需要进行多模态聊天和科学问答的场景,例如日常用户应用和科学领域的推理。"

浏览量:472

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图