简介:

第二代多模态预训练对话模型

功能:

支持多种基准测试,如TextVQA, DocVQA等

支持8K内容长度和1344*1344的高分辨率图像

提供中英文双语支持

开源模型,易于获取和使用

与上一代模型相比,性能有显著提升

提供基础调用方法和微调示例

支持CLI、WebUI和OpenAI API等多种调用方式

需求人群:

"CogVLM2适合需要进行多模态对话和图像理解的研究者和开发者,特别是那些在中文和英文环境下工作,需要处理长文本和高分辨率图像的专业人士。"

浏览量:78

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图