简介:

端侧全模态理解开源模型

功能:

图像理解:基于SigLip-400M构建图像Token,在OpenCompass榜单上平均得分66.2,超越其他更大参数规模的模型。

文本处理:保持在C-EVAL、MMLU/MMLU Pro、AlignBench等多个测试集上的最优精度优势。

语音理解:采用Qwen2-Audio/whisper-large-v3的Encoder作为语音输入,支持中英文语音输入及多轮对话。

多模态交互:支持图文/图音等多种模态和模型进行交互。

端侧部署:模型设计考虑端侧部署,适用于对响应速度和数据处理有要求的应用场景。

高精度:在多个主流多模态评测基准上取得领先精度。

开源协议:遵循Apache-2.0协议开源,可自由使用和修改。

需求人群:

"Megrez-3B-Omni适用于需要进行多模态数据处理和分析的企业和开发者,如智能客服、图像识别、语音助手等领域。其高精度和多模态能力使其成为提升产品智能化水平的理想选择。"

浏览量:14

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图