MiniCPM-o

优质新品

简介:

MiniCPM-o 2.6:一款GPT-4o级别,可在手机上实现视觉、语音和多模态直播的MLLM。

功能:

领先的视觉能力:在OpenCompass等8个流行基准测试中平均得分70.2,超越多个知名模型。

先进的语音能力:支持双语实时语音对话,具备可配置的声音,语音理解任务表现优异。

强大的多模态直播能力:能够接受连续的视频和音频流,支持实时语音交互。

强大的OCR能力:可处理任意宽高比和高达180万像素的图像,OCR性能出色。

优越的效率:具有高像素密度,处理180万像素图像仅产生640个token,提高推理速度和降低内存使用。

需求人群:

"目标受众包括研究人员、开发者和企业,他们需要在移动设备上实现强大的视觉、语音和多模态交互功能,如智能助手、内容创作、教育应用等。该模型适合需要高效、高性能多模态处理能力的用户和组织。"

浏览量:34

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图