简介:

开源多模态大型语言模型,支持实时语音输入和流式音频输出。

功能:

实时语音到语音对话功能,无需额外ASR或TTS模型。

边思考边说话,能够同时生成文本和音频。

支持流式音频输出能力。

提供'Audio-to-Text'和'Audio-to-Audio'批量推理以提升性能。

支持创建新的conda环境并安装所需包。

通过命令行快速启动交互式演示。

支持本地测试,运行预设的音频样本和问题。

需求人群:

"Mini-Omni适合开发者、研究人员和对人工智能多模态交互技术感兴趣的用户。它为开发者提供了一个强大的工具,用于构建和测试具有语音交互能力的应用程序。"

浏览量:72

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图