简介:

端到端中英语音对话模型

功能:

• 语音识别:将连续的语音输入转化为离散的token

• 语音合成:将离散化的语音token转化为连续的语音输出

• 情感控制:根据用户的指令要求改变语音的情感、语调、语速、方言等属性

• 流式推理:支持流式交替输出文本和语音两个模态的内容,降低端到端对话延迟

• 预训练能力:在数百万小时音频和数千亿token的音频文本交错数据上进行预训练,具备强大的音频理解和建模能力

• 多语言支持:能够直接理解和生成中英文语音,进行实时语音对话

需求人群:

"GLM-4-Voice的目标受众包括开发者、企业以及任何需要实时语音交互的个人或组织。对于开发者而言,它提供了一个强大的工具来构建语音交互应用;对于企业,它可以帮助提升客户服务的效率和质量;对于个人用户,它提供了一种新颖的语音交互体验。"

浏览量:38

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图