简介:

实时语音交互的人工智能对话系统。

功能:

支持全双工对话,即在说话时也能监听。

使用基于token的解码器仅TTS技术生成语音。

采用流式自监督学习(SSL)编码器处理实时音频输入。

通过早期融合、中期融合和晚期融合策略优化交互。

在命令式和语音式FDM场景下测试模型的双工通信能力。

对现有系统影响最小,易于集成到现有对话系统中。

需求人群:

"LSLM主要面向需要高级人机交互的企业和开发者,特别是那些希望提升其对话系统自然度和实时响应能力的公司。例如,智能助手、客服机器人和虚拟个人助理等领域。"

浏览量:94

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图