简介:

开源的语音到语音转换模块

功能:

语音活动检测(VAD):使用silero VAD v5。

语音转文本(STT):使用Whisper模型,包括蒸馏版本。

语言模型(LM):可以在Hugging Face Hub上选择任何可用的指令模型。

文本转语音(TTS):使用Parler-TTS,支持不同的检查点。

模块化设计:每个组件都作为类实现,可以根据特定需求进行重新实现。

支持服务器/客户端方法和本地方法运行。

需求人群:

"目标受众为开发者和研究人员,尤其是那些对语音识别、自然语言处理和语音合成技术感兴趣的人。该产品适合他们因为它提供了一个灵活、可定制的开源工具,可以用于研究或开发相关的应用程序。"

浏览量:72

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图