简介:

一款支持中英文的对话语音合成模型。

功能:

支持中英文的对话语音生成。

实现零 - shot 两人语音克隆,准确切换发言者。

长时间的语音生成,适合 AI 播客制作。

高表达力的对话语音,接近人类自然对话的音色。

提供本地和 API 两种推理方式,便于用户使用。

支持批处理工具,能同时处理多个生成请求。

包括播客生成工具,能将长文本或网页内容转为音频。

提供简单的微调脚本,便于用户自定义模型。

需求人群:

"该产品适合语音合成、播客制作和对话 AI 应用的开发者,特别是需要高质量语音生成的内容创作者和研究者。MOSS-TTSD 提供了一个灵活且功能强大的平台,使得用户能够生成自然流畅的对话音频,满足商业和教育需求。"

浏览量:44

打开站点

类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图