简介:

用于评估模型零样本语音生成能力的测试集

功能:

采用Common Voice和DiDiSpeech-2数据集样本进行评估

使用Word Error Rate (WER)和Speaker Similarity (SIM)作为评估指标

为英语和普通话分别采用Whisper-large-v3和Paraformer-zh作为自动语音识别引擎

使用WavLM-large模型进行说话人相似度评估

提供测试集的下载链接

支持零样本文本到语音(TTS)和声音转换(VC)任务的评估

需求人群:

"目标受众为语音合成技术的研究者和开发者,他们可以利用seed-tts-eval模型来评估和改进他们的语音合成系统。"

浏览量:196

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图