简介:

一个用于说话人分割的工具包

功能:

基于AudioZen和Pyannote 3.1,提供高效的说话人分割功能。

支持多种公共数据集,如AMI、AISHELL-4和AliMeeting,用于模型训练和评估。

提供预训练模型和估计的RTTM文件,方便用户直接使用。

支持使用WavLM Base+和ResNet34-LM模型进行说话人分割。

提供详细的安装和使用说明,方便用户快速上手。

开源代码,允许用户根据需要进行定制和优化。

需求人群:

"目标受众主要是音频处理领域的研究人员和开发者,特别是那些需要进行说话人分割以分析多说话人音频的用户。DiariZen的易用性和准确性使其成为学术研究和商业应用的理想选择。"

浏览量:21

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图