whisper-diarization

简介:

基于OpenAI Whisper的自动语音识别与说话人分割

功能:

结合Whisper ASR进行高质量的语音转录

使用声音活动检测(VAD)技术排除静音

利用说话人嵌入技术进行说话人识别

通过WhisperX校正和对齐时间戳

使用标点模型优化转录文本的对齐精度

支持批处理推理,提高处理效率

需求人群:

"该产品适用于需要进行自动语音识别和说话人分割的开发者和研究人员,特别是在处理多说话人音频文件时,能够显著提高转录和分割的准确性。"

浏览量:27

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图