Whisper large-v3-turbo

优质新品

简介:

高效自动语音识别模型

功能:

支持99种语言的语音识别和翻译

能够在零样本设置中泛化到多个数据集和领域

通过减少解码层数量提高模型运行速度

支持长音频文件的逐块处理

兼容所有Whisper解码策略,如温度回落和基于前一个token的条件

自动预测源音频的语言

支持语音转录和语音翻译任务

能够预测时间戳,提供句子级或单词级的时间标记

需求人群:

"目标受众包括AI研究人员、开发者和需要高效语音识别解决方案的企业。由于其支持多语言和快速处理能力,特别适合需要处理大量和多样化语音数据的用户。"

浏览量:86

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图