LookOnceToHear

简介:

实时语音提取智能耳机交互系统

功能:

用户通过看向目标说话者几秒钟来选择想要听到的声音

使用 Scaper 工具包合成生成音频混合

提供自包含的数据集和训练用的 .jams 规范文件

支持实时语音提取和目标语音听力模型的评估

提供了模型的检查点,方便用户进行训练和评估

适用于嘈杂环境下的语音识别和提取

需求人群:

"该产品适合需要在嘈杂环境中进行语音识别和提取的研究人员和开发者。例如,它可以帮助听力障碍者在嘈杂环境中更好地理解对话,或者在多声源环境中进行语音分析和处理。"

浏览量:162

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图