AudioSep

AudioSep是一种基于自然语言查询的开放领域音频源分离模型。它由文本编码器和分离模型两个关键组件组成。我们在大规模多模态数据集上训练AudioSep,并在许多任务上广泛评估其能力,包括音频事件分离、乐器分离和语音增强。AudioSep表现出强大的分离性能和令人印象深刻的零样本泛化能力,使用音频标题或文本标签作为查询,大大优于以前的音频查询和语言查询声音分离模型。为了保证本工作的可重复性,我们将发布源代码、评估基准和预训练模型。

需求人群:

"适用于音频分离领域,可用于音频处理、音频编辑等领域"

使用场景示例:

使用AudioSep分离音频中的吉他声音

使用AudioSep分离音频中的人声

使用AudioSep分离音频中的钢琴声音

产品特色:

基于自然语言查询的音频源分离

支持开放领域音频概念分离

支持音频事件分离、乐器分离和语音增强

具有强大的分离性能和零样本泛化能力

浏览量:118

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
网站流量情况

最新流量情况

月访问量

20208.01k

平均访问时长

00:04:14

每次访问页数

3.13

跳出率

44.64%

流量来源

直接访问

37.16%

自然搜索

48.37%

邮件

0.06%

外链引荐

13.08%

社交媒体

1.31%

展示广告

0

截止目前所有流量趋势图

地理流量分布情况

中国

17.58%

英国

4.07%

印度

4.73%

韩国

5.14%

美国

28.59%

类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图