简介:

高效的文本到音频生成模型

功能:

- 快速生成:能够在3秒内生成长达30秒的44.1kHz立体声音频。

- 高效参数:拥有515M参数,实现高效的音频生成。

- 优化框架:采用CLAP-Ranked Preference Optimization (CRPO)框架,提升音频对齐质量。

- 性能领先:在客观和主观基准测试中均实现最先进的性能。

- 开源代码:所有代码和模型开源,便于研究和比较。

- 支持长音频:能够处理长达30秒的音频生成任务。

- 高音质输出:相比其他模型,输出音质更高,事件更清晰。

需求人群:

"目标受众为音频内容创作者、音频工程师和研究人员。TangoFlux适合他们,因为它能够快速生成高质量的音频内容,同时开源的特性使得他们可以自由地访问和修改代码,以适应特定的需求或进行进一步的研究。"

浏览量:14

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图