Kokoro-82M

Kokoro-82M是一个由hexgrad创建并托管在Hugging Face上的文本到语音(TTS)模型。它具有8200万参数,使用Apache 2.0许可证开源。该模型在2024年12月25日发布了v0.19版本,并提供了10种独特的语音包。Kokoro-82M在TTS Spaces Arena中排名第一,显示出其在参数规模和数据使用上的高效性。它支持美国英语和英国英语,可用于生成高质量的语音输出。

需求人群:

"该模型适合需要高质量文本到语音转换的应用开发者,如语音助手、有声读物制作、语音播报系统等。对于希望在资源受限的环境中实现高效语音合成的开发者来说,Kokoro-82M是一个理想的选择。"

使用场景示例:

为智能语音助手提供自然语言的语音输出

制作有声读物,将文本内容转换为语音朗读

在新闻播报系统中自动将新闻稿转换为语音播报

产品特色:

支持美国英语和英国英语的文本到语音转换

提供多种独特的语音包,可生成不同风格的语音

在少量参数和数据下实现高质量的语音合成

可通过ONNX格式进行高效部署

提供易于使用的API和文档,方便开发者集成

使用教程:

1. 安装依赖:在Google Colab中运行,安装必要的库和工具,如espeak-ng、phonemizer等。

2. 克隆模型仓库:从Hugging Face克隆Kokoro-82M模型仓库。

3. 构建模型并加载默认语音包:使用提供的脚本构建模型,并加载所需的语音包。

4. 生成语音:调用generate函数,传入文本和语音包,生成24khz的音频和使用的音素。

5. 播放音频并查看音素:使用IPython.display播放生成的音频,并打印输出的音素。

浏览量:145

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
网站流量情况

最新流量情况

月访问量

21315.89k

平均访问时长

00:05:02

每次访问页数

5.22

跳出率

45.50%

流量来源

直接访问

49.07%

自然搜索

35.51%

邮件

0.03%

外链引荐

12.37%

社交媒体

3.00%

展示广告

0

截止目前所有流量趋势图

地理流量分布情况

中国

14.90%

印度

8.10%

日本

3.61%

俄罗斯

5.37%

美国

18.06%

类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图