基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
kokoro-onnx是一个基于Kokoro模型和ONNX运行时的文本到语音(TTS)项目。它支持英语,并计划支持法语、日语、韩语和中文。该模型在macOS M1上具有接近实时的快速性能,并提供多种声音选择,包括耳语。模型轻量级,约为300MB(量化后约为80MB)。该项目在GitHub上开源,采用MIT许可证,方便开发者集成和使用。
快速生成类人语音的TTS模型
Flash是ElevenLabs最新推出的文本转语音(Text-to-Speech, TTS)模型,它以75毫秒加上应用和网络延迟的速度生成语音,是低延迟、会话型语音代理的首选模型。Flash v2仅支持英语,而Flash v2.5支持32种语言,每两个字符消耗1个信用点。Flash在盲测中持续超越了同类超低延迟模型,是速度最快且具有质量保证的模型。
快速文本转语音引擎
Auralis是一个文本到语音(TTS)引擎,能够将文本快速转换为自然语音,支持语音克隆,并且处理速度极快,可以在几分钟内处理完整本小说。该产品以其高速、高效、易集成和高质量的音频输出为主要优点,适用于需要快速文本到语音转换的场景。Auralis基于Python API,支持长文本流式处理、内置音频增强、自动语言检测等功能。产品背景信息显示,Auralis由AstraMind AI开发,旨在提供一种实用于现实世界应用的文本到语音解决方案。产品价格未在页面上明确标注,但代码库在Apache 2.0许可下发布,可以免费用于项目中。
AI驱动的视频生成工具,一键生成高质量营销视频
小视频宝(ClipTurbo)是一个AI驱动的视频生成工具,旨在帮助用户轻松创建高质量的营销视频。该工具利用AI技术处理文案、翻译、图标匹配和TTS语音合成,最终使用manim渲染视频,避免了纯生成式AI被平台限流的问题。小视频宝支持多种模板,用户可以根据需要选择分辨率、帧率、宽高比或屏幕方向,模板将自动适配。此外,它还支持多种语音服务,包括内置的EdgeTTS语音。目前,小视频宝仍处于早期开发阶段,仅提供给三花AI的注册用户。
Ortlin是与OpenAI模型和API交互的Web界面。
Ortlin是一个基于Web的图形用户界面,旨在帮助任何人(无论是技术用户还是非技术用户)轻松地与OpenAI的API和底层模型进行交互。它是完全免费且开源的,使用户能够无障碍地利用OpenAI的强大功能。
AI语音转录、翻译和TTS的Gradio Web-UI
Voice-Pro是一个集成的字幕、翻译和文本到语音(TTS)解决方案。它支持将视频添加多语言字幕和多语言音频,助力视频内容扩展到全球市场。该产品使用OpenAI Whisper和开源翻译器及TTS技术,提供一键安装和便携式使用。它还配备了Vocal Remover,使用UVR5和Meta的Demucs引擎,以提高语音识别的准确性。
将电子书转换为有章节和元数据的有声书。
ebook2audiobookXTTS是一个利用Calibre和Coqui TTS技术将电子书转换为有声书的模型,支持章节和元数据的保留,并且可以选择使用自定义语音模型进行语音克隆,支持多种语言。该技术的主要优点是能够将文本内容转换为高质量的有声读物,适合需要将大量文本信息转换为音频格式的用户,如视障人士、喜欢听书的用户或者需要学习外语的用户。
基于ChatTTS模型的文本到语音转换项目
ChatTTS-Forge是一个围绕TTS生成模型ChatTTS开发的项目,实现了API服务器和基于Gradio的WebUI,能够提供全面的API服务,支持生成1000字以上的长文本,保持一致性,并通过内置32种不同风格进行风格管理。
生成高质量、自然 sounding 的语音
Parler-TTS 是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现,两位作者分别来自 Stability AI 和爱丁堡大学。与其他TTS模型不同,Parler-TTS 完全开源发布,包括数据集、预处理、训练代码和权重。功能包括:生成高质量且自然 sounding 的语音输出、灵活的使用和部署、提供丰富的注释语音数据集。定价:免费。
真实人声AI文本转语音
VoiceBar提供最逼真的AI语音合成服务,包括多国语言和口音,具有高级的语音质量和真实感。无需订阅,使用极具竞争力。适用于语音留言、多语言文本转语音、TikTok、解说视频、学习等场景。
© 2025 AIbase 备案号:闽ICP备08105208号-14