Miso One是Miso Labs推出的英语TTS模型,支持情感语音生成。
Miso One是Miso Labs发布的一款具有8B开放权重的英文文本转语音模型。其重要性在于为语音研究和应用提供了新的选择,特别是在低延迟语音代理和富有表现力的对话式语音领域。主要优点包括支持富有表现力的英语对话语音、低延迟生成、支持语音克隆和基于提示的语音设计。产品背景是为了满足语音研究和创作者工作流程的需求。价格方面,有免费计划,每次可使用120个字符,升级后可解锁1000字符。定位是为语音代理研究和创作者提供高质量的语音生成解决方案。
欧洲首款量产就绪的TTS,40+语言自然语音,欧洲开发托管,GDPR合规
KugelAudio是欧洲首款可用于生产的文本转语音(TTS)模型,专为语音AI打造。该模型具备40多种语言的自然语音,在欧洲开发和托管,完全符合GDPR法规。其重要性在于为企业提供了安全、高效、合规的语音合成解决方案。主要优点包括超低延迟(推理到首个音频仅39ms)、优质语音质量、支持多种语言、数据主权保障等。产品背景是为满足欧洲企业对安全合规语音AI的需求而开发。价格方面,提供免费试用,也有针对企业的定制解决方案。定位是为企业级用户提供可靠的语音AI服务。
GPT Realtime 2可实现即时、自然的AI音频生成,支持文本转语音。
GPT Realtime 2是一款基于OpenRouter的AI音频生成和文本转语音API产品。其重要性在于为用户提供便捷、高效的语音生成解决方案。主要优点包括:具有六种自然、富有情感语调的AI语音,可即时生成音频;支持流式音频响应并提供转录反馈;拥有简单的REST API和多语言SDK,便于开发者集成。产品提供免费的演示模式,可在浏览器中直接测试,无需注册。真实的音频生成则通过用户配置的OpenRouter账户和模型路由进行计费。该产品定位为帮助团队快速实现语音生成,适用于多种场景,从原型设计到实际应用开发均可使用。
AI驱动的古英语翻译器,免注册,支持双向翻译及多种语言翻译。
Old English Translator是一款由AI驱动的翻译工具,可将现代英语转换为古英语(盎格鲁 - 撒克逊语),同时支持双向翻译。该产品的主要优点在于其免费使用且无需注册,能够在保留语义的同时生成符合历史背景的古英语表达。它适用于创意写作、学术研究和文化传承等领域,为用户提供了便捷的古英语翻译服务,帮助人们更好地探索和学习古英语。产品价格为免费。
Voco Speech是适用于Mac的离线AI语音克隆和文本转语音工具,有免费额度和无限克隆。
Voco Speech是一款专为Mac设计的离线AI语音克隆和文本转语音应用程序。其重要性在于提供了本地运行的语音生成解决方案,保护用户隐私,减少对网络的依赖。主要优点包括自然的AI语音输出、无限的语音克隆、免费额度定期刷新等。产品背景是满足创作者对高质量、私密语音生成的需求。价格方面,有免费版和每月9.90美元的专业版。定位为创作者和团队提供专业的语音内容生成服务。
提供PTE、IELTS、Duolingo、CELPIP免费在线模拟测试及AI打分
Gurully是一个在线英语语言模拟测试平台,旨在帮助用户备考PTE、IELTS、Duolingo、CELPIP等英语能力考试。平台提供免费的模拟测试和AI评分,具有即时、准确的优点,能帮助用户了解自己的英语水平,明确备考方向。用户可以通过详细的反馈和分析,有针对性地进行练习。平台提供PTE、DET、IELTS、CELPIP练习套餐,使用代码“XMAS20”在12月25日前可享20%折扣。平台定位为英语能力考试备考辅助工具,适合有英语考试需求的人群。
IELTS写作一站式AI工具,含评分、指导、练习、范文,助你快速提分。
IELTSWriting.ai是一款专注于雅思写作的AI工具。其重要性在于为雅思考生提供了全面且高效的备考解决方案。主要优点包括能提供精准的雅思写作分数、个性化的提升指导、无限免费的写作练习以及丰富的高分范文。产品背景是针对雅思考生在写作备考过程中面临的分数难以提升、缺乏专业指导等问题而开发。价格方面,提供免费使用,也可能有付费增值服务。定位是成为雅思考生备考写作的得力助手。
提供语音AI的ASR、TTS和LLM模型,可测试部署用于实时应用。
Hathora Models是一个专注于语音AI的模型平台,提供多种生产就绪的ASR(自动语音识别)、TTS(文本转语音)和LLM(大语言模型)。其重要性在于为开发者和企业提供了便捷的语音AI解决方案,可用于构建语音代理和实时应用。产品的主要优点包括低延迟、高精度、多语言支持等。背景信息方面,平台不断扩展模型目录,以满足不同用户的需求。价格信息未提及,定位为服务于语音AI开发和应用的平台。
AI语法检查 - 校正器是一款强大的AI语法检查工具,能够帮助您校正英语语句和文章,并提供翻译服务。
AI语法检查 - 校正器利用先进的ChatGPT API技术,能够智能检测和修正工作邮件、学术英语论文、日常对话等中的语法错误。产品背景信息丰富,定位于提升用户的英语写作能力。
基于 AI 技术,根据职业背景生成贴合工作场景的英语例句,助力高效记忆单词。
ProWords 是一款专注于英语学习的在线工具,通过 AI 技术根据用户的职业背景生成贴合实际工作场景的英语例句,帮助用户更高效地记忆单词。该产品利用 AI 的智能分析能力,为不同职业的用户提供个性化的学习体验。其主要优点是学习内容与实际工作紧密结合,能够有效提升学习的实用性和趣味性。产品目前以网页形式提供服务,适合希望通过工作场景学习英语的用户。
一款帮助用户高效记忆单词、提升英语学习能力的在线学习工具。
多多记单词是一款专注于英语单词学习的在线平台,通过科学的记忆方法和趣味性的学习方式,帮助用户高效记忆单词,提升英语学习效果。它采用抗遗忘算法,根据用户的记忆情况动态调整复习计划,确保学习效果的长期保持。产品主要面向学生、英语学习爱好者等群体,致力于打造一个简单、高效、有趣的单词学习平台。目前平台提供免费使用,用户可以根据自己的需求选择不同的学习模块。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
kokoro-onnx是一个基于Kokoro模型和ONNX运行时的文本到语音(TTS)项目。它支持英语,并计划支持法语、日语、韩语和中文。该模型在macOS M1上具有接近实时的快速性能,并提供多种声音选择,包括耳语。模型轻量级,约为300MB(量化后约为80MB)。该项目在GitHub上开源,采用MIT许可证,方便开发者集成和使用。
桌面端 AI 英语词源词典,内置四六级、托福词汇表的单词信息。
SSShooter/en-etymology-dict 是一款桌面端 AI 英语词源词典,旨在帮助用户更好地理解和记忆英语单词。产品通过 AI 技术生成单词的词源、使用场景、同义词、反义词、形似词和派生词等信息,为用户提供全面的单词学习体验。该产品适合英语学习者,尤其是需要备考四六级、托福等英语考试的学生。产品目前是免费的,定位为教育领域的辅助学习工具。
LG AI Research开发的双语生成模型
EXAONE 3.5是LG AI Research开发的一系列指令调优的双语(英语和韩语)生成模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与最近发布的类似大小模型相比的一般领域中保持竞争力。EXAONE 3.5模型包括:1) 2.4B模型,优化用于小型或资源受限设备的部署;2) 7.8B模型,与前代模型大小相匹配,但提供改进的性能;3) 32B模型,提供强大的性能。
美国口音训练应用
BoldVoice是一款结合好莱坞口音教练和人工智能技术的英语口音训练应用,旨在帮助用户清晰自信地讲英语。产品通过个性化视频和练习,每天仅需10分钟,帮助用户在几个月内显著改善发音和口音。BoldVoice以其互动性强、专业度高而受到用户好评,特别适合需要提升英语发音的非母语人士。
LG AI Research开发的双语文本生成模型
EXAONE-3.5-2.4B-Instruct是LG AI Research开发的一系列双语(英语和韩语)指令调优的生成模型,参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理,并在真实世界用例和长上下文理解方面展现出最先进的性能,同时在与最近发布的类似大小模型相比的通用领域中保持竞争力。该模型特别适合需要处理长文本和多语言需求的场景,如自动翻译、文本摘要、对话系统等。
EXAONE 3.5系列的7.8B参数双语生成模型
EXAONE 3.5是LG AI Research开发的一系列双语(英语和韩语)指令调优的生成模型,参数从2.4B到32B不等。这些模型支持长达32K令牌的长上下文处理,在真实世界用例和长上下文理解方面展现出了最先进的性能,同时在与近期发布的类似大小模型相比,在通用领域保持竞争力。EXAONE 3.5模型包括:1) 2.4B模型,优化用于部署在小型或资源受限的设备上;2) 7.8B模型,与前代模型大小匹配但提供改进的性能;3) 32B模型,提供强大的性能。
© 2026 AIbase 备案号:闽ICP备08105208号-14