免费将 EPUB、PDF、DOCX 和 TXT 转 MP3 或 M4B 有声书,多种 AI 声音可选
DocsToAudio 是一款在线的文档转有声书工具,它能将 EPUB、PDF、DOCX 和 TXT 文件转换为 MP3 或 M4B 有声书。该工具提供免费的标准版和付费的高级版。标准版无需注册,提供 300 多种 AI 声音,支持 30 种语言,永久免费且无使用限制;高级版需注册账号并购买积分,使用 ElevenLabs AI 语音,有 800 多种声音,支持 50 种语言,音质更自然、更富表现力,适合对音质有更高要求的用户。其主要优点在于无需注册即可免费使用,无文件大小限制,文件解析在浏览器中完成,保障用户隐私。
Seed Audio AI 含 TTS、ASR 等,通过 API 为创作者和开发者生成音频
Seed Audio AI 由字节跳动 Seed 研究推出,是一套完整的音频 AI 栈。它涵盖文本转语音、自动语音识别、音乐生成和实时语音理解等功能。其主要优点在于支持多语言、能适应不同口音和嘈杂环境,且具备高准确性和自然的语音生成能力。产品定位为企业和创意工作流提供服务,价格信息未提及。
Windows和Mac平台语音听写与会议记录工具,有实时转录和AI摘要,14天免费试用
TalkToType是一款专门为Windows和Mac操作系统设计的桌面应用程序。其核心功能是语音听写和会议记录,旨在帮助用户提高工作效率,减少打字时间,让用户能够更流畅地表达想法。该产品对于那些以语言沟通为主要工作方式的人尤为实用,比如销售人员、招聘人员、经理等。产品提供14天免费试用,无需信用卡,用户可以在试用期内充分体验其功能。
免费无限制AI视频生成器,释放创意,让AI带来乐趣
Makefun是一款功能强大的AI视频工具集,提供免费且无限制的AI视频生成服务。其重要性在于为用户提供了便捷、高效的视频创作方式,降低了视频制作的门槛。产品的主要优点包括多种功能集成、超逼真效果、低延迟交互等。背景信息方面,它受到众多开发者和企业的信赖。价格定位灵活,有免费版本,也提供按使用量订阅的付费套餐,起步价为9.9美元。产品定位于满足个人和企业在视频创作、营销、教育等多方面的需求。
Miso One是Miso Labs推出的英语TTS模型,支持情感语音生成。
Miso One是Miso Labs发布的一款具有8B开放权重的英文文本转语音模型。其重要性在于为语音研究和应用提供了新的选择,特别是在低延迟语音代理和富有表现力的对话式语音领域。主要优点包括支持富有表现力的英语对话语音、低延迟生成、支持语音克隆和基于提示的语音设计。产品背景是为了满足语音研究和创作者工作流程的需求。价格方面,有免费计划,每次可使用120个字符,升级后可解锁1000字符。定位是为语音代理研究和创作者提供高质量的语音生成解决方案。
一体化AI工作室,可将简单提示转化为视频、图像和音频
Flixly是由SOFTFORGE DIGITAL LTD在2024年推出的一体化AI工作室,支持网页、安卓和iOS系统。它集成了50种前沿AI模型,如Sora 2、Veo 3.1、GPT Image 2.0等,可实现文本到视频、图像、音频等多种内容的生成。产品采用按使用量付费的信用积分体系,新用户注册可获得免费积分,无需订阅费用。其定位是为用户提供便捷、高效、专业的AI内容创作平台,降低创作门槛,让用户轻松生成高质量的内容。
欧洲首款量产就绪的TTS,40+语言自然语音,欧洲开发托管,GDPR合规
KugelAudio是欧洲首款可用于生产的文本转语音(TTS)模型,专为语音AI打造。该模型具备40多种语言的自然语音,在欧洲开发和托管,完全符合GDPR法规。其重要性在于为企业提供了安全、高效、合规的语音合成解决方案。主要优点包括超低延迟(推理到首个音频仅39ms)、优质语音质量、支持多种语言、数据主权保障等。产品背景是为满足欧洲企业对安全合规语音AI的需求而开发。价格方面,提供免费试用,也有针对企业的定制解决方案。定位是为企业级用户提供可靠的语音AI服务。
免费的Whisper AI,先进的音频转文本工具,支持100+语言,永久免费。
Free Whisper AI是一款由OpenAI的Whisper技术驱动的先进音频转文本工具。其重要性在于能够高效、准确地将语音内容转化为文本,为用户节省大量时间和精力。主要优点包括:具备99%的准确率,支持100多种语言,实时处理能力强,且完全免费,无隐藏费用和使用限制。该产品定位广泛,适用于内容创作者、企业、教育、法律、医疗、媒体等多个领域。
拥有30级关系系统,含图像、视频、语音功能的AI伴侣及恋爱模拟游戏。
这两款产品均围绕AI技术打造。Nika AI提供AI伴侣服务,Aurora City AI是恋爱模拟游戏。它们的主要优点是具备30级关系系统,能让用户与AI建立深度情感连接,影响AI的行为和对话。图像、视频、语音的生成能力为用户提供了丰富的交互体验。该产品适合想要在虚拟世界中感受情感陪伴和体验恋爱乐趣的人群。背景方面,是为满足用户对更加真实和多元化的虚拟交互需求而开发。价格标注可免费试用,定位为年轻群体、喜欢虚拟社交和游戏体验的人群提供服务。
为AI语音代理分配号码,实现电话销售、客服等任务自动化。
PollyReach是一款基于AI技术的语音代理平台,其重要性体现在能够为企业提供高效、智能的电话沟通解决方案。该平台的主要优点包括:让每个AI代理拥有独立电话号码,可实现真实电话拨打;能够自动化完成多种任务,如潜在客户筛选、客户支持和预约安排等;AI语音代理具备类人对话能力,提升沟通效果。产品背景方面,它利用先进的人工智能技术,为企业降低人力成本、提高工作效率。关于价格,文档未提及,可能需进一步咨询官网。其定位是为企业提供智能化的电话沟通解决方案,帮助企业提升业务流程的自动化水平。
一个统一API,可生成图像、合成语音、转录音视频,低成本访问开源模型。
deAPI是一个统一的API,可用于生成图像、合成语音、转录音频或视频。其重要性在于为用户提供了便捷的方式来接入领先的开源AI模型。主要优点包括成本低,用户可以以较低的成本使用这些模型;使用统一的API,操作更加方便。产品背景是为了满足用户对开源AI模型的需求,简化使用流程。价格方面,用户可以先领取免费额度进行试用。产品定位是为开发者和企业提供高效、低成本的AI服务。
7ART是一个AI角色平台,可从单一角色生成音乐、视频、图像和唇同步内容。
7ART是由DataDreamer AI Inc开发的AI创作工作室,它利用先进的AI生成模型,提供了一站式的内容创作解决方案。该平台涵盖了从AI角色的外观创建到全球音乐分发的完整流程。用户无需信用卡即可开始使用,价格方面虽未详细提及,但有免费试用机制。其定位是为创作者提供一个全面、便捷的创作平台,让创作者能够轻松利用AI技术实现自己的创意。主要优点包括一站式创作、多格式支持、角色一致性和先进的生成模型等。
集AI聊天、视频通话和付费会话于一体的支持小部件,企业级支持仅需1/4价格。
Supportson是一款集AI聊天、视频通话和付费会话于一体的支持小部件。其重要性在于为小型团队提供了企业级的支持能力,价格仅为传统方案的1/4。主要优点包括可直接与客户交流而非仅处理工单,能够快速响应客户需求,提高客户满意度。产品背景是为满足企业多样化的客户支持需求而开发。价格方面,有免费计划,也有每月29美元和79美元的付费计划。定位是为企业提供高效、低成本的客户支持解决方案。
talat是私人会议笔记应用,实时转录对话,数据存本地。
Talat是一款用于会议记录的桌面客户端应用程序。它的主要功能是利用设备端AI实时转录会议内容,并将所有数据保存在本地计算机上,避免了数据存储在云端带来的隐私风险。该产品由一个两人团队快速迭代开发。其重要性在于为用户提供了一种安全、便捷的会议记录方式,既保证了数据的隐私性,又具备高效的转录和总结功能。产品为一次性购买,提供10小时免费使用时间,无需创建账户。定位是为注重隐私和数据安全的用户提供高质量的会议记录解决方案。
Askmeety:专为Apple Silicon打造,100%离线会议记录应用
Askmeety是一款专为Apple Silicon设备打造的桌面客户端应用,运行于macOS 14 Sonoma或更高版本系统。它能对会议进行捕捉、转录和总结,且整个过程完全离线,无需依赖云服务,保障了会议信息的隐私安全。产品采用一次性付费模式,提供终身访问权限,避免了云存储的持续费用。其定位是为各类会议参与者提供高效、安全、便捷的会议记录和管理解决方案。
GPT Realtime 2可实现即时、自然的AI音频生成,支持文本转语音。
GPT Realtime 2是一款基于OpenRouter的AI音频生成和文本转语音API产品。其重要性在于为用户提供便捷、高效的语音生成解决方案。主要优点包括:具有六种自然、富有情感语调的AI语音,可即时生成音频;支持流式音频响应并提供转录反馈;拥有简单的REST API和多语言SDK,便于开发者集成。产品提供免费的演示模式,可在浏览器中直接测试,无需注册。真实的音频生成则通过用户配置的OpenRouter账户和模型路由进行计费。该产品定位为帮助团队快速实现语音生成,适用于多种场景,从原型设计到实际应用开发均可使用。
AI语音助手,语音输入比打字快10倍,支持多平台,可跨应用执行语音命令。
NovaVoice App是一款语音驱动的生产力辅助工具,适用于多种操作系统。它具有智能语音听写、文本格式转换、跨应用语音操作等功能。主要优点在于大幅提高输入效率,支持上下文感知的格式处理,能执行各种应用程序中的实际操作。产品背景是为满足用户在日常工作和生活中更高效输入和操作的需求而开发。价格方面,提供免费试用,还有月付和年付的付费计划,标准计划每月10美元,团队计划每个座位每月20美元。产品定位是成为用户的语音生产力副驾驶,帮助用户更高效地完成各种任务。
© 2026 AIbase 备案号:闽ICP备08105208号-14