AI Call可实时翻译电话和视频通话,支持100种语言。
AI Call是由TaraAI LLC开发的一款移动应用程序,适用于iOS和安卓系统。它是一款专门用于实时电话和视频通话翻译的工具,支持100种语言。其主要优点包括翻译速度快(不到0.5秒)、准确性高,使用先进的神经翻译模型,确保日常对话语言翻译准确。该应用免费下载,部分高级功能可通过订阅获取。它的定位是为用户提供便捷的跨语言沟通解决方案,打破语言障碍。
免费AI有声书阅读器,无需注册订阅,支持多种文档格式转语音
AudioDoc是一款免费的AI有声书阅读器,它能将PDF、EPUB、markdown等文件以及粘贴的文本转化为自然的语音朗读。该产品最大的优点是免费使用,无需注册、订阅,也不用提供信用卡信息。其背景在于满足用户便捷听读文档的需求,让用户无论在电脑还是手机上,都能轻松将各类文档转换为音频进行收听。价格方面完全免费,定位是为广大用户提供便捷、无门槛的文档听读服务。
Invoko是可对话的AI桌面助手,能进行起草、总结等操作。
Invoko是一款专为macOS系统设计的AI桌面助手,目前处于测试阶段,主要面向苹果Silicon Mac电脑。它允许用户通过语音与之交流,可从菜单栏调用或拖到桌面使用。用户可以用它来起草文档、总结内容、回复消息或执行经批准的操作。该产品完全免费,借助屏幕上下文信息,能更好地理解用户需求,支持多种常见的Mac应用和网站,还能跨应用执行任务,利用记忆功能辅助后续请求。
企业语音AI平台,可构建、部署和监控拟人化语音智能客服
Bland是一个企业语音AI平台,专为高风险电话通话而设计,注重安全和信任。其核心功能为构建、部署和监控听起来像人类的AI语音代理,支持大规模自动化电话对话。主要优点包括拥有自托管模型、亚秒级延迟(低于400ms),可支持100万个并发呼叫,还具备企业合规性,获得了SOC 2 Type II、HIPAA、PCI DSS和GDPR等认证。平台采用按分钟计费,无按令牌收费、无按功能附加费、无单独供应商发票,价格随使用量缩放,企业计划根据音量、专用基础设施和合规要求签订合同。
点击UI元素,语音反馈修改需求,自动捕获信息并粘贴到AI工具
ClickSay是一款Chrome扩展程序,专为使用Claude Code、Cursor等AI编程工具的开发者打造。它能让开发者通过点击UI元素、语音反馈的方式向AI传达修改需求,自动捕获选择器、样式、截图和组件名等信息,为AI提供完整上下文,提高编程效率。产品具有隐私优先的特点,数据不会离开浏览器,无需注册登录。定价方面,支持免费试用,有免费版和Pro版,免费版可进行每月5次捕获等基础操作,Pro版则提供无限捕获、框架检测等高级功能,7美元/月或45美元/年。
在线AI LaTeX编辑器,支持实时渲染、协作、模板及浏览器内运行Python
Typevia是一款面向研究人员和学者的现代在线AI LaTeX编辑器。它具有实时渲染功能,让用户在输入内容时能立即看到文档的呈现效果,大大提高了写作效率。实时协作功能方便多人共同撰写文档,可同时编辑、共享、评论和跟踪每一处更改。提供丰富的模板,涵盖论文、学位论文和演讲等,帮助用户跳过繁琐的格式设置。此外,还支持在浏览器内运行Python,无需安装和服务器配置。产品定位为Overleaf的现代替代方案,价格信息未在页面提及。
StrikeScribe是一款AI语音转文字和会议转录软件,支持100多种语言。
StrikeScribe是一款专注于语音转文字和会议转录的AI软件。其重要性在于能够高效、准确地将语音内容转化为文字,节省人工记录的时间和精力。主要优点包括无需注册即可上传转录、无会议机器人干扰、支持100多种语言以及提供AI洞察。产品背景方面,它为解决会议记录、音频视频转录等场景的需求而开发。价格方面,提供免费的访客上传功能,还有免费套餐和付费计划,付费计划可享受无限转录和AI洞察。定位是为需要高效转录服务的个人和企业提供解决方案。
Wispr Flow实现无缝语音听写,让写作快速清晰,是语音输入的最佳方式。
Wispr Flow是一款具备语音听写功能的应用程序,其核心技术在于能够将语音快速、准确地转化为文字。该产品的重要性在于极大地提高了用户的写作效率,让写作过程更加流畅。主要优点包括无缝语音听写,能够快速将语音转化为清晰的文本;是最快、最智能的语音输入方式,可将杂乱的语音转化为精炼的文本。产品背景方面,Wispr筹集了8100万美元用于构建语音操作系统。价格方面,Flow Pro提供14天免费试用,无需信用卡信息。产品定位为满足不同用户群体的写作需求,无论是个人、团队领导者、开发者还是创作者都能从中受益。
自主AI DJ,无节目表和播放列表,实时选曲并解释,主打地下电子音乐。
Dub Ninja是一款自主AI DJ产品,其核心功能是借助人工智能技术,实时挑选并播放地下电子音乐。该产品的重要性在于打破了传统DJ的播放模式,无需预设节目表和播放列表,能够根据实时情况选出最合适的音乐。主要优点包括:每天挖掘新的地下电子音乐,丰富曲目库;对每首曲目进行全面分析,确保音乐衔接流畅;实时解说选曲原因,让听众了解音乐选择逻辑。产品背景是满足用户对个性化、实时化音乐体验的需求。价格方面,产品免费使用,定位为提供高品质地下电子音乐的在线平台。
实时语音翻译,支持数十种语言,无需人工口译员,适用于多场景。
Langless是一款实时语音翻译工具,为跨语言沟通的专业人士和团队打造。其重要性在于打破语言障碍,实现高效沟通。主要优点包括无需人工口译员、实时翻译、支持多种语言、保护隐私等。产品背景是满足人们在工作、会议、日常生活等场景下的跨语言交流需求。价格方面,套餐每月25美元起,外加AI分钟费用(每分钟约0.03美元起,使用自己的密钥无加价),还有免费试用和免费访客模式。定位为提供便捷、高效、经济的实时语音翻译服务。
一键翻译亚马逊产品图片,支持7种欧洲语言,低至0.25欧元/张
EZtraduction是一款专为亚马逊卖家设计的图像翻译工具,利用谷歌Gemini人工智能技术,可自动将亚马逊产品图片中的文字翻译成7种欧洲语言。其重要性在于帮助卖家快速、低成本地拓展欧洲市场。主要优点包括:价格低廉,比设计机构便宜20 - 50倍;翻译精准,能理解技术术语、标准和认证;操作便捷,可批量处理图片并自动导出到谷歌云端硬盘;数据安全,符合欧盟通用数据保护条例(RGPD)。价格方面,采用按信用付费模式,5 - 10000个信用有不同的优惠价格,最低0.25欧元/张图,无订阅费用。
免费将 EPUB、PDF、DOCX 和 TXT 转 MP3 或 M4B 有声书,多种 AI 声音可选
DocsToAudio 是一款在线的文档转有声书工具,它能将 EPUB、PDF、DOCX 和 TXT 文件转换为 MP3 或 M4B 有声书。该工具提供免费的标准版和付费的高级版。标准版无需注册,提供 300 多种 AI 声音,支持 30 种语言,永久免费且无使用限制;高级版需注册账号并购买积分,使用 ElevenLabs AI 语音,有 800 多种声音,支持 50 种语言,音质更自然、更富表现力,适合对音质有更高要求的用户。其主要优点在于无需注册即可免费使用,无文件大小限制,文件解析在浏览器中完成,保障用户隐私。
Seed Audio AI 含 TTS、ASR 等,通过 API 为创作者和开发者生成音频
Seed Audio AI 由字节跳动 Seed 研究推出,是一套完整的音频 AI 栈。它涵盖文本转语音、自动语音识别、音乐生成和实时语音理解等功能。其主要优点在于支持多语言、能适应不同口音和嘈杂环境,且具备高准确性和自然的语音生成能力。产品定位为企业和创意工作流提供服务,价格信息未提及。
AI 驱动,几分钟翻译书籍,支持 100+ 语言,完美保留排版
BookTranslator 是一款基于人工智能的书籍翻译工具。其重要性在于为用户提供了高效、便捷的书籍翻译解决方案。主要优点包括:支持多种文件格式如 PDF、EPUB、DOCX 等;能在几分钟内完成整本书的翻译;支持 100 多种语言;翻译过程中完美保留原文的排版、布局和图像;采用上下文感知的 AI 翻译技术,使译文自然流畅。该产品定位为面向科研人员、专业人士以及语言学习爱好者等,帮助他们快速准确地完成书籍翻译。价格方面,支持免费试用,翻译上限为 10000 字,之后按需付费。
Windows和Mac平台语音听写与会议记录工具,有实时转录和AI摘要,14天免费试用
TalkToType是一款专门为Windows和Mac操作系统设计的桌面应用程序。其核心功能是语音听写和会议记录,旨在帮助用户提高工作效率,减少打字时间,让用户能够更流畅地表达想法。该产品对于那些以语言沟通为主要工作方式的人尤为实用,比如销售人员、招聘人员、经理等。产品提供14天免费试用,无需信用卡,用户可以在试用期内充分体验其功能。
免费无限制AI视频生成器,释放创意,让AI带来乐趣
Makefun是一款功能强大的AI视频工具集,提供免费且无限制的AI视频生成服务。其重要性在于为用户提供了便捷、高效的视频创作方式,降低了视频制作的门槛。产品的主要优点包括多种功能集成、超逼真效果、低延迟交互等。背景信息方面,它受到众多开发者和企业的信赖。价格定位灵活,有免费版本,也提供按使用量订阅的付费套餐,起步价为9.9美元。产品定位于满足个人和企业在视频创作、营销、教育等多方面的需求。
Miso One是Miso Labs推出的英语TTS模型,支持情感语音生成。
Miso One是Miso Labs发布的一款具有8B开放权重的英文文本转语音模型。其重要性在于为语音研究和应用提供了新的选择,特别是在低延迟语音代理和富有表现力的对话式语音领域。主要优点包括支持富有表现力的英语对话语音、低延迟生成、支持语音克隆和基于提示的语音设计。产品背景是为了满足语音研究和创作者工作流程的需求。价格方面,有免费计划,每次可使用120个字符,升级后可解锁1000字符。定位是为语音代理研究和创作者提供高质量的语音生成解决方案。
© 2026 AIbase 备案号:闽ICP备08105208号-14