开源免费的 Wispr Flow 替代方案,为中文用户打造的桌面端语音输入与文本处理工具。
蛐蛐 (QuQu) 是一款开源免费的桌面端语音输入与文本处理工具,专为中文用户设计。它提供了隐私保护和本地处理功能,与 Wispr Flow 相比,无需支付订阅费用。通过集成 FunASR 本地模型,蛐蛐 能够精准识别中文,优化语音输入体验,适合开发者和普通用户使用。
BlabbyAI Chrome扩展,快速准确将语音转换为文本,支持任意网站语音输入。
BlabbyAI是一款语音转文本的AI转录工具,以Chrome扩展的形式为用户提供服务。其重要性在于极大地提高了用户输入文本的效率,尤其适用于需要快速记录内容或不方便手动输入的场景。主要优点包括快速、准确的语音识别能力,能够在任意网站上实现无缝的语音打字。产品背景方面,它满足了现代社会人们对高效输入方式的需求。关于价格,文档未提及,推测可能有免费试用或付费模式。其定位是帮助用户提高生产力的语音输入辅助工具。
免费AI音频转文本,含说话人标签、时间戳,支持TXT/DOCX/SRT导出
AudioConvert是一款免费的在线音频转文本工具,采用先进的AI技术,能够快速、准确地将音频文件转换为文本。其重要性在于提高了信息处理的效率,节省了人工转录的时间和精力。主要优点包括高精度的转录、支持多说话人识别、多种导出格式、精确的时间戳等。产品背景是为了满足用户对于高效音频转录的需求,目前完全免费,定位为面向广大用户的生产力工具。
通过AI语音播报,让您听取您保存的文章。
Katalog是一个通过AI语音播报文章的工具。它利用超逼真的AI声音播报您保存的文章,提供顶级的听取体验。Katalog还在公共测试阶段免费使用,未来可能会推出免费和付费版本。
全球顶尖无限AI聊天一站式超级AI智能体
imini AI是一款聚合GPT-5、Grok 4、Gemini 2.5 Pro、Claude Opus 4 Thinking、DeepSeek R1等最新AI大模型的超级AI智能体。它具有出色的智能交互功能,为用户提供高效的聊天、深度研究、报告撰写等服务。定位于提升用户工作和生活效率。
让Mumble Note将您的会议、任务、想法和快速笔记立即转换为笔记、待办事项和输出。
Mumble Note是一款AI语音速记工具,可以将用户的口述内容转换为清晰的笔记、待办事项和输出。该产品具有隐私保护、智能问答等功能,为用户提供高效的语音记录与管理体验。
语音AI助手,清理收件箱,规划日程,轻松完成任务。
Extra Thursday是一款声控AI助手,帮助用户清理收件箱、规划日程,处理行政任务,提高工作效率。该产品利用声控技术提供个人助手功能,节省用户时间和精力。
Relyable 让您快速部署高性能 AI 电话代理。
Relyable 是一个自动化 AI 代理测试与监控工具,通过模拟和智能分析,帮助用户评估、优化和监控 AI 语音代理的表现。它能够帮助用户快速部署生产就绪的 AI 代理,提高工作效率。
Matrix Game 2提供实时交互式世界生成。
Matrix Game 2是一个实时交互式世界生成平台,利用先进的Matrix-Game 2 AI技术构建、探索和玩耐人的AI生成环境。该平台提供即时访问,为用户创造出与动态响应玩家互动的世界。
免费的 AI 播客生成工具,支持多种格式文件。
FlowSpeech是一个免费的 AI 播客生成器,利用最新的语音合成技术将文本转换为自然人声,适合各种用户需求。它支持多种格式的输入,包括 PDF、TXT 等,方便用户快速获取信息。提供多种订阅选项,帮助创作者更高效地制作播客。
通过文本提示生成交互式AI世界。
Genie 3 World是一个基于AI技术的创新性交互式世界生成工具,可以通过简单的文本提示生成令人沉浸的3D环境,适用于训练、教育和娱乐应用。其主要优点在于实时物理仿真、动态天气和AI角色响应能力。
通过文本提示生成交互式环境的AI世界模型。
Genie 3是一种通过文本提示生成交互式环境的AI世界模型。它在AI领域具有革命性意义,能以24 FPS的速度生成具有720p分辨率的世界,并保持物理一致性。
无需开发人员,即可从提示到您的网站,转换时间不超过分钟。
Embeddable - 交互式工具构建器是一个让您可以快速构建交互式工具的平台。它为营销人员提供了在短时间内在网站上集成交互式工具的能力,无需依赖开发人员。通过简单的操作,您可以快速创建多种交互式工具,增强用户体验和提高转化率。
免费在线使用经典的Microsoft SAM文本转语音服务。
Microsoft SAM TTS是一款基于Windows XP声音的文本转语音工具。它的重要性在于保留了经典的Microsoft SAM声音,让用户可以体验到Windows XP时代的怀旧感。
一款支持中英文的对话语音合成模型。
MOSS-TTSD 是一个开源的双语对话合成模型,支持自然、富有表现力的语音生成。它能将对话脚本转换为高质量的语音,适用于播客制作和 AI 对话应用。该模型的特点包括零 - shot 语音克隆和长时间语音生成,具有高度的表达力和真实感。MOSS-TTSD 的训练基础包括大规模的语言数据和语音数据,确保了生成语音的自然性与准确性。该技术适合商业化使用,并且完全开源。
将您的语音立即转换为文本。完全私密,开源,由AI技术驱动。
OpenWispr是一款由AI技术驱动的语音转文本工具,注重隐私保护,完全开源。其主要优点在于处理速度快、隐私保护严格,适用于写作、编程等领域。
智能AI语音代理,自然对话,多语言支持,用于业务通话自动化。
NexaVoxa是一款智能AI语音代理产品,旨在优化销售流程、自动化排程和提升客户支持体验。其主要优点包括自然对话、多语言支持以及企业级可扩展性。
© 2025 AIbase 备案号:闽ICP备08105208号-14