产品库

首页发现 GPTS 排行榜提交 AI导航

首页生产力 EngineerDraft

EngineerDraft

听障人士字幕生成

BeMyEars 是一款实时字幕生成工具，利用本地设备完成语音识别，为听障人士和需要字幕的用户提供极致体验。其主要优点包括多语言支持、多源输入、隐私保护等。

需求人群：

["BeMyEars 适合听障人士、需要字幕支持的用户，以及需要在不便听声音的环境下获取文字信息的人群。","该产品通过实时字幕生成功能，为用户提供便捷的文字信息获取方式，无论是学习、工作还是娱乐，都能得到帮助。"]

使用场景示例：

听障人士在观看视频时使用 BeMyEars 获取实时字幕支持。

在线会议中，用户利用 BeMyEars 录制并导出会议内容。

外语学习者通过 BeMyEars 进行口语训练，获取准确的语音识别支持。

产品特色：

实时语言识别，帮助用户在不同场景下获取文字信息。

直接识别系统播放任意声音，支持口语训练。

录音和导出功能，方便对音频资源进行录制和处理。

利用苹果机器学习框架，实现本地语音识别，保护用户隐私。

支持多种语言，包括中文、英文、法语等，满足全球用户需求。

使用教程：

打开 AppStore，搜索 BeMyEars 或点击下载链接。

安装完成后，启动 BeMyEars 应用。

在系统设置中开启语音识别和 Siri 功能，以保证正常使用。

根据需要选择语言和输入源，即可开始使用 BeMyEars 进行实时字幕生成。

浏览量：356

打开站点

网站流量情况

EngineerDraft

实时字幕生成工具

BeMyEars 是一款实时字幕生成工具，利用本地设备完成语音识别，为听障人士和需要字幕的用户提供极致体验。其主要优点包括多语言支持、多源输入、隐私保护等。

听障人士字幕生成

腾讯云语音识别ASR

语音转文字,支持实时语音识别、录音文件识别等

腾讯云语音识别(ASR)为开发者提供语音转文字服务的最佳体验。语音识别服务具备识别准确率高、接入便捷、性能稳定等特点。腾讯云语音识别服务开放实时语音识别、一句话识别和录音文件识别三种服务形式,满足不同类型开发者需求。技术先进,性价比高,多语种支持,适用于客服、会议、法庭等多场景。

语音识别语音转文字

字幕酱

在线字幕生成工具

字幕酱利用 AI 深度学习技术，提供自动在线字幕生成、字幕制作、语音转字幕、字幕翻译、字幕格式转换等功能。支持多种语种和常见音视频格式，60 秒内短视频免费。

字幕生成字幕翻译

33 字幕是一款精准的 AI 视频字幕识别和字幕翻译软件。它可以将音频、视频转换成文本或 SRT 字幕文件，并支持字幕翻译成其他语言。它使用优化后的 Whisper AI 语音转写模型，准确度接近人类水平。集成多种 AI 翻译引擎，支持 ChatGPT、DeepL、微软、百度等翻译接口。它还提供高效易用的可视化字幕编辑器，支持字幕摘要和预提取人声功能。33 字幕支持英语、日语、韩语、法语、泰语等 50 多种语言。

视频字幕

卡卡字幕助手

基于LLM的智能字幕助手，一键生成高质量视频字幕

卡卡字幕助手（VideoCaptioner）是一款功能强大的视频字幕配制软件，利用大语言模型进行字幕智能断句、校正、优化、翻译，实现字幕视频全流程一键处理。产品无需高配置，操作简单，内置基础LLM模型，保证开箱即用，且消耗模型Token少，适合视频制作者和内容创作者。

字幕生成语音识别

33字幕

精准识别音视频转文本或SRT字幕

33字幕是一款桌面端精准识别音视频转文字或SRT字幕的软件,支持50多种语言识别和翻译,翻译支持DeepL和ChatGPT,可搜索和编辑字幕,支持批量处理,还可以一键剪切口播和播客。

字幕识别音视频转字幕

SpeechPulse

声波 - 语音识别和翻译

SpeechPulse是一款语音识别和翻译软件。它使用OpenAI的Whisper语音到文本模型，实现实时的语音识别，支持多种语言。用户可以使用麦克风输入文字，也可以通过转录音视频文件进行语音识别和翻译。SpeechPulse可以在各种场景下使用，例如办公文档编辑、网页浏览、文件转录、视频字幕生成等。它具有极高的准确性和低延迟，并且完全离线使用。SpeechPulse提供免费版和付费版，付费版支持更多功能和更好的准确性。

语音识别翻译

依图语音开放平台

提供语音识别、语音合成等语音AI能力

依图语音开放平台为开发者提供语音识别、语音合成等语音AI能力,包括精准语音转文本、文本转语音合成、声纹识别、语音增强降噪等服务,支持不同场景下的语音交互应用开发。平台提供高效、灵活的语音AI能力接入方式,可轻松将语音技术应用于各类产品与业务场景。

中文精选

Ai开放平台语音合成

通义浏览器插件

全能AI助手，提供语音识别、字幕翻译、文档速读等功能

通义是一款集成了语音识别、实时字幕翻译、智能总结等功能的浏览器插件，旨在提高用户在网课、追剧追番、线上会议等场景下的效率。它通过AI技术，帮助用户快速记录、转写、翻译和总结网页内容，特别适合需要处理大量信息的用户。产品背景基于当前信息爆炸的时代，用户需要更高效的工具来管理、理解和消化信息。目前产品提供免费试用，具体价格和定位根据用户需求而定。

中文精选

语音识别实时字幕

绘影字幕

为视频自动添加字幕，字幕翻译，字幕制作软件

绘影字幕为您提供视频加字幕、字幕制作、字幕翻译服务。软件采用先进的语音识别技术，自动识别视频中的人声，转化成字幕。并提供翻译服务，轻松制作中英字幕、中日字幕等双语字幕。为抖音、vlog、快手、自媒体、教育课程等视频创作者提供快捷的加字幕服务。

中文精选

Ai动画制作字幕生成

VAS视频加字幕

一键生成视频字幕

VAS 视频加字幕是一款强大且高效的工具，能够使用 AI 提取音频对话内容后翻译、生成字幕文件。它支持 ChatGPT 翻译、GPU 加速、多任务处理、VR 视频、字幕微调、超多语种、实时预览、断点续传等功能。用户只需上传视频，选择语言，即可一键生成字幕。VAS 视频加字幕适用于个人用户、视频制作人、教育机构、企业等多种场景。

优质新品

视频字幕

熊猫字幕

提供字幕下载、解析、生成、翻译及格式转换等功能的一站式字幕服务平台

熊猫字幕是一个专注于字幕服务的平台，其功能覆盖字幕下载、解析、生成、翻译及格式转换等。该平台为用户提供了便捷的字幕获取和处理方式，无论是学习外语、制作视频还是其他需要字幕的场景，都能满足用户的需求。它的重要性在于满足了用户对字幕的多样化需求，提高了视频内容的可访问性和可理解性。目前，熊猫字幕以免费的形式提供服务，旨在为广大用户提供便利。

中文精选

字幕视频

青梧字幕

智能提取视频字幕

青梧字幕是一款视频字幕自动提取工具，用户可以通过选中本地视频文件自动生成字幕，进行编辑和翻译，最终可以下载多种格式的字幕文件。产品功能全面，支持高质量翻译和多种字幕格式下载，适用于视频制作、学习教育等场景。

视频字幕自动生成

Songbird

听新闻，读资讯，了解一切

Songbird 是一个集听新闻、读资讯和获取信息于一体的产品。它提供快速、简洁的新闻浏览功能，帮助用户了解最新的新闻和资讯。通过 Songbird，用户可以方便地收听各种新闻、阅读文章，并获得客观、中立的信息。Songbird 专注于为忙碌的用户提供中立的新闻报道，帮助他们更好地了解世界。

新闻资讯

Dictation IO

在线语音识别工具

语音听写是一款免费的在线语音识别软件，可以通过语音输入来帮助您写邮件、文件和文章，无需打字。

语音识别在线工具

TTSLabs

在线语音合成与语音识别服务

TTSLabs是一款在线语音合成与语音识别服务，提供高质量、自然流畅的语音合成和准确可靠的语音识别功能。通过简单的API调用，用户可以将文字转化为真实的语音，并且可以将语音转化为文本。TTSLabs提供多种语音风格和多国语言的支持，具有快速响应、高效稳定的特点。价格灵活透明，适用于个人开发者和企业用户。

语音合成语音识别

快转字幕

全球领先的语音转文字平台

快转字幕是一款全球领先的语音转文字平台。它可以自动为无字幕的视频高准确率添加字幕，大幅提高自媒体工作者的效率。准确率远超同行，支持超过 99 种语言、方言识别转录，也可以识别不清晰的语音对话。同时，它还提供强大的 AI 自动翻译功能，能够智能添加所需的语言翻译字幕，使优质内容再无国界。快转字幕还适用于会议记录转录，能够快速生成文字记录并准确区分对话中不同的说话者。用户可以实时编辑转写结果，并支持一键导出多种形式的文件。

中文精选

语音转文字字幕制作

CreateEasily

免费语音转文字和视频字幕

CreateEasily可以快速、准确地将英语音频转换为字幕和文本转录。支持56种语言，最大文件限制为2GB。完全免费使用。

语音转文字视频字幕

Whisper

通用语音识别模型

Whisper 是一个通用的语音识别模型。它经过大量多样化音频的训练，并且是一个多任务模型，可以进行多语言语音识别、语音翻译和语种识别。

语音识别语音翻译

自得语音

使用自得语音技术，创造属于你的角色

自得语音技术可通过简单的步骤创造出属于你的角色。类似GPT，可生成与真人无异的语音片段，在情感、音色和语速等方面与真人一致。自得语音支持快速定制角色，只需要上传一段语音即可立即生成属于你的语音角色。无需下载软件，可在浏览器上完成语音生成。同时提供API接口，方便开发者集成到自己的产品中。商用用户可享受7x24小时的技术支持。

中文精选

语音生成创造角色

汉王语音王

智能语音旗舰应用，无障碍语言记录与交流。

汉王语音王App是汉王科技基于自研多模态天地大模型，自主研发的智能语音旗舰应用。它集AI语音记录、智能翻译与同声传译于一体，支持AI精准转写、拍录同步、话稿整理、智能总结及不间断实时翻译等功能。依托全栈AI技术，汉王语音王致力于帮助用户跨越语言障碍，提高办公、学习、会议、旅游等场景的效率和便捷性。

优质新品

语音识别智能翻译

Scribba AI

AI语音转录和字幕制作

Scribba是一款使用AI技术进行语音转写和视频字幕添加的工具。它能在几分钟内以98%的准确率将音频/视频转换为文本，也可以为视频添加字幕。Scribba可节省时间和金钱，支持多种语言，功能强大。

AI 语音转写

whisper-ner-v1

联合语音转录和实体识别的先进模型

Whisper-NER是一个创新的模型，它允许同时进行语音转录和实体识别。该模型支持开放类型的命名实体识别（NER），能够识别多样化和不断演变的实体。Whisper-NER旨在作为自动语音识别（ASR）和NER下游任务的强大基础模型，并且可以在特定数据集上进行微调以提高性能。

语音识别实体识别

Moonshine Web

实时浏览器端语音识别应用

Moonshine Web是一个基于React和Vite构建的简单应用，它运行了Moonshine Base，这是一个针对快速准确自动语音识别（ASR）优化的强大语音识别模型，适用于资源受限的设备。该应用在浏览器端本地运行，使用Transformers.js和WebGPU加速（或WASM作为备选）。它的重要性在于能够为用户提供一个无需服务器即可在本地进行语音识别的解决方案，这对于需要快速处理语音数据的应用场景尤为重要。

语音识别自动语音识别

Vocapia

专业语音识别软件和服务

Vocapia Research开发的语音识别软件提供先进的语音处理技术，支持多语种识别，并能应用于广播监控、讲座和研讨会转录、视频字幕、电话会议转录和语音分析等领域。我们的产品具有大词汇量连续语音识别、语音分割和分区、说话人识别和语种识别等功能。我们的软件适用于批量或实时转录大量音频和视频文件，特别针对电话对话语音和呼叫中心数据的转录需求。我们提供多种语言的转录服务，并可根据客户需求定制模型或系统。

语音识别语音转写

sherpa-onnx

支持多种语音识别和语音合成功能的开源项目

sherpa-onnx 是一个基于下一代 Kaldi 的语音识别和语音合成项目，使用onnxruntime进行推理，支持多种语音相关功能，包括语音转文字(ASR)、文字转语音(TTS)、说话人识别、说话人验证、语言识别、关键词检测等。它支持多种平台和操作系统，包括嵌入式系统、Android、iOS、Raspberry Pi、RISC-V、服务器等。

语音识别语音合成

HoneyDo

语音识别AI购物清单助手

HoneyDo是一款语音识别AI购物清单助手，通过语音输入购物清单，AI将其转化为整洁有序的列表。另外，还支持拍照识别食材并列出清单，以及与家人实时同步共享购物清单等功能。HoneyDo分为免费版和PRO版，PRO版提供无限语音录制和图像捕捉功能。

购物语音识别

Video Subtitles

AI智能生成准确字幕

视频字幕是一款采用先进的AI技术，能够自动转录音频并将其翻译成准确的英文字幕的应用。通过自动转录和同步字幕，提高可访问性并节省时间。支持50多种语言，可将字幕生成为.vtt、.srt或.txt格式。

AI字幕字幕生成

EasySub

视频字幕生成与编辑工具

易字幕是一款简单实用的在线自动字幕生成与编辑工具。能够快速准确地为视频和YouTube链接生成和编辑字幕，并支持150+种免费语言翻译。具有高准确度的转录效果，性价比高，操作方便，提供免费的字幕下载和翻译。

自动字幕视频字幕

Azure 认知服务语音

让应用通过语音与文本的转换实现智能交互。

Azure 认知服务语音是微软推出的一款语音识别与合成服务，支持超过100种语言和方言的语音转文本和文本转语音功能。它通过创建可处理特定术语、背景噪音和重音的自定义语音模型，提高听录的准确度。此外，该服务还支持实时语音转文本、语音翻译、文本转语音等功能，适用于多种商业场景，如字幕生成、通话后听录分析、视频翻译等。

语音识别语音合成

隐私政策

用户协议

意见反馈网站地图

用户协议

AIbase服务使用协议，由享联科技有限公司实施、托管和运营。客户必须同意这些条款才能使用服务。

本网站及位于 AIbase.com 及其他子域名的服务，包括网页 App、小程序 App、移动端 App（统称为“本 App”）是享联科技有限公司的著作权产品。

通过访问或使用本网站，您表示接受这些条款（代表您本人或您代表的实体），并声明和保证您有权、权力和能力遵守这些条款（代表您本人或您代表的实体）。如果您未满 18 岁，您不得访问或使用本网站或接受这些条款。如果您不同意这些条款的所有规定，请不要访问和/或使用本 App。除了以下协议外，您还需要遵守 https://www.chinaz.com/aboutus/agreement.html 中的协议。

用户账户

为了充分利用此网站的所有功能，用户需要创建账户并填写准确的资料。用户有义务保护自己的账户和密码的保密性，并对其账户内的所有活动承担责任。若用户发现其账户遭到未经授权的使用，应迅速告知我们。

用户内容

此网站允许用户将问题记录存储并发送至服务器。用户需要对自身存储和发送的内容负责，确保其不触犯任何法律、法规或本协议。

行为规范

用户在使用此网站服务时，应遵循以下规定：

禁止发布、传播任何违法、淫秽、色情、赌博、暴力、恐怖或煽动犯罪的内容；

禁止发布、传播侵犯他人知识产权或其他合法权益的内容；

禁止发布、传播误导、欺诈、虚假信息或进行任何不诚实的行为；

禁止发布、传播政治宣传或进行任何政治活动；

禁止从事危害网络安全的行为，包括但不限于恶意攻击、恶意破坏、恶意干扰等；

禁止从事影响本网站正常运行的行为，包括但不限于非法使用本网站的资源、恶意注册、恶意请求等；

若用户违反上述规定，我们有权立即终止本协议并禁止用户使用本网站。

一般性支付条款

本网站提供的所有服务均为一次性付款，您只需支付所需的会员服务时长。服务到期后，本网站不会使用您过往的支付方式自动续费，也不存在需要取消的订阅。

会员服务时长购买后无法转送他人。本公司保留调整订阅价格的权力，已购买的服务时长内不受影响。

退款保障

如果由于本公司的过失导致您无法使用服务，您可以在首次购买服务后的24小时内申请取消服务并退还服务费。如果不符合上述要求，您的退款申请可以被考虑，但是最终决定权由本公司全权决定。本公司仅有义务通过原支付渠道进行退款，退款申请将在申请后30天内处理。如果您想根据我们的退款保证申请退款，请通过网站页面上客服联系方式进行联系咨询我们，我们收到信息将为您解决。本退款保证条款仅适用于通过本网站直接订阅服务的用户。

知识产权

本网站包含的所有内容，包括但不限于文本、图片、音频、视频、软件、代码、商标、商业信息等，皆受著作权、商标权、专利权及其他知识产权法律的保护。未经我们书面同意，用户不得使用、复制、修改、拷贝、发布、出售、出租、传播本网站的任何内容。

网站服务器回答内容责任

本网站的服务器根据用户的问题提供答案，但用户需要自行判断回答内容的正确性和可靠性，并自行承担使用回答内容的风险。我们不对回答内容的准确性、可靠性、完整性、有效性、及时性、适用性等作出任何保证或承诺。

隐私保护

我们尊重用户的隐私权，并承诺在使用用户的个人信息时遵守相关法律法规。我们将采取合理的安全措施保护用户的个人信息，但不对因不可抗力或非因我们的原因导致的信息泄露承担责任。

免责声明

本网站提供的信息和服务仅供参考，不构成任何担保或承诺。我们不保证本网站的信息和服务的准确性、可靠性、完整性、有效性、及时性、适用性。用户使用本网站的信息和服务所产生的风险由用户自行承担。

变更和终止

我们有权随时修改本协议的任何条款，并将修改后的协议在本网站上公布。若用户继续使用本网站，即表示用户同意受修改后的协议约束。若用户不同意修改后的协议，应立即停止使用本网站。

我们有权在任何时候终止本协议，且无需提前通知用户。在协议终止后，用户无权继续使用本网站。

适用法律

本协议的订立、执行、解释及争议的解决均适用中华人民共和国法律。如发生本协议与中华人民共和国法律相抵触时，应以中华人民共和国法律的明文规定为准。

如双方就本协议内容或执行发生任何争议，双方应尽力友好协商解决；协商不成时，任何一方均可向本网站所在地的人民法院提起诉讼。

其他

本协议构成双方对本协议之约定事项及其他有关事宜的完整协议，除本协议规定的之外，未赋予本协议各方其他权利。

如本协议中的任何条款无论因何种原因完全或部分无效或不具有执行力，本协议的其余条款仍应有效并且有约束力。

本协议中的标题仅供方便参阅，不具有实际意义，不能作为本协议涵义解释的依据。

本协议未尽事宜，您需遵守我们不时发布的其他服务条款和操作规则。

本协议自您接受之日起生效，对我们和用户均具有约束力。

确认

隐私政策

欢迎访问我们的产品。AIbase（包括 App 和网站等产品提供的服务，以下简称“产品和服务”）是由享联科技有限公司（以下简称“我们”）开发并运营的。确保用户的数据安全和隐私保护是我们的首要任务，本隐私政策详细说明了您访问和使用我们的产品和服务时所收集的数据以及其处理方式。

在继续使用我们的产品之前，我们强烈建议您认真阅读并理解本隐私政策的全部规则和要点。一旦您选择使用，即表示您同意本隐私政策的全部内容，并同意我们收集和使用您相关的信息。如果您在阅读过程中对本政策有任何疑问，请通过产品中的反馈方式联系我们的客服进行咨询。如果您不同意其中的任何条款或相关协议，则应停止使用我们的产品和服务。

本隐私政策旨在帮助您了解以下内容：

一、我们如何收集和使用您的个人信息；

二、我们如何存储和保护您的个人信息；

三、我们如何公开披露您的个人信息；

四、我们如何使用 Cookie 和其他追踪技术；

五、其他补充说明；

一、我们如何收集和使用您的个人信息

个人信息是指以电子或其他方式记录的能够单独或与其他信息结合识别特定自然人身份或反映特定自然人活动情况的各种信息。我们根据《中华人民共和国网络安全法》和《信息安全技术个人信息安全规范》（GB/T 35273-2017）以及其他相关法律法规的要求，严格遵循正当、合法、必要的原则，出于您使用我们提供的服务和/或产品等过程中而收集和使用您的个人信息，包括但不限于电话号码、电子邮箱地址、偏好及兴趣等。

为接受我们全面的产品服务，您应首先注册一个用户账号，我们将通过它记录相关的数据。您所提供的所有信息均来自于您本人在注册时提供的数据。如扫码登录、手机验证登录等方式，我们可能通过发短信或邮件的方式来验证您的身份是否有效。

二、我们如何存储和保护您的个人信息

作为一般规则，我们仅在实现信息收集目的所需的时间内保留您的个人信息。当您开立帐户或从我们的产品获取服务时，我们会在对于管理与您之间的关系严格必要的时间内保留您的个人信息。出于遵守法律义务或为证明某项权利或合同满足适用的诉讼时效要求的目的，我们可能需要在上述期限到期后保留您存档的个人信息，并且无法按您的要求删除。当您的个人信息对于我们的法定义务或法定时效对应的目的或档案不再必要时，我们确保将其完全删除或匿名化。

我们使用符合业界标准的安全防护措施保护您提供的个人信息，并加密其中的关键数据，防止其遭到未经授权访问、公开披露、使用、修改、损坏或丢失。我们会采取一切合理可行的措施，保护您的个人信息。我们会使用加密技术确保数据的保密性；我们会使用受信赖的保护机制防止数据遭到恶意攻击。

值得一提的是，为了加强对隐私数据的保护，我们在收集时就已对其进行了脱敏处理，即使在我们自己的数据库中，也不会储存具有关联性的、明文的隐私数据。

三、我们如何公开披露您的个人信息

为了更好地服务客户并追求合法利益，我们将合规并且恰当地使用您的个人信息。我们可能会根据法律法规规定或政府主管部门的强制性要求，对外共享您的个人信息。在符合法律法规的前提下，当我们收到上述披露信息的请求时，我们会要求必须出具与之相应的法律文件，如传票或调查函。我们坚信，在法律允许的范围内，对于要求我们提供的信息，应该尽可能保持透明。

在以下情形中，共享、公开披露您的个人信息无需事先征得您的授权同意：

与国家安全、国防安全直接相关的；

与犯罪侦查、起诉、审判和判决执行等直接相关的；

出于维护您或其他个人的生命、财产等重大合法权益但难以得到本人同意的；

您自行向社会公众公开的个人信息；

从合法公开披露的信息中收集个人信息的，如合法的新闻报道、政府信息公开等渠道；

根据个人信息主体要求签订和履行合同所必需的；

用于维护所提供的产品或服务的安全稳定运行所必需的，例如发现、处置产品或服务的故障；

法律法规规定的其他情形。

四、如何使用 Cookie 和其他追踪技术

为了确保产品正常运作，我们会在您的计算机或移动设备上存储名为 Cookie 的小数据文件。 Cookie 通常包含标识符、产品名称以及一些数字和字符。通过使用 Cookie，我们可以存储您的偏好或产品数据，并用于判断注册用户是否已登录，提高服务和产品质量以及优化用户体验。我们出于不同目的使用各种 Cookie，包括：严格必要型 Cookie、性能 Cookie、营销 Cookie 和功能 Cookie。某些 Cookie 可能由第三方提供，以向我们的产品提供其他功能。我们不会将 Cookie 用于本政策所述目的之外的任何用途。您可以根据自己的偏好管理或删除 Cookie。您可以清除计算机或手机中保存的所有 Cookie，大多数网络浏览器都设有阻止或禁用 Cookie 的功能，您可以对浏览器进行配置。阻止或禁用 Cookie 功能后，可能会影响您使用或无法充分使用我们的产品和服务。

五：其他补充

1、有关用户身份注销问题

关于您注销账户的方式以及您应满足的条件，请详见《站长之家账户注销须知》。您注销账户后，我们将停止为您提供产品与/或服务，并依据您的要求，除法律法规另有规定外，我们将删除您的个人信息。请您理解，由于技术所限、法律或监管要求，我们可能无法满足您的所有要求，我们会在合理的期限内答复您的请求。

确认