Whisper-Input

Whisper Input 是一个基于 Python 开发的桌面工具,能够实现快速语音转文字功能。它支持通过按键控制录制语音,并调用 Groq Whisper Large V3 Turbo 或 FunAudioLLM/SenseVoiceSmall 模型进行转译。该工具的主要优点是转译速度快、准确率高,并且支持多语言转译。它适合需要高效输入的用户,尤其是那些经常需要进行语音记录和文字转换的场景。目前该工具完全免费,用户无需付费即可使用。

需求人群:

"适合需要高效语音输入的用户,如办公人员、学生、内容创作者等,尤其适用于需要快速记录想法、会议纪要、写作等场景。"

使用场景示例:

在会议中快速记录要点,无需手动输入。

学生在课堂上通过语音记录笔记,课后转为文字复习。

内容创作者通过语音输入撰写文章或脚本。

产品特色:

支持按下 Option 或 Alt 按钮开始录制,抬起按钮结束录制。

支持多语言语音转译,可将多种语言转译为文字。

支持中文翻译为英文,满足双语输入需求。

调用 Groq 或 SiliconFlow 提供的高性能语音转录模型,转译速度快。

自带标点符号支持,无需额外润色即可输出完整句子。

使用教程:

1. 确保本地有 Python 环境,版本不低于 3.10。

2. 注册 Groq 或 SiliconFlow 账户,获取免费的 API KEY。

3. 克隆项目到本地:`git clone git@github.com:ErlichLiu/Whisper-Input.git`。

4. 创建虚拟环境并激活:`python -m venv venv`,然后运行 `source venv/bin/activate`(macOS/Linux)或 `.\venv\Scripts\activate`(Windows)。

5. 安装依赖:`pip install pip-tools`,然后运行 `pip-compile requirements.in` 和 `pip install -r requirements.txt`。

6. 配置 `.env` 文件,填入 API KEY 和相关设置。

7. 运行程序:`python main.py`,即可通过按键进行语音转文字操作。

浏览量:97

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
网站流量情况

最新流量情况

月访问量

4.75m

平均访问时长

00:06:34

每次访问页数

6.10

跳出率

36.20%

流量来源

直接访问

52.19%

自然搜索

32.64%

邮件

0.04%

外链引荐

12.93%

社交媒体

2.02%

展示广告

0

截止目前所有流量趋势图

地理流量分布情况

中国

14.32%

德国

3.68%

印度

9.04%

俄罗斯

3.92%

美国

19.25%

类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图