百聆

百聆是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,提供高质量的语音对话体验。其主要优点是无需GPU即可实现类GPT-4o的对话效果,适用于各种边缘设备和低资源环境。百聆完全开源,鼓励社区贡献与二次开发,用户可以根据自己的需求进行定制和优化。

需求人群:

"该产品适合需要高效语音交互体验的用户,无论是日常对话、信息查询还是任务管理,百聆都能提供便捷的语音支持,尤其适合对硬件配置要求不高但对语音交互质量有较高要求的用户。"

使用场景示例:

用户可以通过语音指令让百聆查询天气情况,如说‘杭州天气怎么样?’,百聆会返回杭州的天气信息。

用户可以使用百聆进行雅思口语练习,百聆会生成雅思口语练习题目和对话,帮助用户进行练习。

用户可以设置定时任务,如说‘每天早上8点提醒我喝水。’,百聆会按照设定的时间提醒用户。

产品特色:

高效开源模型:百聆使用多个开源模型,确保高效、可靠的语音对话体验。

无需GPU:通过优化,可本地部署,仍能提供类GPT-4的性能表现。

模块化设计:ASR、VAD、LLM和TTS模块相互独立,可根据需求进行替换和升级。

支持记忆功能:具备持续学习能力,能够记忆用户的偏好与历史对话,提供个性化的互动体验。

支持工具调用:灵活集成外部工具,用户可通过语音直接请求信息或执行操作,提升助手的实用性。

支持任务管理:高效管理用户任务,能够跟踪进度、设置提醒,并提供动态更新,确保用户不错过任何重要事项。

使用教程:

1. 克隆项目仓库:git clone https://github.com/wwbin2017/bailing.git,然后进入项目目录cd bailing。

2. 安装所需依赖:pip install -r requirements.txt。

3. 配置环境变量:打开config/config.yaml配置ASR LLM等相关配置,下载SenseVoiceSmall到目录models/SenseVoiceSmall,并获取deepseek的api_key。

4. 启动后端服务:cd server,运行python server.py(可选)。

5. 启动主程序:运行python main.py,系统会等待语音输入,用户即可开始使用百聆进行语音对话。

浏览量:9

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
网站流量情况

最新流量情况

月访问量

4.91m

平均访问时长

00:06:18

每次访问页数

5.57

跳出率

37.92%

流量来源

直接访问

51.73%

自然搜索

32.88%

邮件

0.04%

外链引荐

13.01%

社交媒体

2.27%

展示广告

0

截止目前所有流量趋势图

地理流量分布情况

中国

13.81%

德国

3.69%

印度

9.16%

俄罗斯

4.47%

美国

18.04%

类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图