需求人群:
"该产品适合教育工作者用于开发互动式教学内容,也适合创意工作者获取灵感,同时也能为普通用户提供趣味性的娱乐体验。"
使用场景示例:
教育场景:教师利用该聊天机器人设计互动式故事课程,激发学生的学习兴趣。
创意写作:作家通过与聊天机器人的互动,获取故事创作灵感,探索不同的情节发展。
家庭娱乐:家长和孩子一起使用该产品,共同创作属于自己的冒险故事。
产品特色:
利用 Deepgram 实现语音转文字,将用户的语音指令转换为文本。
通过 Google Gemini 2.0 生成故事内容,提供丰富的故事情节和选择。
使用 ElevenLabs 将文本转换为语音,增强故事的沉浸感。
借助 Google Imagen 生成与故事内容相关的图像,提升视觉体验。
支持自定义环境变量,方便用户根据需求调整配置。
提供本地运行和 Docker 部署两种方式,便于开发和测试。
使用教程:
1. 克隆项目代码到本地。
2. 安装 Python 环境并创建虚拟环境,运行 `pip install -r requirements.txt` 安装依赖。
3. 创建 `.env` 文件并配置相关环境变量。
4. 进入 `frontend` 文件夹,运行 `npm install` 和 `npm run build` 构建前端。
5. 启动后端服务,运行 `python src/bot_runner.py --host localhost`。
6. 在浏览器中访问 `http://localhost:7860`,开始使用。
浏览量:119
最新流量情况
月访问量
4.92m
平均访问时长
00:06:33
每次访问页数
6.11
跳出率
36.20%
流量来源
直接访问
51.61%
自然搜索
33.46%
邮件
0.04%
外链引荐
12.58%
社交媒体
2.19%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
12.55%
德国
3.84%
印度
9.38%
俄罗斯
4.61%
美国
18.64%
一个基于语音交互的故事创作聊天机器人,提供沉浸式的“选择你自己的冒险”体验。
该产品利用 Gemini 2.0 语言模型和 Google Imagen 图像生成技术,结合语音识别和语音合成,为用户提供一个互动式的故事创作体验。用户可以通过语音输入选择故事走向,系统会实时生成故事内容和相关图像。该产品的主要优点是创新的交互方式和强大的内容生成能力,适合用于教育、娱乐和创意启发。目前该产品处于开源阶段,未明确具体定价,主要面向开发者和教育机构。
让应用通过语音与文本的转换实现智能交互。
Azure 认知服务语音是微软推出的一款语音识别与合成服务,支持超过100种语言和方言的语音转文本和文本转语音功能。它通过创建可处理特定术语、背景噪音和重音的自定义语音模型,提高听录的准确度。此外,该服务还支持实时语音转文本、语音翻译、文本转语音等功能,适用于多种商业场景,如字幕生成、通话后听录分析、视频翻译等。
提升网站AI语音交互和销售
Site Agent是一款AI语音助手产品,能够个性化地与访问网站的用户进行语音和文字对话,提升用户参与度并促进销售。它结合了最新的AI技术和类似人类对话的细腻触感,为每个客户互动带来价值。Site Agent提供个性化的对话和问答功能,帮助客户解决问题、获取信息和进行购买。它还具备智能推荐和语义理解功能,能够根据用户需求提供个性化建议。Site Agent的定价根据企业需求定制,提供免费试用和付费增值的选择。
AI故事生成器,轻松创作真实的故事
DeepFiction是一个用于创作和分享故事的平台。它采用人工智能技术,提供各种类型、风格和设置的故事生成,帮助用户轻松克服写作障碍。无论是惊险刺激的动作冒险、经典感人的爱情故事,还是幽默搞笑的作品,DeepFiction都能满足每个人的需求。用户可以选择自己喜欢的题材,并由AI生成个性化、引人入胜的故事。DeepFiction不仅可以个性化娱乐,还能根据用户的口味和偏好进行持续调整。它尊重用户的表达自由,带你走进一个无尽且个性化的娱乐世界。
AI创作儿童故事
Once Upon a Bot是一款使用人工智能技术创作儿童故事的网站。用户可以向AI提供故事创作的初始想法,然后AI将完全自动生成一篇故事。用户可以阅读、编辑、导出和分享这些故事。Once Upon a Bot适合家长、教师和孩子们使用,可以提高孩子的阅读能力并让他们享受创作的乐趣。
WhatsApp语音助手,与ChatGPT通过语音信息交互
GabbyGPT是一个通过WhatsApp实现的AI语音助手,用户可以方便地通过语音信息与ChatGPT进行交互。它可以回答问题、提供信息、执行任务等。GabbyGPT的优势在于其简便易用的操作方式和智能的语音识别功能。定价方面,用户可以免费使用基本功能,或选择订阅高级功能的付费套餐。GabbyGPT适用于个人用户和商业用户,能够满足不同场景的需求。
AI创作故事与图像
TMRA是世界上第一个由人工智能驱动的故事、提示和图像创作工具。您可以与AI共同创作独特的世界,拥有丰富的角色背景故事、动态目标系统、行动提示、故事进展、NPC管理和惊人的图像,提供真正独特的故事体验。您的故事完成后,可以与他人分享,发送到打印,甚至自己打印。TMRA还提供了巧妙有趣的成就系统、伤害流血效果、伴侣子系统,以及丰富多彩的故事、提示、图像甚至声音。您可以手动挑选喜欢的图像,创建收藏并与他人分享,甚至将其打印在画布上,制作墙艺品或其他精美的打印产品。
AI 驱动的故事创作平台
Deep Realms是一款 AI 驱动的故事创作平台,通过智能算法和大数据分析,帮助用户释放想象力,生成富有创意的故事。用户可以通过选择不同的故事元素和情节,让 AI 帮助编写出独特的故事内容。深域支持多种故事类型和风格,帮助用户轻松创作出精彩纷呈的故事作品。平台简洁易用,无需编程或写作技巧,适用于任何想要创作故事的人群。
AI创作音乐与语音
Suno AI是一款通过人工智能创作音乐和语音的产品。它利用先进的算法和数据模型,能够生成高质量的音乐和语音作品。Suno AI具有以下功能和优势:1. 创作多种风格的音乐,包括流行、古典、电子等;2. 生成自然流畅的语音,可用于语音合成、配音等场景;3. 提供丰富的音乐和语音效果,可根据用户需求进行定制;4. 界面简洁友好,操作简单易上手;5. 支持多种输出格式,方便用户在不同平台上使用。Suno AI的定价根据用户的使用情况而定,详情请访问官方网站。
AI驱动的个性化儿童故事创作平台
EnchantedPages.Ai是一个利用人工智能技术为儿童创作个性化故事的平台。它允许父母通过简单的点击操作,将自己的孩子置于故事的中心,成为故事的英雄。该平台旨在通过引人入胜的故事讲述,提升亲子间的一对一时间质量,并通过教育性内容激发孩子的兴趣。
创作独特、生动的故事
fabula for kids是一款帮助用户轻松创作生动故事的工具。用户可以描述故事情节和图像,系统将根据描述生成定制图像和音频叙述,为用户创造独一无二的故事体验。该产品定位于帮助家长为孩子打造难忘的故事时光。
AI辅助视频创作,让故事生动起来。
寻光视频创作平台是一个利用人工智能技术,为用户提供全新视频创作模式的在线服务。它通过剧本到分镜的辅助,角色库管理,视觉素材创作,以及视频内容编辑等功能,帮助用户快速实现视频制作。该平台的主要优点包括高效的创作流程、个性化的角色定制、以及先进的AI技术,使得视频制作更加便捷和创新。
AI辅助电影制作平台,从剧本创作到故事板设计,加速电影项目创作流程。
Fenixs是一款AI辅助电影制作平台,帮助电影制作者快速、智能地进行剧本创作和故事板设计。产品定位于提高创作效率,加速电影项目的制作过程。
实时语音提取智能耳机交互系统
LookOnceToHear 是一种创新的智能耳机交互系统,允许用户通过简单的视觉识别来选择想要听到的目标说话者。这项技术在 CHI 2024 上获得了最佳论文荣誉提名。它通过合成音频混合、头相关传输函数(HRTFs)和双耳房间脉冲响应(BRIRs)来实现实时语音提取,为用户提供了一种新颖的交互方式。
无审查,创作故事和角色
DreamGen是一个开源故事创作和角色创作模型平台。用户可以通过这个平台释放想象力,创建自己的故事和角色。该产品提供免费试用以及不同套餐的付费订阅,用户可以根据自己的需求选择相应的套餐进行订阅。通过DreamGen,用户可以进行创作,并将故事和角色模型变得更具个性化。
使用自得语音技术,创造属于你的角色
自得语音技术可通过简单的步骤创造出属于你的角色。类似GPT,可生成与真人无异的语音片段,在情感、音色和语速等方面与真人一致。自得语音支持快速定制角色,只需要上传一段语音即可立即生成属于你的语音角色。无需下载软件,可在浏览器上完成语音生成。同时提供API接口,方便开发者集成到自己的产品中。商用用户可享受7x24小时的技术支持。
AI创作工具,轻松设计并制作故事视频
Artflow是一款AI创作工具,帮助用户设计并制作故事视频。它提供了丰富的功能,包括角色设计、故事情节设计等。用户可以通过Artflow将自己的故事想法转化为生动的视频作品。该产品的优势在于使用AI技术,可以快速生成高质量的视频内容。定价方面,Artflow提供免费试用版本和付费高级版本。它定位于个人用户、创作者和故事讲述者。
语音交互人工智能助手
魔撰写作是一款基于语音交互和软硬结合的人工智能助手,可以帮助用户完成日常生活中的各种任务,包括语音助手、智能家居控制、语音翻译、语音记事本等功能。小问智能的优势在于准确率高、响应速度快、支持多语言、可定制化等特点。定价方面,提供免费版和付费版两种选择,付费版功能更加丰富,价格合理。小问智能的定位是成为用户日常生活中的智能助手。
语音交互式语言学习App
Natulang是一个语音交互式的语言学习App。它利用语音生成和识别技术,让用户可以通过大声朗读对话来学习语言。相比其他注重打字的语言学习App,Natulang更注重语音交流,让用户培养语言表达的自信心。
AI儿童故事生成平台
StoryBee是一个AI驱动的儿童故事生成平台。用户只需提供一个提示或主题,AI就可以为儿童定制出个性化的故事。该平台功能强大,使用简单,让每一个孩子都能探索到富有想象力的奇幻世界。
提供语音识别、语音合成等语音AI能力
依图语音开放平台为开发者提供语音识别、语音合成等语音AI能力,包括精准语音转文本、文本转语音合成、声纹识别、语音增强降噪等服务,支持不同场景下的语音交互应用开发。平台提供高效、灵活的语音AI能力接入方式,可轻松将语音技术应用于各类产品与业务场景。
AI故事生成器,让你写更多更好的故事
Story321 AI故事生成器是一个集成多个AI工具的一站式故事写作工具。它不仅可以生成故事,还可以提供灵感、编辑、保存、分享和分析数据。通过Story321,你可以找到写作灵感、积累写作知识、构建故事大纲、生成原创插图、保存、发布和导出故事,并通过分享获得收益。
将文本转换为自然流畅的语音输出
文本转语音技术是一种将文本信息转换为语音的技术,广泛应用于辅助阅读、语音助手、有声读物制作等领域。它通过模拟人类语音,提高了信息获取的便捷性,尤其对视力障碍者或在无法使用眼睛阅读的情况下非常有帮助。
国内专业的 AI 创作平台
Vega 是一款强大的在线创作工具,操作流程更加简化,能够更好更快地创作内容;几分钟内构思,快速生成高质量的画面;支持在线快速训练,自由定制;率先开放视频生成大模型,体验视频生成的功能;采用了全新的交互模式,是可以提高生产效率的新一代创作平台。
世界首款为医院儿童定制的AI故事创作、讲述和插画产品
Dream Kid是世界上第一个为医院环境中的儿童量身定制、创作、讲述和插画儿童图书的AI讲故事产品。每个故事都旨在帮助您的孩子理解、应对并在医疗旅程中找到勇气。
与任何大型语言模型进行快速的免提语音交互。
Open-LLM-VTuber 是一个开源项目,旨在通过语音与大型语言模型(LLM)进行交互,具有实时的Live2D面部捕捉和跨平台的长期记忆功能。该项目支持macOS、Windows和Linux平台,允许用户选择不同的语音识别和语音合成后端,以及自定义的长期记忆解决方案。它特别适合希望在不同平台上实现与AI进行自然语言对话的开发者和爱好者。
低延迟的实时语音交互API
Realtime API 是 OpenAI 推出的一款低延迟语音交互API,它允许开发者在应用程序中构建快速的语音到语音体验。该API支持自然语音到语音对话,并可处理中断,类似于ChatGPT的高级语音模式。它通过WebSocket连接,支持功能调用,使得语音助手能够响应用户请求,触发动作或引入新上下文。该API的推出,意味着开发者不再需要组合多个模型来构建语音体验,而是可以通过单一API调用实现自然对话体验。
© 2025 AIbase 备案号:闽ICP备08105208号-14