需求人群:
["开发者:对于使用Claude Code、Cursor等AI编程工具的开发者来说,ClickSay能帮助他们更高效地与AI沟通。通过自动捕获界面元素的相关信息,避免手动输入选择器、样式等内容,节省时间和精力,提高编程效率。", "Web设计师:Web设计师在进行界面设计和修改时,可能需要与开发团队或AI工具协作。ClickSay可以让他们通过语音快速反馈界面修改需求,同时AI能准确获取界面元素的详细信息,使修改更加精准。", "无障碍测试人员:ClickSay的无障碍审计功能可以帮助无障碍测试人员检测网页元素的可访问性问题,并将问题反馈给AI进行修复,提高网页的无障碍水平。"]
使用场景示例:
开发者在修改GitHub仪表盘页面的标题样式时,点击标题元素,说出“把这个标题变小,改成深蓝色,字体换成Inter”,ClickSay自动捕获相关信息并复制到Claude Code,AI快速完成修改。
Web设计师在设计一个React项目的界面时,通过Shift点击多个卡片元素,说“修复所有这些卡片的间距”,然后将提示粘贴到Cursor,AI根据完整上下文调整卡片间距。
无障碍测试人员在检查一个Angular应用的可访问性时,使用ClickSay检测元素的WCAG对比度等问题,将反馈信息发送给Replit中的AI,AI对存在的问题进行修复。
产品特色:
自动捕获上下文:ClickSay会自动捕获AI做出正确修改所需的一切信息,包括选择器、样式、HTML、截图和组件名称,将所有上下文整理在一处,让AI一次就做对。
语音优先工作流:采用语音优先的工作方式,点击元素时麦克风自动激活,实时捕获用户的反馈。用户无需打字、截图或复制选择器,像跟同事说话一样自然地表达需求即可。
直接发送到AI:本地中继能将提示直接发送到终端中的Claude Code,用户说话后AI就开始工作,无需手动粘贴和切换窗口。
扫描模式:支持Shift点击多个元素,用户可以给所有选中的元素一个反馈,如“修复所有这些卡片的间距”,方便快捷地处理多个元素的问题。
框架检测:自动识别React、Next js、Vue、Svelte和Angular组件,让AI在提示中获得组件名称和文件路径,更好地理解项目结构。
可配置输出:提供简单、标准、详细或完整等多种输出格式,还有单独的切换按钮,用户可以精确控制AI接收的上下文。
无障碍审计:检测每个点击元素的WCAG对比度、alt文本、ARIA和触摸目标问题,让AI也能修复无障碍问题,确保网页的可访问性。
使用教程:
1. 点击任意元素:按下Cmd + Shift + K,然后点击页面上的任何元素。ClickSay会捕获该元素的选择器、样式、HTML、截图和组件名称。
2. 说出你的反馈:麦克风自动启动,用户可以自然地说出修改需求,如“把这个变大”或“修复间距”。
3. 粘贴到AI工具:一个包含完整上下文的结构化提示会自动复制到剪贴板,用户将其粘贴到Claude Code、Codex、Cursor、Lovable、Replit或Bolt new等AI工具中,AI即可准确理解需求并进行修改。
浏览量:1
让应用通过语音与文本的转换实现智能交互。
Azure 认知服务语音是微软推出的一款语音识别与合成服务,支持超过100种语言和方言的语音转文本和文本转语音功能。它通过创建可处理特定术语、背景噪音和重音的自定义语音模型,提高听录的准确度。此外,该服务还支持实时语音转文本、语音翻译、文本转语音等功能,适用于多种商业场景,如字幕生成、通话后听录分析、视频翻译等。
提升网站AI语音交互和销售
Site Agent是一款AI语音助手产品,能够个性化地与访问网站的用户进行语音和文字对话,提升用户参与度并促进销售。它结合了最新的AI技术和类似人类对话的细腻触感,为每个客户互动带来价值。Site Agent提供个性化的对话和问答功能,帮助客户解决问题、获取信息和进行购买。它还具备智能推荐和语义理解功能,能够根据用户需求提供个性化建议。Site Agent的定价根据企业需求定制,提供免费试用和付费增值的选择。
智能编程助手,助力高效编程。
JoyCoder 是京东自主研发的智能编程助手,基于大语言模型,适配多种 IDE,提供代码预测、智能问答等功能。它能够提升开发人员的编程效率和代码质量,减少编程错误,降低修复问题的频率。该产品适合各种开发者使用,特别是在快速开发和测试需求中。随着智能编程的兴起,JoyCoder 为开发者提供了一个高效、流畅的编程环境,满足其多样化需求。产品定价方面,具体信息请联系售前顾问。
点击UI元素,语音反馈修改需求,自动捕获信息并粘贴到AI工具
ClickSay是一款Chrome扩展程序,专为使用Claude Code、Cursor等AI编程工具的开发者打造。它能让开发者通过点击UI元素、语音反馈的方式向AI传达修改需求,自动捕获选择器、样式、截图和组件名等信息,为AI提供完整上下文,提高编程效率。产品具有隐私优先的特点,数据不会离开浏览器,无需注册登录。定价方面,支持免费试用,有免费版和Pro版,免费版可进行每月5次捕获等基础操作,Pro版则提供无限捕获、框架检测等高级功能,7美元/月或45美元/年。
提供语音识别、语音合成等语音AI能力
依图语音开放平台为开发者提供语音识别、语音合成等语音AI能力,包括精准语音转文本、文本转语音合成、声纹识别、语音增强降噪等服务,支持不同场景下的语音交互应用开发。平台提供高效、灵活的语音AI能力接入方式,可轻松将语音技术应用于各类产品与业务场景。
WhatsApp语音助手,与ChatGPT通过语音信息交互
GabbyGPT是一个通过WhatsApp实现的AI语音助手,用户可以方便地通过语音信息与ChatGPT进行交互。它可以回答问题、提供信息、执行任务等。GabbyGPT的优势在于其简便易用的操作方式和智能的语音识别功能。定价方面,用户可以免费使用基本功能,或选择订阅高级功能的付费套餐。GabbyGPT适用于个人用户和商业用户,能够满足不同场景的需求。
AI模型在线编程和交互学习平台
Promptclub是一个AI模型在线编程和交互学习平台。它提供了多个AI模型供开发者使用,包括gpt-3.5-turbo、gpt-4-32k、gpt-4等。用户可以在Promptclub上编写代码并与AI模型进行交互,实时获取模型的响应。Promptclub还支持保存和加载代码,方便用户进行项目开发和测试。平台提供了丰富的设置选项,如温度、最大标记数、Top P等,用户可以根据需求自定义模型的行为。无论是初学者还是专业开发者,Promptclub都是一个强大而易用的编程学习工具。
Vibe Coder 是一款开源的 VS Code 扩展,用于探索基于语音的 AI 编程体验。
Vibe Coder 是由 Deepgram 开发的一款开源 VS Code 扩展,旨在探索语音驱动编程的可能性。它利用语音识别技术,让用户通过语音指令与 AI 编程助手进行交互,快速将想法转化为代码原型。这种创新的编程方式被称为‘vibe coding’,旨在提高编程效率并改变未来软件开发的方式。Vibe Coder 目前处于实验阶段,Deepgram 希望通过社区反馈不断完善该工具。
使用自得语音技术,创造属于你的角色
自得语音技术可通过简单的步骤创造出属于你的角色。类似GPT,可生成与真人无异的语音片段,在情感、音色和语速等方面与真人一致。自得语音支持快速定制角色,只需要上传一段语音即可立即生成属于你的语音角色。无需下载软件,可在浏览器上完成语音生成。同时提供API接口,方便开发者集成到自己的产品中。商用用户可享受7x24小时的技术支持。
Azure AI Studio提供的语音服务
Azure AI Studio是微软Azure提供的一套人工智能服务,其中包括语音服务。这些服务可能包括语音识别、语音合成、语音翻译等功能,帮助开发者在他们的应用程序中集成语音相关的智能功能。
实时语音提取智能耳机交互系统
LookOnceToHear 是一种创新的智能耳机交互系统,允许用户通过简单的视觉识别来选择想要听到的目标说话者。这项技术在 CHI 2024 上获得了最佳论文荣誉提名。它通过合成音频混合、头相关传输函数(HRTFs)和双耳房间脉冲响应(BRIRs)来实现实时语音提取,为用户提供了一种新颖的交互方式。
Orate 是一个专注于语音的 AI 工具包,支持文本转语音、语音转文本等功能。
Orate 是一个强大的 AI 语音工具包,能够将文本转换为逼真的语音,也可以将语音转换为文本,支持多种主流 AI 服务提供商。其主要优点是提供了一个统一的 API 接口,方便开发者快速集成和使用。该工具包适用于需要语音交互功能的应用开发,例如智能语音助手、语音播报系统等。其价格和具体定位尚未明确,但从其功能和社区反馈来看,具有较高的实用性和开发价值。
基于语音交互的人工智能开放平台
科大讯飞推出的移动互联网智能交互平台,为开发者免费提供:涵盖语音能力增强型SDK,一站式人机智能语音交互解决方案,专业全面的移动应用分析。通过平台能够打造语音助手、智能外呼、智能车载等场景应用。
语音交互人工智能助手
魔撰写作是一款基于语音交互和软硬结合的人工智能助手,可以帮助用户完成日常生活中的各种任务,包括语音助手、智能家居控制、语音翻译、语音记事本等功能。小问智能的优势在于准确率高、响应速度快、支持多语言、可定制化等特点。定价方面,提供免费版和付费版两种选择,付费版功能更加丰富,价格合理。小问智能的定位是成为用户日常生活中的智能助手。
语音交互式语言学习App
Natulang是一个语音交互式的语言学习App。它利用语音生成和识别技术,让用户可以通过大声朗读对话来学习语言。相比其他注重打字的语言学习App,Natulang更注重语音交流,让用户培养语言表达的自信心。
语音编程助手,提高开发效率
Voqal革新了开发者与集成开发环境(IDE)的互动方式,将其从图形用户界面(GUI)转变为语音用户界面(VUI),使程序员可以用语音进行软件开发。Voqal不仅理解您说的话,更重要的是理解您说的话在软件开发上的含义。它让开发者能够用最少甚至零打字的方式编写干净、简洁的代码。此外,Voqal还提供“语音意图”,为开发者提供了语音替代键盘快捷键的选择。它还具有无限召回功能,可根据您的偏好进行记忆,并可配置个性化的助手,轻松导航和管理项目生态系统,实现语音控制调试,并使用Picovoice进行本地转录,确保您的语音永远不离开计算机。Voqal还支持与OpenAI和其他AI提供商集成,提供高效的语音编程助手。个人每月6美元,组织每月10美元,可免费试用。
语音转文字,支持实时语音识别、录音文件识别等
腾讯云语音识别(ASR)为开发者提供语音转文字服务的最佳体验。语音识别服务具备识别准确率高、接入便捷、性能稳定等特点。腾讯云语音识别服务开放实时语音识别、一句话识别和录音文件识别三种服务形式,满足不同类型开发者需求。技术先进,性价比高,多语种支持,适用于客服、会议、法庭等多场景。
低延迟的实时语音交互API
Realtime API 是 OpenAI 推出的一款低延迟语音交互API,它允许开发者在应用程序中构建快速的语音到语音体验。该API支持自然语音到语音对话,并可处理中断,类似于ChatGPT的高级语音模式。它通过WebSocket连接,支持功能调用,使得语音助手能够响应用户请求,触发动作或引入新上下文。该API的推出,意味着开发者不再需要组合多个模型来构建语音体验,而是可以通过单一API调用实现自然对话体验。
与任何大型语言模型进行快速的免提语音交互。
Open-LLM-VTuber 是一个开源项目,旨在通过语音与大型语言模型(LLM)进行交互,具有实时的Live2D面部捕捉和跨平台的长期记忆功能。该项目支持macOS、Windows和Linux平台,允许用户选择不同的语音识别和语音合成后端,以及自定义的长期记忆解决方案。它特别适合希望在不同平台上实现与AI进行自然语言对话的开发者和爱好者。
将文本转换为逼真语音的在线工具
该产品是一个先进的在线文字转语音工具,使用人工智能技术将文本转换为自然逼真的语音。它支持多种语言和语音风格,适用于广告、视频旁白、有声书制作等场景,增强了内容的可访问性和吸引力。产品背景信息显示,它为数字营销人员、内容创作者、有声书作者和教育工作者提供了极大的便利。
改写、续写、生成PPT,数据处理,语音交互,WPS AI助你智能办公
WPS AI是一款智能办公助手,能够帮助用户完成文本改写、续写、生成PPT、数据处理、语音交互等多项功能。WPS AI的优势在于能够快速提高用户的工作效率,让用户更轻松地完成各种办公任务。WPS AI的定价分为免费版和付费版,用户可以根据自己的需求选择不同的版本。WPS AI的定位是智能办公领域的领先品牌。
AI智能辅助编程工具
GitHub Copilot是一款AI智能辅助编程工具,通过与您直接在编辑器中协作,为您提供整行代码或整个函数的建议。它能够帮助您编写更好的代码,提高开发效率。GitHub Copilot已被广泛采用并获得了全球的信赖。它支持多种编程语言,包括JavaScript、Python、TypeScript等。GitHub Copilot提供了丰富的功能,如自动补全、代码生成、语法检查等,帮助您更轻松地完成编程任务。GitHub Copilot还提供了各种使用场景,包括开发新项目、改善现有代码、解决编程难题等。定价方面,请参考官方网站获取详细信息。
发现最好的AI工具,提供全面的AI服务和资源。
AI工具导航是一个为AI从业者和对人工智能感兴趣的用户提供AI工具和资源的平台。它聚集了各种AI工具,包括AI聊天、自然语言处理、绘画和图形处理、机器学习、视频音频制作等,旨在帮助用户提高工作效率和创造力。
实时语音交互数字人,支持端到端语音方案
VideoChat是一个实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。用户可以自定义数字人的形象和音色,支持音色克隆,无需训练,首包延迟低至3秒。该项目利用了最新的人工智能技术,包括自动语音识别(ASR)、大型语言模型(LLM)、端到端多模态大型语言模型(MLLM)、文本到语音(TTS)和说话头生成(THG),为用户提供了一个高度定制化和低延迟的交互体验。
AI助手,加速编程学习
WisBot是一个在Jupyter Notebook中与数据交互的AI助手。它可以识别当前的Notebook,理解所有的代码和数据,并执行从探索性数据分析到高级机器学习建模的任务。WisBot可以回答有关代码和数据的任何问题,执行代码并自动化任务。通过WisBot,您可以在Jupyter Notebook中学习Python和数据科学,并获得个人助手的支持。注册并解锁免费试用。
专为华人企业设计的AI工具导航网站
AI工具集是一个集合了多种AI技术工具的平台,旨在帮助企业通过使用人工智能技术提升工作效率和竞争力。该平台覆盖了从视频、音频到SEO、写作、翻译等多种类型的AI工具,满足不同企业在不同业务场景下的需求。AI工具集的背景是基于人工智能技术在商业领域的广泛应用和企业对于提高效率的迫切需求。
AI助手,通过语音和动画指导用户,提升网站交互体验。
Speek是一款AI驱动的助手,通过语音和动画鼠标指针指导用户在网站上的操作,帮助解答问题、引导用户了解网站功能,并简化购买决策。它通过提供实时帮助,结合支持和引导,快速安装并立即开始工作,改善用户体验,提升销售,并减少客户支持查询。
© 2026 AIbase 备案号:闽ICP备08105208号-14