需求人群:
"适用于在聊天中上传图片进行识别、实现多轮对话以及获取Gemini的实时回应。"
使用场景示例:
启动ChatGemini网站
在聊天中上传图片进行识别
使用逐字输出功能查看Gemini的实时回应
产品特色:
适配移动端
多轮聊天
附件识图
逐字输出回应
聊天导出HTML
聊天导出PDF
浏览量:113
最新流量情况
月访问量
4.85m
平均访问时长
00:06:25
每次访问页数
6.08
跳出率
35.86%
流量来源
直接访问
52.62%
自然搜索
32.72%
邮件
0.05%
外链引荐
12.34%
社交媒体
2.17%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
12.55%
德国
3.84%
印度
9.38%
俄罗斯
4.61%
美国
18.64%
基于Google Gemini的网页客户端,支持上传图片进行识别。
ChatGemini是一个基于Google Gemini的网页客户端,对标ChatGPT 3.5,使用逻辑同ChatGPT 3.5,同时支持在聊天中上传图片,自动调用Gemini-Pro-Vision模型进行识图。用户可以自定义Gemini API服务器地址,将项目部署至支持PHP的服务器。
移动SSH客户端
La Terminal是一款为iPhone和iPad的移动SSH客户端。它提供了完全本地化的、触控优化的命令行体验。La Terminal支持安全的私钥存储、命令搜索、资源监视、美观的界面和文件管理等功能。
无限分支的 GPT 客户端
章节 AI 是一款基于 OpenAI 的 GPT 模型的聊天客户端,它可以无限分支,帮助用户构建复杂的项目,并且能够轻松导航回原始聊天上下文。该产品适用于写作、开发等领域,用户可以创建无限数量的项目,并进行分支和版本管理。项目数据完全保存在用户的浏览器中,保证隐私和安全。ChaptersAI的定价为每月 9 美元,加上 OpenAI API 使用费用。
桌面客户端,语音翻译和语音合成
SpeechLab是一款桌面客户端,提供语音翻译和语音合成功能。它能够帮助用户进行语音翻译,将语言转换成其他语言,同时还能够合成语音,将文字转换成自然流畅的语音。SpeechLab的优势在于其高质量的语音合成技术,可以生成与人类声音相似的合成语音。SpeechLab的定价为免费试用和付费订阅两种方式,具体定价可在官方网站上查看。SpeechLab定位于帮助用户跨越语言障碍,使内容在全球范围内更容易获得。
第三方ChatGPT客户端:提升ChatGPT用户体验
ChatBoost是一个第三方ChatGPT客户端,无需登录或支付月费。我们更新了应用,现在支持OpenAI API KEY和Azure OpenAI。除了基本的聊天功能,我们还提供了一些独特的功能,包括更快的响应、AI键盘扩展、API使用统计、支持多个模型、无需登录或支付月费、本地存储聊天记录、支持Prompt库、自定义Prompt等。我们非常重视用户的反馈和建议,如果在使用过程中遇到任何问题或有任何改进的想法,请随时联系我们。
Windows/macOS GPT 客户端
Cherry Studio 是一款适用于 Windows 和 macOS 的 GPT 客户端软件,支持 Intel 和 Apple Silicon 架构。它通过提供高效的 GPT 交互体验,帮助用户在多种场景下提升工作效率。
强大的客户端JavaScript库,用于ChatGPT
chatgpt.js是一个强大的客户端JavaScript库,用于ChatGPT。它提供了一个简单的界面,让用户可以轻松地与ChatGPT进行对话。该库可在浏览器中直接使用,无需服务器端的支持。它具有高度可定制的界面和功能,可用于构建各种聊天机器人应用。ChatGPT.js可以轻松集成到任何网站或应用程序中,帮助用户实现智能对话交互。
AI聊天客户端,实现模型上下文协议(MCP)
ChatMCP是一个AI聊天客户端,它实现了模型上下文协议(MCP),允许用户使用任何大型语言模型(LLM)与MCP服务器进行交互。这个项目的主要优点在于它的灵活性和开放性,用户可以根据自己的需求选择不同的LLM模型进行聊天,并且可以通过MCP服务器市场安装不同的服务器来与不同的数据进行交互。ChatMCP提供了一个用户友好的界面,支持自动安装MCP服务器、SSE MCP传输支持、自动选择MCP服务器、聊天历史记录等功能。
一个能够分支到无限的GPT客户端
ChaptersAI是一个基于OpenAI的GPT的聊天客户端,它可以将任何段落分支到一个独立的聊天窗口。它适用于构建复杂的项目,可以深入到组成部分的细节,并能轻松返回到原始聊天上下文。ChaptersAI还为作家和开发人员提供了便利,可以创建新版本的聊天窗口,并能够在整个项目中灵活尝试新的想法。此外,ChaptersAI将数据完全存储在本地浏览器中,不会发送到服务器,提供了更高的隐私和安全性。
TypeScript客户端,用于OpenAI的实时语音API。
openai-realtime-api是一个TypeScript客户端,用于与OpenAI的实时语音API进行交互。它提供了强类型的特性,并且是OpenAI官方JavaScript版本的完美替代品。该客户端修复了许多小错误和不一致性,并且完全兼容官方和非官方事件。它支持Node.js、浏览器、Deno、Bun、CF workers等多种环境,并且已发布到NPM。该技术的重要性在于它能够为开发者提供一种更安全、更便捷的方式来集成和使用OpenAI的实时语音功能,特别是在需要处理大量数据和请求时。
用户友好的Web数据库客户端,简化数据库访问,保障数据安全。
hoop.dev是一个现代的、基于Web的数据库客户端,旨在简化数据库访问流程,同时不牺牲安全性。它通过AI数据掩码技术保护个人可识别信息,支持从浏览器即时登录访问数据库,无需安装等待。此外,它还提供实时更新和Slack集成,确保团队成员间的信息同步和安全。hoop.dev支持将脚本转化为无代码应用,通过链接Git仓库、嵌入变量来实现。它还提供了多种快速启动选项,如Kubernetes、Docker、Unix等,适用于金融科技、健康科技等高度监管的行业。
强大的网页抓取能力,支持多种客户端。
Firecrawl MCP Server 是一款集成了强大网页抓取功能的插件,支持多种 LLM 客户端如 Cursor 和 Claude。它能高效地抓取、搜索和提取网页内容,并提供自动重试及流量限制等功能,适合开发者和研究人员使用。该产品具有高度的灵活性与可扩展性,可用于批量抓取和深度研究。
ComfyUI Desktop V1是一款提供一键安装和全新界面的桌面客户端。
ComfyUI Desktop V1是一个为Windows和macOS设计的桌面客户端,它提供了一键安装的便利性,并拥有全新的用户界面。用户可以通过加入等待名单来获得早期访问权限。这款软件的主要优点在于它的易用性和现代化的界面设计,旨在提高用户的工作效率。ComfyUI Desktop V1由Comfy Org组织开发,是一个开源项目,可以在GitHub上找到其源代码。
ChatGPT的早期版本,专为Plus、团队、企业和教育用户设计。
ChatGPT是由OpenAI开发的人工智能聊天机器人,它通过使用最新的模型改进,包括访问OpenAI o1-preview,即最新和最智能的模型,为用户提供即时答案、文件和照片的聊天、多文档的总结和分析、专业建议以及创意灵感等功能。这个早期版本目前只对ChatGPT Plus、团队、企业和教育用户开放,预计今年晚些时候将向所有用户推出完整体验。
谷歌多模态AI模型Gemini,支持文本和图像的组合推理
Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态,成为迄今为止最强大的AI系统之一。它有三个不同规模的版本,可满足从边缘计算到云计算的各种需求。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。
将OpenAI协议转换为Google Gemini Pro协议
Gemini-OpenAI-Proxy是一个代理软件。它旨在将OpenAI API协议调用转换为Google Gemini Pro协议,以便使用OpenAI协议的软件可以在不改变感知的情况下使用Gemini Pro模型。如果您有兴趣使用Google Gemini但不想修改软件,Gemini-OpenAI-Proxy是一个很好的选择。它允许您轻松地集成Google Gemini的强大功能,而无需进行任何复杂的开发工作。
ComfyUI的API服务端,用于为ComfyUI客户端提供后端支持
ComfyUI-APISR是ComfyUI项目的API服务端部分,它为ComfyUI客户端应用提供必要的后端支持。ComfyUI是一个旨在提供舒适用户体验的用户界面框架。
一个可以方便使用 Google Gemini Pro 2.0 的移动客户端,支持实时对话和多AI代理。
Gemini Pro Chatbot 是一款基于 Google Gemini Pro AI 模型开发的移动聊天应用。它通过 React Native 和 Expo 构建,支持实时流式响应、代码高亮、消息持久化存储等功能。该应用允许用户通过自定义系统提示词和创建不同个性的 AI 代理来优化聊天体验。其主要优点包括强大的语言理解能力、灵活的定制化选项以及跨平台支持,适合希望高效利用 AI 进行对话和内容创作的用户。
利用Gemini API生成小型应用
Gemini Coder是一个基于Gemini API的项目,旨在通过一个简单的提示生成小型应用。该项目完全基于llamacoder,并使用了Next.js、Tailwind等技术栈。它允许用户快速创建应用,并且可以本地运行和测试。作为一个个人项目,它并非Google官方项目,但展示了利用先进API进行应用开发的潜力。
Gemini API的指南和示例集合
Gemini API Cookbook是一个包含Gemini API使用指南和示例的集合,旨在帮助开发者快速上手并使用Gemini API。这些示例大多数是用Python编写的Colab Notebooks,可以直接在Google Colab中打开或下载到本地环境中运行。
一个基于Gemini 2.0 Flash模型的Perplexity风格AI搜索引擎。
Gemini-Search是一个模仿Perplexity的AI搜索引擎,它利用了Google的Gemini 2.0 Flash模型和Google搜索API,能够提供实时的网络搜索结果和引用,帮助用户快速获取准确的信息。该产品的主要优点在于其快速的响应时间和清晰的用户界面,使其在信息检索方面具有很高的效率。该产品适用于需要快速获取信息的用户,如研究人员、学生和专业人士。产品目前是免费的,适合各种规模的用户使用。
即时聊天工具
ChatGPT桌面版是一款简单而时尚的应用,直接将ChatGPT带到您的桌面,让您轻松高效地进行沟通。具备快速访问和高效沟通的特点,让您的工作更加专注、有序,提升沟通效率。可自定义界面、提供增强的隐私和安全措施,并支持多任务窗口。立即下载ChatGPT桌面版,解锁更高效、便捷的沟通体验。
桌面端 AI 英语词源词典,内置四六级、托福词汇表的单词信息。
SSShooter/en-etymology-dict 是一款桌面端 AI 英语词源词典,旨在帮助用户更好地理解和记忆英语单词。产品通过 AI 技术生成单词的词源、使用场景、同义词、反义词、形似词和派生词等信息,为用户提供全面的单词学习体验。该产品适合英语学习者,尤其是需要备考四六级、托福等英语考试的学生。产品目前是免费的,定位为教育领域的辅助学习工具。
将 Google Gemini 引入到 ComfyUI 中,用于生成提示词和对话
ComfyUI-Gemini 是一款将 Google Gemini 模型集成到 ComfyUI 中的插件。用户可以利用 Gemini 模型生成提示词、与之对话聊天,并且支持多模态输入如图像。该插件免费使用,提供隐式和显式两种 API Key 使用方式,适合个人和团队使用。
语音转文字,支持实时语音识别、录音文件识别等
腾讯云语音识别(ASR)为开发者提供语音转文字服务的最佳体验。语音识别服务具备识别准确率高、接入便捷、性能稳定等特点。腾讯云语音识别服务开放实时语音识别、一句话识别和录音文件识别三种服务形式,满足不同类型开发者需求。技术先进,性价比高,多语种支持,适用于客服、会议、法庭等多场景。
高效聊天工具
IntelliBar是一款高效聊天工具,为Mac用户提供了一个优雅的ChatGPT客户端。它可以从任何应用程序中快速打开,支持从选定的文本或文件中提取信息,并提供了智能的自动补全和提示库功能。IntelliBar还支持快捷键操作和多个GPT模型,无需订阅即可使用。
端到端中英语音对话模型
GLM-4-Voice是由清华大学团队开发的端到端语音模型,能够直接理解和生成中英文语音,进行实时语音对话。它通过先进的语音识别和合成技术,实现了语音到文本再到语音的无缝转换,具备低延迟和高智商的对话能力。该模型在语音模态下的智商和合成表现力上进行了优化,适用于需要实时语音交互的场景。
© 2025 AIbase 备案号:闽ICP备08105208号-14