需求人群:
"该产品适合需要快速从网页内容中提取信息的用户,如开发者、研究人员和学生。它可以帮助用户在浏览网页时快速获取问题答案,提高工作效率。对于需要对大量网页内容进行索引和查询的用户,Site RAG 提供了强大的功能支持。"
使用场景示例:
用户在浏览技术文档时,通过 Site RAG 快速查询文档中的特定技术问题。
研究人员在浏览学术网站时,使用 Site RAG 对整个网站内容进行索引,后续进行深入研究。
学生在学习过程中,利用 Site RAG 对课程相关网页进行索引,方便复习和查询。
产品特色:
在当前页面进行一次性查询,快速获取问题答案。
将当前页面内容索引到向量存储中,后续可进行 RAG 查询。
支持对整个网站进行索引,将文档持久化存储以便后续查询。
完全本地运行,所有数据存储在浏览器中,确保隐私安全。
支持连接本地运行的 Ollama 实例,进行本地 LLM 推理。
使用教程:
1. 克隆仓库:`git clone https://github.com/bracesproul/site-rag.git`
2. 进入项目目录:`cd site-rag`
3. 安装依赖:`yarn install`
4. 构建项目:`yarn build`
5. 在 Chrome 浏览器中加载扩展:访问 chrome://extensions/,点击 'Load unpacked',选择 `dist` 目录。
6. 打开扩展并进入设置页面,添加 API 密钥和其他配置。
7. 返回聊天视图,输入问题并获取答案。
浏览量:5
最新流量情况
月访问量
5.03m
平均访问时长
00:06:29
每次访问页数
5.88
跳出率
37.10%
流量来源
直接访问
52.07%
自然搜索
32.84%
邮件
0.04%
外链引荐
12.88%
社交媒体
2.04%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
12.85%
德国
3.90%
印度
9.41%
俄罗斯
4.16%
美国
18.95%
一个用于在网站上提问的Chrome扩展程序,支持本地运行和向量存储。
Site RAG 是一款 Chrome 扩展程序,旨在通过自然语言处理技术帮助用户在浏览网页时快速获取问题答案。它支持将当前页面内容作为上下文进行查询,还能将整个网站内容索引到向量数据库中,以便后续进行检索增强生成(RAG)。该产品完全在本地浏览器运行,确保用户数据安全,同时支持连接本地运行的 Ollama 实例进行推理。它主要面向需要快速从网页内容中提取信息的用户,如开发者、研究人员和学生。目前该产品免费提供,适合希望在浏览网页时获得即时帮助的用户。
视频分析工具,结合Llama视觉模型和OpenAI Whisper进行本地视频描述生成。
video-analyzer是一个视频分析工具,它结合了Llama的11B视觉模型和OpenAI的Whisper模型,通过提取关键帧、将它们输入视觉模型以获取细节,并结合每个帧的细节和可用的转录内容来描述视频中发生的事情。这个工具代表了计算机视觉、音频转录和自然语言处理的结合,能够生成视频内容的详细描述。它的主要优点包括完全本地运行无需云服务或API密钥、智能提取视频关键帧、使用OpenAI的Whisper进行高质量音频转录、使用Ollama和Llama3.2 11B视觉模型进行帧分析,以及生成自然语言描述的视频内容。
AI 编码助理,提升软件开发和交付速度
Gemini Code Assist 是 Google Cloud 提供的一款 AI 编码助理,它通过生成式 AI 协助、企业安全和隐私保护机制,帮助提升软件开发和交付速度。该产品利用数十亿行开源代码、安全数据以及 Google Cloud 文档和示例代码进行微调,为开发者在其 IDE 和 Google Cloud 服务中提供代码补全、代码生成、自然语言聊天等功能。它支持多种编程语言,并集成了 Google Cloud 的多种服务,如 Firebase、Colab Enterprise、Databases、BigQuery、Apigee 和 Application Integration。
基于Qwen>=2.0的Agent框架和应用,支持函数调用、代码解释器、RAG和Chrome扩展。
Qwen-Agent是一个基于Qwen>=2.0构建的Agent框架,它具备指令遵循、工具使用、规划和记忆能力。该框架提供了如浏览器助手、代码解释器和自定义助手等示例应用。Qwen-Agent的主要优点包括其高度的可扩展性和模块化设计,允许开发者根据需要集成不同的工具和功能。产品背景信息显示,Qwen-Agent旨在为开发者提供一个强大的工具集,以构建和部署基于大型语言模型的应用程序。Qwen-Agent在GitHub上开源,允许社区贡献和协作。
快速、准确的生产级RAG管道
Vectorize是一个专注于将非结构化数据转化为优化的向量搜索索引的平台,专为检索增强生成(RAG)而设计。它通过连接内容管理系统、文件系统、CRM、协作工具等多种数据源,帮助用户创建提高生产力的辅助系统和创新的客户体验。Vectorize的主要优点包括易于使用、快速部署和高精度的搜索结果,适合需要处理大量数据并希望快速实现AI应用的企业。
在与AI共享之前捕获并删除敏感数据的Chrome扩展
Serendipity是一款Chrome浏览器扩展,旨在保护用户的敏感数据不被意外分享给AI聊天机器人。它能够检测超过25种类型的敏感信息,包括信用卡信息和API密钥。Serendipity强调用户隐私,承诺不会将用户数据上传至服务器,确保了数据的安全性。在AI技术日益普及的今天,Serendipity为用户在享受AI带来的便利的同时,提供了额外的安全保障。
使用AI技术在任何电商平台虚拟试穿衣物。
Visual Try-On Chrome Extension是一款Chrome浏览器插件,利用人工智能图像处理技术,让用户能够在任何电子商务网站上虚拟试穿衣物。该插件通过OpenAI GPT-4捕捉产品主图,上传用户图片至Cloudinary,使用Hugging Face上的Kolors模型进行AI处理,并将结果存储在浏览器缓存中以提高可用性。它保护用户隐私,不将个人数据或图片发送至服务器,仅在Hugging Face进行AI处理时例外。
革命性的检索增强生成系统技术集合。
RAG_Techniques 是一个专注于检索增强生成(Retrieval-Augmented Generation, RAG)系统的技术集合,旨在提升系统的准确性、效率和上下文丰富性。它提供了一个前沿技术的中心,通过社区贡献和协作环境,推动RAG技术的发展和创新。
保护你的数据,避免被大型语言模型获取。
AI Eraser是一款免费的Chrome扩展程序,旨在帮助用户从ChatGPT的提示中删除个人数据,如社会安全号码、API密钥、电子邮件地址等。它完全在设备上运行,不需要将数据发送到任何地方,保护用户隐私,确保使用体验。
一个用于增强LLMs检索增强生成任务的框架
RAGFoundry是一个库,旨在通过在特别创建的RAG增强数据集上微调模型,提高大型语言模型(LLMs)使用外部信息的能力。该库通过参数高效微调(PEFT)帮助用户轻松训练模型,并使用RAG特定指标衡量性能提升。它具有模块化设计,工作流程可通过配置文件自定义。
智能隐私优先的邮件写作助手
Proton Scribe是一个集成在Proton Mail中的智能写作助手,它以隐私优先,可以帮助用户撰写和润色邮件草稿,节省撰写邮件的时间,同时保护最敏感、最有价值的数据。Proton Scribe设计为本地运行,确保用户数据不会离开设备。Proton一直致力于研究保护隐私的AI技术,并在2023年推出了Proton Sentinel,这是第一个利用AI提供增强账户保护的功能。Proton Scribe也是开源的,可以进行独立的安全和隐私审计。
一站式RAG搜索SDK
Korvus是一个基于Postgres构建的搜索SDK,它将整个RAG(检索增强生成)流程统一到单一的数据库查询中。它提供了高性能、可定制的搜索能力,同时最小化了基础设施的考虑。Korvus利用PostgresML的pgml扩展和pgvector扩展,将RAG流程压缩在Postgres内部。它支持多语言SDK,包括Python、JavaScript、Rust和C,允许开发者无缝集成到现有的技术栈中。
掌握RAG技术,提升AI生成内容的准确性和相关性。
Retrieval-Augmented Generation (RAG) 是一种前沿技术,通过整合外部知识源来增强生成模型的能力,提高生成内容的质量和可靠性。LangChain是一个强大的框架,专为构建和部署稳健的语言模型应用而设计。本教程系列将提供全面的、分步骤的指南,帮助您使用LangChain实现RAG,从基础RAG流程的介绍开始,逐步深入到查询转换、文档嵌入、路由机制、查询构建、索引策略、检索技术以及生成阶段,最终将所有概念整合到一个实际场景中,展示RAG的强大和灵活性。
基于RAG框架的可靠输入和可信输出系统
GoMate是一个基于Retrieval-Augmented Generation (RAG)框架的模型,专注于提供可靠输入和可信输出。它通过结合检索和生成技术,提高信息检索和文本生成的准确性和可靠性。GoMate适用于需要高效、准确信息处理的领域,如自然语言处理、知识问答等。
在本地使用 LLMs 根据自然语言提示生成音乐。
MusicGPT 是一款允许在任何平台上以高性能方式在本地运行最新音乐生成 AI 模型的应用程序。它支持文本条件音乐生成、旋律条件音乐生成以及不确定长度 / 无限音乐流。产品优势在于无需安装重型依赖如 Python 或机器学习框架,能够本地运行 AI 模型,提供自然语言提示生成音乐的功能。
允许用户直接在浏览器本地运行Phi-3模型的AI工具。
Phi-3 WebGPU是一款结合了Transformers.js和onnxruntime-web的AI模型,它利用WebGPU加速技术,提供超过20t/s的处理速度,并且所有数据处理在本地完成,确保用户隐私安全。尽管在中文回答上存在一些不足,但其在浏览器中提供的AI模型运行能力仍然值得关注。
Chrome扩展程序,可将ChatGPT对话一键导出为Markdown格式并迁移到DeepSeek。
GPTSeek是一款专为提升用户工作效率而设计的Chrome扩展程序。它能够将ChatGPT中的对话内容快速导出为Markdown格式,并将其迁移到DeepSeek平台。这种功能对于需要在不同平台之间迁移和整理对话内容的用户来说非常实用。它不仅节省了手动复制粘贴的时间,还能保持内容的格式和结构,方便用户在DeepSeek中进一步处理和使用。此外,GPTSeek的开发背景是基于用户对跨平台数据迁移的需求,其目标是提供一种简单、高效且无缝的解决方案。目前,该产品以免费的形式提供给用户,旨在帮助更多人提升工作效率。
AI原生的商业智能平台,通过自然语言生成数据可视化和仪表板
Basedash是一个AI原生的商业智能平台,它通过自然语言处理技术,帮助用户快速生成数据可视化图表和仪表板。该平台无需用户编写SQL代码,即可从550多个数据源中提取数据,并生成直观的图表。Basedash的主要优点是其强大的AI驱动功能,能够理解用户的自然语言需求,自动调整和优化数据查询。它适用于各种规模的企业,帮助他们快速获取业务洞察。目前,Basedash处于Beta阶段,用户可以免费试用。
RAG-FiT是一个用于提升LLMs利用外部信息能力的库,通过特别创建的RAG增强数据集对模型进行微调。
RAG-FiT是一个强大的工具,旨在通过检索增强生成(RAG)技术提升大型语言模型(LLMs)的能力。它通过创建专门的RAG增强数据集,帮助模型更好地利用外部信息。该库支持从数据准备到模型训练、推理和评估的全流程操作。其主要优点包括模块化设计、可定制化工作流以及对多种RAG配置的支持。RAG-FiT基于开源许可,适合研究人员和开发者进行快速原型开发和实验。
s1是一个基于Qwen2.5-32B-Instruct微调的推理模型,仅用1000个样本进行训练。
s1是一个推理模型,专注于通过少量样本实现高效的文本生成能力。它通过预算强制技术在测试时进行扩展,能够匹配o1-preview的性能。该模型由Niklas Muennighoff等人开发,相关研究发表在arXiv上。模型使用Safetensors技术,具有328亿参数,支持文本生成任务。其主要优点是能够通过少量样本实现高质量的推理,适合需要高效文本生成的场景。
支持100万Token上下文的开源Qwen模型,适用于长序列处理任务
Qwen2.5-1M 是一款开源的人工智能语言模型,专为处理长序列任务而设计,支持最多100万Token的上下文长度。该模型通过创新的训练方法和技术优化,显著提升了长序列处理的性能和效率。它在长上下文任务中表现出色,同时保持了短文本任务的性能,是现有长上下文模型的优秀开源替代。该模型适用于需要处理大量文本数据的场景,如文档分析、信息检索等,能够为开发者提供强大的语言处理能力。
Qwen2.5-Max是一个大规模的Mixture-of-Expert (MoE)模型,致力于提升模型智能。
Qwen2.5-Max是一个大规模的Mixture-of-Expert (MoE)模型,经过超过20万亿tokens的预训练和监督微调与人类反馈强化学习的后训练。它在多个基准测试中表现优异,展示了强大的知识和编码能力。该模型通过阿里巴巴云提供API接口,支持开发者在各种应用场景中使用。其主要优点包括强大的性能、灵活的部署方式和高效的训练技术,旨在为人工智能领域提供更智能的解决方案。
DeepSeek是一个智能聊天助手,提供高效的人工智能对话服务。
DeepSeek是一个基于人工智能技术的智能聊天助手,旨在通过自然语言处理技术为用户提供高效、智能的对话体验。它能够理解用户的问题并提供准确的回答,适用于多种场景,包括日常对话、信息查询和问题解答。DeepSeek的核心优势在于其强大的语言理解和生成能力,能够为用户提供流畅的交互体验。该产品目前以网站形式提供服务,适合需要快速获取信息和进行智能对话的用户。
一款支持本地AI运行及通过OpenRouter连接多种AI模型的移动应用。
Apollo AI是专注隐私保护与本地运行的聊天应用,可本地运行小语言模型或连OpenRouter,保护隐私,售价5.99美元,定位高端隐私工具。
Llamao 是一款注重隐私的离线版 ChatGPT 替代品,可在移动设备上使用。
Llamao 是一款基于开源 LLM 模型的离线 AI 助手,专注于保护用户隐私。它运行在本地设备上,无需联网即可使用,适合对隐私和数据安全有较高要求的用户。其主要优点是完全离线、数据不外泄、且提供智能写作、问题解决等多功能支持。产品目前提供免费基础版本,高级功能可付费解锁。
本地运行的人工智能代理,无缝自动化工程任务。
Codename Goose 是一款本地运行的人工智能代理工具,旨在帮助开发者高效完成工程任务。它强调开源和本地运行,确保用户对任务执行有完全控制权。通过连接外部服务器或API,Goose 可以根据用户需求进行扩展,实现复杂任务的自动化处理,从而让开发者专注于更重要的工作。Goose 的开源特性鼓励开发者参与贡献和创新,其本地运行的模式保障了数据隐私和任务执行效率。
通过一分钟视频日记记录生活,借助AI分析情绪,实现自我提升。
Your Daily Minute 是一款专注于个人成长和情绪管理的应用程序。它利用AI技术分析用户每日记录的一分钟视频日记,帮助用户深入了解自己的情绪模式和行为习惯。该产品通过安全、私密的方式存储用户数据,确保用户信息的保密性。其主要优点包括便捷性、隐私保护以及强大的AI分析功能,能够为用户提供有价值的自我洞察。该产品目前主要面向希望通过日常记录实现自我提升的用户,价格和具体定位尚未明确。
Xwen-Chat是专注中文对话的大语言模型集合,提供多版本模型及语言生成服务
Xwen-Chat由xwen-team开发,为满足高质量中文对话模型需求而生,填补领域空白。其有多个版本,具备强大语言理解与生成能力,可处理复杂语言任务,生成自然对话内容,适用于智能客服等场景,在Hugging Face平台免费提供。
结合DeepSeek R1推理能力和Claude创造力及代码生成能力的统一API和聊天界面。
DeepClaude是一个强大的AI工具,旨在将DeepSeek R1的推理能力与Claude的创造力和代码生成能力相结合,通过统一的API和聊天界面提供服务。它利用高性能的流式API(用Rust编写)实现即时响应,同时支持端到端加密和本地API密钥管理,确保用户数据的隐私和安全。该产品是完全开源的,用户可以自由贡献、修改和部署。其主要优点包括零延迟响应、高度可配置性以及支持用户自带密钥(BYOK),为开发者提供了极大的灵活性和控制权。DeepClaude主要面向需要高效代码生成和AI推理能力的开发者和企业,目前处于免费试用阶段,未来可能会根据使用量收费。
© 2025 AIbase 备案号:闽ICP备08105208号-14