需求人群:
"目标受众为数据科学家、研究人员和开发者,他们需要可视化和分析GraphRAG生成的复杂图结构数据。GraphRAG Visualizer提供了一个直观的用户界面,使得用户无需深入了解GraphRAG的内部机制,即可进行数据探索和分析。"
使用场景示例:
数据科学家使用GraphRAG Visualizer分析社交网络中的社区结构。
研究人员利用该工具探索医学文献中的实体关系。
开发者使用GraphRAG Visualizer在本地服务器上测试和调试GraphRAG的输出。
产品特色:
图形可视化:在'Graph Visualization'标签页中以2D或3D视图查看图形。
数据表格:在'Data Tables'标签页中展示parquet文件中的数据。
搜索功能:全面支持搜索,使用户能够专注于特定节点或关系。
本地处理:所有数据都在用户机器上本地处理,确保数据安全和隐私。
自动加载Parquet文件:将Parquet文件放置在public/artifacts目录下,应用启动时自动加载这些文件。
与GraphRAG API集成:通过graphrag-api服务器运行时,可以直接通过GraphRAG Visualizer的搜索界面查询API服务器。
基于Neo4j Cypher的逻辑:创建文本单元、文档、社区和协变量之间的关系逻辑来源于GraphRAG导入Neo4j Cypher笔记本。
使用教程:
1. 克隆仓库到本地机器:使用git clone命令克隆GraphRAG Visualizer仓库。
2. 安装必要的依赖:在仓库目录下运行npm install命令安装所有依赖。
3. 运行开发服务器:通过npm start命令启动开发服务器。
4. 在浏览器中打开应用:访问http://localhost:3000来查看应用。
5. 加载Parquet文件:将Parquet文件放置在public/artifacts目录下,应用会自动加载并展示这些文件。
6. 使用搜索功能:启动graphrag-api服务器后,通过GraphRAG Visualizer的搜索界面查询API服务器。
浏览量:94
最新流量情况
月访问量
4.75m
平均访问时长
00:06:34
每次访问页数
6.10
跳出率
36.20%
流量来源
直接访问
52.19%
自然搜索
32.64%
邮件
0.04%
外链引荐
12.93%
社交媒体
2.02%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
14.32%
德国
3.68%
印度
9.04%
俄罗斯
3.92%
美国
19.25%
一个用于可视化和探索微软GraphRAG工具的网络工具。
GraphRAG Visualizer是一个基于网络的工具,旨在可视化和探索微软GraphRAG工具产生的数据。GraphRAG是微软开发的一种用于生成图结构数据的技术,GraphRAG Visualizer通过让用户上传parquet文件,无需额外软件或脚本即可轻松查看和分析数据。该工具的主要优点包括图形可视化、数据表格展示、搜索功能以及本地处理数据,确保数据安全和隐私。
AI原生数据应用开发框架
DB-GPT是一个开源的AI原生数据应用开发框架,利用AWEL(Agentic Workflow Expression Language)和代理(agent)技术,简化了大型模型应用与数据的结合。它通过多模型管理、Text2SQL效果优化、RAG框架优化、多代理框架协作等技术能力,使企业和开发者能够以更少的代码构建定制化应用。DB-GPT在数据3.0时代,基于模型和数据库,为构建企业级报告分析和业务洞察提供了基础数据智能技术。
全球首个可遵循指令的重排序器,为企业级RAG系统提供精准信息排序
Contextual AI Reranker 是一款革命性的AI模型,专为解决企业级检索增强生成(RAG)系统中信息冲突和排序不准确的问题而设计。它能够根据用户提供的自然语言指令,对检索结果进行精准排序,确保最符合需求的信息优先展示。该产品基于先进的AI技术,经过行业标准BEIR基准测试和内部数据集验证,表现卓越。其主要优点包括高准确率、强大的指令遵循能力和灵活的定制化选项,适用于金融、技术、专业服务等多个领域。产品目前提供免费试用,并通过API形式接入,方便企业快速部署和使用。
wdoc 是一个强大的 RAG(检索增强生成)系统,用于处理和查询多种文件类型的文档。
wdoc 是由 Olicorne(一名医学生)开发的 RAG 系统,旨在通过检索增强生成技术解决文档查询和总结问题。它支持多种文件类型(如 PDF、网页、YouTube 视频等),并结合多种语言模型提供高召回率和高特异性的查询结果。wdoc 的主要优点包括强大的多文件类型支持、高效的检索能力和灵活的扩展性。它适用于研究人员、学生和专业人士,帮助他们快速处理大量信息。wdoc 目前处于开发阶段,开发者欢迎用户反馈和功能请求,以不断完善产品。
Thoughtflow 是一款基于树状结构的聊天助手,帮助用户以更自然的方式与AI进行互动。
Thoughtflow 是一款创新的AI聊天工具,采用树状结构对话格式,使复杂话题的管理和探索变得直观和有条理。它支持与多种GPT模型的灵活集成,无论是本地运行的Ollama还是通过API连接的OpenAI模型,都能轻松适配。其主要优点在于能够保留上下文的分支探索功能,让用户在不丢失主线的情况下深入探讨细节。Thoughtflow 主要面向学生、思考者、创作者和创新者,旨在通过结构化的对话系统提升创造力和解决问题的能力。目前,该产品通过App Store提供下载,具体价格未明确提及。
一个用于在网站上提问的Chrome扩展程序,支持本地运行和向量存储。
Site RAG 是一款 Chrome 扩展程序,旨在通过自然语言处理技术帮助用户在浏览网页时快速获取问题答案。它支持将当前页面内容作为上下文进行查询,还能将整个网站内容索引到向量数据库中,以便后续进行检索增强生成(RAG)。该产品完全在本地浏览器运行,确保用户数据安全,同时支持连接本地运行的 Ollama 实例进行推理。它主要面向需要快速从网页内容中提取信息的用户,如开发者、研究人员和学生。目前该产品免费提供,适合希望在浏览网页时获得即时帮助的用户。
一个为RAG(检索增强生成)AI助手设计的React组件,可快速集成到Next.js应用中。
该产品是一个React组件,专为RAG(检索增强生成)AI助手设计。它结合了Upstash Vector进行相似性搜索、Together AI作为LLM(大型语言模型)以及Vercel AI SDK用于流式响应。这种组件化设计使得开发者可以快速将RAG能力集成到Next.js应用中,极大地简化了开发流程,同时提供了高度的可定制性。其主要优点包括响应式设计、支持流式响应、持久化聊天历史以及支持暗黑/浅色模式等。该组件主要面向需要在Web应用中集成智能聊天功能的开发者,尤其是那些使用Next.js框架的团队。它通过简化集成过程,降低了开发成本,同时提供了强大的功能。
开源的RAG应用日志工具
RAG-logger是一个为检索增强生成(Retrieval-Augmented Generation, RAG)应用设计的开源日志工具。它是一个轻量级的、针对RAG特定日志需求的开源替代方案,专注于为RAG应用提供全面的日志记录功能,包括查询跟踪、检索结果记录、LLM交互记录以及逐步性能监控。它采用基于JSON的日志格式,支持每日日志组织、自动文件管理和元数据丰富化。RAG-logger以其开源、轻量级和专注于RAG应用的特性,为开发者提供了一个有效的工具来监控和分析RAG应用的性能。
快速高效的生成型AI模型
Command R7B是Cohere公司推出的一款高性能、可扩展的大型语言模型(LLM),专为企业级应用设计。它在保持较小模型体积的同时,提供了一流的速度、效率和质量,能够在普通的GPU、边缘设备甚至CPU上部署,大幅降低了AI应用的生产部署成本。Command R7B在多语言支持、引用验证检索增强生成(RAG)、推理、工具使用和代理行为等方面表现出色,特别适合需要优化速度、成本性能和计算资源的企业使用案例。
将各种文件类型转换为Markdown格式的Python库
E2M是一个Python库,能够解析并转换多种文件类型到Markdown格式。它采用了解析器-转换器架构,支持包括doc、docx、epub、html、htm、url、pdf、ppt、pptx、mp3和m4a等多种文件格式的转换。E2M项目的最终目标是为检索增强生成(RAG)和模型训练或微调提供高质量的数据。
利用视觉语言模型的文档检索系统
vision-is-all-you-need是一个展示Vision RAG (V-RAG)架构的演示项目。V-RAG架构使用视觉语言模型(VLM)直接将PDF文件页面(或其他文档)嵌入为向量,无需繁琐的分块处理。该技术的重要性在于它能够大幅提高文档检索的效率和准确性,特别是在处理大量数据时。产品背景信息显示,这是一个利用最新人工智能技术,提高文档处理能力的创新工具。目前,该项目是开源的,可以免费使用。
开源本地RAG,集成ChatGPT和MCP能力
Minima是一个开源的、完全本地化的RAG(Retrieval-Augmented Generation)模型,具备与ChatGPT和MCP(Model Context Protocol)集成的能力。它支持三种模式:完全本地安装、通过ChatGPT查询本地文档以及使用Anthropic Claude查询本地文件。Minima的主要优点包括本地化处理数据,保护隐私,以及能够利用强大的语言模型来增强检索和生成任务。产品背景信息显示,Minima支持多种文件格式,并允许用户自定义配置以适应不同的使用场景。Minima是免费开源的,定位于需要本地化AI解决方案的开发者和企业。
基于Qwen>=2.0的Agent框架和应用,支持函数调用、代码解释器、RAG和Chrome扩展。
Qwen-Agent是一个基于Qwen>=2.0构建的Agent框架,它具备指令遵循、工具使用、规划和记忆能力。该框架提供了如浏览器助手、代码解释器和自定义助手等示例应用。Qwen-Agent的主要优点包括其高度的可扩展性和模块化设计,允许开发者根据需要集成不同的工具和功能。产品背景信息显示,Qwen-Agent旨在为开发者提供一个强大的工具集,以构建和部署基于大型语言模型的应用程序。Qwen-Agent在GitHub上开源,允许社区贡献和协作。
快速高效的非结构化数据提取工具
Extractous是一个用Rust编写的非结构化数据提取工具,提供多语言绑定。它专注于从各种文件类型(如PDF、Word、HTML等)中提取内容和元数据,并且性能优异,内存占用低。Extractous通过原生代码执行实现快速处理速度和低内存使用,支持多种文件格式,并集成了Apache Tika和tesseract-ocr技术,使其能够处理广泛的文件类型并进行OCR识别。该工具的开源性质和Apache 2.0许可使其可以免费用于商业用途,适合需要处理大量文档数据的企业和开发者。
创建您自己的高级搜索引擎,结合AI技术。
Inquir是一个强大的工具,用于创建个性化的搜索引擎,根据您的数据量身定制。它解锁了诸如自定义搜索解决方案、数据组合、AI驱动的检索增强生成(RAG)系统以及上下文感知搜索功能等强大功能。通过启动您的引擎或安排演示,迈向改善用户体验的第一步。
轻量级、快速的RAG文本分块库
Chonkie是一个为检索增强型生成(RAG)应用设计的文本分块库,它轻量级、快速,并且易于使用。该库提供了多种文本分块方法,支持多种分词器,并且具有高性能。Chonkie的主要优点包括丰富的功能、易用性、快速处理速度、广泛的支持和轻量级的设计。它适用于需要高效处理文本数据的开发者和研究人员,特别是在自然语言处理和机器学习领域。Chonkie是开源的,遵循MIT许可证,可以免费使用。
AI优先的基础设施API,提供搜索、推荐和RAG服务
Trieve是一个AI优先的基础设施API,结合了语言模型和工具,用于微调排名和相关性,提供一站式的搜索、推荐、RAG和分析解决方案。它能够自动持续改进,基于数十个反馈信号,确保相关性。Trieve支持语义向量搜索、BM25和SPlade全文搜索,以及混合搜索,结合全文搜索和语义向量搜索。此外,它还提供了商品推销和相关性调整功能,帮助用户通过API或无代码仪表板调整搜索结果以实现KPI。Trieve建立在最佳基础之上,使用开源嵌入模型和LLMs,运行在自己的服务器上,确保数据安全。
A tool for integrating private data with AI large language models.
Dabarqus是一个Retrieval Augmented Generation(RAG)框架,它允许用户将私有数据实时提供给大型语言模型(LLM)。这个工具通过提供REST API、SDKs和CLI工具,使得用户能够轻松地将各种数据源(如PDF、电子邮件和原始数据)存储到语义索引中,称为“记忆库”。Dabarqus支持LLM风格的提示,使用户能够以简单的方式与记忆库进行交互,而无需构建特殊的查询或学习新的查询语言。此外,Dabarqus还支持多语义索引(记忆库)的创建和使用,使得数据可以根据主题、类别或其他分组方式进行组织。Dabarqus的产品背景信息显示,它旨在简化私有数据与AI语言模型的集成过程,提高数据检索的效率和准确性。
快速、准确的生产级RAG管道
Vectorize是一个专注于将非结构化数据转化为优化的向量搜索索引的平台,专为检索增强生成(RAG)而设计。它通过连接内容管理系统、文件系统、CRM、协作工具等多种数据源,帮助用户创建提高生产力的辅助系统和创新的客户体验。Vectorize的主要优点包括易于使用、快速部署和高精度的搜索结果,适合需要处理大量数据并希望快速实现AI应用的企业。
一个可以本地与多个PDF文件进行对话的聊天机器人。
rag-chatbot是一个基于人工智能技术的聊天机器人模型,它能够让用户通过自然语言与多个PDF文件进行交互。该模型使用了最新的机器学习技术,如Huggingface和Ollama,来实现对PDF内容的理解和回答生成。它的重要性在于能够处理大量文档信息,为用户提供快速、准确的问答服务。产品背景信息表明,这是一个开源项目,旨在通过技术创新提升文档处理的效率。目前该项目是免费的,主要面向开发者和技术爱好者。
终端中的个人AI助手,具备本地工具。
gptme是一个运行在终端的个人AI助手,它装备了本地工具,可以编写代码、使用终端、浏览网页、视觉识别等。它是一个不受软件、互联网访问、超时或隐私问题限制的ChatGPT“代码解释器”的本地替代方案。
无需编码即可构建生产就绪的LLM应用程序
Epsilla是一个无需编码的RAG即服务(RAG-as-a-Service)平台,它允许用户基于私有或公共数据构建生产就绪的大型语言模型(Large Language Model, LLM)应用程序。该平台提供了一站式服务,包括数据管理、RAG工具、CI/CD风格的评估以及企业级安全措施,旨在降低总拥有成本(TCO),提高查询速度和吞吐量,同时确保信息的时效性和安全性。
使GPT开发者在OpenAI商店中获得更好的排名和收益
GPT Builder Tools是一个为GPT开发者提供的工具平台,旨在帮助他们通过分析、支付和营销工具来提升其GPT在OpenAI商店中的排名和吸引更多用户。该平台支持开发者追踪GPT的性能,吸引更多用户,并在OpenAI商店中实现GPT的货币化。此外,它还提供了一个分析仪表板,让开发者更好地理解他们的用户群体,从而优化GPT的用户体验和市场表现。
开源的RAG基础聊天工具,与文档对话。
kotaemon是一个开源的、基于RAG(Retrieval-Augmented Generation)模型的工具,旨在通过聊天界面与用户文档进行交互。它支持多种语言模型API提供商和本地语言模型,提供了一个干净、可定制的用户界面,适用于终端用户进行文档问答以及开发者构建自己的RAG问答流程。
开发者友好的RAG即服务。
Ragie是一款面向开发者的RAG(Retrieval-Augmented Generation)即服务产品,它通过易于使用的API和SDK,帮助开发者快速启动并实现生成式AI应用。Ragie具备高级功能,如LLM重排、摘要索引、实体提取等,确保提供精确可靠的信息。它还支持与Google Drive、Notion等流行数据源的直接连接,并支持自动同步,保持数据最新。Ragie由Craft Ventures领导,提供简单明了的定价策略,无需设置费用或隐藏成本。
革命性的检索增强生成系统技术集合。
RAG_Techniques 是一个专注于检索增强生成(Retrieval-Augmented Generation, RAG)系统的技术集合,旨在提升系统的准确性、效率和上下文丰富性。它提供了一个前沿技术的中心,通过社区贡献和协作环境,推动RAG技术的发展和创新。
一个适合学习、使用、自主扩展的RAG系统。
Easy-RAG是一个检索增强生成(RAG)系统,它不仅适合学习者了解和掌握RAG技术,同时也便于开发者使用和进行自主扩展。该系统通过集成知识图谱提取解析工具、rerank重新排序机制以及faiss向量数据库等技术,提高了检索效率和生成质量。
一站式数据处理系统,为大型语言模型提供高质量数据。
Data-Juicer 是一个一站式的多模态数据处理系统,旨在为大型语言模型(LLMs)提供更高质量、更丰富、更易消化的数据。它提供了一个系统化和可复用的数据处理库,支持数据与模型的协同开发,通过沙盒实验室实现快速迭代,并提供基于数据和模型的反馈循环、可视化和多维度自动评估等功能,帮助用户更好地理解和改进他们的数据和模型。Data-Juicer 正在积极更新和维护,定期增强和添加更多功能、数据配方和数据集。
一个用于增强LLMs检索增强生成任务的框架
RAGFoundry是一个库,旨在通过在特别创建的RAG增强数据集上微调模型,提高大型语言模型(LLMs)使用外部信息的能力。该库通过参数高效微调(PEFT)帮助用户轻松训练模型,并使用RAG特定指标衡量性能提升。它具有模块化设计,工作流程可通过配置文件自定义。
开源AI搜索引擎框架,性能媲美Perplexity.ai Pro。
MindSearch是一个基于大型语言模型(LLM)的多智能体网络搜索引擎框架,具有与Perplexity.ai Pro相似的性能。用户可以轻松部署自己的搜索引擎,支持闭源大型语言模型(如GPT、Claude)或开源大型语言模型(如InternLM2.5-7b-chat)。它具备以下特点:能够解决生活中的任何问题,利用网络知识提供深入和广泛的知识库答案;展示详细的解决方案路径,提高最终响应的可信度和可用性;提供优化的UI体验,包括React、Gradio、Streamlit和Terminal等多种接口;动态构建图谱,将用户查询分解为图谱中的原子子问题,并根据WebSearcher的搜索结果逐步扩展图谱。
© 2025 AIbase 备案号:闽ICP备08105208号-14