需求人群:
"KAG的目标受众是开发者和企业用户,特别是那些需要在专业领域内构建知识服务的团队。它适合需要处理大量专业知识、进行复杂推理和问答系统的用户。KAG通过提供一套完整的框架和工具,帮助用户将领域知识转化为可计算的逻辑形式,从而提高问答系统的专业性和准确性。"
使用场景示例:
政务问答:利用KAG构建的政务知识图谱,实现对政策、法规等专业问题的准确回答。
健康问答:通过KAG整合医疗知识,提供专业的健康咨询服务。
风险挖掘:在金融领域,使用KAG定义的专家规则来识别和分析潜在的风险应用和开发者。
产品特色:
LLM友好的知识表示:基于DIKW层次结构,IT升级SPG知识表示能力,兼容无模式约束的信息提取和有模式约束的专业知识构建。
知识图谱与原文片段的相互索引:支持图结构与原文块之间的相互索引表示,有助于基于图结构的倒排索引构建,促进逻辑形式的统一表示和推理。
逻辑形式引导的混合推理引擎:包括规划、推理和检索三种类型的操作符,将自然语言问题转化为结合语言和符号的问题解决过程。
领域知识场景应用:通过定义专家规则和业务数据,KAG可以在风险挖掘等场景中实现有效的推理过程。
与OpenSPG概念建模结合:降低自然语言转换图查询的难度,实现领域应用的自然语言问答。
可扩展性:KAG允许开发者扩展kag-builder和kag-solver的实现,以满足特定的需求。
支持自定义模型和服务:KAG支持与兼容OpenAI服务的MaaS API对接,也支持与本地模型的对接。
使用教程:
1. 安装环境和依赖:根据系统版本要求,安装Docker、Docker Compose等软件。
2. 下载并启动服务:使用curl命令下载docker-compose.yml文件,并使用Docker Compose启动服务。
3. 访问产品:在浏览器中输入默认网址http://127.0.0.1:8887,查看产品指南。
4. 安装KAG:对于开发者,根据指南创建conda环境,克隆代码,并安装KAG。
5. 使用工具包:参考快速入门指南,使用内置组件复现性能结果,并将其应用于新的业务场景。
6. 扩展KAG能力:如果内置组件不满足需求,开发者可以根据KAG-Builder Extension和KAG-Solver Extension进行扩展。
7. 适应自定义模型:KAG支持与OpenAI服务兼容的MaaS API对接,也支持与本地模型的对接。
浏览量:146
最新流量情况
月访问量
4.85m
平均访问时长
00:06:25
每次访问页数
6.08
跳出率
35.86%
流量来源
直接访问
52.62%
自然搜索
32.72%
邮件
0.05%
外链引荐
12.34%
社交媒体
2.17%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
12.55%
德国
3.84%
印度
9.38%
俄罗斯
4.61%
美国
18.64%
基于知识增强的生成框架,用于构建专业的知识服务
KAG(Knowledge Augmented Generation)是一个专业的领域知识服务框架,旨在通过知识图谱和向量检索的优势,双向增强大型语言模型和知识图谱,解决RAG(Retrieval Augmentation Generation)技术在向量相似性与知识推理相关性之间的大差距、对知识逻辑不敏感等问题。KAG在多跳问答任务上的表现显著优于NaiveRAG、HippoRAG等方法,例如在hotpotQA上的F1分数相对提高了19.6%,在2wiki上提高了33.5%。KAG已成功应用于蚂蚁集团的两个专业知识问答任务中,包括政务问答和健康问答,与RAG方法相比,专业性得到了显著提升。
整合所有资料,让 AI 搜索回答,提升知识获取效率。
飞书知识问答是一款基于 AI 的知识管理工具,能够整合用户上传的各类资料,如 PDF、Word、PowerPoint 等,通过 AI 搜索技术快速提供精准答案。该产品主要面向企业用户和知识工作者,帮助他们高效管理和检索知识,提升工作效率。其技术优势在于强大的 AI 搜索算法和对多种文件格式的支持,能够快速解析和理解用户上传的内容,提供准确的问答服务。
PIKE-RAG 是一种专注于领域知识和推理增强生成的模型。
PIKE-RAG 是微软开发的一种领域知识和推理增强生成模型,旨在通过知识提取、存储和推理逻辑增强大型语言模型(LLM)的能力。该模型通过多模块设计,能够处理复杂的多跳问答任务,并在工业制造、矿业和制药等领域显著提升了问答准确性。PIKE-RAG 的主要优点包括高效的知识提取能力、强大的多源信息整合能力和多步推理能力,使其在需要深度领域知识和复杂逻辑推理的场景中表现出色。
长文本问答增强型检索生成模型
LongRAG是一个基于大型语言模型(LLM)的双视角、鲁棒的检索增强型生成系统范式,旨在增强对复杂长文本知识的理解和检索能力。该模型特别适用于长文本问答(LCQA),能够处理全局信息和事实细节。产品背景信息显示,LongRAG通过结合检索和生成技术,提升了对长文本问答任务的性能,特别是在需要多跳推理的场景中。该模型是开源的,可以免费使用,主要面向研究者和开发者。
Cradle框架:用于控制计算机的多模态代理
Cradle框架旨在使基础模型能够通过与人类相同的通用接口(屏幕作为输入,键盘和鼠标操作作为输出)执行复杂的计算机任务。该框架在Red Dead Redemption II游戏中进行了案例研究,展示了其在复杂环境中的泛化和适应能力。
创建和参与多玩家知识问答游戏
Qaiz是一个在线平台,利用AI技术快速生成各种主题的互动式问答游戏,让用户可以与朋友和家人实时竞争,同时跟踪分数并享受实时评论。它提供了一个有趣的方式来测试和分享知识,同时具有社交和娱乐的双重属性。
一站式AI知识库搭建系统,轻松创建企业知识库大模型、智能客服、智能问答
怪兽智能AI知识库是一款企业知识库大模型+智能AI问答机器人的一站式搭建系统。支持零代码搭建企业知识库平台,团队多人协同与权限管理,支持智能回复和第三方集成,可以轻松地集成在网站、小程序、公众号、电商平台等应用中,为企业提供智能客服和知识问答服务。
知识增强大语言模型
文心一言是百度全新一代知识增强大语言模型,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。期待你的反馈,帮助文心一言持续取得进步。
用于多模态上下文中的检索增强生成的基准测试代码库。
M2RAG是一个用于多模态上下文中的检索增强生成的基准测试代码库。它通过多模态检索文档来回答问题,评估多模态大语言模型(MLLMs)在利用多模态上下文知识方面的能力。该模型在图像描述、多模态问答、事实验证和图像重排等任务上进行了评估,旨在提升模型在多模态上下文学习中的有效性。M2RAG为研究人员提供了一个标准化的测试平台,有助于推动多模态语言模型的发展。
易用、灵活、高效的开源大模型应用开发框架。
Agently是一个开源的大模型应用开发框架,旨在帮助开发者快速构建基于大语言模型的AI agent原生应用。它通过提供一系列工具和接口,简化了与大型语言模型的交互过程,使得开发者可以更专注于业务逻辑的实现。Agently框架支持多种模型,易于安装和配置,具有高度的灵活性和扩展性。
分钟级集成AI问答功能,将知识嵌入应用
Doctrine是一个简单但功能强大的API,可以将知识从数据库、网站、文件等多种来源中提取,并将其嵌入到高维向量空间中。它支持问答、分区和扩展,提供多种定价计划。适用于个人、中小型企业和整个组织。
高效检索文档信息,准确回答专业问题
讯飞星火知识库文档问答是科大讯飞基于讯飞星火大模型和星火知识库搭建的文档问答服务,能够高效检索文档信息,准确回答专业问题。具备多文档问答,文档知识库,信源原文定位,文档总结,自定义切分等功能。
构建多智能体系统的JavaScript框架
KaibanJS是一个专为JavaScript开发者设计的框架,用于构建和协调AI智能体。它允许开发者以类似微服务的方式处理AI任务,每个智能体负责不同的任务,如数据处理、处理和输出生成,全部自动协同工作。KaibanJS强调易用性和原生JavaScript支持,使得JavaScript开发者也能享受到构建复杂AI系统的能力。
基于知识图谱的智能问答系统。
Fact Finder 是一个开源的智能问答系统,它使用语言模型和知识图谱来生成自然语言回答和提供证据。该系统通过调用语言模型生成Cypher查询,查询知识图谱以获取答案,并使用另一个语言模型调用生成最终的自然语言回答。Fact Finder 的主要优点包括能够提供透明性,允许用户查看查询和证据,以及通过可视化子图提供直观的证据。
文本到图像生成/编辑框架
RPG-DiffusionMaster是一个全新的无需训练的文本到图像生成/编辑框架,利用多模态LLM的链式推理能力增强文本到图像扩散模型的组合性。该框架采用MLLM作为全局规划器,将复杂图像生成过程分解为多个子区域内的简单生成任务。同时提出了互补的区域扩散以实现区域化的组合生成。此外,在提出的RPG框架中闭环地集成了文本引导的图像生成和编辑,从而增强了泛化能力。大量实验证明,RPG-DiffusionMaster在多类别对象组合和文本-图像语义对齐方面优于DALL-E 3和SDXL等最先进的文本到图像扩散模型。特别地,RPG框架与各种MLLM架构(例如MiniGPT-4)和扩散骨干(例如ControlNet)兼容性广泛。
QAnything是一个支持任意文件格式和数据库的本地知识问答系统
QAnything是一个支持任意文件格式和数据库的本地知识问答系统,可以简单地导入任意本地存储的各种格式的文件,并得到准确、快速、可靠的问答。目前支持的格式包括:PDF、Word(doc/docx)、PPT、Markdown、Eml、TXT、图片(jpg、png等)、网页链接等,后续会持续新增支持的格式。QAnything具有数据安全性,支持断网安装使用;支持中英文跨语言问答;支持海量数据问答,解决大规模数据检索退化问题;直接可用于企业应用的高性能产品级系统;一键安装部署,开箱即用的用户友好体验;支持多知识库问答等功能。
KET-RAG 是一个结合知识图谱的检索增强型生成框架,用于高效文档索引和答案生成。
KET-RAG(Knowledge-Enhanced Text Retrieval Augmented Generation)是一个强大的检索增强型生成框架,结合了知识图谱技术。它通过多粒度索引框架(如知识图谱骨架和文本-关键词二分图)实现高效的知识检索和生成。该框架在降低索引成本的同时,显著提升了检索和生成质量,适用于大规模 RAG 应用场景。KET-RAG 基于 Python 开发,支持灵活的配置和扩展,适用于需要高效知识检索和生成的开发人员和研究人员。
基于大模型 RAG 知识库的知识图谱问答系统,支持多种大模型适配和本地部署。
语析Yuxi-Know 是一个基于大模型 RAG 知识库的知识图谱问答系统,采用 Llamaindex + VueJS + Flask + Neo4j 构建。它支持 OpenAI、国内主流大模型平台的模型调用以及本地 vllm 部署,能够实现知识库问答、知识图谱检索和联网检索等功能。该系统的主要优点是灵活适配多种模型、支持多种知识库格式以及强大的知识图谱集成能力。它适用于需要高效知识管理和智能问答的企业和研究机构,具有较高的技术先进性和实用性。
基于大型语言模型的多智能体应用开发框架
agentUniverse 是一个基于大型语言模型的多智能体应用开发框架,提供了构建单一智能体和多智能体协作机制的所有必需组件。通过模式工厂,允许开发者构建和自定义多智能体协作模式,轻松构建多智能体应用,并分享不同技术与业务领域的模式实践。
多模态智能框架,识别页面任务并执行动作。
NavAIGuide是一个可扩展的多模态智能框架,通过访问移动和桌面生态系统中的应用程序,实现计划和用户查询。具有视觉任务检测、高级代码选择器、面向动作的执行和鲁棒的错误处理等功能。定位于为用户提供高效的自动化解决方案。
企业知识管理与AI问答平台
Dashworks是一个企业级的知识管理和AI问答平台,它通过API使企业能够将Dashworks的智能问答能力集成到现有的工作流程和内部工具中。Dashworks通过AI技术,帮助企业快速获取和分享知识,提高工作效率,减少重复性工作。产品背景信息显示Dashworks致力于通过智能化手段,优化企业内部信息的流通和利用。价格和定位方面,Dashworks提供早期访问API,并接受用户申请以获取访问权限,具体价格未在页面中提及。
多智能体系统构建、编排和部署框架
Swarm是由OpenAI Solutions团队管理的实验性框架,旨在构建、编排和部署多智能体系统。它通过定义智能体(Agent)和交接(handoffs)的抽象概念,实现了智能体之间的协调和执行。Swarm框架强调轻量级、高可控性和易于测试,适用于需要大量独立功能和指令的场景,允许开发者拥有完全的透明度和对上下文、步骤和工具调用的细粒度控制。Swarm框架目前处于实验阶段,不推荐在生产环境中使用。
由知识图谱引擎驱动的创新Agent框架
muAgent是一个创新的Agent框架,由知识图谱引擎驱动,支持多Agent编排和协同技术。它利用LLM+EKG(Eventic Knowledge Graph 行业知识承载)技术,结合FunctionCall、CodeInterpreter等,通过画布式拖拽和轻文字编写,实现复杂SOP流程的自动化。muAgent兼容市面上各类Agent框架,具备复杂推理、在线协同、人工交互、知识即用等核心功能。该框架已在蚂蚁集团多个复杂DevOps场景中得到验证。
一个通用的多模态模型,可用于问答、图像描述等任务
HuggingFaceM4/idefics-80b-instruct是一个开源的多模态模型,它可以接受图像和文本的输入,输出相关的文本内容。该模型在视觉问答、图像描述等任务上表现出色,是一个通用的智能助手模型。它由Hugging Face团队开发,基于开放数据集训练,提供免费使用。
VideoRAG 是一个用于处理极长上下文视频的检索增强型生成框架。
VideoRAG 是一种创新的检索增强型生成框架,专门用于理解和处理极长上下文视频。它通过结合图驱动的文本知识锚定和层次化多模态上下文编码,实现了对无限制长度视频的理解。该框架能够动态构建知识图谱,保持多视频上下文的语义连贯性,并通过自适应多模态融合机制优化检索效率。VideoRAG 的主要优点包括高效的极长上下文视频处理能力、结构化的视频知识索引以及多模态检索能力,使其能够为复杂查询提供全面的回答。该框架在长视频理解领域具有重要的技术价值和应用前景。
易用的大规模语言模型知识编辑框架
EasyEdit 是一个面向大型语言模型(LLMs)的易用知识编辑框架,旨在帮助用户高效、准确地调整预训练模型的特定行为。它提供了统一的编辑器、方法和评估框架,支持多种知识编辑技术,如ROME、MEND等,并提供了丰富的数据集和评估指标,以衡量编辑的可靠性、泛化性、局部性和可移植性。
© 2025 AIbase 备案号:闽ICP备08105208号-14