需求人群:
"目标受众为数据科学家、开发者和任何需要从大量非结构化数据中提取信息并构建知识图谱的专业人士。该产品适合他们,因为它简化了从复杂数据源中提取有用信息的过程,提高了效率并促进了知识的可视化和分析。"
使用场景示例:
从学术论文中提取关键概念并构建领域知识图谱。
分析社交媒体数据,识别趋势和影响力人物。
整合企业内部文档,构建内部知识管理系统。
产品特色:
知识图谱创建:使用LLMs将非结构化数据转换为结构化知识图谱。
提供模式:自定义模式或使用设置中的现有模式生成图。
查看图谱:在Bloom中查看特定来源或多个来源的图谱。
与数据对话:通过对话式查询与Neo4j数据库中的数据进行交互,也可以检索有关查询响应来源的元数据。
本地部署:通过docker-compose运行,支持OpenAI和Diffbot。
云部署:支持在Google Cloud Platform上部署应用程序和包。
环境配置:根据需要配置环境变量以启用特定功能或集成。
使用教程:
1. 确保拥有Neo4j数据库V5.15或更高版本,并安装APOC。
2. 创建并配置.env文件,输入必要的API密钥。
3. 选择文件来源,例如本地文件、YouTube视频或网页。
4. 上传文件到系统,选择LLM模型进行知识图谱生成。
5. 在Bloom中查看和分析生成的知识图谱。
6. 通过聊天机器人与数据库进行交互,提出问题并获取答案。
7. 根据需要调整环境变量和配置,以适应不同的部署环境。
浏览量:546
最新流量情况
月访问量
4.85m
平均访问时长
00:06:25
每次访问页数
6.08
跳出率
35.86%
流量来源
直接访问
52.62%
自然搜索
32.72%
邮件
0.05%
外链引荐
12.34%
社交媒体
2.17%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
12.55%
德国
3.84%
印度
9.38%
俄罗斯
4.61%
美国
18.64%
构建知识图谱的Neo4j应用
llm-graph-builder是一个利用大型语言模型(如OpenAI、Gemini等)从非结构化数据(PDF、DOCS、TXT、YouTube视频、网页等)中提取节点、关系及其属性,并使用Langchain框架创建结构化知识图谱的应用程序。它支持从本地机器、GCS或S3存储桶或网络资源上传文件,选择LLM模型并生成知识图谱。
利用大型语言模型增量构建知识图谱
iText2KG是一个Python包,旨在利用大型语言模型从文本文档中提取实体和关系,增量构建一致的知识图谱。它具备零样本能力,允许在没有特定训练的情况下跨不同领域进行知识提取。该包包括文档蒸馏、实体提取和关系提取模块,确保实体和关系得到解决和唯一性。它通过Neo4j提供知识图谱的可视化表示,支持交互式探索和分析结构化数据。
利用知识图谱和文档网络增强语言模型性能
Knowledge Graph RAG 是一个开源的Python库,它通过创建知识图谱和文档网络来增强大型语言模型(LLM)的性能。这个库允许用户通过图谱结构来搜索和关联信息,从而为语言模型提供更丰富的上下文。它主要应用于自然语言处理领域,尤其是在文档检索和信息抽取任务中。
基于知识图谱的检索增强生成框架,赋能大型语言模型处理知识密集型任务
KG-RAG是一个任务无关的框架,它结合知识图谱的显性知识和大型语言模型的隐性知识。这里,我们利用一个巨大的生物医学知识图谱SPOKE作为生物医学上下文的提供者。KG-RAG的主要特征是它从SPOKE知识图谱中提取“与提示相关的上下文”,这被定义为响应用户提示所需的最小上下文。
基于知识图谱的智能问答系统。
Fact Finder 是一个开源的智能问答系统,它使用语言模型和知识图谱来生成自然语言回答和提供证据。该系统通过调用语言模型生成Cypher查询,查询知识图谱以获取答案,并使用另一个语言模型调用生成最终的自然语言回答。Fact Finder 的主要优点包括能够提供透明性,允许用户查看查询和证据,以及通过可视化子图提供直观的证据。
多模态知识图谱补全工具
MyGO是一个用于多模态知识图谱补全的工具,它通过将离散模态信息作为细粒度的标记来处理,以提高补全的准确性。MyGO利用transformers库对文本标记进行嵌入,进而在多模态数据集上进行训练和评估。它支持自定义数据集,并且提供了训练脚本以复现实验结果。
基于大模型 RAG 知识库的知识图谱问答系统,支持多种大模型适配和本地部署。
语析Yuxi-Know 是一个基于大模型 RAG 知识库的知识图谱问答系统,采用 Llamaindex + VueJS + Flask + Neo4j 构建。它支持 OpenAI、国内主流大模型平台的模型调用以及本地 vllm 部署,能够实现知识库问答、知识图谱检索和联网检索等功能。该系统的主要优点是灵活适配多种模型、支持多种知识库格式以及强大的知识图谱集成能力。它适用于需要高效知识管理和智能问答的企业和研究机构,具有较高的技术先进性和实用性。
利用本地Llama模型构建知识图谱,探索相关问题和答案。
Local Knowledge Graph是一个基于Flask的Web应用程序,它使用本地Llama语言模型来处理用户查询,生成逐步推理,并以交互式知识图谱的形式可视化思考过程。它还能根据语义相似性找到并显示相关问题和答案。该应用程序的主要优点包括实时显示推理过程、动态知识图谱可视化、计算并显示最强推理路径、以及基于语义相似性的相关问答。
开源知识图谱构建模型,成本低廉
Triplex是一个创新的开源模型,能够将大量非结构化数据转换为结构化数据,其在知识图谱构建方面的表现超越了gpt-4o,且成本仅为其十分之一。它通过高效的将非结构化文本转换为知识图谱的构建基础——语义三元组,大幅降低了知识图谱的生成成本。
由知识图谱引擎驱动的创新Agent框架
muAgent是一个创新的Agent框架,由知识图谱引擎驱动,支持多Agent编排和协同技术。它利用LLM+EKG(Eventic Knowledge Graph 行业知识承载)技术,结合FunctionCall、CodeInterpreter等,通过画布式拖拽和轻文字编写,实现复杂SOP流程的自动化。muAgent兼容市面上各类Agent框架,具备复杂推理、在线协同、人工交互、知识即用等核心功能。该框架已在蚂蚁集团多个复杂DevOps场景中得到验证。
将知识图谱与Obsidian笔记整合,实现问答、链接预测等功能
ODIN是一个Obsidian的插件,它可以将用户的笔记知识图谱化,从而实现智能问答、链接预测等功能,帮助用户管理知识点,建立全面的知识体系。ODIN的关键功能包括:基于LLM的智能问答,可以直观查询笔记中的知识点;全局笔记网络可视化,以知识图的形式呈现笔记内容;基于语义的链接预测,自动在笔记间建立关联;基于语义的节点提示,发现笔记中的关键知识点等。ODIN可以大幅提升Obsidian在知识管理方面的能力,是作者构建个人知识管理系统的不二之选。
从任何文本中提取知识图谱的人工智能工具。
kg-gen 是一个基于人工智能的工具,能够从普通文本中提取知识图谱。它支持处理小到单句话、大到长篇文档的文本输入,并且可以处理对话格式的消息。该工具利用先进的语言模型和结构化输出技术,能够帮助用户快速构建知识图谱,适用于自然语言处理、知识管理以及模型训练等领域。kg-gen 提供了灵活的接口和多种功能,旨在简化知识图谱的生成过程,提高效率。
将文本转换为知识图谱的Python工具。
knowledge_graph_maker是一个Python库,能够根据给定的本体论将任意文本转换为知识图谱。知识图谱是一种语义网络,代表现实世界实体之间的网络和它们之间的关系。该库通过图算法和中心性计算,帮助用户深入分析文本内容,实现概念之间的连接性分析,以及通过图检索增强生成(GRAG)技术,提升与文本的交流深度。
开源知识图谱工作室,助力构建动态图谱AI工作流
WhyHow Knowledge Graph Studio是一个开源平台,旨在简化创建和管理RAG-native知识图谱的过程。该平台提供基于规则的实体解析、模块化图构建、灵活的数据摄取以及API优先设计,并支持SDK。它基于NoSQL数据库构建,提供灵活、可扩展的存储层,使复杂关系的数据检索和遍历变得容易。该平台适用于处理结构化和非结构化数据,构建探索性图谱或高度模式化约束图谱,旨在实现规模化和灵活性,适用于实验和大规模使用。
智能语义,知识图谱,AI+内容创作
智搜AI是一款基于人工智能技术的内容创作工具,通过智能语义和知识图谱技术,帮助用户快速生成高质量的文章、PPT等内容,提高生产力。同时,智搜AI还提供多种解决方案,包括AI+媒体、AI+金融等,满足不同领域的需求。
AI驱动的技能平台,自动生成交互式课程和全球知识图谱
NOLEJ是一个由AI引擎驱动的去中心化技能平台,可以自动生成交互式课程和全球知识图谱。它提供一系列功能,帮助个人教育者、学校/机构和企业创建、管理和共享教育内容。NOLEJ的主要优势在于自动化课程生成、智能推荐和全球知识图谱的构建。定价方面,请访问官方网站获取详细信息。NOLEJ适用于个人学习、教育机构和企业培训等场景。
将课程大纲转化为交互式知识图谱,提高学习效率,帮助准备考试。
SophistAI是一个AI驱动的学习助手,将混乱的学习材料转化为结构化的交互式知识图谱,帮助用户更高效地学习和备考。它提供了智能进度追踪、深度挖掘子主题、自动完成进度等功能。
一个实验性的UI,用于将文本转换为知识图谱。
prettygraph是一个基于Python的Web应用程序,由@yoheinakajima开发,展示了一种新的UI模式,用于将文本输入动态地转换为知识图谱。该项目是一个快速原型,旨在提供一种简单的UI想法,通过实时更新UI中的文本高亮来生成知识图谱。
高性能知识图谱数据库与推理引擎
RDFox 是由牛津大学计算机科学系的三位教授基于数十年知识表示与推理(KRR)研究开发的规则驱动人工智能技术。其独特之处在于:1. 强大的AI推理能力:RDFox 能够像人类一样从数据中创建知识,基于事实进行推理,确保结果的准确性和可解释性。2. 高性能:作为唯一在内存中运行的知识图谱,RDFox 在基准测试中的表现远超其他图技术,能够处理数十亿三元组的复杂数据存储。3. 可扩展部署:RDFox 具有极高的效率和优化的占用空间,可以嵌入边缘和移动设备,作为 AI 应用的大脑独立运行。4. 企业级特性:包括高性能、高可用性、访问控制、可解释性、人类般的推理能力、数据导入和 API 支持等。5. 增量推理:RDFox 的推理功能在数据添加或删除时即时更新,不影响性能,无需重新加载。
基于人工智能生成及查询不断扩展的知识图谱的概念证明
MindGraph是一个开源、API优先的基于图形的项目原型,旨在实现自然语言交互(输入和输出)。它可作为构建和定制自己的CRM解决方案的模板,重点是易于集成和可扩展性。主要功能包括:实体管理、集成触发器、搜索功能、人工智能整备。它采用模块化架构,通过集成管理器动态注册和执行各种集成函数,使其具有无缝集成人工智能功能的能力。它支持灵活的数据库集成,包括内存数据库和云数据库NexusDB。再加上基于模式的知识图谱创建,使其能够自动从自然语言输入中生成结构化数据。
知识编辑基准测试,用于评估大型语言模型的知识编辑方法。
KnowEdit是一个专注于大型语言模型(LLMs)的知识编辑基准测试。它提供了一个综合的评估框架,用于测试和比较不同的知识编辑方法在修改特定领域内LLMs行为时的有效性,同时保持跨各种输入的整体性能。KnowEdit基准测试包括六个不同的数据集,涵盖了事实操作、情感修改和幻觉生成等多种编辑类型。该基准测试旨在帮助研究者和开发者更好地理解和改进知识编辑技术,推动LLMs的持续发展和应用。
从文本中提取知识图谱三元组的管道工具
Graphusion是一个用于从文本中提取知识图谱三元组的管道工具。它通过一系列步骤,包括概念提取、候选三元组提取和三元组融合,来构建知识图谱。这个工具的重要性在于它能够帮助研究人员和开发者自动化地从大量文本数据中提取结构化信息,进而支持知识管理和数据科学项目。Graphusion的主要优点包括其自动化处理能力、对不同数据集的适应性以及灵活的配置选项。产品背景信息显示,Graphusion是由tdurieux开发的,可以在GitHub上找到相关代码和文档。目前,该工具是免费的,但具体的定价策略可能会根据开发者的更新和维护情况而变化。
利用GPT-3模型将非结构化文本数据转换为结构化知识图谱表示
KnowledgeGraph GPT项目旨在利用OpenAI的GPT-3模型,将非结构化文本数据转换为结构化知识图谱表示。该产品具有强大的功能和优势,定价合理,定位于满足用户对文本数据结构化处理的需求。
多模态语音大型语言模型
fixie-ai/ultravox-v0_4_1-llama-3_1-70b是一个基于预训练的Llama3.1-70B-Instruct和whisper-large-v3-turbo的大型语言模型,能够处理语音和文本输入,生成文本输出。该模型通过特殊伪标记<|audio|>将输入音频转换为嵌入,并与文本提示合并后生成输出文本。Ultravox的开发旨在扩展语音识别和文本生成的应用场景,如语音代理、语音到语音翻译和口语音频分析等。该模型遵循MIT许可,由Fixie.ai开发。
KET-RAG 是一个结合知识图谱的检索增强型生成框架,用于高效文档索引和答案生成。
KET-RAG(Knowledge-Enhanced Text Retrieval Augmented Generation)是一个强大的检索增强型生成框架,结合了知识图谱技术。它通过多粒度索引框架(如知识图谱骨架和文本-关键词二分图)实现高效的知识检索和生成。该框架在降低索引成本的同时,显著提升了检索和生成质量,适用于大规模 RAG 应用场景。KET-RAG 基于 Python 开发,支持灵活的配置和扩展,适用于需要高效知识检索和生成的开发人员和研究人员。
多模态语音大型语言模型
fixie-ai/ultravox-v0_4_1-llama-3_1-8b是一个基于预训练的Llama3.1-8B-Instruct和whisper-large-v3-turbo的大型语言模型,能够处理语音和文本输入,生成文本输出。该模型通过特殊的<|audio|>伪标记将输入音频转换为嵌入,并生成输出文本。未来版本计划扩展标记词汇以支持生成语义和声学音频标记,进而可以用于声码器产生语音输出。该模型在翻译评估中表现出色,且没有偏好调整,适用于语音代理、语音到语音翻译、语音分析等场景。
大型语言模型,支持多语言和编程语言文本生成。
Nemotron-4-340B-Base是由NVIDIA开发的大型语言模型,拥有3400亿参数,支持4096个token的上下文长度,适用于生成合成数据,帮助研究人员和开发者构建自己的大型语言模型。模型经过9万亿token的预训练,涵盖50多种自然语言和40多种编程语言。NVIDIA开放模型许可允许商业使用和派生模型的创建与分发,不声明对使用模型或派生模型生成的任何输出拥有所有权。
多模态大型语言模型,融合视觉与语言理解。
InternVL2_5-4B是一个先进的多模态大型语言模型(MLLM),在InternVL 2.0的基础上进行了核心模型架构的维护,并在训练和测试策略以及数据质量上进行了显著增强。该模型在处理图像、文本到文本的任务中表现出色,特别是在多模态推理、数学问题解决、OCR、图表和文档理解等方面。作为开源模型,它为研究人员和开发者提供了强大的工具,以探索和构建基于视觉和语言的智能应用。
© 2025 AIbase 备案号:闽ICP备08105208号-14