需求人群:
"目标受众包括研究人员、开发者和任何需要与大量文档进行交互的用户。IncarnaMind通过提供高效的文档查询和对话功能,帮助他们更好地理解和利用文档中的数据,提高工作效率。"
使用场景示例:
研究人员可以使用IncarnaMind与他们的研究论文进行对话,快速获取所需信息。
开发者可以通过IncarnaMind与技术文档交互,解决编程中遇到的问题。
企业用户可以利用IncarnaMind进行知识管理,提高团队协作效率。
产品特色:
自适应分块:动态调整窗口大小和位置,平衡细粒度和粗粒度数据访问。
多文档对话问答:支持简单和多跳查询,同时跨多个文档进行查询。
文件兼容性:支持PDF和TXT文件格式。
LLM模型兼容性:支持OpenAI GPT、Anthropic Claude、Llama2和其他开源LLMs。
系统要求:需要超过35GB的GPU RAM来运行GGUF量化版本。
开源和本地LLMs支持:推荐使用llama2-70b-chat模型,支持其他LLMs的实验。
即将发布:计划发布更小、成本效益更高的微调模型。
使用教程:
1. 安装:克隆仓库并设置Python环境。
2. 创建环境:使用Conda创建虚拟环境并激活。
3. 安装依赖:安装所有必需的依赖项。
4. 设置API密钥:在configparser.ini文件中设置API密钥。
5. 上传文件:将文件放入/data目录并运行命令处理文件。
6. 运行:启动对话,等待脚本提示输入。
7. 聊天:与系统进行交互,提出问题并获取答案。
8. 日志管理:系统会自动生成IncarnaMind.log文件,可以根据需要编辑日志设置。
浏览量:19
最新流量情况
月访问量
5.00m
平均访问时长
00:06:52
每次访问页数
5.82
跳出率
37.31%
流量来源
直接访问
52.65%
自然搜索
32.08%
邮件
0.05%
外链引荐
12.79%
社交媒体
2.25%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
13.49%
德国
3.62%
印度
9.70%
俄罗斯
3.96%
美国
18.50%
通过GPT等大型语言模型与你的文档对话
IncarnaMind是一个开源项目,旨在通过大型语言模型(LLMs)如GPT、Claude和本地开源LLMs,实现与个人文档(PDF、TXT)的交互对话。该项目利用滑动窗口分块机制和集成检索器,提高查询效率,增强LLMs的准确性。它支持多文档对话问答,突破了单文档限制,并兼容多种文件格式和LLM模型。
发现、分享和推广最好的OpenAI GPT
ProGPTs是一个专注于OpenAI GPT的平台,用户可以发现、分享和推广最好的GPT模型。平台提供了一个独家列表,展示了各种领域的顶尖GPT模型。用户可以提交自己的GPT模型,与超过7000名用户分享和推广。ProGPTs还提供了订阅功能,让用户可以及时了解到最新的GPT模型。无论你是开发者、研究者还是对GPT模型感兴趣的人,ProGPTs都是一个不可多得的资源。
一站式数据处理系统,为大型语言模型提供高质量数据。
Data-Juicer 是一个一站式的多模态数据处理系统,旨在为大型语言模型(LLMs)提供更高质量、更丰富、更易消化的数据。它提供了一个系统化和可复用的数据处理库,支持数据与模型的协同开发,通过沙盒实验室实现快速迭代,并提供基于数据和模型的反馈循环、可视化和多维度自动评估等功能,帮助用户更好地理解和改进他们的数据和模型。Data-Juicer 正在积极更新和维护,定期增强和添加更多功能、数据配方和数据集。
集成大型语言模型的SDK
Semantic Kernel是一个集成了大型语言模型(LLMs)如OpenAI、Azure OpenAI和Hugging Face的软件开发工具包(SDK),它允许开发者通过定义可串联的插件,在几行代码内实现与AI的交互。其特色在于能够自动编排AI插件,使用户能够通过LLM生成实现特定目标的计划,并由Semantic Kernel执行该计划。
AI原生数据应用开发框架
DB-GPT是一个开源的AI原生数据应用开发框架,利用AWEL(Agentic Workflow Expression Language)和代理(agent)技术,简化了大型模型应用与数据的结合。它通过多模型管理、Text2SQL效果优化、RAG框架优化、多代理框架协作等技术能力,使企业和开发者能够以更少的代码构建定制化应用。DB-GPT在数据3.0时代,基于模型和数据库,为构建企业级报告分析和业务洞察提供了基础数据智能技术。
基于AI的Python网络爬虫库,自动化提取网页信息。
ScrapeGraphAI是一个使用LLM(大型语言模型)和直接图逻辑来为网站、文档和XML文件创建抓取管道的Python网络爬虫库。用户只需指定想要提取的信息,库就会自动完成这项工作。该库的主要优点在于简化了网络数据抓取的过程,提高了数据提取的效率和准确性。它适用于数据探索和研究目的,但不应被滥用。
基于 LLM 大语言模型的知识库问答系统。
MaxKB 是一款基于 LLM 大语言模型的知识库问答系统,旨在成为企业的最强大脑。支持文档上传、自动爬取在线文档,智能问答交互体验好。支持快速嵌入到第三方业务系统。技术栈包括 Vue.js、Python/Django、Langchain、PostgreSQL/pgvector。
GPT-4超能力聊天机器人
PageBot是一款由GPT驱动的聊天机器人,能够理解您的网站内容和知识库。它可以为您的客户提供令人愉快和即时的对话体验。无需编程,只需一行代码,即可将PageBot集成到您的网站中。 PageBot可以自动导入各种数据,提供优化的回答,还有免费计划和灵活的定价。
Visual Studio Code插件,基于GPT-4,帮助编程,提高效率。
Sidekick AI是一个Visual Studio Code的插件,它利用GPT-4的能力,为开发者提供各种支持,比如快速生成代码、检索和修改代码、提出疑问并解答、查找bug等,可以极大提高编程效率。
AI Buddy - 智能个人助理
AI Buddy是一款智能个人助理应用,采用最新的OpenAI技术,GPT,可以回答问题、帮助撰写文本等,以自然对话的形式提供帮助。免费版本提供每日5条信息,订阅版本提供更多交互和更深入有意义的对话。定价方案灵活且实惠。不断更新改进的应用,添加新功能和能力。快来下载AI Buddy,探索人工智能的无限可能吧!
定制化GPT解决方案,加速业务转型
YourGPT是一款定制化的GPT解决方案,帮助您更快更智能地实现业务目标。借助LLMs和GPT的强大能力,您可以轻松构建和集成GPT,满足个性化需求。通过YourGPT,您可以解锁人工智能和GPT技术的全部潜力,自信地实现创新。
让您的AI助手像人类一样交流
Quickchat AI是一款帮助公司构建自己的多语言AI助手的技术。借助我们的无代码平台和强大的集成功能,公司可以构建会话式AI界面,并将其连接到任何网站、产品、应用、游戏或智能设备。Quickchat AI由生成式AI模型(如GPT-3)驱动,可以实现多语言的自然对话,并提供自动化客户支持、线索生成等功能。
与文档进行自然语言对话的Python应用
Chat With Your Docs 是一个Python应用程序,允许用户与多种文档格式(如PDF、网页和YouTube视频)进行对话。用户可以使用自然语言提问,应用程序将基于文档内容提供相关回答。该应用利用语言模型生成准确答案。请注意,应用仅回应与加载的文档相关的问题。
基于记忆的RAG框架,用于全目的应用
MemoRAG是一个基于记忆的RAG框架,它通过高效的超长记忆模型,为各种应用提供支持。与传统的RAG不同,MemoRAG利用其记忆模型实现对整个数据库的全局理解,通过从记忆中回忆查询特定的线索,增强证据检索,从而生成更准确、更丰富的上下文响应。MemoRAG的开发活跃,不断有资源和原型在此仓库发布。
旨在帮助我们理解AI代理的工程化提示项目。
SuperPrompt是一个开源项目,旨在通过精心设计的提示来帮助我们更好地理解人工智能代理。该项目由多个阶段组成,目前仍处于永远的测试阶段。它不仅适用于Claude这样的大型语言模型,也适用于其他类似的模型。项目在移动设备上创建,预期将不断改进。SuperPrompt通过一系列复杂的逻辑和数学结构,旨在探索和扩展AI的认知边界,推动AI技术的发展。
模块化研究导向的检索增强生成统一框架
RAGLAB是一个模块化、研究导向的开源框架,专注于检索增强生成(RAG)算法。它提供了6种现有RAG算法的复现,以及一个包含10个基准数据集的全面评估系统,支持公平比较不同RAG算法,并便于高效开发新算法、数据集和评估指标。
集成了通用和编程能力的人工智能模型
DeepSeek-V2.5 是一个升级版本,结合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的功能。这个新模型整合了两个先前版本的通用和编程能力,更好地符合人类的偏好,并在写作和指令遵循等多个方面进行了优化。
情商智商俱佳的多模态大模型
西湖大模型是心辰智能云推出的一款具有高情商和智商的多模态大模型,它能够处理包括文本、图像、声音等多种数据类型,为用户提供智能对话、写作、绘画、语音等AI服务。该模型通过先进的人工智能算法,能够理解和生成自然语言,适用于多种场景,如心理咨询、内容创作、客户服务等,具有高度的定制性和灵活性。西湖大模型的推出,标志着心辰智能云在AI领域的技术实力和创新能力,为用户提供了更加丰富和高效的智能服务体验。
使GPT开发者在OpenAI商店中获得更好的排名和收益
GPT Builder Tools是一个为GPT开发者提供的工具平台,旨在帮助他们通过分析、支付和营销工具来提升其GPT在OpenAI商店中的排名和吸引更多用户。该平台支持开发者追踪GPT的性能,吸引更多用户,并在OpenAI商店中实现GPT的货币化。此外,它还提供了一个分析仪表板,让开发者更好地理解他们的用户群体,从而优化GPT的用户体验和市场表现。
RWKV v6 Finch 14B,开源大模型,高效处理长文本。
RWKV v6 Finch 14B是RWKV架构的第六个版本,也是该系列中最大的模型。它通过引入数据依赖性到token shift和time-mixing中,提高了处理长文本时的效率。Finch 14B模型在处理提示时,能够更好地管理其长期记忆,从而提供更广泛的应用范围。该模型是开源的,由Linux Foundation认可,并且接受社区的GPU集群时间捐赠以支持训练。
104B参数的多语种高级对话生成模型
C4AI Command R+ 08-2024是一个拥有104B参数的大规模研究发布模型,具备高度先进的能力,包括检索增强生成(RAG)和工具使用,以自动化复杂任务。该模型支持23种语言的训练,并在10种语言中进行评估。它优化了多种用例,包括推理、总结和问答。
一个用于加载和测试大型语言模型的互动平台。
LLM Playground是一个在线平台,允许用户加载和测试各种大型语言模型。它为开发者和研究者提供了一个实验和探索人工智能最新进展的环境。该平台的主要优点是易于使用,支持多种模型,并且可以即时看到模型的输出结果。
未来派的AI驱动网页爬虫工具。
CyberScraper 2077是一款基于AI的网页爬虫工具,它利用OpenAI和Ollama等大型语言模型(LLM)来智能解析网页内容,提供数据提取服务。这款工具不仅拥有用户友好的图形界面,还支持多种数据导出格式,包括JSON、CSV、HTML、SQL和Excel。此外,它还具备隐形模式,以降低被检测为机器人的风险,以及遵循robots.txt和网站政策的道德爬取特性。
革命性的检索增强生成系统技术集合。
RAG_Techniques 是一个专注于检索增强生成(Retrieval-Augmented Generation, RAG)系统的技术集合,旨在提升系统的准确性、效率和上下文丰富性。它提供了一个前沿技术的中心,通过社区贡献和协作环境,推动RAG技术的发展和创新。
专业的数据解决方案提供商
博登智能自主研发的数据标注处理平台——BASE(Boden Annotation Service Enhancement),具有超强适用性,可完成从数据采集、清洗、标注到验证的全套服务。BASE平台覆盖了包括语音、文本、图像、视频、点云等多种模态类型的数据处理能力,通过AI辅助标注的形式,相较于传统的标注方式,帮助企业节省了高达30%-40%的成本,并提升50%以上的效率,已经获得了市场的广泛认可。 数据处理平台——BASE平台能够支持开展包括通用图像标注,3D/4D点云标注,图片点云融合标注,NLP文本标注,医疗影像标注,视频描述标注,音素标注,音频标注等标注业务。
前端标注组件库,支持多种数据标注方式。
labelU-Kit 是一个开源的前端标注组件库,提供图片、视频和音频的标注功能,支持2D框、点、线、多边形、立体框等多种标注方式。它以NPM包的形式提供,方便开发者集成到自己的标注平台中,提高数据标注的效率和灵活性。
开源版Anthropic的Claude Artifacts界面
AI Artifacts是一个开源的Anthropic Claude Artifacts界面版本,使用E2B的代码解释器SDK和核心SDK执行AI代码。E2B提供了一个云沙箱来安全地运行AI生成的代码,并可以处理安装库、运行shell命令、运行Python、JavaScript、R以及Nextjs应用程序等。
© 2024 AIbase 备案号:闽ICP备08105208号-14