需求人群:
"WorkflowLLM的目标受众是开发者、数据科学家和自动化工程师,特别是那些需要处理复杂工作流和自动化任务的人。该框架通过提供大规模的数据集和优化的模型,使得这些专业人员能够更有效地构建和部署基于LLM的解决方案,以实现业务流程的自动化。"
使用场景示例:
开发者使用WorkflowLLM来自动化复杂的软件开发流程。
数据科学家利用WorkflowLLM处理和分析大规模数据集。
自动化工程师使用WorkflowLLM来设计和优化工业自动化流程。
产品特色:
数据收集:从RoutineHub等平台收集现实世界的Apple快捷指令,并将其转录成Python风格的代码。
查询扩展:使用ChatGPT生成多样化和复杂的任务查询,以丰富工作流数据集。
工作流生成:训练有素的注释模型为合成查询生成工作流,然后进行质量检查,并与收集的样本合并,形成最终的数据集。
模型微调:使用WorkflowBench微调Llama-3.1-8B模型,创建WorkflowLlama,专门针对工作流编排任务优化。
实验结果:WorkflowLlama在编排复杂工作流和泛化到未见API方面表现出色。
数据预处理:将原始的Apple Shortcuts plist格式转换为抽象语法树(AST)表示,提高数据的可读性和实用性。
训练与推理:提供工具用于模型的训练和推理,支持日志记录和保存中间检查点。
使用教程:
1. 环境设置:确保Python 3.8已安装,并根据requirements.txt安装所有依赖。
2. 数据预处理:运行preprocess/Convert_ShortCut_to_Python.py脚本来将.plist或.shortcut文件转换为Python兼容格式。
3. 训练模型:执行scripts/train.sh脚本来开始训练模型,提供基础模型路径和数据路径作为参数。
4. 运行推理:模型训练完成后,使用scripts/infer.sh运行推理,提供训练好的模型检查点路径。
5. 查看结果:分析模型的输出,评估工作流编排的效果。
6. 微调和优化:根据实验结果对模型进行微调,以适应特定的工作流需求。
浏览量:53
最新流量情况
月访问量
4.92m
平均访问时长
00:06:33
每次访问页数
6.11
跳出率
36.20%
流量来源
直接访问
51.61%
自然搜索
33.46%
邮件
0.04%
外链引荐
12.58%
社交媒体
2.19%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
12.55%
德国
3.84%
印度
9.38%
俄罗斯
4.61%
美国
18.64%
数据驱动的框架,增强大型语言模型的工作流编排能力
WorkflowLLM是一个以数据为中心的框架,旨在增强大型语言模型(LLMs)在工作流编排方面的能力。核心是WorkflowBench,这是一个大规模的监督式微调数据集,包含来自83个应用、28个类别的1503个API的106763个样本。WorkflowLLM通过微调Llama-3.1-8B模型,创建了专门针对工作流编排任务优化的WorkflowLlama模型。实验结果表明,WorkflowLlama在编排复杂工作流方面表现出色,并且能够很好地泛化到未见过的API。
AI数据引擎,涵盖标注、工作流、数据集和人工智能
V7是一个AI数据引擎,提供企业级训练数据的完整基础设施,涵盖标注、工作流、数据集和人工在循环中。它能够帮助用户快速高效地标注、处理和管理训练数据,提高AI模型的准确性和性能。V7支持自动化标注、视频标注、文档处理等功能,适用于各种行业和应用场景。
AI驱动的数据工作流引擎
Seudo是一款AI驱动的数据工作流引擎,旨在快速、轻松、可扩展地进行数据伪装。我们强大的数据引擎结合AI助手,不仅为您提供了快速方便地转换数据的工具,还会分析您的数据并提供关键洞察和建议。Seudo支持多种关键转换操作,使您的数据集可以安全地与客户、同事和客户共享,包括个人数据的删除、稀有事件的屏蔽和日期时间戳的时间偏移。Seudo开发团队目前正在将我们的数据引擎转变为一个云门户,在那里用户可以构建、存储和管理您的伪装工作流。配合我们的API,Seudo可以无缝集成到任何现有的CI/CD工作流程或数据管道中。与此同时,请探索并享受我们的演示应用。
Flyte是一款无限可扩展且灵活的工作流编排平台,无缝统一数据、机器学习和分析技术栈。
Flyte是一个生产级别的数据和机器学习工作流平台,提供了无缝集成数据、机器学习和分析技术栈的能力。它支持构建、部署和管理复杂的工作流,使得数据处理、模型训练和推理变得更加高效和可靠。Flyte提供了可视化的界面和强大的编排能力,帮助用户轻松构建和管理生产级别的数据和机器学习工作流。Flyte还提供了丰富的功能,包括任务调度、数据传输、错误处理、监控和日志记录等,以及可扩展的执行引擎,可以在云上或本地运行。
自然语言工作流自动化
DryMerge允许您使用简单的自然语言指令自动化内部团队的重复工作流程。我们的聊天机器人听取流程描述并自动处理实现,无需工程工作。自动化运营、销售、支持等工作流程,无需提交工单并等待工程师。灵活的软件集成,连接Slack、Gmail、Notion等SaaS工具。AI聚焦用户体验,通过聊天理解工作流的人际和微妙的性质,提供准确的自动化。无与伦比的产品分析,持续改进自动化质量,提供可视化的长时间运行自动化监控。[定价:免费试用]
高效的自更新视觉工作流,适用于大型语言模型。
OmniChain是一个为大型语言模型设计的高效自更新视觉工作流工具。它通过自定义逻辑流程引导AI语言模型,显著提高了工作效率。OmniChain利用链式记忆能力存储和回忆信息,基于这些信息做出决策。它允许用户创建像不知疲倦的机器人员工一样24/7工作的流程,只有在用户决定与之交流时才会暂停操作。OmniChain还可以通过特定过程引导较小的模型,提高效率和成本效益。此外,它能够访问底层操作系统读写文件和运行命令,生成和运行NodeJS代码片段或脚本,使用API,自动化任务等。OmniChain是私有的(自托管)、完全开源的,并通过非限制性的MIT许可证可供商业使用。
分散AI资源整合工具,编排自动化工作流
FlowDeer³是一款分散AI资源整合工具,提供工作流编排、思维树等功能,帮助用户自动化处理复杂任务。通过编排分散的AI服务和自动化组件,实现高效的工作流程。支持自定义组件扩展,助力降低自动化开发成本。
文本到图像生成的自适应工作流
ComfyGen 是一个专注于文本到图像生成的自适应工作流系统,它通过学习用户提示来自动化并定制有效的工作流。这项技术的出现,标志着从使用单一模型到结合多个专业组件的复杂工作流的转变,旨在提高图像生成的质量。ComfyGen 背后的主要优点是能够根据用户的文本提示自动调整工作流,以生成更高质量的图像,这对于需要生成特定风格或主题图像的用户来说非常重要。
基于ComfyUI前端开发的LLM工作流节点集合
ComfyUI LLM Party旨在基于ComfyUI前端开发一套完整的LLM工作流节点集合,使用户能够快速便捷地构建自己的LLM工作流,并轻松地将它们集成到现有的图像工作流中。
自动化工作流生成框架
AFlow是一个框架,用于自动生成和优化代理工作流。它利用蒙特卡洛树搜索在代码表示的工作流空间中寻找有效的工作流,替代手工开发,展现出在多种任务上超越手工工作流的潜力。AFlow的主要优点包括提高开发效率、减少人力成本,并能够适应不同的任务需求。
构建无代码 AI 工作流
Questflow 是一个无代码 AI 工作流自动化的市场平台。我们帮助用户发现和部署跨平台的 AI 工作流,提高工作效率。此外,我们还帮助创作者定制、分发和盈利 AI 工作流,无需编码经验。
一个可视化的AI工作流构建平台
Playnode是一个基于网页的AI工作流构建平台,它允许用户通过拖拽的方式创建和部署AI模型,支持多种AI模型和数据流的组合,以实现复杂的数据处理和分析任务。该平台的主要优点是其可视化操作界面,使得即使是非技术用户也能轻松上手,快速构建和部署AI工作流。Playnode的背景信息显示,它旨在降低AI技术的门槛,让更多人能够利用AI技术解决实际问题。目前,Playnode提供免费试用,用户可以开始免费使用并获得每周20个积分,无需信用卡信息。
一个受启发的创意工作流
Minionverse是一个基于AI的创意工作流,它通过使用不同的节点和模型来生成图像。这个工作流的灵感来自于一个在线的glif应用,并且提供了一个视频教程来指导用户如何使用。它包含了多种自定义节点,能够进行文本替换、条件加载、图像保存等操作,非常适合需要进行图像生成和编辑的用户。
多人协作工作流的无缝集成节点
ComfyUI-Nexus 是一个为 ComfyUI 定制的节点,旨在实现多人协作工作流的无缝集成。它允许多个用户同时在同一工作流上工作,支持本地和远程访问,并通过实时聊天功能加强团队协作。该插件还具备管理员权限控制、工作流备份等功能,确保团队工作流程的顺畅和高效。
简化复杂的UML和工作流设计
Diagramming AI是一个利用人工智能简化复杂的UML和工作流设计的工具。通过直观的AI命令,您可以轻松创建和更新图表。AI Chat功能可以为您提供定制建议和高级条件,使图表设计变得更加简单和动态。我们的存储和检索系统可以确保您的项目保持有序和可访问。
TOFU数据集为大型语言模型的虚构遗忘任务提供基准。
TOFU数据集包含根据不存在的200位作者虚构生成的问答对,用于评估大型语言模型在真实任务上的遗忘性能。该任务的目标是遗忘在各种遗忘集比例上经过微调的模型。该数据集采用问答格式,非常适合用于流行的聊天模型,如Llama2、Mistral或Qwen。但是,它也适用于任何其他大型语言模型。对应的代码库是针对Llama2聊天和Phi-1.5模型编写的,但可以轻松地适配到其他模型。
高性能语言模型基准测试数据集
DCLM-baseline是一个用于语言模型基准测试的预训练数据集,包含4T个token和3B个文档。它通过精心策划的数据清洗、过滤和去重步骤,从Common Crawl数据集中提取,旨在展示数据策划在训练高效语言模型中的重要性。该数据集仅供研究使用,不适用于生产环境或特定领域的模型训练,如代码和数学。
ScanFlow - 智能设备上的AI扫描仪,用于数据捕获和工作流自动化
ScanFlow是一款智能设备上的AI扫描仪,用于数据捕获和工作流自动化。它为工人和顾客与实体对象互动提供实时洞察力,提高工作流效率。ScanFlow能够实时扫描条形码、文本和其他数据,并将其转化为可用于工作流程的信息。它还支持自定义工作流和自动化规则,以满足不同的业务需求。ScanFlow提供简单易用的界面和丰富的功能,使用户能够快速准确地捕获和处理数据。
构建和训练大型语言模型的综合框架
DataComp-LM (DCLM) 是一个为构建和训练大型语言模型(LLMs)而设计的综合性框架,提供了标准化的语料库、基于open_lm框架的高效预训练配方,以及超过50种评估方法。DCLM 支持研究人员在不同的计算规模上实验不同的数据集构建策略,从411M到7B参数模型。DCLM 通过优化的数据集设计显著提高了模型性能,并且已经促成了多个高质量数据集的创建,这些数据集在不同规模上表现优异,超越了所有开放数据集。
AI工作流驱动的智能代理平台
VectorVein是一个AI工作流驱动的智能代理平台,无需编程即可通过拖放创建强大的工作流,快速生成智能代理的无限可能性。该平台专注于提高生产力,具有丰富的功能和强大的扩展性,适用于需要自动化处理重复工作流的各种场景。
大型语言模型角色扮演框架
RoleLLM是一个角色扮演框架,用于构建和评估大型语言模型的角色扮演能力。它包括四个阶段:角色概要构建、基于上下文的指令生成、使用GPT进行角色提示和基于角色的指令调整。通过Context-Instruct和RoleGPT,我们创建了RoleBench,这是一个系统化和细粒度的角色级别基准数据集,包含168,093个样本。此外,RoCIT在RoleBench上产生了RoleLLaMA(英语)和RoleGLM(中文),显著提高了角色扮演能力,甚至与使用GPT-4的RoleGPT取得了可比较的结果。
高质量开放数据集平台,为大型模型提供数据支持
OpenDataLab是一个开源数据平台,提供高质量的开放数据集,支持大型AI模型的训练和应用。平台容量巨大,包含5500多个数据集,涵盖1500多种任务类型,总数据量达到80TB以上,下载量超过1064500次。平台提供30多种应用场景、20多种标注类型和5种数据类型,支持数据结构、标注格式和在线可视化的统一标准,实现数据的开放共享和智能搜索,提供结构化的数据信息和可视化的注释和数据分布,方便用户阅读和筛选。平台提供快速下载服务,无需VPN即可从国内云端快速下载数据。
简单集成 AI 工作流,无需编码
Script.It 是一款无代码平台,让您轻松构建复杂的 AI 工作流。增强您的 AI 生产力,实现高效的工作流程,提升业务效率。在几天内为您的业务获得 AI 的好处,而不是几个月。通过灵活使用上下文数据,提供一致准确的输出。通过可适应的工作流自动化繁琐重复的任务。无代码解决方案轻松与现有工作流集成,无需开发!
AI驱动的YouTube内容管理和工作流
Clipcision是一个AI驱动的YouTube内容管理和工作流工具,帮助优化内容管理和工作流程,提升YouTube频道的表现。它提供了15种工具,包括AI训练模块、即时短视频编辑、推送功能等,可提高内容创作效率、质量和观众数量。Clipcision的定价根据不同的使用情况而定。它适用于任何需要优化YouTube内容策略的创作者。
自动化工作流,简化业务流程。
Manaflow是一个旨在通过AI技术自动化长而重复的工作流程,特别是那些适合表格的任务。它允许用户通过自然语言来构建工作流,一键执行涉及数据、API和操作的任务。产品由Y Combinator支持,致力于帮助企业像大型科技公司一样使用AI来扩展业务,将繁琐的手动电子表格和软件任务转变为自动化的工作流程。
AI助力的自动化工作流软件。
Bardeen AI是一个通过简单提示即可执行重复性工作的AI代理,旨在简化工作流程,提高效率。它集成了多种应用程序和浏览器,以安全、可靠地完成工作。Bardeen AI的主要优点包括无需编程或技术背景即可通过简单语言指令操作,实时确认行动计划,并在后台持续执行任务。它支持多种集成,如Google Sheets、Slack、LinkedIn等,适用于销售、招聘、市场研究等多种场景。
探索大型语言模型作为编程辅导工具的潜力,提出Trace-and-Verify工作流。
Coding-Tutor是一个基于大型语言模型(LLM)的编程辅导工具,旨在通过对话式交互帮助学习者提升编程能力。它通过Trace-and-Verify(Traver)工作流,结合知识追踪和逐轮验证,解决编程辅导中的关键挑战。该工具不仅适用于编程教育,还可扩展到其他任务辅导场景,帮助根据学习者的知识水平调整教学内容。项目开源,支持社区贡献。
© 2025 AIbase 备案号:闽ICP备08105208号-14