简介:

使用自主强化学习训练野外设备控制代理

功能:

使用自主VLM评估器解决开放式Android任务

通过离线强化学习最大化现有数据集的利用

采用离线到在线的强化学习鼓励代理自我学习

使用指令级价值函数构建自动课程

利用步进级价值函数挑选有利动作

通过自主收集的rollout训练,减少从错误中恢复的失败

与现有的行为克隆方法相比,具有更低的样本复杂度和更高的学习效率

需求人群:

"DigiRL的目标受众主要是人工智能和机器学习领域的研究人员与开发者,特别是那些专注于强化学习、自主智能代理以及设备控制自动化的专业人士。他们可以利用DigiRL来开发能够适应不断变化环境的智能系统,提高自动化任务的效率和准确性。"

浏览量:14

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图