简介:

从人工智能反馈中获得内在动机

功能:

使用 LLM 的偏好创建一组注释对的注释数据集

使用交叉熵将 LLM 的偏好转化为奖励函数

使用强化学习训练代理

需求人群:

"Motif 可以用于训练 AI 代理在开放式且程序生成的游戏中获取内在动机。"

浏览量:8

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图