简介:

一个用于训练高性能奖励模型的开源数据集。

功能:

包含21,362个样本,每个样本包括一个提示、一个响应以及五个人类标注的属性评分。

属性评分包括帮助性、正确性、连贯性、复杂性和冗余度。

支持多轮对话的样本,可以用于基于偏好对的DPO或Preference RM训练。

响应由10种不同的内部大型语言模型生成,提供多样化但合理的响应。

使用Scale AI进行标注,确保了数据集的质量和一致性。

数据集遵循CC-BY-4.0许可,可以自由使用和分发。

需求人群:

"HelpSteer2数据集主要面向需要训练和优化对话系统、奖励模型和语言模型的开发者和研究人员。它特别适合那些希望提高模型在特定任务上表现的专业人士,例如客户服务自动化、虚拟助手或任何需要自然语言理解和生成的场景。"

浏览量:16

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图