OLMo 2 1124 13B Preference Mixture

简介:

大规模多语言偏好混合数据集

功能:

包含多个来源的合成数据,用于生成偏好和指令遵循数据。

支持多种语言和方言,增强模型的多语言能力。

提供大量的文本对,用于微调和优化大型语言模型。

数据集经过清洗,去除了ShareGPT和TruthfulQA实例,提高了数据质量。

支持研究和教育用途,符合Ai2的负责任使用指南。

数据集包含多个模型的输出,如Mistral、Tulu、Yi等,增加了数据多样性。

适用于开发和训练具有特定偏好和指令理解能力的语言模型。

需求人群:

"目标受众为自然语言处理领域的研究人员、开发者和教育机构。他们可以利用这个数据集来训练和改进语言模型,特别是在需要理解和生成具有特定用户偏好的文本方面。"

浏览量:2

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图