Light-R1-14B-DS

简介:

一款开源的14B参数量的数学模型,通过强化学习训练,性能卓越。

功能:

基于强化学习的长链推理训练,提升数学问题解决能力

开源模型,方便研究人员和开发者进行二次开发和研究

在 AIME24 和 AIME25 等数学基准测试中表现优异,具有高准确率

支持轻量级预算下的高效训练,降低计算成本

提供详细的训练日志和技术报告,便于理解和复现

需求人群:

"该模型适合从事自然语言处理研究的学者和开发者,尤其是那些专注于数学问题解决、教育领域应用以及强化学习技术研究的人员。对于希望在轻量级预算下实现高性能模型训练的团队,该模型提供了一个优秀的参考案例,能够帮助他们快速上手并进行相关研究和开发工作。"

浏览量:131

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图