简介:

这是一个完全开放的 DeepSeek-R1 模型的复现项目,旨在帮助开发者复现和构建基于 R1 的模型。

功能:

提供完整的 R1 模型训练和评估流程,包括 SFT 和 GRPO 方法。

支持多种硬件配置,如 DDP 和 DeepSpeed(ZeRO-2 和 ZeRO-3)。

通过 Distilabel 生成合成数据,丰富训练数据集。

使用 lighteval 进行模型评估,支持多种任务和模型大小。

提供 Makefile 简化命令操作,方便用户快速上手。

需求人群:

"该项目适合希望在自然语言处理领域进行研究和开发的开发者、研究人员以及企业用户。它提供了一个完整的框架,帮助用户复现和改进 DeepSeek-R1 模型,同时支持多种硬件配置和训练方法,适合不同规模和需求的项目。"

浏览量:23

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图