DeepScaleR-1.5B-Preview

简介:

一个基于强化学习优化的大型语言模型,专注于数学问题解决能力的提升。

功能:

使用分布式强化学习算法优化模型性能

支持长文本上下文(最长可达24K),提升复杂问题解决能力

基于大规模数学问题数据集进行训练,覆盖 AIME、AMC 等竞赛题目

提供高效的推理服务支持,兼容多种高性能推理系统

开源模型架构和训练方法,便于开发者二次开发和研究

需求人群:

"该模型主要面向教育领域的研究人员、开发者以及数学竞赛选手。研究人员可以利用其开源特性进行算法研究和改进;开发者可以将其集成到教育软件中,为学生提供智能辅导;数学竞赛选手可以使用该模型进行解题练习和思路启发。"

浏览量:55

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图