简介:

展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。

功能:

采用蒙特卡洛树搜索(MCTS)进行深度思考和测试时搜索。

提出新颖的代码增强链式推理(CoT)数据合成方法,生成验证推理轨迹。

开发新的流程奖励模型训练方法,避免简单的步骤级评分标注。

实现自我演化配方,从头开始构建并迭代演化策略SLM和PPM,提升推理能力。

在多个数学基准测试中表现出色,提升小型语言模型的数学推理水平。

需求人群:

"目标受众为研究人员、开发者以及对提升小型语言模型数学推理能力感兴趣的学术界和工业界人士。该模型适用于需要高效数学推理和问题解决能力的场景,如教育领域的智能辅导系统、数学竞赛训练工具等。"

浏览量:7

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图