简介:

通过自博弈相互推理,提升小型语言模型的解决问题能力。

功能:

自我博弈相互推理:通过自博弈的方式,提升小型语言模型的推理能力。

蒙特卡洛树搜索(MCTS):结合人类推理动作,构建高质量的推理轨迹。

SLMs鉴别器验证:使用另一个SLM作为鉴别器,验证推理轨迹的正确性。

无需微调或高级模型:直接提升现有模型的推理能力。

广泛的实验验证:在多个SLMs上进行实验,证明其有效性。

显著提升推理问题解决率:如GSM8K问题解决率显著提高。

需求人群:

"rStar适合那些希望提升小型语言模型推理能力而无需进行复杂微调的研究人员和开发者。它特别适合于需要解决复杂推理问题的场景,如自动问答、自然语言推理等。"

浏览量:7

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图