Goedel-Prover

Goedel-Prover 是一款专注于自动化定理证明的开源大型语言模型。它通过将自然语言数学问题翻译为形式化语言(如 Lean 4),并生成形式化证明,显著提升了数学问题的自动化证明效率。该模型在 miniF2F 基准测试中达到了 57.6% 的成功率,超越了其他开源模型。其主要优点包括高性能、开源可扩展性以及对数学问题的深度理解能力。Goedel-Prover 旨在推动自动化定理证明技术的发展,并为数学研究和教育提供强大的工具支持。

需求人群:

"Goedel-Prover 适合数学家、计算机科学家、研究人员以及对自动化定理证明感兴趣的开发者。它为数学研究、教育和相关领域的自动化证明提供了强大的技术支持。"

使用场景示例:

在 miniF2F 基准测试中,Goedel-Prover 达到了 57.6% 的成功率,显著高于其他开源模型。

在 PutnamBench 排行榜中,Goedel-Prover 成功解决了 7 个问题,位居榜首。

为 Lean Workbook 生成了 29.7K 个形式化证明,几乎翻倍于此前的工作成果。

产品特色:

将自然语言数学问题翻译为形式化语言(Lean 4)

生成高质量的形式化证明

支持多数据集的性能评估

提供开源模型和数据集,便于研究和扩展

在多个基准测试中表现优异,如 miniF2F 和 PutnamBench

支持多 GPU 并行推理,提升计算效率

使用教程:

1. 克隆仓库:`git clone --recurse-submodules https://github.com/Goedel-LM/Goedel-Prover.git`

2. 安装依赖:`pip install -r requirements.txt`

3. 构建 Lean 4 和 mathlib4:`cd mathlib4 && lake build`

4. 测试安装:运行 `python prover/lean/verifier.py` 确保环境正常

5. 运行推理:使用 `sh eval/eval.sh` 脚本,指定数据集、模型路径和输出目录等参数

浏览量:12

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
网站流量情况

最新流量情况

月访问量

5.03m

平均访问时长

00:06:29

每次访问页数

5.88

跳出率

37.10%

流量来源

直接访问

52.07%

自然搜索

32.84%

邮件

0.04%

外链引荐

12.88%

社交媒体

2.04%

展示广告

0

截止目前所有流量趋势图

地理流量分布情况

中国

12.85%

德国

3.90%

印度

9.41%

俄罗斯

4.16%

美国

18.95%

类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图