Elimination Game

简介:

一种测试大语言模型在复杂社交博弈中智能性的基准测试框架,灵感来源于‘狼人杀’游戏。

功能:

模拟多玩家竞争环境,测试模型在社交博弈中的综合能力。

支持公开讨论和私下交流,模拟真实社交场景中的信息传递。

通过投票淘汰机制,评估模型的策略性决策和社交推理能力。

提供详细的评估指标,包括背叛率、陪审团说服力等,全面衡量模型表现。

支持多种语言模型参与测试,为 AI 研究提供丰富的实验数据。

需求人群:

"该产品适合人工智能研究人员、开发者以及对社交博弈和 AI 社交能力感兴趣的专业人士。它为研究语言模型在复杂社交环境中的表现提供了独特的视角和工具,有助于推动 AI 在社交智能领域的研究和发展。"

浏览量:50

打开站点

类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图