OpenCompass 2.0 Large Language Model Leaderboard

简介:

大型语言模型排行榜,实时评估模型性能。

功能:

多维度评估模型性能:语言、知识、推理、数学和编程。

实时更新排行榜,展示最新模型性能。

提供模型在不同数据集上的详细评分。

支持查看模型配置文件,了解评分背后的技术细节。

闭源数据集确保评估的公正性和权威性。

用户可以轻松导航到GitHub查看相关配置文件。

需求人群:

"该产品适合研究人员、开发者和企业决策者,他们需要评估和比较不同大型语言模型的性能,以便选择最适合自己项目的模型。"

浏览量:33

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图