Open LLM Leaderboard：开源大模型排行榜，助力筛选先进模型

作者：佚名时间：2025-12-27 08:40

字号

Open LLM Leaderboard是什么

Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace 推出的开源大模型排行榜单，基于 Eleuther AI Language Model Evaluation Harness（Eleuther AI语言模型评估框架）封装。Open LLM Leaderboard通过多种基准测试（如 IFEval、BBH、MATH 等），从指令遵循、复杂推理、数学解题、专业知识问答等多个维度对模型进行评估。排行榜涵盖预训练模型、聊天模型等多种类型，提供详细的数值结果和模型输入输出细节。Open LLM Leaderboard 能帮助用户筛选出当前最先进的模型，推动开源社区的进步。

Open LLM Leaderboard

Open LLM Leaderboard 的主要功能

Open LLM Leaderboard 的评估基准

如何使用Open LLM Leaderboard

git clone git@github.com:huggingface/lm-evaluation-harness.git
cd lm-evaluation-harness
git checkout main
pip install -e .
lm-eval --model_args="pretrained=,revision=,dtype=" --tasks=leaderboard --batch_size=auto --output_path=<output_path>

Open LLM Leaderboard的应用场景

责任编辑：CQITer新闻报料：400-888-8888 本站原创，未经授权不得转载

关键词 >>Open LLM Leaderboard：开源大模型排行榜，

继续阅读

软银与OpenAI强强联手打造水晶智能，日本企业效率革命即将爆发

月之暗面开源Kosong框架：异步编排+插件化设计，开发者自由度拉满！你准备好迎接AI开发新革命了吗？

还在为3D建模发愁？这款免费AI工具竟能秒出高质量模型，效率提升500%

热新闻

7天 30天 1年