Open LLM Leaderboard:开源大模型排行榜,助力筛选先进模型
作者:佚名 时间:2025-12-27 08:40
字号
Open LLM Leaderboard是什么
Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace 推出的开源大模型排行榜单,基于 Eleuther AI Language Model Evaluation Harness(Eleuther AI语言模型评估框架)封装。Open LLM Leaderboard通过多种基准测试(如 IFEval、BBH、MATH 等),从指令遵循、复杂推理、数学解题、专业知识问答等多个维度对模型进行评估。排行榜涵盖预训练模型、聊天模型等多种类型,提供详细的数值结果和模型输入输出细节。Open LLM Leaderboard 能帮助用户筛选出当前最先进的模型,推动开源社区的进步。

Open LLM Leaderboard 的主要功能
Open LLM Leaderboard 的评估基准
如何使用Open LLM Leaderboard
git clone git@github.com:huggingface/lm-evaluation-harness.git
cd lm-evaluation-harness
git checkout main
pip install -e .
lm-eval --model_args="pretrained=,revision=,dtype=" --tasks=leaderboard --batch_size=auto --output_path=<output_path>
Open LLM Leaderboard的应用场景
责任编辑:CQITer新闻报料:400-888-8888 本站原创,未经授权不得转载
继续阅读




