GPT-5.2科研题得分仅25%!AI的聪明竟是假象,深度推理惨不忍睹?
作者:佚名 时间:2025-12-28 15:10
字号
FrontierScience是什么
FrontierScience是OpenAI推出的科学AI能力评估基准,专门测试大模型在物理、化学、生物领域的专家级推理能力。包含两个子集:奥林匹克赛道(100道竞赛级短答题)和研究赛道(60道博士级开放任务),由国际奥赛奖牌得主和在职科学家设计。测试结果显示,GPT-5.2在竞赛题上得分77%,但科研题仅25%,暴露出AI在长期推理和假设验证方面的不足。基准填补了传统科学测试的空白,强调深度推理而非简单知识检索,为AI在科研中的应用潜力提供了量化参考。

FrontierScience的主要功能
FrontierScience的技术原理
FrontierScience的项目地址
FrontierScience的应用场景
责任编辑:CQITer新闻报料:400-888-8888 本站原创,未经授权不得转载
继续阅读




