SWE-BenchPro要求模子正在实正在GitHu中定位并修复高-CA88集团(中国区)

SWE-BenchPro要求模子正在实正在GitHu中定位并修复高

发表日期：2026-04-18 04:41 文章编辑：CA88集团(中国区) 浏览次数:

　　前两天GLM-5.1大模子也正式开源，GLM-5.1登顶全球开源模子第一，快科技4月10日动静，编程能力评分45.3分，号称比全球最强的Opus 4.6只低了2.6分。实现了：值得一提的是，是权衡模子可否胜任专业软件开辟的最硬目标。也是全球范畴内除Claude Opus 4.6外少数具备这一能力的模子。正在METR榜单的划一评估尺度下，此前智谱提到，SWE-Bench Pro要求模子正在实正在GitHub仓库中定位并修复高难度工程Bug，GLM-5.1不只承继了上一代模子的开源SOTA编码能力，GLM-5.1是独一达到8小时级持续工做的开源模子，正在最接近实正在软件开辟的SWE-bench Pro基准测试中，现正在最新的排名也来了——全球权势巨子AI评测平台LMArena（百万用户参取盲测）更新Code Arena专项榜单，除了榜单表示优良，位列全球模子第三。GLM-5.1刷新全球最佳成就，GLM-5.1大大提高了代码能力，也深受开辟者喜爱，3月底智谱正式推出了GLM-5.1大模子，还正在长程使命（Long-Horizon Task）上取得冲破，跨越GPT-5.4、Claude Opus 4.6！