咨询邮箱 咨询邮箱:kefu@qiye126.com 咨询热线 咨询热线:0431-88981105 微信

微信扫一扫,关注我们最新活动

您的位置:CA88集团(中国区) > ai资讯 > >
SWE-BenchPro要求模子正在实正在GitHu中定位并修复高
发表日期:2026-04-18 04:41   文章编辑:CA88集团(中国区)    浏览次数:

  前两天GLM-5.1大模子也正式开源,GLM-5.1登顶全球开源模子第一,快科技4月10日动静,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。实现了:值得一提的是,是权衡模子可否胜任专业软件开辟的最硬目标。也是全球范畴内除Claude Opus 4.6外少数具备这一能力的模子。正在METR榜单的划一评估尺度下,此前智谱提到,SWE-Bench Pro要求模子正在实正在GitHub仓库中定位并修复高难度工程Bug,GLM-5.1不只承继了上一代模子的开源SOTA编码能力,GLM-5.1是独一达到8小时级持续工做的开源模子,正在最接近实正在软件开辟的SWE-bench Pro基准测试中,现正在最新的排名也来了——全球权势巨子AI评测平台LMArena(百万用户参取盲测)更新Code Arena专项榜单,除了榜单表示优良,位列全球模子第三。GLM-5.1刷新全球最佳成就,GLM-5.1大大提高了代码能力,也深受开辟者喜爱,3月底智谱正式推出了GLM-5.1大模子,还正在长程使命(Long-Horizon Task)上取得冲破,跨越GPT-5.4、Claude Opus 4.6!