新闻分享
如欲分享新闻,请填写收件人及阁下之电邮,再按「送出」。*必需填写
收件者电邮*
请用分号「;」分隔不同电邮地址,例子:a@a.com; b@b.com
阁下之电邮*
分享内容
Artificial Analysis发布全新Coding Agent基准 智谱GLM-5.1取得全球开源SOTA
5月12日|全球权威评测机构Artificial Analysis今日发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agen...
重设
送出
视窗将於5秒内关闭
Artificial Analysis发布全新Coding Agent基准 智谱GLM-5.1取得全球开源SOTA
关闭
格隆汇新闻
推荐
18
利好
21
利淡
18
 
 

5月12日|全球权威评测机构Artificial Analysis今日发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA主流基准上的表现。其中,智谱GLM-5.1(在Claude Code中运行)取得开源第一。

Artificial Analysis在官方推文中点明了这一新榜单的“含金量”:“当开发者使用AI编程时,他们不仅在选择模型,也在将其与特定的Agent harness搭配使用。只有对这一组合进行基准测试,才能真正理解并比较不同模型的真实性能。”

从评测结果上来看,GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。

新闻来源 (不包括新闻图片): 格隆汇
AASTOCKS.com LIMITED 版权所有,不得转载