新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
Artificial Analysis發佈全新Coding Agent基準 智譜GLM-5.1取得全球開源SOTA
5月12日|全球權威評測機構Artificial Analysis今日發佈全新Coding Agent基準Artificial Analysis Coding Agent Index,用於衡量Agen...
重設
送出
視窗將於5秒內關閉
Artificial Analysis發佈全新Coding Agent基準 智譜GLM-5.1取得全球開源SOTA
關閉
格隆匯新聞
推薦
18
利好
21
利淡
18
 
 

5月12日|全球權威評測機構Artificial Analysis今日發佈全新Coding Agent基準Artificial Analysis Coding Agent Index,用於衡量Agent harnesses與模型的組合在SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA主流基準上的表現。其中,智譜GLM-5.1(在Claude Code中運行)取得開源第一。

Artificial Analysis在官方推文中點明瞭這一新榜單的“含金量”:“當開發者使用AI編程時,他們不僅在選擇模型,也在將其與特定的Agent harness搭配使用。只有對這一組合進行基準測試,才能真正理解並比較不同模型的真實性能。”

從評測結果上來看,GLM-5.1代表了國產大模型在實際編程Agent場景下的SOTA級別能力。

新聞來源 (不包括新聞圖片): 格隆匯
AASTOCKS.com LIMITED 版權所有,不得轉載