新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
阿里旗艦版Qwen3模型升級 通用能力超DeepSeek-V3等
阿里巴巴(09988)旗下通義千問(Qwen)宣布,已更新旗艦版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名為Qwen3-2...
重設
送出
視窗將於5秒內關閉
阿里旗艦版Qwen3模型升級 通用能力超DeepSeek-V3等
關閉
滙港資訊
推薦
10
利好
24
利淡
4
 
 

<匯港通訊> 阿里巴巴(09988)旗下通義千問(Qwen)宣布,已更新旗艦版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名為Qwen3-235B-A22B-Instruct-2507-FP8,並已在魔搭社區和HuggingFace上開源更新。

據悉,更新版Qwen3模型的通用能力明顯提升,包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面,在GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等評測表現出色,超過Kimi-K2、DeepSeek-V3等頂級開源模型,以及Claude-Opus4-Non-thinking等領先閉源模型。

更新版Qwen3模型增強多項關鍵效能,包括在多語言的長尾知識覆蓋方面,模型取得顯著進步;在主觀及開放性任務中,模型顯著增強對用戶偏好的契合能力,能夠提供更有用的回覆,生成更高質量的文本;長文本提升到256K,上下文理解能力進一步增強。 (ST)

#Owen3 #阿里巴巴 #通義千問 (ST)

新聞來源 (不包括新聞圖片): 滙港資訊
AASTOCKS.com LIMITED 版權所有,不得轉載