新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
阿里千問3登頂全球最強開源模型,參數僅為DeepSeek-R1三分之一
4月29日|4月29日凌晨,阿里巴巴開源新一代通義千問模型Qwen3(簡稱千問3),參數量僅為DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等領先模型,登頂全球最強...
重設
送出
視窗將於5秒內關閉
阿里千問3登頂全球最強開源模型,參數僅為DeepSeek-R1三分之一
關閉
格隆匯新聞
推薦
30
利好
61
利淡
9
 
 

4月29日|4月29日凌晨,阿里巴巴開源新一代通義千問模型Qwen3(簡稱千問3),參數量僅為DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等領先模型,登頂全球最強開源模型。千問3是國內首個“混合推理模型”,將“快思考”與“慢思考”集成進同一個模型,大大節省算力消耗。

據瞭解,千問3採用混合專家(MoE)架構,總參數量235B,激活僅需22B。千問3預訓練數據量達36T tokens,並在後訓練階段經過多輪強化學習,將非思考模式無縫整合到思考模型中。千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強。性能大幅提升的同時,千問3的部署成本還大幅下降,僅需4張H20即可部署千問3滿血版,顯存佔用僅為性能相近模型的三分之一。

新聞來源 (不包括新聞圖片): 格隆匯
AASTOCKS.com LIMITED 版權所有,不得轉載