阿里千問3登頂全球最強開源模型，參數僅為DeepSeek-R1三分之一

新聞分享

如欲分享新聞，請填寫收件人及閣下之電郵，再按「送出」。*必需填寫

收件者電郵*

請用分號「;」分隔不同電郵地址，例子：a@a.com;b@b.com

閣下之電郵*

分享內容

阿里千問3登頂全球最強開源模型，參數僅為DeepSeek-R1三分之一

4月29日｜4月29日凌晨，阿里巴巴開源新一代通義千問模型Qwen3(簡稱千問3)，參數量僅為DeepSeek-R1的1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等領先模型，登頂全球最強...

重設

送出

視窗將於5秒內關閉

阿里千問3登頂全球最強開源模型，參數僅為DeepSeek-R1三分之一

關閉

格隆匯新聞

推薦

利好

利淡

沽空

股價

4月29日｜4月29日凌晨，阿里巴巴開源新一代通義千問模型Qwen3(簡稱千問3)，參數量僅為DeepSeek-R1的1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等領先模型，登頂全球最強開源模型。千問3是國內首個“混合推理模型”，將“快思考”與“慢思考”集成進同一個模型，大大節省算力消耗。

據瞭解，千問3採用混合專家(MoE)架構，總參數量235B，激活僅需22B。千問3預訓練數據量達36T tokens，並在後訓練階段經過多輪強化學習，將非思考模式無縫整合到思考模型中。千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強。性能大幅提升的同時，千問3的部署成本還大幅下降，僅需4張H20即可部署千問3滿血版，顯存佔用僅為性能相近模型的三分之一。

新聞來源 (不包括新聞圖片): 格隆匯

免責聲明 : 以上資訊僅供參考。AASTOCKS.com Limited對以上資訊的內容不承擔任何責任，對其準確性，完整性，品質，及時性，或可靠性不作任何陳述或予以認可，並明確表示不對任何由本資訊的全部或部分內容引致之損失或損害承擔任何法律責任或為其引起的損失負責。以上資訊或反映了相關文章或專題作者的的個人意見和觀點，並不代表AASTOCKS.com Limited的立場。以上資訊的任何內容均不構成AASTOCKS為任何投資作出招攬、提出要約、意見或推薦，或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務。投資者必須按其本身投資目標及財務狀況自行作出投資決定。

免責聲明