阿里巴巴推出更高效的Qwen3-Next人工智能模型

新聞分享

如欲分享新聞，請填寫收件人及閣下之電郵，再按「送出」。*必需填寫

收件者電郵*

請用分號「;」分隔不同電郵地址，例子：a@a.com;b@b.com

閣下之電郵*

分享內容

阿里巴巴推出更高效的Qwen3-Next人工智能模型

9月12日｜阿里巴巴旗下通義千問發佈了下一代基礎模型架構Qwen3-Next，並開源了基於該架構的Qwen3-Next-80B-A3B系列模型。該結構相比Qwen3的MoE模型結構,進行了以下核心改進...

重設

送出

視窗將於5秒內關閉

阿里巴巴推出更高效的Qwen3-Next人工智能模型

關閉

格隆匯新聞

推薦

利好

利淡

沽空

股價

AASTOCKS旗下aacat開證券戶口送NVDA

9月12日｜阿里巴巴旗下通義千問發佈了下一代基礎模型架構Qwen3-Next，並開源了基於該架構的Qwen3-Next-80B-A3B系列模型。該結構相比Qwen3的MoE模型結構,進行了以下核心改進：混合注意力機制、高稀疏度MoE結構、一系列訓練穩定友好的優化，以及提升推理效率的多token預測機制。基於Qwen3-Next的模型結構，阿里訓練了Qwen3-Next-80B-A3B-Base模型，該模型擁有800億參數僅激活30億參數。該Base模型實現了與Qwen3-32B dense模型相近甚至略好的性能，而它的訓練成本(GPU hours) 僅為Qwen3-32B的十分之一不到，在32k以上的上下文下的推理吞吐則是Qwen3-32B的十倍以上，實現了極致的訓練和推理性價比。

新聞來源 (不包括新聞圖片): 格隆匯

免責聲明 : 以上資訊僅供參考。AASTOCKS.com Limited對以上資訊的內容不承擔任何責任，對其準確性，完整性，品質，及時性，或可靠性不作任何陳述或予以認可，並明確表示不對任何由本資訊的全部或部分內容引致之損失或損害承擔任何法律責任或為其引起的損失負責。以上資訊或反映了相關文章或專題作者的的個人意見和觀點，並不代表AASTOCKS.com Limited的立場。以上資訊的任何內容均不構成AASTOCKS為任何投資作出招攬、提出要約、意見或推薦，或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務。投資者必須按其本身投資目標及財務狀況自行作出投資決定。

免責聲明