阿里雲推新模型 QwQ-32B 性能媲美 DeepSeek-R1

新聞分享

如欲分享新聞，請填寫收件人及閣下之電郵，再按「送出」。*必需填寫

收件者電郵*

請用分號「;」分隔不同電郵地址，例子：a@a.com;b@b.com

閣下之電郵*

分享內容

阿里雲推新模型 QwQ-32B 性能媲美 DeepSeek-R1

阿里巴巴(09988)旗下阿里雲發布並開源「通義千問」(Qwen)系列推理模型 QwQ-32B。「通義千問」團隊指出，QwQ-32B 是一款擁有320億參數的模型，其性能可與具備6710億參數(其...

重設

送出

視窗將於5秒內關閉

阿里雲推新模型 QwQ-32B 性能媲美 DeepSeek-R1

關閉

滙港資訊

推薦

利好

利淡

沽空

股價

AASTOCKS旗下aacat開證券戶口送NVDA

<匯港通訊> 阿里巴巴(09988)旗下阿里雲發布並開源「通義千問」(Qwen)系列推理模型 QwQ-32B。

「通義千問」團隊指出，QwQ-32B 是一款擁有320億參數的模型，其性能可與具備6710億參數(其中370億被啟動)的 DeepSeek-R1 媲美。這一成果突顯將強化學習應用於經過大規模預訓練的強大基礎模型的有效性，團隊還在推理模型中集成了與 Agent 相關的能力，使其能夠在使用工具的同時進行批判性思考，並根據環境反饋調整推理過程。

QwQ-32B 大幅降低部署使用成本，在消費級顯卡上也能實現本地部署。目前，阿里已採用寬鬆的Apache2.0 協議，將 QwQ-32B 模型向全球開源。

阿里雲表示，這是「通義千問」在大規模強化學習(RL)以增強推理能力方面的第一步。在致力開發下一代「通義千問」的過程中，阿里雲計劃將更強大的基礎模型與依託規模化計算資源的 RL 相結合，從而使其更接近實現人工通用智能(AGI)。此外，阿里雲正積極探索將智能體與 RL 集成，以實現長時推理，目標是通過推理時間擴展來釋放更高的智能。 (LF)

#阿里雲 #DeepSeek-R1

新聞來源 (不包括新聞圖片): 滙港資訊

免責聲明 : 以上資訊僅供參考。AASTOCKS.com Limited對以上資訊的內容不承擔任何責任，對其準確性，完整性，品質，及時性，或可靠性不作任何陳述或予以認可，並明確表示不對任何由本資訊的全部或部分內容引致之損失或損害承擔任何法律責任或為其引起的損失負責。以上資訊或反映了相關文章或專題作者的的個人意見和觀點，並不代表AASTOCKS.com Limited的立場。以上資訊的任何內容均不構成AASTOCKS為任何投資作出招攬、提出要約、意見或推薦，或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務。投資者必須按其本身投資目標及財務狀況自行作出投資決定。

免責聲明