<匯港通訊> 阿里巴巴(09988)旗下阿里雲發布並開源「通義千問」(Qwen)系列推理模型 QwQ-32B。
「通義千問」團隊指出,QwQ-32B 是一款擁有320億參數的模型,其性能可與具備6710億參數(其中370億被啟動)的 DeepSeek-R1 媲美。這一成果突顯將強化學習應用於經過大規模預訓練的強大基礎模型的有效性,團隊還在推理模型中集成了與 Agent 相關的能力,使其能夠在使用工具的同時進行批判性思考,並根據環境反饋調整推理過程。
QwQ-32B 大幅降低部署使用成本,在消費級顯卡上也能實現本地部署。目前,阿里已採用寬鬆的Apache2.0 協議,將 QwQ-32B 模型向全球開源。
阿里雲表示,這是「通義千問」在大規模強化學習(RL)以增強推理能力方面的第一步。在致力開發下一代「通義千問」的過程中,阿里雲計劃將更強大的基礎模型與依託規模化計算資源的 RL 相結合,從而使其更接近實現人工通用智能(AGI)。此外,阿里雲正積極探索將智能體與 RL 集成,以實現長時推理,目標是通過推理時間擴展來釋放更高的智能。 (LF)
#阿里雲 #DeepSeek-R1
新聞來源 (不包括新聞圖片): 滙港資訊