新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
DeepSeek發表Prover-V2模型 參數量達6710億
DeepSeek今日在AI開源社群 Hugging Face上發布了一個名為DeepSeek-Prover-V2-671B的新模型。據悉,DeepSeek-Prover-V2-671...
重設
送出
視窗將於5秒內關閉
DeepSeek發表Prover-V2模型 參數量達6710億
關閉
滙港資訊
推薦
1
利好
2
利淡
2
 
 

<匯港通訊> DeepSeek今日在AI開源社群 Hugging Face上發布了一個名為DeepSeek-Prover-V2-671B的新模型。

據悉,DeepSeek-Prover-V2-671B使用了更有效率的safetensors檔案格式,並支援多種運算精度,方便模型更快、更省資源地訓練和部署,參數達6710億,或為去年發布的Prover-V1.5數學模型升級版本。同時支援超長上下文,最大位置嵌入達163840,使其能處理複雜的數學證明,並且採用了FP8量化,可透過量化技術減小模型大小,提高推理效率。

#DeepSeek #人工智能 (CW)

新聞來源 (不包括新聞圖片): 滙港資訊
AASTOCKS.com LIMITED 版權所有,不得轉載