<汇港通讯> DeepSeek今日在AI开源社群 Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。据悉,DeepSeek-Prover-V2-671B使用了更有效率的safetensors档案格式,并支援多种运算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。同时支援超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可透过量化技术减小模型大小,提高推理效率。#DeepSeek #人工智能 (CW)