<汇港通讯> DeepSeek 宣布同时推出两个正式版人工智能模型,包括 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。V3.2 在工具呼叫能力上达到目前开源模型最高水平,大幅缩小开源模型与闭源模型的差距。
在推理能力方面,V3.2 在数学基准(AIME 2025)测试中达到93.1%的通过率,接近 GPT-5 的94.6%和 Gemini-3.0-Pro 的95%。而 Gemini-3.0-Pro 在2025年国际数学奥林匹克竞赛(IMO 2025)等四项国际顶级竞赛中斩获金牌。
V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。(BC)
#DeepSeek
新闻来源 (不包括新闻图片): 汇港资讯