2025年8月21日,DeepSeek正式发布了DeepSeek-V3.1,官方称其为“迈向Agent(智能体)时代的第一步”。
DeepSeek-V3.1是首款“混合推理”模型,一个模型可同时支持推理模式和非推理模式(自主切换)。用户可通过官方App或网页端的“深度思考”按钮切换这两种模式。
该模型共有671B参数,激活参数37B,上下文128k。在软件工程基准测试中,全方位碾压DeepSeek-V3-0324和DeepSeek-R1-0528。在人类的最后考试HLE中,拿下了29.8的高分,在数学、知识问答、编程等任务中,也全面超越DeepSeek-R1-0528。
DeepSeek-V3.1-Think推理速度比DeepSeek-R1-0528更快,经过思维链压缩训练后,输出token减少了20%-50%,但各项任务平均表现与DeepSeek-R1-0528持平,回答质量相媲美,思考效率大幅提升。
模型的工具使用、智能体任务有了显著提升,多步推理能力强化,复杂搜索也可轻松应对。它还可以支持多种Code Agent框架,开发者能够自己搭建智能体。目前能处理超过100种语言,尤其对亚洲语言和资源较少语种的运用进行了优化。
随着DeepSeek-V3.1发布,其API接口也同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,上下文均扩展为128K。同时,API Beta接口支持strict模式的Function Calling,并增加了对Anthropic API格式的支持。官方还宣布从2025年9月6日凌晨起,调整DeepSeek开放平台API接口调用价格,并取消夜间时段优惠。