10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

刚刚,DeepSeek V3.2 正式发布:强化 Agent 能力,融入思考推理,支持工具调用

3月前 AI最新动态 858 0

继上周发布数学推理模型 DeepSeekMath-V2 后,DeepSeek V3.2 正式发布,而且是同时发布两个正式版模型:

DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

与此同时,官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2,可以去用了~

新模型技术报告已同步发布:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf

其实两个月前,DeepSeek 就发布了实验版 V3.2-Exp,说是要收集用户反馈。这次正式版终于来了一波大的更新,一起来看看都有哪些重大升级!

版本概述

DeepSeek-V3.2(标准版)

标准版的目标是平衡推理能力与输出长度,更适合日常使用

例如问答场景和通用 Agent 任务场景。在公开的推理类 Benchmark 测试中,从公布的基准测试数据来看,确实和 GPT-5 High 不相上下,有些指标甚至更强。,仅略低于 Gemini-3.0-Pro;

相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待时间。

DeepSeek-V3.2-Speciale(研究版)

Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。

V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力。

该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。

更令人瞩目的是,V3.2-Speciale 模型成功斩获 4 块金牌:IMO 2025、CMO 2025、ICPC 世界总决赛、IOI 2025。

其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。

在主流推理基准测试中,它和 Gemini 3 Pro 打得有来有回。

也正因为 token 消耗大、成本高,DeepSeek 官方强调这个模型目前只供研究使用,不支持工具调用,也没有针对日常对话优化。

并且,仅开放临时 API,有效期到北京时间 12 月 15 日 23:59;价格和 V3.2 一样。

DSA 稀疏注意力

V3.2(V3.2-Exp 也是)的核心架构叫做「DSA」(DeepSeek Sparse Attention)。

这是一种稀疏注意力机制。

传统注意力有个问题:每生成一个新 token,模型都要回顾所有历史内容。

计算复杂度是平方级别的。

而 DSA 的思路是:不是所有历史信息都同等重要。

它引入了一个「索引器」(Lightning Indexer),快速判断哪些 token 是关键,然后只对这些部分执行精细计算。

最终核心注意力的复杂度大幅降低。

实际效果:

在 128K 上下文长度下,V3.2 的推理成本比 V3.1-Terminus 降低了 50-70%。

Agent 能力强化

DeepSeek-V3.2 模型在智能体评测中达到了当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。

比如 Agent 评测 τ²-Bench 准确率 80.3%,和 GPT-5 High 基本持平。

以前,DeepSeek 的深度思考和工具调用是互斥的。

模型要么思考,要么调用工具,不能同时进行。

V3.2 解决了这个问题。

它现在可以一边思考,一边调用搜索、代码执行工具,然后基于返回的结果继续推理。

示例为通过 LobeChat 使用 DeepSeek-V3.2 的深度思考+工具调用能力得到更加详细准确的回复

工具调用

本次 API 更新支持了 DeepSeek-V3.2 思考模式下的工具调用能力。

当前在思考模式下,模型能够经过多轮的思考 + 工具调用,最终给出更详尽准确的回答。下图为思考模式下进行工具调用的 API 请求示意图:

  • 在回答问题 1 过程中(请求 1.1 - 1.3),模型进行了多次思考 + 工具调用后给出答案。在这个过程中,用户需回传思维链内容(reasoning_content)给 API,以让模型继续思考。

  • 在下一个用户问题开始时(请求 2.1),需删除之前的思维链,并保留其它内容发送给 API。

  • 更详细的使用方法请参考 API 文档:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode

正式版 V3.2 还增加了对 Claude Code 的支持。根据 DeepSeek API 文档中的 Anthropic 兼容 API 指南,用户可以先安装 CC,配置环境后,就能通过 Anthropic 兼容 API 调用 DeepSeek 模型。

配置文档:https://api-docs.deepseek.com/zh-cn/guides/anthropic_api

但需要注意的是,思考模式未充分适配 Cline、RooCode 等使用非标准工具调用的组件,我们建议用户在使用此类组件时继续使用非思考模式。

定价对比

和 Kimi K2 Thinking 官方价对比,DeepSeek-V3.2 thinking 大致是:

输入命中:1 元 vs 0.2 元 → Kimi 大约 贵 5 倍

输入未命中:4 元 vs 2 元 → Kimi 大约 贵 2 倍

输出:16 元 vs 3 元 → Kimi 大约 贵 ~5.3 倍

与 Kimi K2 thinking、MiniMax M2 相比,V3.2 的整体编码思路并不完全相同,推理路径也会有自己的特色。正式版在思考与工具调用的结合上走得更远一些,这使得它在需要综合规划和调用外部工具的场景中更有潜力。

对普通用户来说,V3.2 正式版可以作为一个日常可用的主力模型;而对于研究者或开发者,如果你遇到某些问题 K2 thinking 或 GPT 5 没有很好解决,不妨换一个视角,试试让 V3.2 thinking 来再思考一次,或许会得到一些不同的收获。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:刚刚,DeepSeek V3.2 正式发布:强化 Agent 能力,融入思考推理,支持工具调用
#DeepSeek #Agent #DeepSeek-V3.2 
收藏 1
GELab-Zero:本地可控的移动设备GUI智能体,仅 4B 轻量小模型
Couple AI:AI情侣照生成器,一键合成逼真情侣合影
推荐阅读
  • 智谱发布旗下 GLM-4.5 模型,跃居全球模型第三,支持接入Claude Code
  • 火山方舟满血版DeepSeek R1 API免费体验,可薅145元代金券!不封顶(附API接入教程)
  • OpenAI联手谷歌,开源 agents.md,Agent文档编写有了统一标准!
  • Google Vids:AI数字人制作体验,vids .new免费制作数字人
  • 2025最值的联合会员,Lenny's Newsletter到底值不值得冲?独立开发者的春天?
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
25494 7月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
24206 9月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
16463 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
15197 10月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
14924 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13431 10月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13152 10月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
12164 1年前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
10541 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
9854 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 MiniMax 发布 MaxClaw:39 元起,上云即用
2 IMA 任务模式开放体验(邀请码):高校教师三类开学任务更高效
3 从零到一搭建 AI Agent 框架:理论拆解与实战落地
4 LM Studio发布LM Link:把家里的4090算力装进你的笔记本
5 5 个关于 OpenClaw 安全设置,有效防范黑客利用 OpenClaw 漏洞进行攻击!
6 Anthropic 发布11 款 Claude 企业插件,一个 AI 顶一个部门,SaaS 将发生巨变
7 谷歌出手封禁接入OpenClaw的用户:Antigravity订阅账号不是 API
8 Ollama 新命令 Launch,一条指令直连 Claude Code、Codex、OpenCode(零配置)
9 Cline 升级:Minimax‑2.1、Kimi‑k2.5 限时免费开放,Cline CLI 2.0 同步上线
10 开工速览:OpenClaw(小龙虾)的前世今生
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联