10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

DeepSeek-V3.2-Exp模型正式发布,性能不变,API价格大幅下调50%

6月前 AI最新动态 3946 0

DeepSeek发布新模型,还降价?没错!

9月29日晚间,DeepSeek宣布正式发布 DeepSeek-V3.2-Exp模型,性能仍是稳步提升,但出乎意料的是,调用价格大幅降低,尤其输出价格大降75%,业界人士表示“这很难卷得过”。DeepSeek提到,在新价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

据介绍,DeepSeek Sparse Attention(DSA)稀疏注意力机制首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

为了严谨地评估引入稀疏注意力带来的影响,我们特意把 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。

目前,Deepseek官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时 API 大幅度降价。

值得注意的是,在DeepSeek-V3.2-Exp模型发布的同一天,国产AI芯片大厂寒武纪就宣布,已同步实现对DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。

目前,开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。

寒武纪表示,公司一直重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。

此前,寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。

针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。

寒武纪表示,依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。

V3.2只是开胃菜?都在等V4!

就在大家为V3.2的降价和开源欢呼雀跃时,大量出现不同的声音,那就是:“所以,V4什么时候来?”、“V4在实验室里憋大招了吗?”、“我们能期待下一个大版本吗?”。

更有趣的是,就在国庆节来临之际DeepSeek放出更新真的是有点“节前更新!卷死同行!”的意思。

苏米只想说,DeepSeek真的是国产大模型的劳模~

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:DeepSeek-V3.2-Exp模型正式发布,性能不变,API价格大幅下调50%
#DeepSeek #DeepSeek发布 #DeepSeek降价 
收藏 1
Anthropic发布Claude Sonnet 4.5,代码能力超越 GPT-5,这次更新不止是模型!
腾讯开源混元图像模型 3.0(HunyuanImage 3.0),免费开放使用!
推荐阅读
  • GLM-5实测直逼Claude Opus 4.5:国产大模型再上台阶
  • Bolt: StackBlitz 推出全新Ai编程体验,全栈开发平台,快速运行、编辑和部署全栈 Web 应用
  • Qwen3 循环报错!扣钱!欠费!Qwen3-Coder使用避坑指南
  • 快手发布 AI 编程矩阵:AI编程工具 CodeFlicker、自研的大模型 KAT-Coder
  • Windsurf新LOGO和新免费计划:全面升级的AI编程体验
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
27085 8月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
25182 11月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
17132 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
16723 11月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15113 1年前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13605 11月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13599 11月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
13028 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
11647 8月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
11340 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Google Gemma 4 发布:31B 参数开源第一梯队,代码能力提升 19 倍,改用 Apache 2.0 许可证
2 小米 MiMo Token Plan 上线:39 元起订阅,1M 上下文全模态共享额度
3 KAT-Coder-Pro V2发布:Claude Code + KAT-Coder-Pro V2实测新一代代码助手在前端生成与审美上显著进化
4 Claude Code的Harness Engineering公开后,全世界的 Agent 能力提高了一个档次
5 OpenClaw 官方在 X 平台正式宣布:旗下技能市场 ClawHub 推出中国官方镜像站,附中文界面,国内访问不再受限
6 Claude Code 源码大泄露,我看到了 AI Agent 即将爆发的 7 大能力
7 智谱 GLM-5V-Turbo 发布:原生多模态 Coding 基座模型
8 智谱推出 Super Z:微信、飞书直接对话 GLM-5,零配置使用大模型
9 阿里 Wan2.7-Image 实测:AI 捏脸、调色盘、3K 文本渲染、交互式编辑全评测
10 Claude Code 正式推出全自动模式 Auto mode:AI 全权接管权限审核,兼顾高自由度与零误操
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联