10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

DeepSeek登上了《Nature》封面!国内首家大模型!

6月前 AI最新动态 1909 0

今天刷到一条让我兴奋到想立刻写下来分享的消息:DeepSeek登上了《Nature》封面。

要知道,《Nature》是全球顶级的科学期刊,能在上面发表AI成果的,几乎都代表着划时代的突破。之前能上去的案例,像 AlphaGo、AlphaFold,都是AI发展史上浓墨重彩的一笔。而这一次,轮到了一家国内大模型厂商。

作为一个每天泡在各种AI产品里的产品经理,我第一反应是:为什么是DeepSeek? 它到底做对了什么,才有资格和这些重量级成果并列?

我结合论文和之前的跟进体验,总结了三点核心原因。

1. 成本

DeepSeek-R1 的训练成本只有 29万美元(约200万人民币)。

对比一下:Grok-4 的训练成本是 4.9亿美元,足足是 DeepSeek-R1 的 1689倍。

什么意思?同样的钱,能训练一个 Grok-4,还是能训练 1600多个 DeepSeek-R1。这不仅仅是“便宜”,而是颠覆了整个行业对于大模型训练“必须烧钱”的认知。

还记得今年年初,DeepSeek-R1 发布时,美股都被震了一下。很多人不信,质疑是不是“炒作”。结果大量同行去复现,最后证明:真·能跑出来。

2. 数据

当时还有不少声音怀疑 DeepSeek 是不是偷偷蒸馏了别人的模型。

结果团队直接把训练数据集细节公开了,用行动回击了这些质疑。

这套数据大约有 15.4万道题,覆盖五大类:

  • 数学:2.6万题,专注推理计算

  • 编程:2.5万题(算法竞赛题 + 代码修复),提升代码生成与调试能力

  • STEM:2.2万题,涵盖物理、化学、生物

  • 逻辑:1.5万题,训练推断与分析

  • 通用:6.6万题,创意写作、问答、角色扮演、无害性评估等

这种透明度,在大模型圈其实很罕见。也正因为如此,Nature 才认可了它的原创性和科学贡献。

3. 算法

最让我感兴趣的,是 DeepSeek 真正把强化学习用在推理能力提升上,而且是第一个做成功的。

传统的做法,需要大量人工标注推理过程,成本高得吓人。DeepSeek 走的是“自演化”路线:

  • 只看最终答案是否正确,把它作为奖励信号

  • 底座用 DeepSeek-V3-Base

  • 算法用 GRPO 强化学习

  • 再通过少量冷启动 + 拒绝采样 + 监督微调,把模型一步步打磨出来

这种做法有点像“把学生丢进考场,只看最后成绩”,结果还真让模型学会了“如何思考”。

更关键的是,这一突破不仅节省了训练成本,还让 DeepSeek-R1 成为了当时最强的推理模型之一。甚至和闭源的 O1 相比,也丝毫不逊色。

感想

说实话,我在体验过那么多 AI 产品之后,这次还是被 DeepSeek 震撼到了。

它证明了:顶级大模型,不一定要靠烧钱砸出来。

它用行动告诉大家:开源 + 透明,也能走上顶级舞台。

它还打开了一条新路:强化学习不止能玩游戏,还能让模型学会更强的推理。

如果说 2025 年中国 AI 技术的里程碑事件之一是什么,我觉得 DeepSeek-R1 肯定榜上有名。

从某种程度上,它让闭源阵营的“老大哥们”意识到:开放和创新的结合,可能才是最有杀伤力的武器。

文章地址:https://www.nature.com/articles/s41586-025-09422-z

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:DeepSeek登上了《Nature》封面!国内首家大模型!
#DeepSeek #Nature 
收藏 1
a16z:Top 100 Gen AI Consumer Apps(生成式 AI 消费应用 Top 100)
重磅更新:Claude 现可接管整台电脑,鼠标、键盘与屏幕一体化操控
推荐阅读
  • MiniMax 推出旗舰模型 M2.5,面向 Agent 的新选择
  • 刚刚!Cursor风控又加强了,可能是因为这个原因!
  • 收到邀请码,我赶紧试了阿里这款会做生意的Accio Agent
  • 字节又出狠活:免费开源的 DreamOmni2,让图像编辑变成一句话的事
  • 限时免费:GLM‑4.6在 Cline 免费开放,VS Code + Cline上手体验
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
26408 8月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
24876 10月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
16957 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
16220 11月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15029 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13536 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13453 11月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
12731 1年前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
10910 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
10877 8月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 重磅更新:Claude 现可接管整台电脑,鼠标、键盘与屏幕一体化操控
2 一站式搞定多家模型订阅:火山方舟 Coding Plan 畅用 OpenClaw 与 Claude Code
3 cc-weixin:微信 ClawBot 刚开放,在微信里跑 Claude Code ,让 AI 编程实时对话
4 龙虾变身导演?LibTV 重塑视频创作新范式,OpenClaw 实现自动化制片
5 MiniMax M2.7: 开启模型的自我进化,MiniMax-M2.7 深度测评报告
6 宝塔面板一键部署OpenClaw 上新,宿主机安装、面板内管理、打开即可使用
7 腾讯QClaw发布重大更新:微信入口升级为小程序,内测扩容“码管够”
8 30+ Claw项目爆发,Claw生态重绘AI Agent版图
9 MiroFish:用AI智能体群体模拟社会演化,预测未来可能性的开源项目
10 全网最全 OpenClaw 彻底卸载教程,保姆级全流程,删除Openclaw不用求人
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联