10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

DeepSeek 官方Github开源及DeepSeek相关Github开源项目合集

8月前 AI最新动态 2065 0

DeepSeek 是一家致力于探索通用人工智能(AGI)的公司,近期通过“开源周”活动发布了多个开源项目,涵盖了模型训练、推理优化、并行计算等多个领域。DeepSeek 的开源项目不仅展示了其在 AI 领域的技术实力,还通过开放共享推动了行业的整体进步。

如果你对这些项目感兴趣,可以通过下面链接获取更多详细信息。以下是 DeepSeek 开源项目的主要内容和相关信息:

官方开源

项目名称 项目链接 简介
DeepSeek-R1 https://github.com/deepseek-ai/DeepSeek-R1 DeepSeek的旗舰语言模型,提供高质量的响应,支持多种自然语言处理任务。
DeepSeek-V3 https://github.com/deepseek-ai/DeepSeek-V3 DeepSeek的第三个版本,采用创新的混合专家架构(MoE),支持多模态搜索。
DeepSeek-V2 https://github.com/deepseek-ai/DeepSeek-V2 一款强大、经济高效的专家混合语言模型
DeepSeek-Coder-V2 https://github.com/deepseek-ai/DeepSeek-Coder-V2 采用混合专家(Mixture-of-Experts,MoE)架构,突破闭源模型在代码智能中的壁垒
DeepSeek-Coder https://github.com/deepseek-ai/DeepSeek-Coder 用于辅助代码编写的AI工具,支持多种编程语言。
DeepSeek-LLM https://github.com/deepseek-ai/DeepSeek-LLM 提供准确可靠答案的综合语言模型。
Janus https://github.com/deepseek-ai/Janus 统一的多模态理解与生成模型
DreamCraft3D https://github.com/deepseek-ai/DreamCraft3D 基于引导扩散先验的分层3D生成模型的官方实现
DeepSeek-Math https://github.com/deepseek-ai/DeepSeek-Math 通过增强模型的数学理解和推理能力,突破了传统语言模型在数学领域的限制,能够处理更复杂的数学推理任务,如符号计算、定理证明等
DeepSeek-MoE https://github.com/deepseek-ai/DeepSeek-MoE 创新的混合专家架构模型,支持高效推理。
DeepSeek-VL2 https://github.com/deepseek-ai/DeepSeek-VL2 用于先进多模态理解的专家混合视觉-语言模型
DeepSeek-VL https://github.com/deepseek-ai/DeepSeek-VL 通过深度学习技术增强视觉和语言的融合,解决复杂的视觉-语言任务

其他有关 DeepSeek 开源项目

项目名称 项目链接 简介
DeepSeek-API-Integration https://github.com/deepseek-ai/awesome-deepseek-integration 整理了DeepSeek API的集成应用,支持多种平台和语言。
GPT4Free https://github.com/xtekky/gpt4free 提供免费访问DeepSeek V3 & R1等模型的接口。
CherryStudio https://github.com/CherryHQ/cherry-studio 支持包括DeepSeek-R1在内的多款LLM的桌面客户端。
TinyZero https://github.com/Jiayi-Pan/TinyZero 伯克利团队复现DeepSeek R1-Zero的项目。
simpleRL-reason https://github.com/hkust-nlp/simpleRL-reason 港科大团队复现DeepSeek R1-Zero和R1的项目。
DeepSeek-Free https://github.com/deepseek-free/deepseek-free 提供DeepSeek部署教程和免费API接口。
Unlock-DeepSeek https://github.com/datawhalechina/unlock-deepseek 面向AI研究爱好者的DeepSeek系列工作解读和复现。

开源周回顾:5天5大硬核项目

DeepSeek此次开源周以“每日一弹”形式,依次开放了5个核心项目,均聚焦AI基础设施的优化与创新:

1. FlashMLA(2月24日)

定位:专为英伟达Hopper GPU(如H100/H800)优化的高效MLA解码内核。

性能:在H800 GPU上实现3000GB/s内存带宽与580TFLOPS算力,支持可变长度序列处理,已投入生产环境。

2. DeepEP(2月25日)

突破:首个面向MoE(混合专家)模型的开源专家并行(EP)通信库。

亮点:支持NVLink和RDMA高速通信,原生适配FP8低精度运算,显著提升集群训练效率。

3. DeepGEMM(2月26日)

创新:高效FP8通用矩阵乘法库,核心逻辑仅300行代码,性能却超越传统专家调优内核。

应用:在Hopper GPU上实现1350+ TFLOPS的FP8性能,适配传统稠密模型与MoE模型。

4. DualPipe & EPLB(2月27日)

双工具:双向流水线并行算法(DualPipe)解决计算通信重叠问题;专家并行负载均衡器(EPLB)优化资源分配,提升训练稳定性。

5. 3FS文件系统(2月28日)

性能怪兽:专为SSD和RDMA网络设计的高性能并行文件系统,聚合读取吞吐量达6.6 TiB/s(180节点集群),支持AI训练全流程(数据加载、检查点保存等)。

总结

DeepSeek的开源周不仅是技术实力的展示,更是一场“车库创业精神”的宣言——正如其创始人梁文锋所言:“技术没有象牙塔,唯有社区共筑的创新力量”。这场开源行动或将重新定义AI行业的竞争格局,让技术普惠真正照进现实。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:DeepSeek 官方Github开源及DeepSeek相关Github开源项目合集
#DeepSeek #开源周 #Github开源 #开源项目 
收藏 1
小莫写作: 基于人工智能的AI论文写作改写辅助工具
AiProPortrait:一句话生成高清职业头像,LinkedIn/简历/官网即插即用
推荐阅读
  • 白嫖百亿Token!50+顶级大模型一站式调用,claude 4.5、gpt-5、glm-4.6一键适配
  • 腾讯开源混元图像模型 3.0(HunyuanImage 3.0),免费开放使用!
  • 字节Trae Windows版正式推出,更适合中文编程的IDE工具 + Claude 3.5免费用,完美替代Cursor
  • Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
  • Comet:Perplexity 的彗星浏览器,好不好用?
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
21450 4月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
19808 7月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
14566 9月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
13493 12月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
12820 7月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
11790 7月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
11693 7月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
10407 9月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
9315 11月前
Trae Pro 来了,终于可以告别排队了!这价格真香
7180 6月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Seedream 4.5 悄悄上线公测,画面细节改善,小字更清晰,人物更自然
2 Mistral 3 来了:这次只对标中国模型
3 突发!Anthropic收购 Bun!Claude Code 半年营收破10 亿美金
4 LiblibAI 上线 Z-Image Turbo 模型!
5 刚刚,DeepSeek V3.2 正式发布:强化 Agent 能力,融入思考推理,支持工具调用
6 ChatGPT 上线「智能购物」:三分钟帮你做完购物指南
7 字节跳动发布 Vidi2 :AI 视频模型性能超越 Gemini 3 Pro,小时级素材直出剪辑方案
8 PixVerse V5.5 正式发布,自动做分镜、配对白、加音效,整段短片一键生成
9 DeepSeek刚刚上新:DeepSeek-Math-V2,直接开源 IMO 金牌数学模型
10 美团 LongCat 全新上线 AI 生图系列模型「LongCat-Image」!精准高效,AI 创作不设限
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联