大模型 - 苏米客

摘要：本文详细介绍国内六大厂（阿里、腾讯、字节、百度、智谱、MiniMax）的 CodingPlan/TokenPlan 套餐费用、限制及可用模型。4 月底最新数据，帮助开发者选择合适的 AI 编程套餐。国内各大厂的按次 CodingPl…

187

昨天

AI工具集合

阿里发布了 Qwen3.6-27B，27B 参数的 Dense 架构模型（不是 MoE），原生支持 262K 上下文，Apache-2.0 开源。苏米注：Dense 架构相比 MoE 部署更简单，不需要考虑路由问题，推理更稳定。这是本…

370

前天

AI产品百科

今年以来，OpenClaw、Hermes 这些 Agent 工具接连爆火，但 Token 消耗快得吓人，只是对话几次、简单设置个任务，一天就烧掉几十块。于是越来越多人把目光转向了本地模型部署，既省钱又能离线使用。苏米注：但真动手的时候，…

108

前天

AI开源项目

苏米注：手持一台 Mac Mini M4 16GB，想跑本地大模型但不知道选哪个方案？这篇文章帮你选。我来详细对比 MLX、Ollama 和 DFlash 三种部署方案的优劣。一、Mac Mini M4 16GB 能跑什么模型先算一笔账…

457

5天前

苏米注：MiniMax-M2.7 量化版发布后，Unsloth 团队第一时间推出了 22 个 GGUF 量化版本，从 1-bit 到 8-bit 全覆盖。最值得关注的是 4-bit 动态量化版只需要 108GB，一台 128GB 内存的 M…

603

1周前

AI学习教程

2026 年 4 月，国产大模型井喷。Kimi K2.6 刚上线，GLM-5.1、Qwen3、MiniMax M2 紧随其后。四大模型正面竞争，参数、性能、价格全面对比。四大模型速览模型厂商架构总参数激活参数上下文 …

2502

1周前

你手机里装了多少个 App？如果我问你，能不能在手机上跑一个 80 亿参数的大语言模型，你大概率会摇头——毕竟一个常规的 8B 模型至少需要 16GB 显存，手机那点内存根本装不下。但就在上周，一家来自 Calte…

229

1周前

AI最新动态

今天凌晨，Meta 发布了全新的大模型 Muse Spark，已上线到 Meta 旗下的各类产品。 Meta Superintelligence Labs（MSL）负责人 Alexandr Wang 在推特上宣布了这个消息。他说，九个月前团…

174

2周前

AI最新动态

Gemma 4 模型家族与端侧部署场景 Gemma 4 的开源将端侧 AI 推向工程化落地阶段。它提供四个变体，针对不同资源场景设计：E2B（最轻量）、E4B（平衡版）、26B A4B（MoE 架构）和 31B（最强性能）。端侧部署的核心…

556

2周前

AI学习教程

2026 年 4 月 8 日，DeepSeek 网页版在无明显公告的情况下上线了两项新功能：输入框上方出现了「快速模式」和「专家模式」两个选项，分别标注为「适合日常对话，即时响应」和「擅长复杂问题，高峰需等待」。这被社区广泛解读为 Deep…

328

2周前

AI最新动态

#大模型