模型 - 苏米客

前言月之暗面正式上线并开源了新模型 Kimi K2.6。从官方公布的 benchmark 来看，代码能力追平或者超越 GPT 5.4 和 Opus 4.6，非常能打。当然与 A 厂刚发布的 Mythos 和 Opus 4.7 还有差距。 …

586

2月前

之前分享过 NVIDIA 注册和接入 OpenClaw 的教程，这次详细讲解如何在 Hermes Agent 中配置 NVIDIA NIM，并实测可以使用 MiniMax-m2.7 模型。本文对 NVIDIA 注册流程不再赘述，如需了解可查…

4168

2月前

AI学习教程

苏米注：手持一台 Mac Mini M4 16GB，想跑本地大模型但不知道选哪个方案？这篇文章帮你选。我来详细对比 MLX、Ollama 和 DFlash 三种部署方案的优劣。一、Mac Mini M4 16GB 能跑什么模型先算一笔账…

2567

2月前

苏米注：Google Research 团队开源的 TimesFM 在 GitHub 上已经斩获 17.9K Star，在全球趋势榜冲到前三。在时间序列预测这个小众但极其实用的领域，能引起这么大轰动的项目真不多见。今天我来详细拆解这个"黑科…

556

2月前

AI开源项目

苏米注：Anthropic 刚刚发布迄今为止最强大的 Opus 模型 4.7 版本。相比前代 4.6 版本，它在处理长任务时更加严谨，能更精确地遵循指令，并在反馈前验证自己的输出。这意味着用户可以更放心地将复杂工作交给它处理，减少监督需求。…

432

2月前

苏米注：MiniMax-M2.7 量化版发布后，Unsloth 团队第一时间推出了 22 个 GGUF 量化版本，从 1-bit 到 8-bit 全覆盖。最值得关注的是 4-bit 动态量化版只需要 108GB，一台 128GB 内存的 M…

2257

2月前

AI学习教程

2026 年 4 月，国产大模型井喷。Kimi K2.6 刚上线，GLM-5.1、Qwen3、MiniMax M2 紧随其后。四大模型正面竞争，参数、性能、价格全面对比。四大模型速览模型厂商架构总参数激活参数上下文 …

14701

2月前

你手机里装了多少个 App？如果我问你，能不能在手机上跑一个 80 亿参数的大语言模型，你大概率会摇头——毕竟一个常规的 8B 模型至少需要 16GB 显存，手机那点内存根本装不下。但就在上周，一家来自 Calte…

540

2月前

昨天 Kimi Code 悄悄推了一条通知：K2.6-code-preview 已上线，向所有订阅用户开放。今天我把 Hermes 里 23 个 Agent 全切了过去，跑了整整一天。结论先说：K2.6 目前是我用过的国产编程模型里最强的…

1192

2月前

摘要：昨天下午 4 点，领导突然甩来一句："把这半年所有 Excel 报表合并汇总，下班前给我。"127 个 Excel，格式五花八门。我打开 WorkBuddy，切到 GLM-5.1，3 分 47 秒全部搞定。这不是我效率高，是选对了模型…

910

2月前

AI学习教程

#模型