#模型
Kimi K2.6 正式发布:开源代码能力新标杆,智能体集群扩展至 300 个
前言
月之暗面正式上线并开源了新模型 Kimi K2.6。从官方公布的 benchmark 来看,代码能力追平或者超越 GPT 5.4 和 Opus 4.6,非常能打。当然与 A 厂刚发布的 Mythos 和 Opus 4.7 还有差距。
…
手把手教你 在Hermes 接入 NVIDIA 免费使用 MiniMax-m2.7 模型教程
之前分享过 NVIDIA 注册和接入 OpenClaw 的教程,这次详细讲解如何在 Hermes Agent 中配置 NVIDIA NIM,并实测可以使用 MiniMax-m2.7 模型。本文对 NVIDIA 注册流程不再赘述,如需了解可查…
Mac Mini M4 部署 Qwen3.5 最佳方案:MLX、Ollama、DFlash 全面对比评测
苏米注:手持一台 Mac Mini M4 16GB,想跑本地大模型但不知道选哪个方案?这篇文章帮你选。我来详细对比 MLX、Ollama 和 DFlash 三种部署方案的优劣。
一、Mac Mini M4 16GB 能跑什么模型
先算一笔账…
Google TimesFM 开源详解:1000 亿时间点预训练,零样本时间序列预测模型
苏米注:Google Research 团队开源的 TimesFM 在 GitHub 上已经斩获 17.9K Star,在全球趋势榜冲到前三。在时间序列预测这个小众但极其实用的领域,能引起这么大轰动的项目真不多见。今天我来详细拆解这个"黑科…
Claude Opus 4.7 发布:长任务处理能力与自我验证升级,企业测试数据详解
苏米注:Anthropic 刚刚发布迄今为止最强大的 Opus 模型 4.7 版本。相比前代 4.6 版本,它在处理长任务时更加严谨,能更精确地遵循指令,并在反馈前验证自己的输出。这意味着用户可以更放心地将复杂工作交给它处理,减少监督需求。…
MiniMax-M2.7 量化版本地部署指南:Unsloth 22 个版本选择 +3 种部署方式详解
苏米注:MiniMax-M2.7 量化版发布后,Unsloth 团队第一时间推出了 22 个 GGUF 量化版本,从 1-bit 到 8-bit 全覆盖。最值得关注的是 4-bit 动态量化版只需要 108GB,一台 128GB 内存的 M…
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
2026 年 4 月,国产大模型井喷。Kimi K2.6 刚上线,GLM-5.1、Qwen3、MiniMax M2 紧随其后。四大模型正面竞争,参数、性能、价格全面对比。
四大模型速览
模型
厂商
架构
总参数
激活参数
上下文
…
1-bit Bonsai 8B 大模型详解:8B 参数压缩至 1.15GB,手机也能跑 AI
你手机里装了多少个 App?如果我问你,能不能在手机上跑一个 80 亿参数的大语言模型,你大概率会摇头——毕竟一个常规的 8B 模型至少需要 16GB 显存,手机那点内存根本装不下。
但就在上周,一家来自 Calte…
Hermes 接入 Kimi K2.6 实测:SOTA 代码能力深度评测,不限流但推理速度慢
昨天 Kimi Code 悄悄推了一条通知:K2.6-code-preview 已上线,向所有订阅用户开放。今天我把 Hermes 里 23 个 Agent 全切了过去,跑了整整一天。
结论先说:K2.6 目前是我用过的国产编程模型里最强的…
WorkBuddy 进阶:别再用默认模型了!切换 GLM-5.1 后我的工作效率翻了 3 倍
摘要:昨天下午 4 点,领导突然甩来一句:"把这半年所有 Excel 报表合并汇总,下班前给我。"127 个 Excel,格式五花八门。我打开 WorkBuddy,切到 GLM-5.1,3 分 47 秒全部搞定。这不是我效率高,是选对了模型…