这绝对是目前 AI 界最炸裂的新闻,Kimi 于2025年7月11日的晚上 22 点55分发布文章,宣布 k2 模型已正式可用,全面上线。

相关的评测文章呢,非常多,苏米看了官方介绍和 归藏 老师的文章,其详细评测了 k2 模型的能力,结论就是:前端能力上非常强,基本上在一流梯队,我感觉接近 Claude Sonnet 3.7 和 4 之间。
恰逢昨天我常用的一个海外信用卡支付平台 野卡 跑路, 这下Claude续费又成问题,K2 的出现,到底能不能成为 Claude 3.7 到 Claude 4 之间的那个“平替选手”?
看完各博主的分享先说说我个人的小观点:期待K2 发布能够真正的成为Claude 3.7 - Claude 4的平替,因为百万Token(输入/输出)/4-16元真的是属于白菜价了

接下来就来聊聊我对 Kimi K2 的整体体验!
模型性能
Kimi K2 这次主打三项硬实力:Agent 编码、工具调用、数学推理。在多个基准测试中表现亮眼,甚至有种“Moonshot 这是奔着 Claude 4 去的”既视感。尤其是前端开发场景里,不仅写代码写得漂亮,UI 设计感也在线。Kimi K2 生成带粒子系统、3D 效果的网页完全不在话下,是真的能做出 demo 级作品的水平。

Agent 实战能力
让我最惊讶的是 Kimi K2 的 Agentic 能力。在没有明确指令的情况下,它能自动调用合适工具,比如我看到有用户让它写一个期货交易模拟器,它直接用了 TradingView,构建了完整的交互界面。 甚至我内部也测试了一个案例:把13万行原始数据丢给它,它能直接分析远程办公对薪资的影响,自动跑回归、画图,还能写分析报告,图表配色甚至都风格统一了。
最重要的是,它支持将需求解析成 ToolCall 结构,意味着你可以非常方便地接入自己的 Agent 系统(比如 Owl、Cline、RooCode),实现自动化流程和编程。
代码能力
以前遇到的AI写代码,更多是“按格式凑代码”,但 Kimi K2 更像是“理解设计再动手”。我测试前端页面构建时,它能主动提出 UI/UX 建议,还能补充性能优化建议,比如什么时候该懒加载、哪些地方该拆组件等。
写作与改写
改写科研文本为初中生语言、模仿苹果广告语调,这些风格化输出我都试过,Kimi K2 基本都能保留原意并合理迁移语气。甚至在虚构写作上,它也能写出有情绪、有逻辑、有节奏感的小说段落。那段关于数字生命自主意识的描述,说实话还挺打动人的。
可以直在kimi官网或APP直接体验Kimi K2模型对话了:

模型开源与部署
Moonshot 这次也算是下了大力气,直接开源了两个版本:
-
Kimi-K2-Base:基础预训练模型,适合研究或自己再微调;
-
Kimi-K2-Instruct:已经做过指令微调,适合日常问答和 Agent 场景。
模型和权重已上传至 Hugging Face(点这里看模型),部署方式支持 vLLM、SGLang、ktransformers 等主流推理框架。你自己部署后,能获得几乎一致的调用体验。

API 计费也很“白菜”:
-
输入 100 万 tokens 只要 4 元;
-
输出 100 万 tokens 也才 16 元。
支持 OpenAI 和 Anthropic 两种接口格式,可以与现有系统快速对接。

Kimi 开放平台:https://platform.moonshot.cn/
总结
Kimi K2 的出现,确实在当下 Claude API 难买、价格高、信用卡受限的情况下,提供了一个非常有竞争力的国产替代方案。从代码生成、Agent 调用到文本写作,它的能力都处在“真正可用”的水准。
对我来说,它的最大价值是:不仅能用,还能部署,还支持本地扩展,这意味着我们可以用它来构建属于自己的 AI 工具链,甚至自定义小模型生态。