阿里巴巴发布了最新旗舰模型 Qwen 3.7-Max,定位为专为 Agent 场景设计的模型。该模型在编程、推理等核心能力上进行了针对性优化,支持复杂编程、多智能体协作和生产级办公自动化等高难度任务。

性能评测
在 Arena Leaderboard 上,Qwen 3.7 Max 目前排名第 13 位。

在多项基准测试中,Qwen 3.7 Max 超过了 GLM-5.1、DeepSeek V4 Pro、Kimi K2.6,部分参数评测甚至优于 Claude Opus 4.6 Max。以下是 12 个基准测试的详细对比:

苏米注:国内模型新发布时跑分普遍较高,实际使用体验可能会有差异。但从目前数据来看,Qwen 3.7 Max 确实具备了与 GLM-5.1 一较高下的实力。
使用方式
Qcoder 集成
Qwen 3.7-Max 已在 Qcoder 中开放支持。面向 Agent 全新设计,在编程、推理等核心能力上持续突破,可胜任复杂编程、多智能体协作、生产级办公自动化等高难度任务。

使用 Qcoder 敲代码时,可以将 Qwen 3.7-Max 作为主力模型。Qcoder 中的 GLM 是量化版,能力与官方版本存在差距,使用阿里自家的 Qwen 3.7-Max 效果可能更好。
百炼平台 API
百炼平台也已开放 Qwen 3.7-Max 的 API 调用。需要注意以下几点:
- 不支持图片和多模态:百炼平台的 Qwen 3.7 目前仅支持文本
- 上下文窗口 1M:在处理长上下文任务时有明显优势
- API 价格:输入 12 元/百万 tokens,输出 36 元/百万 tokens
- 建议使用 Token Plan:API 调用价格较高,Coding Plan 暂不支持
应用场景
目前 Qwen 3.7-Max 适合以下场景:
- Agent 调用:以前使用 3.6-Plus 的用户可以升级到 3.7-Max
- 代码编程:使用 Qcoder 的用户可以将 Qwen 3.7-Max 作为主力模型
Qwen 的市场表现
值得关注的是,Qwen 系列模型的市场关注度有所下降。新模型发布的讨论热度不如从前。自阿里下架 Coding Plan 后,加上模型定位"高不成低不就",部分 C 端用户转向了 GLM 和 DeepSeek。
目前 Qwen 的主要方向似乎是商业用户、多模态能力和私有化部署。留给 C 端用户的选择有限,Token Plan 性价比不高,Qcoder 成为相对较好的使用途径。
苏米注:Qwen 3.7-Max 的性能数据确实亮眼,但 API 定价策略和 C 端用户友好度仍是需要关注的问题。对于开发者来说,Qcoder 集成是目前最经济的体验方式。