OpenAI 发布了最新的 GPT-5.6 预览版,但这次情况有些特殊:模型发布了,但绝大多数用户都无法使用。
由于美国政府对顶尖模型的事先审核要求,GPT-5.6 目前仅有限开放给部分审批过的合作伙伴。普通用户何时能接触到,目前尚无具体时间表。
GPT-5.6 三大档位
本次发布的 GPT-5.6 系列包含三个版本:旗舰版 Sol(太阳)、均衡版 Terra(大地)、轻量版 Luna(月亮)。
旗舰模型 Sol:最强的网络安全与编程工具
Sol 直接对标 Anthropic 的 Mythos Preview。在测试安全能力的 ExploitBench 指标上,Sol 的表现与 Mythos Preview 基本持平,但 Token 消耗量仅为对方的三分之一。

Sol 是 OpenAI 目前最强大的网络安全模型,可用于漏洞挖掘、研究和利用。不过 OpenAI 澄清:Sol 能找到漏洞和利用组件,但无法独立完成端到端的完整攻击链。它更像是一个顶级的防守型工具,而非自动攻击武器。
除了安全能力,Sol 的上下文窗口从 105 万 Token 扩展到了 150 万 Token,增幅约 43%。这对代码分析和复杂项目规划至关重要。
在编程方面,Sol Ultra 在测试命令行实际操作能力的 Terminal Bench 2.1 指标中得分最高,甚至超越了 Claude Mythos 5 和 Fable 5。

在生物学领域的 GeneBench V1 测试中,Sol 的得分从 GPT-5.5 的 22% 提升至 30%,且 Token 使用更少。这使得 GPT-5.6 系列在生化领域的理解与辅助能力触发了更高等级的安全预警。

全新推理模式:Max 与 Ultra
随着 GPT-5.6 的发布,OpenAI 引入了两个新的推理模式:
- Max 模式:给予模型更多推理时间,让回答更深入。
- Ultra 模式:主模型将任务拆分,调度多个子进程并行处理,最后汇总结果。
定价与缓存优化
价格方面,Sol 输入为每百万 Token 5 美元,输出为 30 美元。Terra 价格减半,Luna 更低。
同时,GPT-5.6 引入了更可预测的提示词缓存机制,最短有效期 30 分钟。如果从缓存中读取,开发者可享受高达 90% 的折扣。
命名规则大改:向 Anthropic 看齐
OpenAI 这次采用了类似 Claude 的命名策略:用数字代表代际,用名称区分等级。GPT-5.6 这一代对应 Sol、Terra 和 Luna,与 Claude 的 Opus、Sonnet、Haiku 思路如出一辙。
监管时代的到来
网络上对“有限预览”的吐槽不少。现实情况是,每个顶尖模型在发布前可能都要经过政府审查。那种广泛、全量发布最新模型的日子,或许已经一去不复返了。
正如 OpenAI 和其他 AI 大佬们多年来所呼吁的那样——最严格的监管终于来了。
参考链接:OpenAI 官方博文