OpenAI 的 Codex 正在经历它的"ChatGPT 时刻"。最近有不少人感受到这个变化了——GPT-5.5 模型推出后,Codex 一天能推好几个版本,App 端功能一个接一个上:computer use、内置浏览器、桌面宠物、image2 图片生成。
这篇是基于实际使用体验整理的 Codex 全面指南,覆盖 13 个核心功能,以及从 Claude Code 迁移的完整流程。

Codex 产品家族:5 个客户端
Codex 目前已经覆盖了 5 个客户端形态:
- Codex CLI:终端里跑,Rust 写的,启动快,开发者最爱
- Codex APP:macOS / Windows 桌面端,所见即所得
- Codex Web / Cloud:chatgpt.com/codex,云端跑长任务
- IDE 插件:VS Code / Cursor / Windsurf,写代码现场调用
- Codex SDK:TypeScript 包,自己写代码编排 Agent

其中 Codex App 是把所有能力收在一个图形界面里,没有学习成本,上手就能用。在对话框里打 / 斜杠,就能调用所有插件、Skill 或开启其他功能开关。

苏米注:Codex 的产品设计思路很清晰——CLI 给硬核开发者,App 给大多数用户,Web 给临时救火,IDE 插件给写代码场景,SDK 给二次开发。每个端都有明确的定位,不像有些工具什么都想做但什么都不精。
安装与登录
Windows / macOS 在官网下载并安装:chatgpt.com/codex
安装后登录选 Sign in with ChatGPT,浏览器授权完就登录成功了。CLI 已经登过的话,App 直接复用同一套登录态,免登录。
关于配额:ChatGPT Plus / Pro / Business / Enterprise 自带 Codex 配额,不用额外付费。Plus 5 小时一轮,总体感觉比 Claude 的额度要多一些。重度使用上 Pro,或者走国内中转配置 API 也行。

从 Claude Code 一键迁移
Codex 内嵌了迁移工具,专门针对 Claude Code 用户:
操作路径:设置 → General → Import other agent setup → Import


迁移覆盖范围:
- 指令文件 CLAUDE.md 自动转成 AGENTS.md
- 配置文件 settings.json 自动转成 config.toml
- Skills、MCP 服务器配置
- 过去 30 天的会话历史
- Hooks
- 子 Agent 设定
迁完重点查 4 项:Skill 和 Agent 里的工具权限设置、自定义认证/环境变量的 MCP 配置(密钥不会自动迁,得重填)、行为可能变的 Hooks、依赖参数/文件路径的 Prompt 模板。主要是密钥和路径需要手填,业务逻辑都帮转好了,半个小时就能完成全套切换。
模型选择策略
主界面右下角是模型选择器,下拉切换。日常配比建议:

- GPT-5.5:日常默认。重构、调试、写测试、知识检索,token 消耗比 Opus 4.6 还省
- GPT-5.4:要 1M 上下文 / 跑 computer use 时切它。比如让它读完整个代码架构总结,5.5 的 400K 装不下,5.4 才行
- GPT-5.4-mini:额度紧张时 Codex 会主动问要不要降。子任务、扫代码库、做长上下文压缩用它,便宜快
- GPT-5.3-Codex:要"几乎实时反馈"的小改动场景。比如改 Tailwind 类名、调 prop 类型这种活,秒回
有一点比较好,App 在额度快炸的时候会主动弹"要不要降一档",跟手机省电模式一样。Claude Code 是直接弹"5 小时后再来",体验差了一截。
Git 管理:内置工作流
App 把 git 工作流做进了侧边栏,不用再开终端敲命令行推送代码了。

常用流程:
- 项目 → 选择本地文件夹,自动识别 git 仓库
- 改完代码 APP 顶部"提交"按钮亮起,写 commit message 直接提
- 配好 GitHub 远程仓库后"推送"按钮可点,一键 push
- 拉 PR 到侧边栏,review 评论、diff、行内回复都能看
- 让 Codex 针对 review 评论改代码、再自我检查、再推
MCP:图形化配置外部工具
MCP 在 Codex APP 里走图形化配置,不用手写 JSON。设置 → Plugins / MCP → 添加服务器 → 填命令、参数、env。

常见的 MCP 包括 GitHub、Linear、Postgres、飞书、Notion、Slack、Sentry。装完在对话里直接 @github 拉 issue、@linear 查 ticket、@postgres 查 SQL 结果,Codex 自动调用对应工具。
MCP 这个协议是 Anthropic 提的,但把它做成普通用户也能用的形态,反倒是 OpenAI 先这么做了。
Skills:工作流管理
Codex 里 Skills 有自己的设置面板,比 Claude Code 的 .md 文件清爽。安装方式:插件 → 技能/Skills → 管理/创建,或者在对话里 /skill名 直接调。
也可以直接在项目根目录复制粘贴你的 skill 到 .codex/skills/your-skill/,结构和 Claude Code 几乎一致。

插件市场:超级应用的关键一步
插件市场是 APP 端最近改动最大的模块。Plugins → Marketplace,分类里有:
- 编程类:GitHub、CircleCI、CodeRabbit、Atlassian Rovo、GitLab Issues
- 设计类:Figma 集成,把设计稿直接搬进对话
- 生活方式类:任务、日程、笔记
- 自定义远程插件:自家公司的内部 Agent 也能挂上去

实际场景:装 CodeRabbit 插件后,PR 自动出第一轮 AI review;装 Figma 插件后,对话框扔一个 Figma 链接,Codex 自己读节点结构、出 React 组件代码。装插件的体验跟手机 App Store 一样,搜、装、开权限。
Computer Use:让 Codex 接管电脑
GPT-5.4 起的原生能力,目前 Codex 独占。设置 → Features → Computer Use 打开,在对话框里选择插件——电脑,输入你想做的事情。
第一次用会请求屏幕录制和辅助功能权限,授权后 Codex 就能按你的要求操作电脑了。

内置浏览器:边写代码边看效果
App 里直接开浏览器标签页:
- 让 Codex 直接预览本地启动的 dev server(localhost:3000),改完代码热更新,它自己看截图判断
- 复现视觉 bug 时截图丢回对话让它改 CSS,整个回路在 APP 里闭环
- 让 Codex 打开真实网站做数据抓取
改前端代码最爽的就是:一边对话框让 Codex 改组件,一边内置浏览器开 dev server,肉眼对比,效率翻倍。
自动化:定时唤醒线程
设置 → Automations,输入自动化要求,选择项目、执行频率,就能让某个对话线程按计划自动跑。

举例:
- 每天早上 9 点让某个线程"检查我的 GitHub 通知,把 review 请求列出来发到飞书"
- 每周五自动跑一次"扫描这周的 commit,写个研发周报"
- 每天 8 点跑一次"看看昨天的播客更新,挑三条总结到 Obsidian"
配合 /goal 持久化目标,相当于把"半自动任务编排器"内置进了 Codex。
image2 图片生成
Codex APP 集成了 OpenAI 的 image2 模型,对话里直接出图,不用切 ChatGPT 网页版。直接说"画个 XXX"或者"按这个截图风格生成一张 banner",几秒出图。
常用场景:写技术文档时顺手出配图、批量出小红书封面/公众号头图。

桌面宠物:花里胡哨但真上头
桌面悬浮一只像素风小宠物,实时反映 Codex 工作状态。挠头表示忙、挥手表示干完了、待机表示在等输入。相当于一个跨应用的"灵动岛",瞥一眼就知道任务跑到哪。
开启方式:设置 → 外观 → 宠物 → 选择宠物 → 显示头像。官方内置 8 只(Codex 吉祥物、整理鸭 Dewey、火焰精灵 Fireball 等)。社区宠物去 petdex.crafter.run,几百只玩家自制按喜欢数排序,一行命令安装:npx petdex install ikun。

苏米注:桌面宠物看起来是"花里胡哨"的功能,但实际上它解决了一个真实问题——Agent 在后台跑任务时,你不知道它在干嘛。宠物用一种直观的方式告诉你任务状态,比看日志轻松多了。这种细节设计体现了 OpenAI 对用户心理的把握。
总结
Claude 模型本体的代码能力到今天仍然是最顶尖水准。但模型领先 ≠ 产品领先。过去半年 Anthropic 把太多精力花在"克制"和"安全"上,而 OpenAI 在不停地堆桌面端、堆插件、堆生态、堆细节。
如果模型能力发展到顶的时候,产品体验的优势就凸显出来了。插件市场、Computer Use、自动化、内置浏览器……这些功能让 Codex 从一个"AI 代码助手"变成了一个"AI 开发工作台"。
对于正在使用 Claude Code 的开发者来说,Codex 的迁移工具让切换成本降到了最低。如果你也在考虑主力 Coding Agent 的选择,建议两个都试试,找到最适合自己的工具。