OpenAI 重新启用 Codex 这个品牌之后,很多开发者开始问:Codex 和 Claude Code 到底什么区别?我该用哪个? 如果两个都还没用过,先看 Codex 新手指南 与 Claude Code 新手指南 各跑一遍,再回到这篇会更有体感。
一句话总结
- Codex:OpenAI 的 AI 编程代理,强调”自动完成整段任务”,运行在云端环境(也有 CLI / IDE 接入)。
- Claude Code:Anthropic 的 AI 编程代理,强调”在你本地终端 / 本地代码库里执行任务”。
两者都属于”agentic coding”赛道,但默认运行位置不同,是最大的区分点。
详细对比
| 维度 | Codex | Claude Code |
|---|---|---|
| 出品方 | OpenAI | Anthropic |
| 默认模型 | GPT 系列(如 GPT-5 系) | Claude 系列(默认 Opus) |
| 运行位置 | 默认云端任务环境 | 默认本地终端 |
| 主要交互 | 网页 / IDE 任务台 + CLI | 本地终端 + IDE 扩展 |
| 强项 | 跑长任务、并行多任务 | 与本地代码、git、shell 紧耦合 |
| 上下文方式 | 上传仓库 / 远端环境 | 直接读取你本机文件 |
各自最擅长什么
Codex 更擅长
- 长任务:例如”看一下这个 issue,给出修复方案并打开 PR”。
- 并行:让它同时处理多个任务。
- 远程沙盒:不愿意让 AI 在自己电脑上执行命令?让它在云端运行更安全。
Claude Code 更擅长
- 就地操作:直接读你本机文件、改你本机分支、跑你本机命令。完整起手式见 Claude Code 项目搭建。
- 响应速度:本地交互几乎没有延迟。
- 细颗粒度:可以一边人工 review 一边让 AI 改。常用提示词见 Claude Code 项目 Prompt。
怎么选
如果你是个体开发者,做 indie 项目 → Claude Code 更顺手,因为它能直接动你本地的项目。
如果你在团队里,负责一堆 issue / PR 自动化 → Codex 在云端跑任务对你帮助更大。
**两个都试。**最终大部分认真用 AI 写代码的人,会同时装两个。它们解决的问题略有不同。
价格与限额
两者都需要订阅或按 token 计费:
- Claude Code 通常随 Claude 订阅(Pro / Team / 企业)一起提供使用额度。
- Codex 通常随 ChatGPT 订阅或单独的 API 计费提供。
具体额度与价格变化较快,以官网为准。
容易踩的坑
“Codex 是 ChatGPT 写代码模式” — 不对。Codex 现在是一个独立的代理产品,能跑长任务、能开 PR,不只是 ChatGPT 的代码模式。
“Claude Code 就是 Claude 的网页版” — 不对。它专门跑在你终端,是另一个产品形态。
总结
不是”谁更强”,而是”谁更适合你目前的工作方式”。 建议从Claude Code 解决本地工作 + Codex 解决长任务自动化的组合开始尝试。当 AI 改错文件或卡住时,Claude Code 改错文件了 与 Claude Code 卡在循环里 排查笔记最省时间。
实战例子
先拿一个具体小任务跑这套流程。比如:总结一份 PDF、重写一个落地页模块、审一个 PR、生成一组图片方向、调一个 prompt。输入要小到你能人工判断 AI 是否真的帮上忙。确认结果稳定后,再把同样模式扩展到完整文档、完整代码库或完整素材批次。
什么时候必须人工再复核一遍
- 输出要公开发布、发给客户、写进代码,或用于钱相关决策。
- 答案里有事实判断、法律 / 医疗 / 金融含义、隐私数据,或品牌敏感表达。
- 工具改了文件、设置、权限、账单、部署,或任何不容易撤销的东西。
- 你无法不用”相信模型”来解释最终结果为什么正确。
可直接复制的 Prompt
我想把这套流程用于一个真实任务。
目标:
- [写清楚你想得到什么结果]
上下文:
- 使用工具:[ChatGPT / Claude / Gemini / Cursor / Codex / 其它]
- 输入资料:[粘贴或上传文件、笔记、链接、截图]
- 限制条件:[语气、长度、格式、截止时间、受众、隐私限制]
请做三件事:
1. 先用你自己的话复述任务,并列出缺失信息。
2. 只基于我提供的上下文产出第一版。
3. 附一个简短检查清单,让我在使用前能验证结果。
详细实操流程
- 先用最小的真实输入开始。不要用假文本测试;用一个真实文件、一个真实页面、一个真实 bug,或一份真实创意 brief。
- 在同一条消息里给工具目标、输入材料和好答案标准,避免模型优化错方向。
- 任务会影响代码、公开内容、钱、账号或品牌语气时,先让它出计划,不要直接要最终结果。
- 跑第一轮后人工检查:缺了哪些上下文、有没有事实不确定、格式有没有跑偏、模型有没有越权发挥。
- 修改时给具体反馈,不要只说”再好一点”。明确哪些保留、哪些删除、下一版要达到什么标准。
- 把最终 prompt、输入结构和检查清单保存成模板,下次同类任务直接复用。
常见的翻车情况
- 输出很空泛:加入真实资料,并指定更严格的输出格式。
- 工具编造事实:要求它区分”来自资料的确认信息”和”推断”,删掉无来源内容。
- 答案太长:先让它完整输出,再要求压缩到目标长度。
- 文字看起来专业但实际不对:按原始资料核对,不要按语气自信程度判断。
- 第二轮开始越改越乱:用修正后的上下文和上一版最佳结果重新开一轮。
FAQ
Q:Codex 和 Claude Code 最大的区别是什么? A:默认运行位置。Codex 跑在云端任务环境(也有 CLI / IDE 接入),强调“自动完成整段任务”;Claude Code 默认在你本地终端直接读写文件、调 shell、跑 git。要并行多任务和远端长跑选 Codex,要紧贴本地 repo 选 Claude Code。
Q:两个都用一个开发者会怎么用? A:常见模式是 Claude Code 当主力做日常 repo 修改(在本地一直挂着),Codex 派去跑独立的“看 issue、出 PR”长任务(30 分钟以上)。两边的上下文不互通,所以每次任务自带边界即可。
Q:哪个更适合大型重构? A:Claude Code。它能直接读多文件、跑测试、连续 diff 审;Codex 的云环境每次拉一个完整副本,迭代成本更高。但跨多 repo 的长跑迁移可以反过来——Codex 一次起 N 个任务并行,Claude Code 没有这种 fan-out。
Q:价格怎么算? A:Codex 按任务 / 按使用计入 OpenAI 配额;Claude Code 在 Claude Pro / Max 套餐里包含,超出走 API 计费。一周 5+ 小时密集用 Claude Code 通常 Max 更划算;偶尔跑长任务的更适合按用量付 Codex。