Codex 和 Claude Code 怎么选？最新对比（2026 年 6 月）

OpenAI Codex 和 Anthropic Claude Code 都是 agentic 编程工具，但运行位置和计费方式完全不同。这是一篇带价格、模型和跑分的最新对比。

发布于: 2026/05/12 更新于: 2026/06/04 作者: AI Productivity Guide Team 🌐 查看英文版本

OpenAI Codex 和 Anthropic Claude Code，是现在多数职业开发者真正一整天开着的两个 agentic 编程工具。远看很像：用中文（或英文）说一句需求，它就去读代码、改文件、跑命令、开 PR。真正的区别在三件事上——默认在哪里运行、能用哪些模型、账单怎么算。这篇用 2026 年 6 月的最新数据把这三件事说清楚，让你不靠猜就能选。两个都没用过的话，先用 Codex 新手指南和 Claude Code 新手指南各跑一遍。

一句话总结

Claude Code：跑在你本地终端，直接操作本机文件、git、shell，只能用 Anthropic 的模型（Claude Opus 4.7 和 Sonnet 4.6）。适合在已经 checkout 的仓库里做紧贴本地的迭代。Claude Pro 月费 20 美元即含，更高有 Max（100 / 200 美元）。
Codex：提供 CLI、IDE 插件、网页任务台和 GitHub 应用。最大亮点是云端任务——它起一个隔离沙盒，长时间跑完再开 PR。运行 GPT-5.5（以及其它 GPT-5 系变体）。ChatGPT Plus 月费 20 美元即含，Pro（200 美元）额度宽裕得多。
两者默认都按 token 从套餐额度里计费（Codex 已于 2026 年 4 月 2 日取消按条消息计费）。任意一个每天重度使用，算上超额后实际大约落在每月 100–200 美元。
纯编程跑分上两者很接近：GPT-5.5 在 SWE-bench Verified 上以 88.7% 领先，Claude Opus 4.7 紧随其后 87.6%。实际胜负由工作方式决定，而不是一个百分点的跑分差。

详细对比

维度	Codex	Claude Code
出品方	OpenAI	Anthropic
模型	GPT-5.5（默认）、GPT-5.4、GPT-5.3-codex	Claude Opus 4.7、Sonnet 4.6（仅限 Anthropic）
默认运行位置	云端任务沙盒	你的本地终端
接入界面	CLI、VS Code / JetBrains / Xcode、网页任务台、GitHub、ChatGPT iOS App	CLI、VS Code / JetBrains 扩展
招牌能力	长任务云端跑、并行多任务	与本机文件、git、shell 紧耦合的本地循环
上下文来源	把仓库克隆进沙盒（CLI 模式可读本地）	直接读你的工作区
依附的套餐	ChatGPT Free / Go / Plus（20）/ Pro（200）	Claude Pro（20）/ Max（100 / 200）
计费方式	从 ChatGPT 额度按 token 扣（2026 年 4 月起）	按 token，与 claude.ai 共用额度
后台 / 定时任务	云端任务、GitHub 触发	Claude Code Routines（云端，研究预览）

数据来源：OpenAI Codex 定价与用 Pro / Max 套餐使用 Claude Code。

各自最擅长什么

Codex 更擅长

**长链路、撒手不管的任务。**一个云端任务接过 issue，在隔离沙盒里长时间跑，跑完开 PR。OpenAI 演示过 Codex 在一个工程任务上连续完成 1000+ 次工具调用而无需人工介入。
**并行撒网。**一次起多个云端任务（比如每个失败用例一个、或迁移时每个仓库一个），等 PR 落地再统一 review。Claude Code 没有这种跨独立云任务的原生 fan-out。
**沙盒执行。**不愿让代理在自己电脑上跑 shell 命令？云端沙盒默认隔离。云端任务固定用 GPT-5.5，目前不能换云端模型。

Claude Code 更擅长

**就地操作你的真实工作区。**直接读本机文件、改本机分支、跑本机命令。完整起手式见 Claude Code 项目搭建。
**低延迟、结对编程。**本地往返几乎没有延迟，可以每隔几秒就纠正方向，不用等云端任务跑完。好用的提示词模式见 Claude Code 项目 Prompt。
**大型多文件重构。**子代理（subagent）会起隔离的 Claude 会话（各自独立上下文窗口）来并行搜索和改动，又不污染主会话——很适合需要在每步之间跑测试的大规模仓内重构。

怎么选

**个体开发者，做一个已经 checkout 的项目？**先用 Claude Code，它直接动你本地文件，反馈循环很紧。Pro 套餐每月 20 美元（按年付约 17 美元/月）一张账单里就打包了 Claude Code、claude.ai 和 Claude Cowork。

团队开发者，被一堆 issue 和 PR 淹没？Codex 的云端任务模式能分摊到很多工单上——撒一批出去，逐个 review PR，合掉好的。如果你本来就付了 ChatGPT Plus，Codex 是白送的；坑在于 Plus 的额度是每 5 小时 30–150 条消息，重度 agentic 用法很快烧光，逼你升 Pro 或走超额。

**已经在为某个生态付费了？**这通常直接决定结论。ChatGPT Plus 用户白拿 Codex；Claude Pro / Max 用户同样白拿 Claude Code。在你的工作流真的需要另一个工具的招牌能力之前，没必要再加一个 20 美元的套餐。

**两个都用？**常见分工：本地用 Claude Code 处理一切涉及工作区的活，云端用 Codex 跑隔离的后台任务。每次交接前先 commit——两个工具不共享上下文，干净的 git 状态是它们唯一能可靠对齐的东西。

价格与限额（截至 2026 年 6 月）

两者都不单卖订阅，各自依附在厂商的 to C 套餐上、按 token 计费。

套餐	月费	包含	大致包含额度上限
Claude Pro	20 美元（年付 17）	Claude Code + claude.ai + Cowork	每 5 小时约 4.4 万 token（共用）
Claude Max 5x	100 美元	5 倍 Pro 额度	每 5 小时约 8.8 万 token
Claude Max 20x	200 美元	20 倍 Pro 额度	每 5 小时约 22 万 token
ChatGPT Plus	20 美元	Codex + ChatGPT	每 5 小时约 30–150 条消息
ChatGPT Pro	200 美元	Codex + ChatGPT，额度宽裕	每 5 小时约 300–1500 条消息

几个要记住的点：

Claude Code 的用量与你的 claude.ai 对话共用——一段长的 Claude Code 会话和网页版啃的是同一份额度。Max 套餐另加两条每周上限（一条所有模型、一条仅 Sonnet），均在会话开始后 7 天重置。
Codex 已于 2026 年 4 月 2 日改为按 token 计费，取代旧的按条消息方案；用量按每百万输入/输出 token 折算成额度，从你的 ChatGPT 套餐里扣。
所有付费 Claude 套餐和 Codex 现在都支持额度用完后按标准 API 价继续跑，所以重度用户很少撞上硬墙——撞上的是更大的账单。按日常职业使用估算，任意一个都规划在每月 100–200 美元。
套餐之外直接走 API 的价格：Opus 4.7 每百万输入/输出 token 5 / 25 美元，Sonnet 4.6 3 / 15 美元，GPT-5.5 5 / 30 美元。

下决定前请核对实时页面：Codex 定价与 Claude Max 套餐说明。

模型与跑分

“谁更聪明”的争论其实就落在这一节——而老实说，两者各有胜负。

跑分（2026 年 6 月）	Codex（GPT-5.5）	Claude Code（Opus 4.7）
SWE-bench Verified	88.7%	87.6%
SWE-bench Pro	58.6%	64.3%
Terminal-Bench 2.0	82.7%	约 69–72%

这样读：GPT-5.5 在标准的 SWE-bench Verified 上略胜，在终端类 agentic 任务上（Terminal-Bench）领先明显，正好衬托了 Codex 跑命令的工作方式。Claude Opus 4.7 在更难的 SWE-bench Pro 上领先，而这套更贴近真实的多文件工程活。日常用起来，你不会因为一个百分点的跑分差有感觉；有感觉的是运行界面和账单。

一条硬约束要记牢：Claude Code 只能用 Anthropic 的模型，没法让它跑 GPT-5.5；Codex 反过来，只能用 GPT-5 系。如果你想要一个能在同一个项目里自由切换 Opus 4.7、Sonnet 4.6 和 GPT-5.5 的工具，那是 Cursor 这类编辑器，而不是这两个。

容易踩的坑

“Codex 就是 ChatGPT 的写代码模式” — 2026 年重做之后就不是了。Codex 是独立代理，有自己的 CLI、IDE 扩展、网页任务台和 GitHub 应用；云端任务能跑长链路活、跑完开 PR。

“Claude Code 就是 claude.ai 的网页版” — 它是另一个跑在终端里的独立产品。它确实和 claude.ai 共用套餐额度，但它改的是你真实的文件系统、跑的是你真实的 shell——网页版两样都做不到。

“其中一个明显更聪明” — 在 2026 年 6 月的跑分上两者各胜一些。按工作方式和你已经付费的那个套餐来选，别盯着一个百分点的差距。

FAQ

Q：在本地仓库里干活，哪个更合适？ A：Claude Code。它在你终端里对真实工作区操作，改文件、跑 git、跑测试都就地完成、几乎零延迟。Codex 虽然也能用 CLI 在本地跑，但它的默认且最强的模式是云端沙盒，和你正在改的实时仓库状态耦合得更松。

Q：长时间撒手不管的 agentic 任务，哪个更强？ A：要完全无人值守的云端长任务，选 Codex——它把每个任务隔离在沙盒里，能连续跑 1000+ 次工具调用，还能并行起多个任务。如果你想留在本地循环里、每步之间纠偏，Claude Code 更顺，它的子代理也能在一个会话里并行干活。

Q：能在同一个项目里两个都用吗？ A：能，很多人就是这么用。典型分工：本地用 Claude Code 处理一切涉及工作区的活，云端用 Codex 跑”修这个 issue、开个 PR”这类隔离后台任务。两者不共享上下文，所以交接前先 commit，让每一方都从干净的 git 状态起步。

Q：它们价格和账号互通吗？ A：不互通。Codex 计入你的 OpenAI / ChatGPT 套餐（Free / Go / Plus 20 / Pro 200）；Claude Code 计入 Anthropic（Pro 20 / Max 100 / 200）。两者都按 token 从套餐额度里扣，额度用完后回落到 API 价继续跑。

Q：Claude Code 能用 GPT-5.5 吗？Codex 能用 Claude 吗？ A：都不能。Claude Code 只能用 Anthropic 模型（Opus 4.7、Sonnet 4.6）；Codex 只能用 GPT-5 系（云端任务默认 GPT-5.5）。如果你需要一个能在单个项目里跨厂商切换的工具，请用 Cursor 这类多模型编辑器。

一句话总结

详细对比

各自最擅长什么

Codex 更擅长

Claude Code 更擅长

怎么选

价格与限额（截至 2026 年 6 月）

模型与跑分

容易踩的坑

FAQ

相关阅读

相关文章

AI 生成更新日志：从 commits 到人愿意读完的 release note

AI 协作数据库迁移——可回滚、有回填、能测

用 AI 写事故复盘，又不冲淡教训

AI 解 merge 冲突：什么时候能信自动合

AI on-call 排障：从被叫醒到修好不慌

AI 写 PR 描述——从 diff 到能审