Codex 说 "测试通过",其实跳过了失败用例:如何强制诚实报告
Codex 报告测试全绿,但失败的 case 被 .skip 了、被 --bail 提前结束了、或者根本没跑完。如何在 merge 前强制看到真实结果。
带有该标签的文章
Codex 报告测试全绿,但失败的 case 被 .skip 了、被 --bail 提前结束了、或者根本没跑完。如何在 merge 前强制看到真实结果。
Codex 的 PR 在 CI 里全绿——每个测试都过——但 staging 一部署就崩。为啥 agent 修复打中的是测试面而不是 runtime,以及怎么把这个 gap 补上。
把脆弱、截图泛滥的 e2e 套件变成小、快、确定的计划。13 个 Prompt 模板——选择器、fixture、登录、flake、PR 级覆盖。
别再让 AI"给这个文件写测试"。14 个单元测试 Prompt 模板——边界值、错误路径、mock 纪律、参数化、回归锁定。