你问”创业公司工程团队怎么 scale 最好?“得到 800 字覆盖招聘、文化、流程、工具、远程。答案严格来说对,适用于历史上每一家创业公司。不适用于你的。泛问题必产泛答案,因为模型得写一个在整个输入空间都站得住的东西。输入空间巨大时,唯一站得住的输出就是常规建议的平均态——按定义就是平庸。
本文讲怎么把宽问题收窄到只有一个具体答案能成立。
常见原因
1. 没规模 / 范围
“怎么组织工程团队”可以是 3 人也可以是 300 人。模型写一个两边都覆盖的答案,结果两边都不贴。
如何判断:你的问题没数字。
2. 没约束
“用什么数据库最好”没流量、没成本、没团队熟悉度。模型没东西排除选项。
如何判断:开放问题没有”给定 X”或”受 Y 约束”的子句。
3. 没决策方
“我们 roadmap 该怎么选”——给谁选?CEO 的标准和 eng lead 的不同。没声明决策方时模型平均。
如何判断:prompt 里没点名角色。
4. 没成功标准
“帮我想想 X”没说什么算”帮上”。模型写综述,因为综述无可指摘。
如何判断:prompt 里没”好的输出长什么样”的子句。
5. 没输入数据
要建议但没你的具体情况。模型只能泛写。
如何判断:prompt 里 0 个具体数字、名字、文件、数据点。
动手前先确认
- 写下 5-10 条你的具体事实。
- 决定模型该用哪几条。
- 标决策者 + 他要用输出做什么。
- 用 2-3 条可测项定义成功。
- 计划问一个窄问题,不是一个宽问题。
需要收集的信息
- 当前宽 prompt。
- 拿到的泛输出。
- 5+ 条你真实情况的具体事实。
- 输出应该支持的决策。
- 模型 + system prompt。
最短修复路径
Step 1:开放动词换决策动词
差: "工程团队 scale 怎么做最好?"
好: "我们 8 个工程师做 B2B SaaS,2 个 squad,
PR 到 prod lead time 是 4 天。我们想 1 季度内砍半 lead time。
在以下三条里选 1 个干预,3 句话辩护:
(a) 切到 trunk-based 开发
(b) 加 1 个专职 platform 工程师
(c) PR 大小限到 200 行"
决策动词(“选”)+ 候选 + 标准逼出具体答案。
Step 2:加 5 行具体上下文
技术栈:<运行时、框架、关键依赖含版本>
规模:<用户、QPS、数据量>
约束:<预算、deadline、人数>
试过:<已经失败什么>
目标:<带成功标准的交付物>
模板把泛 prompt 翻成具体的。
Step 3:点名决策方
"这决定由 eng lead 决定、CTO 复审。
eng lead 优化交付速度。CTO 优化留存风险。"
stakeholder + 优先级校准答案。
Step 4:用数字定义成功
成功标准:
- 提出 1 项具体干预(不是清单)。
- 辩护 ≤100 字。
- 标出 1 个风险 + 缓解。
- 2 周内能看的 1 个先行指标。
数字让模型没法 hedge 进 prose。
Step 5:还泛就问模型缺什么
"要给具体而非泛的答案,你还需要我提供哪 3 个数据点?"
回答这些粘回去重问。两轮胜过一次泛回答。
Step 6:宽拆窄
问题真的大(“我们怎么 scale”)就拆:
- Prompt 1:基于我们的具体数据识别 top 3 瓶颈。
- Prompt 2:top 瓶颈选干预。
- Prompt 3:设计 rollout。
3 个窄 prompt 比 1 个宽 prompt 多产出 3 倍可执行内容。
怎么确认已经修好
- 答案指明具体干预,不是清单。
- 答案引用你的具体事实。
- 不同数据的另一队会得到不同答案。
- 同事能直接行动,无追问。
- 输出字数集中在建议而非综述。
如果还是没修好
- 上下文可能还缺——多加你情况的具体信息。
- 告诉模型要忽略什么(如”忽略通用创业建议”)。
- 强制二选一(“A 或 B”);二元比开放更难 hedge。
- 当前数据真的没答案就说明瓶颈在数据收集,不是 prompt。
预防建议
- 默认窄 prompt:范围 + 约束 + 决策方 + 成功标准。
- 发送前 checklist:谁决定、用什么数据、优化什么、成功长什么样。
- 探索型先要 1 个具体稻草人再迭代。
- 审”问宽问题”的习惯:每个”X 怎么做最好”都触发收窄步骤。
- 团队工作流建”窄 prompt”模板,含范围、约束、决策动词。
- 想问宽时反问”我能问的最小具体决策是什么?“。
相关阅读
标签: #排查 #Prompt #Prompt 质量 #回答太泛