Prompt 太泛,产不出有用结果

问 AI "创业公司工程团队怎么 scale",得到 800 字常规建议——泛问题必产泛答案,因为模型必须在整个输入空间都站得住。本文教你把宽问题收窄到唯一答案能成立。

你问”创业公司工程团队怎么 scale 最好?“得到 800 字覆盖招聘、文化、流程、工具、远程。答案严格来说对,适用于历史上每一家创业公司。不适用于你的。泛问题必产泛答案,因为模型得写一个在整个输入空间都站得住的东西。输入空间巨大时,唯一站得住的输出就是常规建议的平均态——按定义就是平庸。

本文讲怎么把宽问题收窄到只有一个具体答案能成立。

常见原因

1. 没规模 / 范围

“怎么组织工程团队”可以是 3 人也可以是 300 人。模型写一个两边都覆盖的答案,结果两边都不贴。

如何判断:你的问题没数字。

2. 没约束

“用什么数据库最好”没流量、没成本、没团队熟悉度。模型没东西排除选项。

如何判断:开放问题没有”给定 X”或”受 Y 约束”的子句。

3. 没决策方

“我们 roadmap 该怎么选”——给谁选?CEO 的标准和 eng lead 的不同。没声明决策方时模型平均。

如何判断:prompt 里没点名角色。

4. 没成功标准

“帮我想想 X”没说什么算”帮上”。模型写综述,因为综述无可指摘。

如何判断:prompt 里没”好的输出长什么样”的子句。

5. 没输入数据

要建议但没你的具体情况。模型只能泛写。

如何判断:prompt 里 0 个具体数字、名字、文件、数据点。

动手前先确认

  • 写下 5-10 条你的具体事实。
  • 决定模型该用哪几条。
  • 标决策者 + 他要用输出做什么。
  • 用 2-3 条可测项定义成功。
  • 计划问一个窄问题,不是一个宽问题。

需要收集的信息

  • 当前宽 prompt。
  • 拿到的泛输出。
  • 5+ 条你真实情况的具体事实。
  • 输出应该支持的决策。
  • 模型 + system prompt。

最短修复路径

Step 1:开放动词换决策动词

差:  "工程团队 scale 怎么做最好?"
好:  "我们 8 个工程师做 B2B SaaS,2 个 squad,
       PR 到 prod lead time 是 4 天。我们想 1 季度内砍半 lead time。
       在以下三条里选 1 个干预,3 句话辩护:
       (a) 切到 trunk-based 开发
       (b) 加 1 个专职 platform 工程师
       (c) PR 大小限到 200 行"

决策动词(“选”)+ 候选 + 标准逼出具体答案。

Step 2:加 5 行具体上下文

技术栈:<运行时、框架、关键依赖含版本>
规模:<用户、QPS、数据量>
约束:<预算、deadline、人数>
试过:<已经失败什么>
目标:<带成功标准的交付物>

模板把泛 prompt 翻成具体的。

Step 3:点名决策方

"这决定由 eng lead 决定、CTO 复审。
eng lead 优化交付速度。CTO 优化留存风险。"

stakeholder + 优先级校准答案。

Step 4:用数字定义成功

成功标准:
- 提出 1 项具体干预(不是清单)。
- 辩护 ≤100 字。
- 标出 1 个风险 + 缓解。
- 2 周内能看的 1 个先行指标。

数字让模型没法 hedge 进 prose。

Step 5:还泛就问模型缺什么

"要给具体而非泛的答案,你还需要我提供哪 3 个数据点?"

回答这些粘回去重问。两轮胜过一次泛回答。

Step 6:宽拆窄

问题真的大(“我们怎么 scale”)就拆:

  • Prompt 1:基于我们的具体数据识别 top 3 瓶颈。
  • Prompt 2:top 瓶颈选干预。
  • Prompt 3:设计 rollout。

3 个窄 prompt 比 1 个宽 prompt 多产出 3 倍可执行内容。

怎么确认已经修好

  • 答案指明具体干预,不是清单。
  • 答案引用你的具体事实。
  • 不同数据的另一队会得到不同答案。
  • 同事能直接行动,无追问。
  • 输出字数集中在建议而非综述。

如果还是没修好

  1. 上下文可能还缺——多加你情况的具体信息。
  2. 告诉模型要忽略什么(如”忽略通用创业建议”)。
  3. 强制二选一(“A 或 B”);二元比开放更难 hedge。
  4. 当前数据真的没答案就说明瓶颈在数据收集,不是 prompt。

预防建议

  • 默认窄 prompt:范围 + 约束 + 决策方 + 成功标准。
  • 发送前 checklist:谁决定、用什么数据、优化什么、成功长什么样。
  • 探索型先要 1 个具体稻草人再迭代。
  • 审”问宽问题”的习惯:每个”X 怎么做最好”都触发收窄步骤。
  • 团队工作流建”窄 prompt”模板,含范围、约束、决策动词。
  • 想问宽时反问”我能问的最小具体决策是什么?“。

相关阅读

标签: #排查 #Prompt #Prompt 质量 #回答太泛