任务场景
两周前你跑了一份客户问卷。200 条回应、12 道题,躺在一份 CSV 里。PM 想要周五 EOD 之前一份一页纸,用来支持 3 个决策:要不要涨价、要不要砍掉 free tier、下一个 integration 做什么。本能反应是”我做 30 张图”——这正是没人看的 deck 的来源,而且更糟,每个读者看完都带不同的结论走。你要一份围绕 3 个决策组织的一页纸——带真实百分比、样本量、原话——再加一段诚实的”这份问卷不能回答的事”。
什么时候适合让 AI 来做
AI 擅长把开放题聚成主题、抽出能代表每个主题的原话、给百分比配上样本量上下文、并把问卷按决策而不是按题号重组。它也擅长抓”和你先验冲突的发现”——那才是真能改决策的发现。
AI 做不到:判断哪个发现对业务最重要。同一个 84% 既能支持”降价”也能支持”重做升级页”——取决于底下的原话。把你的 2-3 个决策明确喂给它,让它围绕这些组织。AI 也判断不了样本是否有偏——只调研活跃用户得到的数据对 churn 一点也说不了,无论百分比多干净。
常见失败模式:AI 在 N 很小时也乐于报百分比(N=8 时报”75% 的人说 X”)。明说:“每个百分比必须括号里带 N,N<30 的发现必须标’仅方向性’。“
需要先给 AI 的信息
- 原始问卷回应(CSV 上传,或粘文本如果数量少)
- 这份问卷要支持的 2-3 个业务决策——具体到事
- 你对每个决策的先验预期(让模型标出冲突)
- 你调研了谁、怎么抽样——活跃用户?churned 用户?邮件列表?(解释完全不同)
- 总 N 和响应率(低响应率改变置信度)
- 关键分组(B2B vs B2C、free vs 付费、国内 vs 海外)
- 你后悔问的题(让模型降权)
- 已经引起你注意的原话——给模型一个 qualitative 信号的 anchor
可直接复制的 Prompt
解读这份问卷结果。
回应(CSV 或粘):{paste}
调研对象 + 抽样方式:{paste}
总 N + 响应率:{paste}
这份问卷要支持的 2-3 个业务决策:{paste}
我对每个决策的先验:{paste}
重要分组(B2B/B2C、free/付费 等):{paste}
我后悔问的题:{paste}
返回:
1)每个决策一句话标题(最多 3 个决策)。先讲数据说了什么,再讲行动含义。
2)每个决策的定量发现:百分比、括号里 N、样本量上下文。N<30 的标"仅方向性"。
3)每个决策的开放题主题:最多 3 个,每个配一句带引号的原话。没原话不算主题。
4)先验冲突标记——任何与我先验相反的发现。这些值得额外注意,因为它们才是改行为的地方。
5)太薄不能下结论的——明确列出样本不足的题和分组。不要糊弄。
6)末尾两节:"这份问卷已能支持的决策" vs "下一轮要问的问题"。
规则:
- 每个百分比必须括号里带 N。
- 每个开放题主题必须有真实原话——意译不算。
- "不知道"和空白不要合并——是不同信号。
- 与先验冲突的发现前面加 [先验冲突] 标签,让我不会漏看。
- 总长 500 字以内。一页纸,不是报告。
短版本——单题深读
下面是单题的所有开放回应。聚成 3-5 个主题。每个主题给:计数、占比(带 N)、一句原话。提及不到 5 次或没可用原话的主题丢掉。
回应:{paste}
输出示例
一条好用的标题:“定价决策:84% 流失用户提到「太贵」(N=92 / 110 流失),但开放题揭示真问题是价值不清晰,不是价格本身。行动:先重做升级页,再考虑降价。[先验冲突:你预期的是价格本身。]”
一段好用的”主题 + 原话”:“主题:‘我不知道我付的钱换了什么’(N=38 / 92 提到价格的人)。代表原话:‘我不知道 ¥150 换的是什么,跟免费版有什么区别。一直想去看升级页,但页面没说清。’ 这个主题比纯’价格太高’(N=22 / 92)大约 2:1。”
一段好用的”太薄不能结论”:“Integration 决策:太薄不能结论。只有 32 个回应回答了 integration 题,其中 18 个说’无所谓’。剩下 14 个分散在 6 个 integration 上,每个 N≤3。下一轮要把 integration 改成强制排序题,给 5 个候选。”
一段好用的”可支持的决策”收尾:“这份问卷已能支持:(1)定价决策——先重做升级页,降价 defer。(2)free tier 决策——保留,但 free 转付费需要单独调研。这份问卷不能支持:(1)下一个 integration——样本太薄。下一轮要加 integration 强制排序题。“
怎么改输出
- 每个百分比强制带 N —— “通读全文。每个百分比都要括号带 N。漏的补上。N<30 的后面加’— 仅方向性’。”
- 每个主题必须有原话 —— “每个开放题主题都要带真实带引号的原话。没原话不算主题——换一个有原话的,或合并。”
- 先验冲突显眼标 —— “再对照我的先验。任何冲突在前面加 [先验冲突]。这些是最重要的发现,不要埋。”
- 把”不知道”单独出来 —— “把’不知道’、‘不适用’、空白当三个分桶,不要合一。每个信号不同——‘不知道’在定价上通常是价值不清晰;空白通常是问卷疲劳。”
- 末尾给”能 / 不能”分割 —— “每份问卷 readout 都用两节收尾:‘已能支持的决策’ vs ‘下一轮的问题’。如果全在’已能’里,是 overclaim;通常 3 个决策里 1 个该入下一轮。“
容易踩的坑
- 只引百分比不报样本量——8 人里 75% 不是发现,是巧合;每个百分比都要 N
- 主题没原话——AI 在意译,读者却当权威;原话把主题落到真实顾客语言上
- 忽略”不知道”和空白——它们是信号,往往是最重要的那条;合并掉就把故事埋了
- 按题号顺序组织 readout——读者在意的是决策,不是你问问题的顺序;按 2-3 个决策重组
- 过度延伸子分组——12 个回应的子分组只能支持方向性;当作结论会误导
- 一份问卷想支持太多决策——为 5 个决策设计的问卷通常一个都没答好;进去前选 2-3 个
- 没喂模型先验——没先验,模型分不清哪个发现是惊喜;惊喜才是改决策的
- 把”太薄”那部分藏起来——本能想糊过去;这一糊把强发现的可信度也毁了
FAQ
- finding 最少多少样本? —— 整体百分比:方向性 30+,自信 200+。子分组:每组 30+,最好提前分层让分组 N 已知。低于 30 是”暗示”,不是”显示”。
- 一页纸里要图吗? —— 每个决策一张图就够。再多就是凑页;带原话的叙事干得更多。如果一张图不能改变行动含义,就砍。
- 问卷样本有偏(只活跃用户答了)怎么办? —— readout 里明说:“这份问卷反映的是活跃用户;本报告任何内容都不能解读为对 churned 用户的表态。“然后另排一次 churned 用户的跟进。
- 模型一直从薄样本里 overclaim 怎么办? —— 加:“基于 N<30 的发现,标题里必须含’仅方向性——样本不足以下置信结论’。任何小 N 发现不带这个 caveat 都不允许出现。“再跑。
- 怎么把 readout 分享给团队? —— 先发一页纸(文字)。然后做一次 20 分钟现场 walkthrough。不要做 30 页 slide——那正是你一开始想避免的失败模式。