AI 分析问卷开放题:500+ 自由文本聚成可解释的主题

一套可复用的 AI 问卷开放题聚类流程:主题可核实、引用可追溯,避免『挑句子凑结论』。

任务场景

你跑了一份问卷,“哪里需要改进""最近一次让你抓狂的场景”这类开放题收回几百到几千条。手工数不可能,但这一张主题图会决定接下来一季的产品或运营动作。你需要经得起追问的聚类。

哪些情况适合让 AI 来做

  • 有 200-5000 条开放题,要在一天内出结构。
  • 答案较短(5-100 字),主要 1-2 种语言。
  • 想要初稿聚类,再人工打磨。
  • 每次问卷后都要重跑同一套分析,主题命名要可对齐。

什么时候不要完全依赖 AI

  • 样本太小(50 条以内)——自己读更快。
  • 敏感话题(心理健康、骚扰、裁员),误读有伤害。
  • 要在董事会或监管面前答辩的战略决策。
  • 多语种数据,模型对各语言覆盖不均。

需要先给 AI 的信息

  • 清洗、去重、过滤垃圾后的答案。
  • 问卷题目原文——聚类高度依赖问题。
  • 预期主题数(一般 5-12)。
  • 禁用主题清单(“其他反馈""一般评论”)。
  • 如果要分群对比,附上每条答案的人群标签(岗位、地区、付费层级)。

可直接复制的 Prompt

你是研究分析师,对自由文本问卷答案做聚类。

问卷题目:{survey_question}
答案条数:{n}
预期主题数:{expected_themes}
禁用主题:{stop_list}
分群标签(如有):{segments}

答案:
"""
{responses}
"""

输出:
1. 主题表:
   - 主题名(3-6 字,具体)
   - 一句话定义
   - 3-5 条原文支撑(带 response_id)
   - 计数 + 占比
2. 分群表(如有标签):每群主题占比。
3. 长尾段:5-10 条没归入任何主题的答案 + 你的说明。
4. 信心标记:支撑少于 5 条的主题标 "[weak]"。

规则:
- 引用必须逐字。
- 每条引用注 response_id。
- 主题计数总和 = 答案总数 - 长尾。
- 不能造少于 3 条支撑的主题。
- 主题互斥——每条答案只入一个主题。

建议让 AI 输出成什么样

主题表 + 分群表 + 长尾段 + 信心标记。这套结构能直接放进 slide deck 或 Notion 报告。

怎么判断 AI 的结果能不能用

  • 随机抽 10-15 条引用对照原文,主题归属对吗?
  • 主题计数 + 长尾 = 总数?
  • 同一 prompt 跑两次比较聚类——漂移大说明聚类弱。
  • 把主题名给没看过数据的同事——他能猜出每个主题装的是哪种评论吗?

容易踩的坑

  • 让模型硬套你预设的主题,而不是自然聚出。
  • 不验证归属就直接信计数。
  • 把自选样本的百分比当代表性数据报。
  • 忽略长尾——有时候下一个产品点子就藏在长尾里。

下一步怎么改得更好

每轮问卷把主题表存成 codebook,下次作为预定义主题喂回去,跨季度趋势线才可对比。跟踪主题随时间的体量——上升中的主题即便还不是多数也值得关注。

实操加深

做「AI 分析问卷开放题:500+ 自由文本聚成可解释的主题」这类任务时,AI 输出质量主要取决于输入包是否完整。至少给它受众、原始材料、目标格式、你要做的决策,以及一好一坏两个参考。第一轮先要求保留事实,第二轮再优化结构、语气或表达,不要让模型一边猜事实一边润色。

拿到结果后单独做一次复核:有没有遗漏限制、编造细节、行动项不清、语气和真实场景不符。最终稿最好能马上使用,包含明确对象、下一步和判断标准,而不是还需要别人重新解释一遍。

FAQ

  • 多大样本值得用 AI? 开放题 200+ 起。再少自己读更准。
  • 要先匿名化吗? 要——去掉姓名、公司、所有可识别信息。
  • 怎么诚实地报告? 永远先报样本量、回收率、分群说明。
  • 能把问卷主题和访谈主题合在一起吗? 可以,但先各自建 codebook 再对齐。

相关阅读

可结合 用户反馈聚类 prompt用户反馈聚类 AI 流程问卷结果解读 AI

标签: #数据分析 #工作流 #研究