上线前用 AI 生成 3 个可验证的定价假设

用 AI 产出 3 个不同形态的定价假设(形态、人群、关键风险、一周实验),附 2026 年 SaaS 定价基准和可直接复制的 Prompt。

一句话总结

别问 AI”我该收多少钱”——它拿不到你的毛利和转化数据,只会瞎猜。正确用法是让它产出 3 个不同的定价形态(不是 3 个数字),把每个形态对着一个细分人群压力测试,再给你每个形态配一个一周内能跑完的实验。形态决策(按席位 / 按用量 / 混合 / 按结果)比具体金额重要得多:截至 2026 年 6 月,纯按席位定价已降到 SaaS 公司的约 15%,而”基础费 + 用量”的混合模式预计到年底将达到约 61%。本文给你该喂什么给模型、一段可直接复制的 Prompt,以及在任何价格上线前如何验证它的输出。

任务场景

你处在上线前,或正在考虑调价,定价说不清楚。可选方案有十几种:免费 + 付费、Freemium + Premium、按席位、按用量、按价值打包、按结果。“形态错了”比”数字错了”代价大得多。这里的目标不是猜一个价,而是产出 3 个互斥的假设,每个都配一个一周内能跑完的验证实验

适合上线前的 SaaS 创始人、纠结订阅还是买断的独立开发者、要加新档的产品团队。

2026 年的定价形态全景(用来约束 AI)

定价”形态”是模型该最先推理的结构性决策。下面是截至 2026 年 6 月的市场现状,免得你或 AI 锚定在过时的默认值(比如”大家都按席位收费”)上。

形态按什么收费2026 年现状最适合
按席位每个命名用户下滑中——约 12 个月内从 21% 降到 15%每用户价值清晰的协作类工具
按用量消耗的单位(API 调用、GB、运行次数)约 77% 的头部软件公司已含用量组件单客户成本波动大的产品(尤其 AI)
混合(基础费 + 用量)固定下限 + 超量浮动赢家——目前约 43% 的 SaaS,预计 2026 年底约 61%既要可预测又要上行空间的现代 SaaS
按结果只对成功结果收费新兴前沿,如 AI 客服按”已解决工单”计费价值可量化的 AI 智能体

这对你的 Prompt 有两点意义:(1)用较旧数据训练的模型倾向于默认按席位,而这恰恰是 2026 年在萎缩的选项;(2)如果你的单客户成本波动很大(任何重度依赖大模型推理的产品),固定收费会悄悄在重度用户身上亏钱,所以模型至少应该提出一个按用量或混合的假设。

哪些情况适合让 AI 来做

适合做结构化这一步:给定产品、受众、支付意愿信号,一个有水平的模型(截至 2026 年 6 月的 GPT-5.5、Claude Opus 4.7 或 Gemini 3.1 Pro)能产出不同的定价形态,并推理每种形态最适合哪个细分。Opus 4.7、Sonnet 4.6 和 Gemini 3.1 Pro 都有 100 万 token 上下文,你可以把完整的竞品定价页和原始客户访谈记录整段贴进去,让模型自己找出打包的边界。

它也擅长压力测试:贴上你现在的假设,问”最可能的单一失败模式是什么?第一周里什么早期信号会暴露它?“

什么时候不要完全依赖 AI

AI 不知道你的真实转化数据、单客户服务成本、毛利现实。定价的算术必须你自己用真实数字做,不能靠模型的假设。每个建议价格都要对照毛利下限手动验算一遍。

强监管行业(保险、医疗、信贷)有合规价格要求,不要纯交给 AI。

需要先给 AI 的信息

  • 产品:是什么,以及核心价值单位(一个项目、一个席位、一次 API 调用、一个已解决工单、节省 1 小时)
  • 受众:具体细分 + 购买动作(自服务 vs. 销售驱动)
  • 支付意愿信号:5–10 个目标客户说他们愿意付多少,最好带原话——理想情况下用结构化方法采集,比如 Van Westendorp 价格敏感度测量(四个问题会收敛出一个可接受价格区间)
  • 竞品定价:3–5 个最近竞品,标注形态而不只是价格
  • 约束:毛利下限、计费系统(Stripe 境内约 2.9% + 30¢ vs. Paddle 作为记录商户约 5% + 50¢,会改变你的下限)、地区
  • 一件你确定的事 + 一件你不确定的事

后两项能避免模型偷懒给标准答案。

可直接复制的 Prompt

把每个 [方括号] 占位符换成你的真实输入,再贴进你选的模型。

你是定价策略师。请为下方产品产出 3 个互斥的定价假设。
每个必须用不同的定价形态(如按席位、按用量、基础费+用量混合、按结果),
而不是同一形态换三组数字。

产品:[是什么 + 核心价值单位]
受众:[细分 + 购买动作:自服务还是销售驱动]
WTP 信号:[5-10 个带数字的客户原话]
竞品定价(含形态):[竞品清单]
约束:[毛利下限]、[计费系统]、[地区/币种]
确定:[我确定的那一件事]
不确定:[我不确定的那一件事]

每个假设输出:
- 一句话定价形态总结
- 套餐结构:分层、每层内容、锚点价 + 币种
- 目标细分 + 这种形态解决他们的什么 JTBD
- 选这种形态的理由(1 段,能反共识就反)
- 关键风险:什么情况下会失败
- 第一周要监控的领先指标
- 1 周内可执行的验证实验(谁、怎么做、量什么)

刻意保留其中一个为反共识假设。
最后给出"先测哪个 + 为什么",并为每个假设补一句
"即使失败也能学到什么"。

价格上线前如何验证输出

模型输出只是起点假设,永远不是决定。把每个建议过一遍这份清单:

  1. 毛利核查——每个价格对照毛利下限手动验算,把支付通道费算进去。能过 Stripe 约 2.9% + 30¢ 的价,未必能过 Paddle 约 5% + 50¢。
  2. 可触达核查——确认每个假设对应一个你本月真能接触到的细分。没有企业销售渠道,就别接受”企业 CIO”。
  3. 一周实验——每个验证实验都要能在一周内、不动开发跑完。“假门”定价页(价格真实展示,点击后进等待名单而非真扣款)是最快的无代码方案。
  4. 真实对话——把 3 个假设都放进 10 次真实客户对话里。对话数据胜过任何模型输出。

始终保留其中一个反共识假设——通常是团队没人喜欢的那个,最大信号往往就在那。衡量实验是否值得做的标尺是那句”即使失败也能学到什么”:如果你填不出来,说明这个实验还没设计好。

别忘了价格本地化

如果你卖向海外,单一美元价会白白损失转化。用当地货币展示价格平均能把转化率提升约 25%;按购买力平价(PPP)定价——例如一个 50 美元的美国套餐在印度定到接近 14 美元——在中低收入市场往往带来明显更高的转化。如果你的受众是全球的,就把”是否应该有一个假设包含本地化/PPP 档位?“作为明确问题抛给模型。Stripe 和 Paddle 都原生支持地区与多币种定价,所以这是配置决策,不是开发任务。

容易踩的坑

  • 把定价当成一个数字——形态比金额重要
  • 没有验证实验,只是”上线后看看 dashboard”
  • 因为模型建议就默认按席位(这恰恰是 2026 年在萎缩的模型)
  • 照抄竞品价格,却忽略自己的单位成本和通道费
  • 免费档太慷慨没人付费,或太抠门没人注册
  • 跳过反共识假设(最让你意外的那个)

下一步怎么改得更好

定价上线 30 天后,把真实数据连同你学到的一起回贴给模型,让它产”下一轮 3 个值得测的假设”。定价是一连串实验,不是一次性决定。只有当同一个假设在两个细分、约 60 天里都赢,才把它定下来——然后每年复盘一次。

FAQ

同时上线几个定价假设合适? 最多 2 个。超过 2 个会分散流量、把信号搅浑。用 AI 生成 3 个,再挑最强的 2 个真测(保留一个反共识)。

用哪个 AI 模型最好? 截至 2026 年 6 月,任何前沿模型都能胜任这种推理。GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro 都有 100 万 token 上下文,所以实际优势在于能整段贴入完整竞品页和访谈记录,而不是摘要。用同一段 Prompt 在两个模型上跑,对比它们分歧的地方——分歧点正是你风险最高的假设。

怎么采集真实的支付意愿数字喂进去? 一份结构化的 Van Westendorp 问卷(四个问题:太便宜、划算、开始变贵、太贵)会收敛出一个可接受价格区间。为统计置信度,每个细分争取 100+ 份回答;做早期验证时,10 次真实对话胜过一份单薄的问卷。

折扣要不要放进假设里? 不要——别把折扣烤进基础价。先测基础价,再把折扣当成单独实验跑,这样每个信号才读得清楚。

什么时候才算把价格定下来? 当同一个假设在两个不同细分、约 60 天里都赢的时候。然后视为定案,每年复盘一次;如果单位成本变了(AI 重度产品常见),就提前复盘。

相关阅读

复用本文结构可参考 定价假设 Prompt,让定价和信息对齐用 产品定位 Prompt,先验证 idea 本身值不值得定价用 创业想法评估 Prompt。想看权威的定价模型背景,可读 Bessemer 的 AI 定价与变现手册Paddle 的 SaaS 定价模型指南

标签: #工作流 #定价