这篇讲什么
痛点是:站上有几百页,Search Console 流量不均,你怀疑一长串薄页在拖整站排名。逐页看不现实,靠直觉又不准。这套 3 趟 AI 工作流给每页打分、浮出最差的、给出唯一一条动作建议——扩 / 合 / noindex / 删——并记录每次改动,30 天后能复测索引和流量回升。
这篇适合谁看
约 100 到 2000 页的内容站站长,怀疑一部分目录薄到拖整站。也适合联盟站、菜谱站、文档站、任何”生成 / 模板化页面目录”。不到 50 页的站不适用——人工 review 比搭这套流程快。
什么时候适合用
AdSense 或联盟项目申请前——两者都拒”薄页太多”的站。内容迁移后可能导入了短 stub 页。Google Helpful Content 或核心更新后,发现整站排名跌但又不对应具体关键词。每季度做一次卫生扫——薄内容会随主题漂和模板克隆重新出现。
开始前准备
- 打开 AI 之前先建页面清单 CSV。列:URL、字数、最后修改日期、入站内链数、近 90 天 organic 点击、近 90 天 organic 展示、首要查询词。
- 展示和点击数据从 Search Console 拉;字数和内链从 crawler 拉(Screaming Frog、自写脚本、或 CMS)。
- 定义”有展示无点击”的复核阈值。默认值:90 天内点击少于 50 且展示超过 200。
- 准备好 redirect 策略:删除的页 301 到哪里、哪些是好的合并目标。
- 今天截一张 Search Console 表现截图。30 天后用来比对。
具体步骤
- 建页面清单 CSV。按点击升序排。最低 30% 是首批池。
- 50 行一批喂 AI,prompt:每页打 1-5 薄内容风险分。任何一页满足”字数少于 300 字 OR 实质段落少于 2 OR 展示超过 200 但点击为 0” 就标。输出 JSON:URL、分数、首要原因。
- 第 2 趟:被标的页打开真实 HTML 让 AI 判断——这页是回答了一个具体搜索意图,还是绕主题转?把”意图错配”和”深度不足”分开标。
- 第 3 趟:动作建议。AI 每页只选一个动作:
expand— 意图清,只是短。值得花 60-90 分钟深化。merge— 与兄弟 URL 重叠。合并到流量更高的 URL,输的一方 301。noindex— 工具页(tag 列表、作者页、thank-you),无搜索价值。robots-meta noindex 并从 sitemap 删除。delete— 没流量、不合并、扩不动。410 或 301 到最近的主题枢纽。
- 按优先序执行:先删(最容易赢)→ noindex(免费、低风险)→ 合(要重写)→ 扩(最费力)。
- 每次改动记录到动作 CSV:旧 URL、新 URL 或状态码、执行日期。30 天后再截一张 Search Console。
- 季度重做。新内容、模板克隆、主题漂会让薄内容重新出现。
第一次实操怎么跑
先在一个子目录跑,不要全站跑。挑你怀疑最差的——通常是 tag 页、作者页、或某个早期主题没成熟。3 趟全跑、改、再观察 30 天 Search Console 信号。多数站会发现:可疑子目录里 30-60% 进了 noindex 或删除桶、20% 合并、剩下 20% 值得扩展。第一批的数据用来标定其他子目录的阈值。
完成后检查
- 每个被标的页都记录了首要原因。“看起来薄”不算原因;“200 字、无标题、和 /sibling-page 内容重复”才算。
- 动作建议互斥——每页只有一个。AI 偶尔会说”扩或删”。
- 近 30 天展示在涨的页不能进删除桶。展示在涨说明 Google 在起排名,让它煮。
- 删之前重定向映射要做好。
410 Gone可接受,404 不行。 - 动作 CSV 提交到仓库或存档。没有日志没法知道哪次改动带来哪次回升。
怎么复用这套流程
- 三个 prompt 存成片段:薄分、意图核、动作建议。每批改一行。
- 动作 CSV 长期累积。4 个季度后你就有一份”哪种动作真的拉动指标”的本站语料。
- 建周期监控:任何新页 90 天点击少于 50、展示超过 200,自动进复核队列。
- 每季度清单和上季度 diff。新薄页通常三类来源:模板克隆、半成品草稿、主题漂。修源头不只是修症状。
- 把动作 CSV 给一个跑相似站的同事看。对比能浮出你分类法里的盲点。
建议的操作流程
页面清单 CSV(URL + 字数 + 点击 + 展示 + 内链)→ 50 一批薄分 → 被标页意图核 → 动作建议(扩 / 合 / noindex / 删)→ 按优先级先删 → 每次改动记录 → 30 天后查 Search Console → 季度重做。
容易踩的坑
- 删不做 redirect——内链静默死,链接权重也丢。
- 合不重写——Google 把”部分合并”当重复;规范版要重写。
- 把”短”等同”薄”——一页 250 字答得准的页面照样能排。信号是意图贴合,不是长度。
- 批量 noindex 不从 sitemap 删——Google 会持续爬并忽略,浪费 crawl budget。
- 只信 pass-1 分不做意图核。500 字的页可能比 250 字一击即中的页更薄。
- 不做 30 天复测。没有度量你不知道改动是有帮助、有害还是噪声。
FAQ
- 有字数阈值吗?: 没有魔法数。意图贴合和深度比长度重要。250 字答案页可以在同一查询下压过 1500 字列表。
- 对 AdSense 影响?: AdSense 拒”薄页太多”的站。这套审计在申请前跑通常会显著拉高通过率。
- 用 noindex 还是 410?: 用户内部用途的 tag 页用 noindex。不应再存在的用 410。用户仍需落地的用 301 重定向。
- AI 标了一页薄但我知道很高质怎么办?: 推翻。流程是建议,你做决定。把假阳性记进动作 CSV,prompt 越调越准。
- 整套审计多长时间?: setup 约 30 分钟,每 50 行 10 分钟,加上实际改动时间。500 页站半天就能搞定。
- 非英文站能跑吗?: 能。prompt 里显式写语言,字数预期调一下——中文页面常常用更少字符表达更多。