薄页面被 Google 默默降级:4 个原因 + 对症修复

Google 不会显式罚薄页面——它只是默默降级:更少抓取、更低排名、最后掉收录。

Google 不会发邮件告诉你”你这页太薄”。它只是悄悄降低对薄页面的处理优先级:

  1. 抓取频率下降 → 这条 URL 几个月不被重抓
  2. 排名权重打折 → 即使收录也排不上 SERP 前 50
  3. 整组判定 → 同 URL 模式(如 /articles/auto-generated-*)的所有页全降级
  4. 最终掉收录 → 几个月后从 Indexed 移除

整个过程没有任何 Search Console 通知。修法不是”加字数”,是实质性提升信息密度主动清理

症状

  • 100-300 字以下的页面收录率 < 30%
  • 已收录的薄页随时间被降级(排名跌、流量跌)
  • Crawl Stats 显示这些 URL 路径每月命中次数下降
  • Search Console “Crawled - currently not indexed” 里大量 URL 同模式

快速结论

Google 不需要明说”薄”。它只是降优先级——抓得少、排名低、最后掉。修法是合并、扩充或删除。

常见原因

1. 为 SEO 生成但没有内容深度的页

最常见。看到某关键词有量就写一篇,但写的全是定义复述 + 套话:

"什么是 X"
"X 的好处有哪些"
"如何使用 X"
"X 的注意事项"

每段 50 字定义改写,0 独有信息。

2. 没有独特视角的 AI 生成页

AI 一次生成 50 篇,每篇 800 字,但全是同一种风格 / 同样结构 / 无人工 fact-check / 无第一手经验。Helpful Content System 专门识别这种模式。

3. 程序化 SEO 输出,页面之间几乎一样

/best-X-for-{city}/  → 1000 个城市生成 1000 页
/{verb}-{noun}-prompts/  → 100×100 组合 = 10000 页

每页只有变量不同,其他文字 90% 相同。Google 标”模板薄页”。

4. 自动生成的分类 / 标签 / 归档页

/tag/seo 只有 1-3 篇文章,模板里就一个 H1 + 卡片列表。

5. 内容仅是引用 / 摘录别处

转载、汇总、“30 个 X 的引言”——无原创注释。

6. 内容空白页面

注册成功页、感谢页、空 search 结果、未到货商品页——都返回 200 但 body 几乎空。

最短修复路径

Step 1:盘点所有 500 字以下的页

// scripts/find-thin-pages.mjs
import fg from "fast-glob";
import fs from "node:fs";
import matter from "gray-matter";

const thin = [];
for (const f of fg.sync("src/content/**/*.{md,mdx}")) {
  const { content } = matter(fs.readFileSync(f, "utf8"));
  const text = content.replace(/```[\s\S]+?```/g, "").replace(/!\[.*?\]\(.+?\)/g, "");
  const words = text.split(/\s+/).filter(Boolean).length;
  if (words < 500) thin.push({ file: f, words });
}
thin.sort((a, b) => a.words - b.words);
console.log(thin.map(x => `${x.words}\t${x.file}`).join("\n"));

输出按字数从少到多排列,最薄的最先处理。

Step 2:逐页决定:扩、合、删

对每个薄页问 3 个问题:

  1. 这页对应的 query 真的有人搜吗? (Keyword Planner 验证)
  2. 我有独有信息能加吗? (第一手经验、截图、数据)
  3. 有没有相邻的兄弟页可以合并?

决策:

  • 1 yes + 2 yes →
  • 1 yes + 3 yes →
  • 1 no →

Step 3:扩 — 加具体内容

模板:

1. 加 1 张原创截图
2. 加 1 个数字对比表
3. 加 1 段真实代码 / 命令
4. 加 1 个 FAQ 段(至少 3 问)
5. 加 1 段第一人称经验("我们 2026 年 X 月试过 Y,结果 Z")

每加 1 项 = 信息密度上一档。目标 800-1500 字带丰富格式元素。

Step 4:合 — 3-5 篇合并成完整指南

# 旧 URL 列表
echo "/articles/seo-tip-1
/articles/seo-tip-2
/articles/seo-tip-3" > to-merge.txt

# 合并成 /articles/seo-complete-guide
# 旧 URL 全部 301 到新 URL
// firebase.json
{
  "hosting": {
    "redirects": [
      { "source": "/articles/seo-tip-1", "destination": "/articles/seo-complete-guide", "type": 301 },
      { "source": "/articles/seo-tip-2", "destination": "/articles/seo-complete-guide", "type": 301 }
    ]
  }
}

新文章把 3 个老文章的精华内容融合,加新视角和数据。

Step 5:删 — noindex 或 410

未来无用的薄页:

<!-- 暂留可访问但不收录 -->
<meta name="robots" content="noindex,follow" />

或彻底删除:

res.status(410).send("This page has been permanently removed.");

410 比 404 更明确地告诉 Google “这页永远不会回来”,更快从索引移除。

Step 6:从 sitemap 删除处理过的 URL

// scripts/clean-sitemap.mjs
import fs from "node:fs";

const sitemap = fs.readFileSync("public/sitemap.xml", "utf8");
const toRemove = fs.readFileSync("noindex-list.txt", "utf8").trim().split("\n");

let cleaned = sitemap;
for (const url of toRemove) {
  const re = new RegExp(`<url>\\s*<loc>${url}</loc>[\\s\\S]*?</url>`, "g");
  cleaned = cleaned.replace(re, "");
}
fs.writeFileSync("public/sitemap.xml", cleaned);

哪些情况可能不是你操作错了

少量薄页(如联系页、隐私政策、关于页)没关系。Google 知道不是每页都要 2000 字。问题是当薄页比例 > 20% 时整站受连累。

容易误判的情况

  • 塞水文充字数:水文不是深度——Google 看得出。质量比字数重要。
  • 以为 noindex 是处罚:noindex 是好工具,是”主动选择不收”
  • 以为合并会丢权重:合并 + 301 反而集中权重到主版本
  • 删薄页能立即恢复站点排名:通常 4-8 周才看到效果

预防建议

  • 发布前有最低质量门槛:≥ 500 字 + ≥ 1 张图 + ≥ 2 处内链 + ≥ 1 个具体数字
  • 不要靠”关键词排列组合”自动生成页面冲数量
  • AI 生成的初稿必须人工 fact-check + 加第一手经验
  • 季度内容审计:找出最薄的 20% 处理
  • CI 拦截薄文:< 300 字直接 build fail(强制写到位)

FAQ

Q:“薄”具体多少字? A:Google 不公布字数门槛。500 字以下基本算薄,但没独特信息价值的 2000 字文章也是薄

Q:删薄页能帮其他页吗? A:常常能——释放 crawl budget、提升站点质量整体印象,4-8 周后好页面收录率上升。

Q:是不是所有自动生成页都不该有? A:不是。如果每个程序化页面真有独有的数据 / 上下文 / 用户价值(不是模板填空),可以。例:航班搜索结果页 = 独有数据。

相关阅读

标签: #SEO #Google #Search Console #收录 #排查 #薄页面