薄页面太多拖累整个内容站:6 种薄页来源 + 「expand / merge / noindex / 410」四档处理

500+ 页 Google 觉得多数薄——按字数 + 流量审计,每页打 expand / merge / noindex / 410——剪掉最弱的 20-40%。

你发了 500+ 页。Search Console 「Crawled — not indexed」月月增。内容审计显示很多页 <300 字——流量集中在 Top 10%、剩 90% 月展示近 0。首页看起来内容丰富,但 Google 把你当低质站点——因为页面平均质量薄。

薄页不只是个体不排名——它们主动降低 Google 对整站质量的感知。剪掉最弱 20-40% 能提升剩余文章的排名,因为站平均质量门槛升高。下面:诚实审计、按页决定(expand / merge / noindex / 410)、未来防薄页发布。

常见原因

按命中率从高到低:

1. 程序化 SEO 页面少独有内容

你通过组合列表生成了 200 个「Best X for Y」页——每个模板化 + 稀疏。Google 看到模板,不是独有价值。

如何判断:URL 模式相似、字数都在 200-400 区间——程序化形状。

2. AI 生成文章全套同模板

不同源的同问题:AI 管道文章都打”最低可接受门槛”不超出。每个技术上”回答”了 query 但加不了什么。

如何判断:AI 生成文章聚同字数(500-800)、同结构、同例子模式。

3. 老短文(另一内容时代)

2020 年前的短文(300-500 字)那时是标准、现在薄——标准升了、老内容没升。

如何判断publishedAt 2020 以前 + 字数 <600——时代不匹配。

4. 自动生成 tag / 归档页

(见 Too many tags create thin archive pages)——这些经常潜入”薄页”计数。

如何判断:tag 页列 <5 篇文章。按日期 / 作者的归档页只有自动生成内容。

「Best tools for X」页只是 10 个名字 + 一句话描述——页面没帮助,被 link 的工具有。

如何判断:页面多数是出链 + 极少解释——独有价值不超过被链目的地。

6. 翻译 stub 无各语言深度

你机翻了 stub——现在两个语言都是 stub——薄页数翻倍。

如何判断:ZH 版镜像 EN 字数,两边都低于深度阈值。

最短修复路径

按收益从高到低。Step 1 审计、Step 2 按页决定、3-6 执行。

Step 1:爬出 URL + 字数 + 最后修改 + 流量

# 每篇:字数 + 最后修改 + 90 天展示

# 导出 CSV
# 按字数升序排
# 过滤 <500 字 = 候选

可能 20-40% 文章 <500 字——这是你的薄堆。

Step 2:每篇打 expand / merge / noindex / 410

标签何时用
Expand话题有量 + 能赢;1-2 小时加深
Merge3-5 篇相似薄页 → 一篇深指南;旧 URL 301
Noindex内部留可访问、搜索隐藏
410无未来用途、永久删除

不要全扩——很多薄页该合并或删。

Step 3:expand——做真深度

- 加 3-5 个具体例子(真的,不是通用)
- 加「常见 pitfall」一节
- 加 FAQ 4-6 个真问题
- 原始数据、截图、专家引用
- 涉及 UI 引用就重截图
- 重评字数:1200-2000+ 才是真回答

凑字数的填充文字不算修——Google 检测填充。

Step 4:merge——3-5 篇薄页合一篇深指南

1. 定合并目标(组内最强的成 consolidated home)
2. 把每个薄页的最佳 1-2 节合进目标
3. 其他 URL 301 到目标
4. 验证目标字数过深度门槛

5 篇薄页 → 1 篇深页——站质量平均升。

Step 5:noindex / 410 刻意执行

<!-- noindex:内部留可访问、搜索隐藏 -->
<meta name="robots" content="noindex" />

410(永久删除):

- 删 MDX 文件
- firebase.json / hosting 配置加 410 条目
  或重定向到相关后继(301)
- 不要 301 到首页——Google 当软 404

Step 6:4-8 周后重审

# Search Console:
# - 「Crawled - not indexed」数应该降
# - 已索引页数降(剪了)但质量升
# - 剩余文章平均位置改善

指标按对的方向动 = 剪对了。没动 = 剪错或要更狠。

预防建议

  • 发之前设最低质量门槛——光字数不够,深度 + 独特性都要
  • 季度内容审计排进团队节奏,薄页静默积累
  • 程序化 SEO 页要每页独有 substance,不只模板填充
  • 老目录剪最弱 20-40% 提升全站质量平均
  • 不要 301 到首页——要么 410 要么 301 到话题后继
  • 凑字数的填充被检测——质量内容必须真存在

相关阅读

标签: #内容运营 #站点质量 #站点审计 #排查 #薄页面