Google 不会发邮件告诉你”你这页太薄”。它只是悄悄降低对薄页面的处理优先级:
- 抓取频率下降 → 这条 URL 几个月不被重抓
- 排名权重打折 → 即使收录也排不上 SERP 前 50
- 整组判定 → 同 URL 模式(如
/articles/auto-generated-*)的所有页全降级 - 最终掉收录 → 几个月后从 Indexed 移除
整个过程没有任何 Search Console 通知。修法不是”加字数”,是实质性提升信息密度或主动清理。
症状
- 100-300 字以下的页面收录率 < 30%
- 已收录的薄页随时间被降级(排名跌、流量跌)
- Crawl Stats 显示这些 URL 路径每月命中次数下降
- Search Console “Crawled - currently not indexed” 里大量 URL 同模式
快速结论
Google 不需要明说”薄”。它只是降优先级——抓得少、排名低、最后掉。修法是合并、扩充或删除。
常见原因
1. 为 SEO 生成但没有内容深度的页
最常见。看到某关键词有量就写一篇,但写的全是定义复述 + 套话:
"什么是 X"
"X 的好处有哪些"
"如何使用 X"
"X 的注意事项"
每段 50 字定义改写,0 独有信息。
2. 没有独特视角的 AI 生成页
AI 一次生成 50 篇,每篇 800 字,但全是同一种风格 / 同样结构 / 无人工 fact-check / 无第一手经验。Helpful Content System 专门识别这种模式。
3. 程序化 SEO 输出,页面之间几乎一样
/best-X-for-{city}/ → 1000 个城市生成 1000 页
/{verb}-{noun}-prompts/ → 100×100 组合 = 10000 页
每页只有变量不同,其他文字 90% 相同。Google 标”模板薄页”。
4. 自动生成的分类 / 标签 / 归档页
/tag/seo 只有 1-3 篇文章,模板里就一个 H1 + 卡片列表。
5. 内容仅是引用 / 摘录别处
转载、汇总、“30 个 X 的引言”——无原创注释。
6. 内容空白页面
注册成功页、感谢页、空 search 结果、未到货商品页——都返回 200 但 body 几乎空。
最短修复路径
Step 1:盘点所有 500 字以下的页
// scripts/find-thin-pages.mjs
import fg from "fast-glob";
import fs from "node:fs";
import matter from "gray-matter";
const thin = [];
for (const f of fg.sync("src/content/**/*.{md,mdx}")) {
const { content } = matter(fs.readFileSync(f, "utf8"));
const text = content.replace(/```[\s\S]+?```/g, "").replace(/!\[.*?\]\(.+?\)/g, "");
const words = text.split(/\s+/).filter(Boolean).length;
if (words < 500) thin.push({ file: f, words });
}
thin.sort((a, b) => a.words - b.words);
console.log(thin.map(x => `${x.words}\t${x.file}`).join("\n"));
输出按字数从少到多排列,最薄的最先处理。
Step 2:逐页决定:扩、合、删
对每个薄页问 3 个问题:
- 这页对应的 query 真的有人搜吗? (Keyword Planner 验证)
- 我有独有信息能加吗? (第一手经验、截图、数据)
- 有没有相邻的兄弟页可以合并?
决策:
- 1 yes + 2 yes → 扩
- 1 yes + 3 yes → 合
- 1 no → 删
Step 3:扩 — 加具体内容
模板:
1. 加 1 张原创截图
2. 加 1 个数字对比表
3. 加 1 段真实代码 / 命令
4. 加 1 个 FAQ 段(至少 3 问)
5. 加 1 段第一人称经验("我们 2026 年 X 月试过 Y,结果 Z")
每加 1 项 = 信息密度上一档。目标 800-1500 字带丰富格式元素。
Step 4:合 — 3-5 篇合并成完整指南
# 旧 URL 列表
echo "/articles/seo-tip-1
/articles/seo-tip-2
/articles/seo-tip-3" > to-merge.txt
# 合并成 /articles/seo-complete-guide
# 旧 URL 全部 301 到新 URL
// firebase.json
{
"hosting": {
"redirects": [
{ "source": "/articles/seo-tip-1", "destination": "/articles/seo-complete-guide", "type": 301 },
{ "source": "/articles/seo-tip-2", "destination": "/articles/seo-complete-guide", "type": 301 }
]
}
}
新文章把 3 个老文章的精华内容融合,加新视角和数据。
Step 5:删 — noindex 或 410
未来无用的薄页:
<!-- 暂留可访问但不收录 -->
<meta name="robots" content="noindex,follow" />
或彻底删除:
res.status(410).send("This page has been permanently removed.");
410 比 404 更明确地告诉 Google “这页永远不会回来”,更快从索引移除。
Step 6:从 sitemap 删除处理过的 URL
// scripts/clean-sitemap.mjs
import fs from "node:fs";
const sitemap = fs.readFileSync("public/sitemap.xml", "utf8");
const toRemove = fs.readFileSync("noindex-list.txt", "utf8").trim().split("\n");
let cleaned = sitemap;
for (const url of toRemove) {
const re = new RegExp(`<url>\\s*<loc>${url}</loc>[\\s\\S]*?</url>`, "g");
cleaned = cleaned.replace(re, "");
}
fs.writeFileSync("public/sitemap.xml", cleaned);
哪些情况可能不是你操作错了
少量薄页(如联系页、隐私政策、关于页)没关系。Google 知道不是每页都要 2000 字。问题是当薄页比例 > 20% 时整站受连累。
容易误判的情况
- 塞水文充字数:水文不是深度——Google 看得出。质量比字数重要。
- 以为 noindex 是处罚:noindex 是好工具,是”主动选择不收”
- 以为合并会丢权重:合并 + 301 反而集中权重到主版本
- 删薄页能立即恢复站点排名:通常 4-8 周才看到效果
预防建议
- 发布前有最低质量门槛:≥ 500 字 + ≥ 1 张图 + ≥ 2 处内链 + ≥ 1 个具体数字
- 不要靠”关键词排列组合”自动生成页面冲数量
- AI 生成的初稿必须人工 fact-check + 加第一手经验
- 季度内容审计:找出最薄的 20% 处理
- CI 拦截薄文:< 300 字直接 build fail(强制写到位)
FAQ
Q:“薄”具体多少字? A:Google 不公布字数门槛。500 字以下基本算薄,但没独特信息价值的 2000 字文章也是薄。
Q:删薄页能帮其他页吗? A:常常能——释放 crawl budget、提升站点质量整体印象,4-8 周后好页面收录率上升。
Q:是不是所有自动生成页都不该有? A:不是。如果每个程序化页面真有独有的数据 / 上下文 / 用户价值(不是模板填空),可以。例:航班搜索结果页 = 独有数据。