标签页是 2010 年的想法,2026 年大多以「祖传垃圾」形式残留。多数独立站有几十上百个近重复的标签归档 URL,浪费爬取预算、啥词都排不到。修复就一行 HTML——但先理解为什么再动手。
问题背景
标签页是自动生成的归档,列出所有带某标签的文章。和分类(通常是小而固定的分类法)不同,标签会不受控地繁殖——每个作者乱加标签,结果有 200 个标签页,每个只挂 1-3 篇文章。这些标签页 title 和片段内容高度重复、和分类页内卷、给索引贡献一条长长的低质 URL 尾巴。对 95% 的独立内容站,正确做法是全站给标签页加 noindex,把标签当导航 / 过滤器,而不是可被收录的着陆页。
判断标准
- 标签页数量比文章数还多(或差不多)。
- 很多标签页只挂 1-2 篇文章。
- Pages 报告里成片的标签 URL 显示「Crawled — currently not indexed」。
- 你从没有意识地为任何一个标签写过原创介绍、当它是着陆页。
快速结论
标签归档默认加 <meta name="robots" content="noindex, follow">。标签仍可以做导航 / 过滤器——用户可以按标签筛——只是不再让 Google 收录。如果有某个标签确实值得当主题页排名(少见),把它升级成真分类或手写 hub 页,不是靠标签归档。
实操步骤
- 找到标签归档的 URL 模式。常见:
/tag/x/、/tags/x/、?tag=x。访问一个确认是站上真实页面。 - 所有标签归档加
<meta name="robots" content="noindex, follow">。follow关键——告诉 Google 仍然顺着链接去爬底下的文章,只是不收录这个归档页本身。 - 从 sitemap.xml 里去掉标签 URL。多数框架的 sitemap 插件有
exclude选项,用上。 - robots.txt 不要 Disallow 标签路径。要让 Google 爬得到,才能读到 noindex——Disallow + noindex 会冲突(见 robots.txt 那篇)。
- 部署后用 URL Inspection 验证 2-3 个标签 URL:「Indexing allowed? No (‘noindex’ detected in robots meta tag)」。30 天内这些 URL 会从索引里掉出去。
- 审查内容里的标签使用。50 个一次性标签合并成 10 个有用的。标签卫生好了,标签页对用户仍然有价值(作为过滤器),但不再污染归档。
容易踩的坑
- 用 robots.txt 的
Disallow: /tag/「藏」标签页。这只是阻止爬取,结果 Google 永远读不到 noindex——URL 仍可能出现在结果里没描述。 - noindex 的同时把标签从站内导航里全删掉。那对用户也没用了。导航里留着当过滤器,只是别让归档页被收录。
- 写成
noindex, nofollow而不是noindex, follow。nofollow阻止 Google 顺着标签页爬文章,没意义——你希望这些内链被算上。 - 把一两个「有价值的」标签页升级成可收录,但没给它写原创介绍。一个没介绍的标签页被收录还是薄列表——质量问题没解。
- 忘了 SEO 插件已经有一键开关。WordPress:Rank Math、Yoast 都有「noindex tags」一键。手写 meta 也行,开关更快。
这篇适合谁
常年自动生成标签归档的 WordPress / Ghost / Jekyll 站。或基于 content collections 生成标签路由的 Astro / Next.js 站。
这篇不适合谁
故意做了精选标签着陆页、写了原创内容、有明确主题意图的站(少见但合理)。那种把它当分类对待,保留收录。
FAQ
- 如果我的标签页在排某个词怎么办?: 在 Search Console -> Performance 按那个 URL 过滤一下。如果有稳定的非品牌词 impressions,留着收录、补原创介绍,让它变成真正的着陆页。否则 noindex。
- 标签 noindex 会影响内链信号吗?: 不会,因为你用的是
noindex, follow——Google 仍然顺着标签页的链接走,只是不收录页面本身。文章仍然吃到内链好处。 - 老标签 URL 要不要做 301?: 只在有外链时做。没有反向链接的标签 URL 留着当 noindex 页就行。301 到分类页只有在目标真的相关时才有意义。
- 分类页是同样逻辑吗?: 不是。分类是小而固定的分类法,写了介绍可以收录。看分类那一篇做决定。