内链腐烂:文章链向已改名/已删除的 slug——301 重定向 + CI 断链检查
重命名 slug 没回头更新 47 篇 linker——内链一半 404。用 linkinator 或 lychee 在 CI 跑、维护 redirects 文件、prebuild 内链断链直接 fail。
薄页面、分类页弱、孤儿页、重复 title、过期文章、内链分布、双语漂移、标签页太多、AI 内容质量、低价值 URL。
内容站做到几百篇之后,问题从"写不出来"变成"页太多、看着重复、收录率不高、AdSense 拒审、Search Console 全是低价值 URL"。 这个 Hub 直接服务这些症状:薄页面太多、分类页太弱、文章数看着夸张但权威撑不住、孤儿页、重复 title、过期文章、内链不均、双语版本漂移、topic cluster 太浅、首页分不出权重、标签页太多变成薄归档、草稿误发布、Search Console 低价值 URL 飙升、AI 内容缺独特价值、文章很多但少有曝光。 每篇都讲"这是不是真问题、要不要修、修了对收录 / 广告审核 / 长期可维护性会带来什么影响"。
重命名 slug 没回头更新 47 篇 linker——内链一半 404。用 linkinator 或 lychee 在 CI 跑、维护 redirects 文件、prebuild 内链断链直接 fail。
ZH 页的 canonical 指向 EN 版——Google 把 ZH 去索引。每页 canonical 自指(current URL)、curl + view-source 验证。
页面有 FAQPage JSON-LD 但 Google 不出 rich result。原因:Question/Answer 嵌套错、页面 noindex、schema 文本和正文不匹配。修完用 Rich Results Test 验。
hreflang 不互引、语言代码不一致(zh vs zh-CN)、缺 x-default。从 translationKey 自动发、用 hreflang.org 校验、源头修一次。
img 标签无 alt——无障碍砸了、图片搜索没法索引、AdSense 质量信号差。审计、回填、prebuild 强制 + MDX lint 锁死。
publishedAt 永不移动——SERP 显示陈旧。加 updatedAt、快变话题用 volatile、只在实质改动时刷日期——而不是改个错别字也动。
tag 页存在但 0 篇已发布文章。审计 tag 使用、要求每 tag 最少 N 篇、自动去索引或 410 空归档。
单边编辑导致 EN/ZH 章节、代码块、链接逐步分叉。按结构(不只 mtime)审计、PR 层强制 translate-as-you-edit、低价值页明确标单语。
_redirects 文件三千多行,构建多花八秒,爬虫追多跳链路,没人记得哪些规则还需要。讲清楚怎么审计、合并和裁剪。
每篇文章底部的'相关文章'都是三条几乎一样的稿子。读者跳出,内链权重稀释。讲清楚怎么检测、打分、去重。
重新构建上线了,访客看到的还是旧文章——CDN 边缘缓存、浏览器缓存、或者 HTML 还引用着旧的资源 hash。
新加了 50 篇文章,Search Console 里还显示上个月的数量——sitemap 在本地生成了但没传达到爬虫。