谷歌收录状态 “Unknown”“Discovered”“Crawled” 解读

本文包含个人见解,不一定代表实际情况,仅供个人记录以及供读者参考。

在 Google Search Console(GSC)后台,未收录的页面状态有如下两种情况:

  • Discovered - currently not indexed
  • Crawled - currently not indexed

这二者虽都是 not indexed 状态,但有所差别。在谷歌,URL 从未知到收录会经历下面四个阶段。具体某个 URL 处于什么状态,可以通过 GSC 顶部的 URL inspection 搜索框中搜索查询。

  1. 未知(URL is unknown to Google)
  2. 已发现(Discovered - currently not indexed)
  3. 已抓取(Crawled - currently not indexed)
  4. 已收录(Page is indexed)

只有第四阶段的状态才是被正式收录的情况,有可能被谷歌在搜索结果中展示。

未知:Unknown

这一阶段谷歌根本不知道有这个 URL 的存在。此时需要在 Inspection 结果页点击 REQUEST INDEXING 请求索引,告知谷歌此 URL 的存在。

已发现:Discovered

这一状态表明谷歌已经发现此 URL,但是尚未抓取(crawled)。即,谷歌知道有这么个东西,但是还没去看、没去抓取。一般随着时间会自动进入抓取,也可以通过在 Inspection 页点 REQUEST INDEXING 提前让谷歌抓取。

已抓取:Crawled

如果 URL 进入这一阶段,通常会比较棘手。这表明 URL 的内容质量不佳,或缺乏用户搜索相关性。谷歌虽然已经获取到了页面内容,但是暂不收录。如果达到收录标准,通常不会进入这个阶段。可通过调整页面内容等方式优化页面质量,提交重新索引让谷歌再次评判。

添加新评论