本文包含个人见解,不一定代表实际情况,仅供个人记录以及供读者参考。
在 Google Search Console(GSC)后台,未收录的页面状态有如下两种情况:
- Discovered - currently not indexed
- Crawled - currently not indexed
这二者虽都是 not indexed 状态,但有所差别。在谷歌,URL 从未知到收录会经历下面四个阶段。具体某个 URL 处于什么状态,可以通过 GSC 顶部的 URL inspection 搜索框中搜索查询。
- 未知(URL is unknown to Google)
- 已发现(Discovered - currently not indexed)
- 已抓取(Crawled - currently not indexed)
- 已收录(Page is indexed)
只有第四阶段的状态才是被正式收录的情况,有可能被谷歌在搜索结果中展示。
未知:Unknown
这一阶段谷歌根本不知道有这个 URL 的存在。此时需要在 Inspection 结果页点击 REQUEST INDEXING 请求索引,告知谷歌此 URL 的存在。
已发现:Discovered
这一状态表明谷歌已经发现此 URL,但是尚未抓取(crawled)。即,谷歌知道有这么个东西,但是还没去看、没去抓取。一般随着时间会自动进入抓取,也可以通过在 Inspection 页点 REQUEST INDEXING 提前让谷歌抓取。
已抓取:Crawled
如果 URL 进入这一阶段,通常会比较棘手。这表明 URL 的内容质量不佳,或缺乏用户搜索相关性。谷歌虽然已经获取到了页面内容,但是暂不收录。如果达到收录标准,通常不会进入这个阶段。可通过调整页面内容等方式优化页面质量,提交重新索引让谷歌再次评判。