10个方法让谷歌快速索引你的网站

如果Google没有将你的网站编入索引,那么网站几乎是不可见的。你不会出现在任何搜索结果中,也不会获得任何自然流量。

既然你在这里,相信你已经知道这件事情了。因此,让我们直接开始进入话题。

本文会教你如何解决以下这三个问题:

1.你的整个站点没有被索引;

2.一部分页面有索引,而其他的没有;

3.新发布的页面并没有被即时索引。

但是首先,我们得先理解索引的意义。

 

什么是抓取和索引?

Google通过抓取来发现新的网页,然后将这些网页添加到索引中。他们使用称为Googlebot的网络爬虫来进行此操作。

很困惑?让我们来对一些名词做一些解释:

抓取:在网页上跟踪超链接以发现新内容的过程。

索引:Google 已将某个网页“编入索引”是指:Google 抓取工具(“Googlebot”)已访问该网页、已分析其内容和含义并已将其存储在 Google 索引中。已编入索引的网页可以显示在 Google 搜索结果中(前提是这些网页遵循了 Google 的网站站长指南)。虽然大多数网页都是在被抓取后才被编入索引,但 Google 也可能会在不访问网页内容的情况下将网页编入索引(例如,如果相应网页被 robots.txt 指令屏蔽了)。

网络爬虫:一种执行抓取的程序。

Googlebot:谷歌的网络爬虫(谷歌蜘蛛)。

当你在Google搜索内容时,其实是在要求Google返回其索引中的所有相关页面。由于通常有成千上万的网页符合要求,因此Google的排名算法会尽力对网页进行排序,以便你会首先看到最好的和最相关的结果。

我这里要阐述的一个要点是,索引和排名是两个不同的事情。

索引为了是参与,而排名是为了获胜。

如果你都没有参与是不可能获得获胜的。

 

如何检查你的页面是否被索引了

进去谷歌搜索,然后通过site指令搜索:  site:你的网址

site指令

这里的数字显示的是大致的索引页面数量,不一定是精准的数量。

如果你想检查某个具体的页面是否被索引的话,同样也可以进行这样的操作site:某个页面网址

如果没有任何结果的话,就说明页面没有被索引。

如果你是Google Search Console的用户的话,你只需要查看覆盖率额报告就可以找到精准的索引数据。你只需要进入:

Google Search Console > 索引 > 覆盖率

覆盖率

 

另外你也可以使用Google Search Console来检测特定页面是否被索引。你只需要将页面URL放入顶部的URL检测工具中。

URL检查工具

 

如何让谷歌索引你的页面

你的网站或者页面没有被谷歌索引?试下这些:
进入Google Search Console。
进入URL检测工具。
将需要索引的URL粘贴到搜索框中。
等待谷歌检测URL。
点击“请求编入索引”按钮。
当你发布新帖子或页面时,最好这么操作。你实际上是在告诉Google,你已经在网站上添加了一些新内容,它们应该去看看。
但是,请求编入索引不太可能解决旧页面的索引问题。如果是这种情况,请按照下面的清单进行诊断并解决问题。

  1. 去除Robots.txt中的抓取阻碍
  2. 去除不必要的noindex标签
  3. 将需要索引的页面包含在网站地图中
  4. 去除不必要的canonical标签
  5. 检查页面是否是孤岛页面
  6. 修复不必要的内部nofollow链接
  7. 在“强力”页面中加入内部链接
  8. 确保页面独特并且有价值
  9. 去除低质量页面 (优化“抓取预算”)
  10. 建立高质量的外链

1) 去除Robots.txt中的抓取阻碍

Google没有索引整个网站?这可能是由于robots.txt文件存在抓取阻碍导致的。

进入yourdomain.com/robots.txt检查详细的问题。

检查是否右下方的这两段中的任意一个代码:

1 User-agent: Googlebot

2 Disallow: /

 

1 User-agent: *

2 Disallow: /

这两个都告诉Googlebot,不允许它们抓取网站上的任何页面。要解决此问题,你只需要删除它们,就这么简单。

如果Google没有为单个网页编制索引,也有可能是robots.txt中的某个代码导致的。要检查是否存在这种情况,请将URL粘贴到Google Search Console中的URL检测工具中。点击覆盖率板块以显示更多详细信息,然后查找“是否允许抓取?否:被robots.txt阻止”错误。

这就代表,页面被robots.txt阻止了。

如果是这种情况,请重新检查你的robots.txt文件中是否有与该页面或相关目录有关的“禁止”规则。

2) 去除不必要的noindex标签

如果你告诉谷歌不索引某个网页,谷歌是不会为其编制索引的。这可以让一部分页面保持隐秘。有两种方法可以做到这一点:

方法1:meta标签

在页面的<head> 中如果出现如下任意代码,则不会被谷歌索引:

1 <meta name=“robots” content=“noindex”>

1 <meta name=“googlebot” content=“noindex”>

这是一个针对爬虫的meta标记,它告诉搜索引擎它们是否可以为该页面编制索引。

小提示. 核心的参数是“noindex”,如果出现了“noindex”就代表页面设置了不索引。

方法2:X‑Robots-Tag

网络爬虫遵循X-Robots-Tag的HTTP响应标头。你可以使用服务器端脚本语言(例如PHP)、. htaccess文件中的内容或通过更改服务器配置来实现此效果。

Google Search Console中的URL检查工具可告诉你,是否是由于此标头而阻止Google抓取页面。只需输入URL,然后查找“允许索引?否:在“ X‑Robots-Tag” http标头中检测到“ noindex”标记。

3) 将需要索引的页面包含在网站地图中

网站地图会告诉Google网站上的哪些页面很重要,哪些不重要。它同时也可以为谷歌的抓取频率做一些指导。

Google应该能够在你的网站上找到网页,无论它们是否在站点地图中,但将它们包括在网站地图内仍然是一种很好的做法。毕竟,没必要让谷歌进行毫无意义的抓取。

要检查网页是否在你的站点地图中,请使用Google Search Console中的URL检查工具。如果你看到“此网站未显示在Google搜索结果中”和“站点地图:不适用”,则表明该URL未建立索引或不在你的站点地图中。

可以向谷歌站长工具提交站点地图(xml格式)

站点地图提交

4) 去除不必要的canonical标签

Canonical标签会告诉Google哪个是页面的首选版本。它看起来像这样:

<link rel=“canonical” href=“/page.html”/>

大多数页面没有canonical标签,也就是所谓的自引用的canonical标签。这就告诉Google该页面本身就是首选版本,同时可能是唯一的版本。换句话说,你希望对该页面建立索引。

但是,如果你的页面有不规范的canonical标签,那么有可能在告诉Google错误的首选版本。在这种情况下,你的页面将不会被索引。

检测canonical标签,你只需要使用谷歌的URL检测工具。如果你的页面的canonical标签指向了另外一个页面,你看可以看到“具有Canonical标签的备用页面”的提示。如果这个不应该出现,你希望当前页面被索引,那么只需要去除该页面的canonical标签即可。

提示:请注意,canonical标签并不总是不好的。带有这些标签的大多数页面都会有它们的原因。如果你看到你的页面具有canonical标签,请检查对应的页面。如果确实是该页面的首选版本,并且也无需索引该页面,则应该保留canonical标记。

5) 检查页面是否是孤岛页面

孤岛页面指的是那些没有内部链接支撑的页面。

由于Google通过抓取链接发现新内容,因此他们无法通过该过程发现孤岛页面。网站访客也将无法找到这些内容。

检测孤岛页面,可以使用Ahrefs’ Site Audit(网站诊断)工具。然后点击 Incoming links(指向链接)报告,并查看“孤岛页面 (没有任何指向链接)”错误:

孤岛页面

这会显示出所有可索引、在站点地图中显示的、但没有内部指向链接的所有页面。

提示:

这个只有在下方两种情况下才能够正常检测出结果:

1.所有需要索引的页面都在你的网站地图中。

2.在Ahrefs的Site Audit(网站诊断)最开始,将选择使用网站地图中的页面选项打勾。

你可以通过以下两种中任意一个方法解决孤岛问题:

1.如果页面不重要,那么将它删除,并移出网站地图。

2.如果页面很重要,将它放到你的内链结构中去。

6) 修复不必要的内部nofollow链接

Nofollow链接指的是那些有着 rel=“nofollow” 标记的链接。它们会阻止 PageRank 的传递。同时谷歌并不会抓取Nofollow链接。

这里是谷歌针对这个做的说明:

本质上,使用nofollow会导致我们从抓取目录中删除目标链接。但是,如果其他网站在不使用nofollow的情况下链接到目标页面,或者这些URL是在站点地图中提交给Google的,则目标页面仍可能会出现在我们的索引中。

简而言之,你需要确保指向索引页面的链接是follow状态的。

同样可以使用Ahrefs的Site Audit(网站诊断)工具对网站进行抓取。检查“Incoming links(指向链接)”报告中是否出现“Page has nofollow incoming internal links only(页面仅具有nofollow的指向链接)”的错误

假设你要Google索引该页面,请从这些指向链接中删除nofollow标记。如果不是,请删除该页面或对该页面进行noindex处理。

7) 在“强力”页面中加入内部链接

Google通过抓取你的网站来发现新内容。如果你忽略了内部链接到相关页面,则它可能找不到这个页面。

解决此问题的一种简单方法是在网站中添加一些内部链接。你可以在建立索引的任何网页上执行此操作。但是,如果你希望Google尽可能快地为页面建立索引,则可以在一些“强力的”页面上建立一些内部链接。

为什么?因为相比于一些不太重要的页面,Google会更快地抓取此类页面。

做法就是,进入Ahrefs Site Explorer(网站分析),输入你的域名,并查看 Best by links(最佳链接)报告。

ahrefs网站分析

这将显示网站上的所有页面,按URL Rating(网址评分)进行排序。换句话说,它首先显示的是权重最高的页面。

查看列表并查找相关页面,可以在这些页面上添加一些目标页面的内部链接。

建议:在你添加完内部链接之后,将该页面粘贴到Google的URL检查工具中。点击“请求编入索引”按钮,以使Google知道页面上的某些内容已更改,它需要尽快对其进行重新抓取。这可以加快Google发现内部链接并因此发现你要索引的页面的进程。

8) 确保页面独特并且有价值

Google不太可能将低质量的网页编入索引,因为它们对用户没有任何价值。

如果你的页面已经排除了技术问题但还是不索引,那么可能就是页面的价值不足。因此,你需要重新审视页面并问自己:这个页面真的有价值吗?如果用户从搜索结果中点击该页面,会在该页面找到有用的内容吗?

如果对上述两个问题的回答均为否,那么你就需要改进你的内容。

”内容为王“时至今日在SEO领域还是适用。

9) 去除低质量页面 (优化“抓取预算”)

网站上的劣质页面过多,会浪费谷歌的抓取预算。

这里是谷歌对此做的说明:

在低价值页面上浪费服务器资源,会使抓取有价值内容的频率下降,这可能会导致在站点上发现大量新内容时出现延迟。

可以将其视为导师在给论文进行评分,其中一个就是你的论文。如果他们要审阅10篇论文,那么他们很快就会看到你的论文。如果他们要审阅一百个,那将花费更长的时间。如果有成千上万的话,那么他们的工作量就太高了,他们可能永远也无法对你的内容进行打分。

Google确实指出:抓取预算并不是大多数站长都需要担心的事情,并且“如果网站的页面少于几千个”,则都可以对其进行有效的抓取。

不过,从你的网站上删除低质量的页面绝不是一件坏事。它只会产生积极影响。

10) 建立高质量的外链

外链告诉Google这个页面很重要。毕竟,如果有人链接到它,则它必须具有一定的价值。这些是Google想要索引的页面。

Google不仅会索引带有外链的网页。有很多(上亿的)没有外链的页面也编入了索引。但是,由于Google认为具有高质量链接的页面更为重要,因此与不具有高质量链接的页面相比,它们抓取和重新抓取的速度可能更快。这会使得索引变的更快。

关于外链的文章可以参考:《什么是外链,如何获取更多的外链?》

 

索引 ≠ 排名

在Google上获得索引,并不代表你能获得排名或者是流量。

这是两个不同的东西。

索引意味着谷歌已经看到了你的网站,但是并不意味着你的内容值得谷歌对特定关键词进行排序。

这就是SEO需要做的——优化网页以针对特定关键词进行排名的艺术。

简单的来说,SEO包含:

找到你的用户在搜索什么;

围绕话题创作内容;

针对目标关键词进行优化;

外链建设;

对页面内容进行更新,保持“新鲜”。

 

最后……

Google不索引你网站或页面的原因只有两个:

技术性问题导致它无法索引;

它认为你的内容没有价值,不值得被索引。

这两个问题很可能同时存在。但是,我想说技术问题要普遍得多。技术问题还可能导致低质量内容的自动生成(例如,分页问题)。

尽管如此,通过上面的步骤检查多数是可以解决索引问题的。

记住索引≠排名。如果你想对任何有价值的关键词进行排名,并吸引源源不断的自然流量,那么SEO就是至关重要的。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注