8.2 搜索引擎对重要页面的抓取
搜索引擎抓取页面的过程及原理已经在第2章中详细介绍过,本节要补充说明的是搜索引擎如何抓取网站中相对重要的页面。
由于互联网中信息量极其庞大,为了向用户展示更多有价值的信息,搜索引擎会优先抓取每个网站中相对重要的页面(即权重较高的页面)。然而,搜索引擎是怎样发现这些相对重要的页面呢?根据重要页面的链接指向的页面也有可能是重要页面的思路,搜索引擎首先会从权重相对较高的页面(即源页面 ¹)出发并跟踪其中的链接,从而抓取其他相对重要页面(即目标页面 ¹)。
1 链接关系中,我们称存放链接的页面为源页面,被链接指向的页面为目标页面。
例如,一般情况下,搜索引擎会从网站的首页出发并跟踪其中的链接,抓取网站中其他相对重要的页面。
由此得知,提高页面被收录几率的最好办法就是减短页面与重要页面之间的链接路径。




本书评论