9.2 链接的意义
从搜索引擎的角度来看,链接会直接影响目标页面的权重及相关性。接下来,将从多个角度剖析链接对目标页面权重及相关性的影响。
9.2.1 链接与页面相关性
链接对目标页面相关性的影响主要取决于链接的对象及内容。在前面介绍的三种链接对象中,在提高页面相关性方面所起作用最大的是文本,其次是图片,最后就是多媒体文件。
1. 文本链接
文本链接在提高目标页面相关性方面所起的作用最大。因为,文本链接可以通过锚文本直接、有效地表达目标页面的主题。
例如,在某页面中存在链接:<a href=http://www.seochat.org>搜索引擎优化</a>。这个链接就是通过锚文本“搜索引擎优化”来表达目标页面的主题。
在使用文本作为链接对象的时候,应该尽量使用那些与目标页面主题相关的关键字作为锚文本。例如,在同一页面上存在以下两个使用不同锚文本的链接。
链接1:<a href=http://www.seochat.org>seochat</a>链接2:<a href=http://www.seochat.org>搜索引擎优化</a>那么,在提高网站www.seochat.org与关键字“搜索引擎优化”之间的相关性方面,链接2所起的作用要远远大于链接1。
在同一页面中,即使链接的锚文本相同,目标页面与锚文本之间的相关性也会由于锚文本样式的不同而有所差异。例如以下两种链接方式链接1:<a href=http://www.seochat.org>搜索引擎优化</a>链接2:<a href=http://www.seochat.org><b>搜索引擎优化</b></a>
其中,链接2在提高目标页面与锚文本“搜索引擎优化”之间的相关性方面所起的作用要大于链接1,因为链接2使用了加粗这种突显内容的样式。
2. 图片链接
由于搜索引擎并不能识别图片里的文本内容,图片链接在提高页面相关性方面所起的作用几乎是可以忽略的(但可以提高目标页面的链接权重)。在使用图片作为链接对象的时候,可以通过设置图片的alt标签属性值来表达目标页面的主题。
例如,<a href=http://www.seochat.org><img src=http://www.seochat.org/logo. gif alt=搜索引擎优化></a>。
在上面的图片链接中,我们就是通过设置alt标签属性值来提高网站http://www.seochat.org与关键字“搜索引擎优化”之间的相关性。但是,这种间接的表达方式所起的作用远不如文本链接。
3. 多媒体文件链接
搜索引擎解析多媒体文件的几率是非常低的,很多搜索引擎甚至会忽略多媒体文件。因此,多媒体文件链接在提高目标页面相关性及权重两方面所起的作用可以忽略不计。
综上所述,对于重要的目标页面,我们应该优先使用具有特别样式的文本作为链接对象,且锚文本应该采用与目标页面主题相关的关键字,这样才可以最大程度地提高目标页面的相关性。
9.2.2 链接与页面权重继承
链接反映的是页面之间的信任关系,搜索引擎根据页面的导入链接数来统计每个页面的得票数,从而计算出每个页面的链接权重¹ 。从一定程度上来看,页面得到的投票越多,该页面的重要性就越高,链接权重越大。
通常,每个源页面中都会存在多个导出链接(包括网站内部及外部),这就涉及源页面权重分配;或者说,目标页面对源页面权重继承的问题。一般情况下,决定目标页面继承源页面权重的主要因素包括:
- 目标页面的链接在源页面中的位置;
- 目标页面的链接在源页面中存在的时间;
- 源页面中导出链接的数量。
链接在源页面中出现的位置会在一定程度上影响目标页面对源页面权重的继承。例如,指向同样页面的链接,如果出现在源页面的左上方,那么它能继承到的权重就会大于右下方。在规划页面的链接分布时,应遵循页面重要区域的分布规律:左上 > 右上 > 左 > 右 > 左下 > 右下,即把指向相对重要的目标页面的链接放在源页面较为重要的区域上。这样,该链接指向的目标页面就可以继承到更多的权重。
2. 链接存在时间
由于页面内容是经常更新的,页面中链接的更替也是正常的现象。如果指向某目标页面的链接在搜索引擎更新源页面之前就被替换掉,则该链接所指向的目标页面就继承不到源页面的权重,即对于搜索引擎来说,指向该目标页面的链接从来就没在源页面中出现过。
相反,如果源页面被搜索引擎更新N次以后,指向某目标页面的链接依然存在,则该目标页面就可以继承到更多的权重,即链接在源页面中存在的时间越长,其指向的目标页面继承到的权重就会越多。
3. 导出链接数量
忽略链接在页面中出现的位置及存在的时间,目标页面对源页面权重的继承是以平均的方式进行的,即源页面上导出链接的数量越多,目标页面能继承到的权重就会越少。例如,源页面中有N(N≥0)个导出链接,则这N个导出链接所指向的目标页面将以平均的方式继承源页面的权重,即每个目标页面将继承到源页面1/N的权重;N越大,目标页面能继承到的权重就越少。
此外,搜索引擎对每个页面导出链接的数量是有一定限制的,因此不能在同一页面上堆放过多的导出链接(特别是外部导出链接)。否则,不但目标页面能继承到的权重会降低;而且对于页面本身而言,也可能会由于存在过多的导出链接而被搜索引擎判为垃圾链接页面(请参考9.3节和9.4节)。
4. Google PageRank传递
前面已经介绍了目标页面对源页面权重继承的问题,不过比较抽象。本节将通过Google PR值(请参考附录A)在页面中的传递现象来说明目标页面对源页面权重继承的问题。
细心的读者可能会发现这样的现象:当一个网站首页的PR值是5时,链接深度为1的页面的PR值有的是4,有的却是3,有的甚至是0或者“Google没有对当前网页评级”。
例如,幽灵小游戏首页的PR值为5,图9-1所示是首页的底部区域。其中,框里的链接分别指向4个目标页面,如图9-2、图9-3、图9-4和图9-5所示。
从上面的图中可以看到,模拟保姆做家务小游戏页面的PR值是“Google没有对当前网页评级”,而玛雅文化小游戏、控球练习小游戏这两个页面的PR值是3,迷你小游戏页面的PR值是4。
这些目标页面的链接同处于一个源页面上,位置分布也相差无几,为什么PR值却会存在这么大的差别呢?原因如下。
- 图9-2所示的这个页面是新增加的,尚未被Google收录;或者即使被收录了,但Google PR值资料还没更新 ²。因此,该页面的PR值是“Google没有对当前网页评级”。
- 图9-3所示页面的PR值是3,指向该页面的链接在首页中已经存在相当长的时间,而且经历了多次PR值更新。
- 图9-4所示页面的PR值也是3,但这并不代表图9-3与图9-4这两个目标页面继承的权重是相等的,仅能反映它们的权重在同一个级别上(Google PageRank在工具栏上只反映了12个级别,即“没有PR资料”及0~10)。
我们再查看这两个页面的Sogou Rank,结果就不一样了,前者是35,后者是38(Sogou Rank值是百分制的,更能反映页面间微妙的差别,但Sogou Rank机制远没有Google PageRank完善)。
- 图9-5所示页面的PR值是4,虽然与图9-3页面一样,指向该页面的链接在首页中也存在相当长的时间,且链接所在的位置也基本相同,但网站中所有的页面上都存在指向该页面的链接,其拥有的导入链接数是图9-3页面远不能及的。
本书评论