4.5 URL长度
搜索引擎在抓取页面的时候,对于页面的URL长度会存在一定的限制。对于超过限定长度的URL所指向的页面,搜索引擎就可能放弃收录。决定URL长度的主要因素包括域名长度、路径长度及文件名长度。
4.5.1 域名长度⁶
域名长度是指子域名+域名名称+域名类型所占用的字符数。例如,对于www.seochat.org,子域名是www,域名是seochat,域名类型是org,则域名长度为15。
4.5.2 路径长度
路径长度指文件存放路径的名称所占用的字符数,路径长度=目录1名称长度+目录2名称长度+厖+目录N名称长度,例如,http://www.seochat.org/mobile/nokia/n95.htm 。其中,“/”为根目录,“mobile/”为二级目录,“nokia/”为三级目录,则该页面的路径长度=1+7+6,即14。
4.5.3 文件名长度
文件名长度指文件名称所占用的字符数(包括后缀名),例如n95.htm文件名长度就是7。
4.5.4 URL长度
综上所述,URL长度=Internet资源类型+域名长度+端口号+路径长度+文件名长度。例如,http://www.seochat.org/mobile/nokia/n95.htm 的URL长度=7+15+14+7,即43。
4.5.5 URL长度的影响
搜索引擎抓取页面的时候,对页面的URL长度是有一定限制的。对于超过这个限制的页面搜索引擎就可能会放弃收录。而且,页面的URL越短,得到的权重就越高(请参考8.4节)。
例如,
URL A: http://www.a.com/n95.htm
URL B: http://www.a.com/mobile/nokia/n95.htm
同样的页面n95.htm,使用URL A比URL B能获得更高的权重。因为站在目录深度的角度,URL A显示比URL B更浅(关于URL目录深度,请查看7.4.1节)。
本书评论