4.4 分隔符的使用
为了让搜索引擎能够正确识别以英文形式命名的URL中的关键字,我们需要使用相应的符号对词组之间的单词进行分隔,常见的分隔符包括:
空格“ ”、横杠“-”、下划线“_”、逗号“,”及加号“+”等。
例如,搜索引擎并不能识别digitalcamerabattery,因为这个单词在搜索引擎的切词系统中是不存在的,但却可以识别digital camera battery或者digital-camera-battery。
说明 除了使用特定的符号作为分隔符外,还可以使用其他的方式来表达单词间的分隔意义,例如,将每个单词的第一个字母设为大写(如CamcorderBattery)。但这种方式只方便普通用户识别,对于搜索引擎来说却是无效的,因为搜索引擎并不区分单词间字母的大小写。
4.4.1 常见分隔符
在URL中,很多符号都具有分隔符的意义。例如,横杠“-”、加号“+”、下划线“_”、逗号“,”、空格“ ”及反斜杠“/”等。但这些符号在URL中所起的作用及表达的意义是不一样的。不仅不同的分隔符在URL中所起的作用不一样,即使是同一分隔符在不同的搜索引擎里表达的意义也会有所差别。
接下来,将重点介绍常见的分隔符:横杠“-”、下划线“_”、空格“ ”及反斜杠“/”。
4.4.2 空格与横杠
在有些搜索引擎里,把URL中的横杠“-”与空格符“%20”都当做空格符处理(URL中“%20”就是空格)。例如在Google中,以下关系是成立的:
camcorder-battery == camcorder battery == camcorder%20battery
下面我们验证一下。以“camcorder battery”为例,在Google中搜索“allinurl: camcorder battery”⁴,我们可以看到以加号“+”、横杠“-”及空格符“%20”作为URL中单词间分隔符的搜索结果,如图4-5所示。

第一条搜索结果中的“camcorder-battery”与第二条搜索结果中的“camcorder%20battery”在Google中表达的意义是相同的。
1. 横杠“-”
对于分隔符的使用,我们可以在域名的命名规则上得到启发⁵ 。例如,在申请一个域名时,我们只能使用横杠“-”而不是下划线“_”或者空格“”作为分隔符。由此,我们可以推测对于搜索引擎来说横杠“-”比空格“”及下划线“_”可能更加友好。
2. 空格“ ”
不管是在浏览器还是搜索引擎中,URL中的“%20”字符表达的就是空格的意义,但这不利于普通用户对URL的理解及记忆。用户不喜欢的东西,难道搜索引擎会喜欢吗?
搜索引擎索引效果如图4-6所示。

浏览器URL显示效果如图4-7所示。

4.4.3 下划线“_”
下划线“_”也是URL中单词间的一个有效的分隔符号。在有些搜索引擎里,也会把下划线“_”当做空格处理,如图4-8所示。

也就是说,以下关系是成立的:
"camcorder_battery == camcorder battery == camcorder-battery";但在“allinurl: camcorder battery”的搜索结果中,只有极个别的URL是使用下划线“_”的,这从一定程度上说明,在搜索引擎中下划线“_”作为单词间分隔符的影响力远不如空格“ ”及横杠“-”。
4.4.4 反斜杠“/”
反斜杠“/”是URL中的自然分隔符。但是,反斜杠只能作为URL中目录之间或者目录与文件名之间的分隔符,而不能作为目录名称或者文件名称内部的分隔符。在4.7节里,将会详细介绍如何利用反斜杠对目录之间或目录与文件之间的名称进行分隔与组合。




本书评论