11.2 常见的内容作弊方式
11.2.1 关键字堆砌
关键字堆砌是指在页面上堆放大量与页面主题相关的或无关的关键字,目的是为了增加某些关键字的词频或密度以提高页面与某个关键字之间的相关性。在页面中常用于堆砌关键字的区域包括正文内容、<noframes>标签及注释。
1. 正文内容
正文内容中堆砌关键字是指在页面主体标记(即<body>?</body>标签间)的任意区域上堆放与页面相关或无关的关键字,如图11-1所示。
在页面正文内容中堆砌关键字不仅会影响页面美观及用户体验,而且还是一种欺骗搜索引擎的违规行为,搜索引擎通过分词算法很轻易就可以识别。
有些读者可能会产生这样的想法:如果页面中堆砌的关键字是看不见的,那就既不会影响页面美观及用户体验,又可以提高页面相关性。于是就产生了另外一种作弊手段—隐藏文本(请参考11.2.2节)。
2. <noframes>标签<noframes>标签的作用是向那些不支持框架技术的设备(如搜索引擎及不支持框架页面的浏览器)返回指定的信息。也就是说,在正常的情况下,<noframes>标签里的内容对于普通用户来说是不可见的,但搜索引擎却可以识别。
曾经有不少人利用<noframes>标签内容对于普通用户不可见的特性,在框架网页或普通网页的<noframes>标签中堆砌关键字。如下面代码所示:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">
<html>
<head>
<title>关于我们</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
</head>
<frameset rows="166,*" cols="*" frameborder="NO" border="0" framespacing="0">
<frame src="Frame-1.htm" name="topFrame" scrolling="NO" noresize>
<frameset rows="*" cols="245,*" framespacing="0" frameborder="NO" border="0">
<frame src="Frame-2.htm" name="leftFrame" scrolling="NO" noresize>
<frame src="Frame-3.htm" name="mainFrame">
</frameset>
</frameset>
<noframes>
<body>
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
</body>
</noframes>
</html>
尽管在<noframes>标签里堆砌关键字不会影响页面美观及用户体验,但这也是一种欺骗搜索引擎的违规行为,因此难免会受到搜索引擎的惩罚(关于<noframes>标签优化请参考7.5.3节)。
3. 注释
注释是指对代码功能或者作用进行说明的信息,利用注释语句在页面中不可见的特性而堆砌关键字同样是一种欺骗搜索引擎的违规行为,如下代码所示:
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td><table align="center" cellpadding="0" cellspacing="0">
<tr>
<td align="center" height="30">
<a href="aboutus.php" class="sz_black_under">小游戏简介</a> |
<a href="documentary.php" class="sz_black_under">本站大事记</a> |
<a href="ourad.php" class="sz_black_under">广告服务</a> |
<a href="work.php" class="sz_black_under">频道合作</a> |
<a href="http://dir.10flash.net" class="sz_black_under">交换链接</a> |
<a href="link.php" class="sz_black_under">友情链接</a> |
<a href="partner.php" class="sz_black_under">合作网站</a> |
<a href="contactus.php" class="sz_black_under">联系我们</a> |
广告QQ:404577387 </td>
</tr>
<!--
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
-->
<tr>
<td align="center" height="27">CopyRight © 2005-2007
<a href="http://www.10flash.net/" class="sz_org">幽灵小游戏</a>,
All Rights Reserved. </td>
</tr>
<tr>
<td align="center" height="30">本站所有小游戏版权归原作者所有,本站只作转载,
如无意侵犯了您的版权,请来信告知,我们将会在两个工作日内删除侵权游戏。</td>
</tr>
<tr>
<td align="center" height="30">本站由幽灵小游戏负责设计及维护更新. <br />
<br />
<strong>粤ICP备05000946号</strong></td>
</tr>
</table></td>
</tr>
</table>
11.2.2 隐藏文本
隐藏文本是最早也是最简单的搜索引擎优化作弊方式之一,通过隐藏页面中堆砌的关键字,达到既增加关键字词频、提高页面相关性,又不影响页面美观及用户体验的目的。
隐藏文本通常通过控制文本的字号及颜色属性值来实现,因此对于普通用户来说它是不可见的。但由于搜索引擎分析页面是在源代码中进行的,因此可以轻易识别。
说明 隐藏文本也是关键字堆砌的一种方式。
1. 字号属性
如果把页面中文本的字号属性值设置得足够小,那么在浏览器中这些文本内容几乎是看不见的,如图11-2所示。
但是,我们在查看页面源代码时,却可以查看到这些被隐藏的文本内容,因此搜索引擎也能识别。代码如下所示:
<body>
<font size="-7">搜索引擎优化作弊是十分愚蠢的行为</font>
</body>
2. 字体颜色
如果页面中文本的颜色属性值与其所在的表格、层或者页面背景的颜色属性值相同,则这些文本内容在浏览器中是不可见的,也就是说对于普通用户来说是“不存在”的,如图11-3所示。
同样,我们也可以通过查看页面源代码来查看这些被隐藏的内容,因此搜索引擎也能识别,代码如下所示:
<body>
<font color="#FFFFFF">搜索引擎优化作弊是十行愚蠢的行为</font>
</body>
此外,我们还可以使用组合键Ctrl+A对页面内容进行全选的方式查看被隐藏的内容,如图 11-4所示。
3. CSS样式
利用CSS样式控制文本的字号及颜色属性值同样可以达到隐藏文本的目的。由于搜索引擎一般不解析CSS样式的内容,这种做法不会被认为是隐藏文本,但会被判为关键字堆砌。
例如,通过CSS样式定义字体的字号属性值,从而达到隐藏文本内容的目的,效果如图11-5所示。
代码如下所示:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>搜索引擎优化作弊</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<style type="text/css">
<!--
.font {font-size: 1px}
-->
</style>
</head>
<body>
<font class="font">
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
</font>
</body>
</html>
或者通过CSS样式定义文本的字体颜色属性值来隐藏文本,效果如图11-6所示。
源代码如下所示:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>搜索引擎优化作弊</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<style type="text/css">
<!--
.font {font-color: #FFFFFF}
-->
</style>
</head>
<body>
<font class="font">
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏,小游戏
</font>
</body>
</html>
11.2.3 空页面
空页面是指没有实际内容(或多个页面内容相同)但又有明确目标关键字的页面,这类页面会被搜索引擎判断为非法页面。
例如,某个页面的关键字是“云浮眼科医院”,但是该页面下没有任何符合云浮眼科医院的内容,这就是典型的空页面,如图11-7所示。
11.2.4 内容农场
内容农场是指网站中大部分内容是根据特定关键字² 制造的,且质量低下。这些低质量内容通常是通过非正常途径产生的,包括但不限于批量采集、采集改编、采集机器生成,往往可读性差或无实质性信息。
低质量³ 内容充斥搜索结果必然会影响搜索引擎的用户体验,因此这是搜索引擎重点打击的行为之一。例如,Google 针对内容农场发布了Panda算法,并多次升级完善该算法。国内的百度也推出百度原创星火计划,它与Google Panda有着本质的区别,主要通过给予原创内容更大的权重,来推后低质量内容的排名,但无法从根源上解决低质量内容问题。
11.2.5 标签滥用
在搜索引擎中存在一些权重标签,如加粗标签(<b>)、标题标签(<hx>)等。对于网站中的内容,不管是否是重点或与当前页面主题相关,个别站长都喜欢在页面中大量使用这些权重标签。这样就会影响搜索引擎对页面主题相关性的判断,从而影响搜索结果的质量。因此,对于权重标签的使用一定要有限度,只对网页中的个别重点内容加权重标签。
1. 当前页面中所有SEO都加粗或者加标题标签。
2. 与主题不相关的推广、索引及互联网营销等也加上了加粗标签。
11.2.6 不相关搜索结果页
与内容农场类似,不相关搜索结果页也是为特定关键字而制造出来的内容,只不过内容展示的形式是文章列表。如图11-9所示,网页主题是奇瑞开瑞优优油耗4,但列表中却没有满足“奇瑞开瑞优优+油耗”条件的结果。
摘自百度站长平台中的站长资讯。
图 11-9 不相关搜索结果页示例
本书评论