跟踪错误页面和死链接
使用默认安装的 Google Analytics,你将无法跟踪网站上的错误页面或死链接。这是因为,默认情况下,你可能不会向错误页面上添加 GATC。那么,你怎样才能跟踪并不存在页面呢?
为了做到这一点,你需要向网站服务器发送的错误页面模板中添加 GATC。网站管理员通常可以做到这一点。然后,GATC 将跟踪错误页面的 URL 就像其他的页面浏览请求一样。这里提醒一下:不经过修改,错误页面将报告为正常的页面,而不是错误页面,这使它们在报告中很难辨别!通过像下面这样修改错误页面的模板,你能突出并分离错误页面。
通常,网站服务器允许你定义每一个错误状态码的模板。例如,为了跟踪网站上缺少的页面,可以像这里所示的这样修改 404 模板的标准 GATC:
<script type="text/javascript">
var _gaq = _gaq || [];
_gaq.push(['_setAccount', 'UA-18159656-1']);_gaq.push(['_trackPageview', '/error404/'+document.location.pathname]);
(function() {
var ga = document.createElement('script');
ga.type = 'text/javascript';
ga.async = true;ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
var s = document.getElementsByTagName('script')[0];
s.parentNode.insertBefore(ga, s);
})();
</script>
这是第 7 章"高级实施"所讨论的虚拟页面浏览技术的一个例子。这种方法允许你创建一个虚拟的目录/error404/,以及一个完整的路径及错误页面文件名(URI)。你可以用同样的方式修改其他错误模板页:
_gaq.push(['_trackPageview','/error500'+document.locantion.pathname]);
Web 服务器状态码
这些是在 HTTP 细则 1.0 中定义的状态码,由 Web 服务器在标题中返回(见www.w3.org/Protocols/Overview.html)。
2XX 成功
请求的动作被成功接受并理解:
· 200 成功
· 201 创建
· 202 接受
· 203 临时信息
· 204 没有响应
· 205 删除
· 206 修改
3XX 重定向
为了完成请求必须进行下一个动作:
· 301 永久转移
· 302 暂时转移
· 303 方法
· 304 没有修改
4XX 客户端错误
请求包含错误的语法或本来就不能实现:
· 400 非法请求
· 401 未经授权
· 402 需要付费
· 403 禁止
· 404 未找到
· 405 方法不允许
· 406 无法接受
· 407 需要代理证明
· 408 请求超时
5XX 服务器端错误
服务器无法实现请求:
· 500 服务器内部错误
· 501 为实现
· 502 非法网关
· 503 服务不可用
· 504 网关超时
用这种方法你能在 Google Analytics 报告中将错误页面与其他页面浏览区分开。错误页面产生的条目将显示在内容报告>热门内容中,比如,/error404/noexistingpage.html。这为你提供两类重要的信息:错误的类型(错误代码)以及产生这一错误的页面 URL。
图9.6显示了热门报告中的错误页面。注意,这里使用表格过滤器来突出这些错误页面,即让它们冒出来显示在表格的顶部。这很重要,因为,错误页面通常被埋没在页面浏览列表的底部——假设它们只是总量的很少一部分!
图 9.6 查看错误页面
小技巧:很明显,了解错误页面 URL 非常重要,然而,它们通常出现在热门内容的底部——可能有几百页之深。为了确保你的网站设计及开发团队能跟进这些错误,将表格过滤器设置为 error(如图 9.6 所示)并且定制这个报告每天或每周发送给他们(点击报告顶部的Email 按钮,按照提示进行)。发送报告 Email 在第 4 章"Google Analytics 界面的使用"
中的"导出和电子邮件功能"部分讨论过。
如果你找到了错误页面,当然,也想知道网站中的哪个链接指向了这些页面,即识别死链接。在图 9.6 所示的报告中,点击任何一个列出的错误页面,可以获得特定页面的详情(图
9.7),然后再选择导航摘要。这里显示了访问者在点击和接受错误页面时停留的页面列表,如图 9.8 所示。
如果你无法在错误页面模板上使用不同的 GATC 怎么办?一些服务提供商甚至大企业都受困于通用的控制面板或 CMS,这样就不可能(或很难)在错误页面模板上使用不同的 GATC。
可能你的情况就是如此,只要错误页面的标题有一个标识能够指出显示的是一个错误页面,那么仍有可能跟踪错误页面。大多数 Apache 配置默认这样做,如图 9.9 所示。
图 9.7 热门报告中具体页面的详细信息
图 9.8 指向错误页面的页面
因为错误页面模板在 HTML
图 9.9 Apache web 服务器返回的典型 404"没有找到"错误页面
图 9.10 突出错误页面的过滤器
简单来说,这个过滤器的意思如下:
· 检查网页标题是否包含短语"Error page"。如果包含,那么提取网页标题及网页的URI 条目。
· 合并网页标题及页面的 URI 条目,并且重写原始的 URI 字段。
本书评论