理解网站分析数据的准确性-SEO高级网站数据分析提升网站排名在线阅读

语速55: 80

进度0:

理解网站分析数据的准确性

当谈到网站效果的标准时，网站分析是关键。但是，这种信息只有在你避免了与收集数据相关的一些常见错误时，才是准确的，特别是与多种来源比较时。

偏偏，太多的企业对网站分析报告有肤浅的理解。毕竟，获得数字并不难。严酷的事实是网站分析的数据永远也不可能是百分之百准确的，甚至测量误差线也将很困难。

那么，重点是什么？

尽管有缺陷，但是基本上，误差线在每周或甚至每月都保持相对稳定。甚至比较年与年的行为也是安全的，只要在技术上或终端用户行为没有巨大的变化。只要你使用相同的标准，访问者数的趋势将是准确的。例如，网站分析数据能反映以下的模式：

· 30%的流量来自搜索引擎
· 50%的流量来到 X.html 页面
· 上周我们从 email 广告活动增加了 20%的订阅转化
· 三月里网站目录页的跳出率减少了 10%

通过这些指标，营销人员和网站管理员能够确定特定营销活动的直接影响。详细程度是关键。例如，你能确定增加 PPC 广告——单一搜索引擎的一系列关键字，能否增加这段时期内的投资回报率。只要你能将不准确性控制在最小，那么网站分析工具对测量你的线上业务的访问者流量是有效的。

数据点的冲突是常见的。

英国对 800 个企业的调查表明将近三分之二（63%）的受访者表示，他们遇到过来自不同网络数据测量的信息冲突。

（"网络测量和策略报告 2009"，Econsultancy.com，2009 年六月）接下来，我将详细讨论为什么会出现这些不准确，以使你能正确看待这一信息。其目的是使你能对分析数据达到一个可接受的准确性水平。回想一下表 2.1，两种收集网站访问者数据的主要方法——日志文件和页面标签——都有局限性。

影响日志文件访问者数据准确性的问题

日志文件跟踪通常在服务器上默认安装。可能因为这一原因，系统管理员很少考虑其他的跟踪方法。

动态分配的 IP 地址

一般来说，日志文件法通过将相同的 IP 地址和浏览器签名的所有点击归为一个人，来跟踪访问者的会话。当网络服务服务提供商在会话过程中分配不同的 IP 地址时，会出现问题。总部设在美国的 comScore 的一项研究（http://www.comscore.com/Press_Events/Presentations_Whitepapers/2007/Cookie_Deletion_Whitepaper）表明，一台典型的家用 PC 每个月平均有 10.5 个不同的 IP 地址。这些访问者将被日志文件分析软件计算为 10 个独立访问者。由于每个网络用户都有相同的浏览器签名（当前的 IE），所以，这个问题将更加严重。结果，访问者数量被极大的高估。cookies 的使用可以克服这一局限性。

客户端缓存页面

客户端缓存指存储在访问者电脑上的先前访问页面。在这种情况下，再一次访问相同页面导致这一页面由访问者的电脑提供，因此，这一次访问没有被记录在服务器中。

服务器端缓存来自于网络加速技术，这种技术缓存网站的一个副本，并从他们的服务器提供这一副本以加速传输，这意味着所有随后的网站请求来自缓存而不是网站本身，导致了跟踪信息的丢失。现在，大部分网站都以某种方式缓存以改善性能。例如，在http://en.wikipedia.org/wiki/Cache 看一下维基百科关于缓存的解释。

计算机器人

机器人，也被称为蜘蛛或网络爬虫，最常被搜索引擎用来抓取和索引页面。但是，也存在其他监测服务器性能的机器人——运行时间、下载速度等等，还有的进行页面分析，包括比价、email 搜集和竞争性研究等等。这些影响网站分析，因为日志文件法也包括机器人在你网站上的活动，尽管它们并不是真正的访问者。当计算访问者数量时，机器人占网站综合浏览量的很大比例。遗憾的是，很难完全过滤这些，因为有数千自制的、不知名的机器人存在。因为这个原因，日志分析法可能高估访问者数量，在大多数情况下，这是很严重的。

影响页面标签访问者数据的问题

在每一个页面实施标签在许多情况下是一个自动化的过程。但是，对于大网站来说，100%的正确实施是很难达到的。可能是因为页面标签是人眼不可见的或者太多可用的其他数据，以至于那些错误在很长时间内被忽视。完整的实施是这种方法准确和有效的关键。

设置错误导致标签遗漏

页面标签法目前所知的最常见的错误都来自它的设置。与网站服务器默认设置为记录每一件事不同，页面标签法需要网站管理员为每一页添加跟踪代码。即使自动化的CMS系统，页面也可能而且确实存在遗漏。

事实上，来自MAXAMINE（www.maxamine.com，现在是Accenture Marketing sciences的一部分）的分析师的证据表明，他们使用自动页面审查工具发现一些自称所有页面都设置了标签的网站，实际上有20%的页面遗漏了页面标签——有时，网站管理员根本没有意识到这一点。在一个案例中，发现一个公司的B2B网站70%的页面没有标签。遗漏标签等于没有这些页面的浏览数据。

JavaScript 的错误停止了页面加载

如果访问者的浏览器支持JavaScript，那么页面标签工作正常。还好只有1-3%的互联网用户禁用浏览器的JavaScript，如图2.3所示。但是，网站页面的JavaScript代码的不一致使用将引起更大的问题：页面其他JavaScript的任何错误都将在那里立即终止浏览器脚本引擎，因此，放置在其下的页面标签将不执行。

图 2.3 浏览器禁用 JavaScript 的用户百分比

图 2.3 浏览器禁用 JavaScript 的用户百分比
来源：来自使用索引工具，浏览多种行业网站的1,000,000,000访问者
（www.visualrevenue.com/blog—Dennis R. Mortensen）

防火墙阻挡了页面标签

企业和个人防火墙能阻止页面标签法向数据收集服务器发送数据。另外，防火墙也能设置为自动拒绝或删除 cookies。这对访问者数据有重要的影响。一些网站分析服务提供商能恢复使用访问者的 IP 地址来跟踪这些事件，但是，不推荐混合法。正如之前在"影响日志文件访问者数据准确性的问题"（comsore 的报告）中所讨论的，使用访问者 IP 地址的准确性远低于简单不计算这种访问者。因此，最好应保持处理数据的连续性。

页面标签安装研究

下面的数据来自10000多个网站，这些网站的页面标签是有效的。各种网站分析服务提供商检查了这些页面标签。（感谢MAXAMINE的Stephen Kirby的信息。）

摘要：

网站内容变换的越频繁，网站越容易丢失页面标签。在下图中，网站内容在1月14日更新，由于失误，更新的页面没包含页面标签。

大网站很少达到百分之百的标签准确率，如下图所示。

跟踪旧式手机访问者

comSore早在2007的1月的移动网站的受众研究（http://www.comscore.com/press/release.asp?press=1432）表明，在美国，1亿5千9百万互联网用户中有3千万（或19%）用移动设备接入互联网。在当时，大多数手机不支持JavaScript或cookies，因此，只有日志分析法能跟踪使用手机浏览互联网的用户。

但是，主要感谢iPhone的非凡成就，手机用户能用页面标签法跟踪，因为，他们的浏览器软件与笔记本电脑和个人电脑的非常相似，即JavaScript和cookies都是用。第八章"最佳配置指南"详细介绍了跟踪手机访问者。

使用 cookies 时影响访问者数据的问题

cookies是非常简单而完善的跟踪访问者的方法。但是，他的简单性和透明度（任何用户都能删除它们）为自身带来了问题。是否使用cookies的争论仍是网站分析圈的热门话题。

访问者拒绝和删除 cookies

Cookies信息对网站分析至关重要，因为，它确定访问者、他们的推介来源和后来的页面浏览数据。对服务提供商来说，目前服务提供商的最佳做法是仅使用第一方cookies。这是因为，访问者通常认为第三方cookies侵犯其隐私，在没有他们明确同意的情况下，暗中将他们的信息传递给第三方。因此，许多现存的反间谍软件程序及防火墙自动阻止第三方cookies。通过浏览器也容易做到这一点。相反，有证据表明，95%以上的访问者接受第一方cookies。

访问者也变得越来越聪明，经常删除cookies。由Belden Associates（2004），JupiterResearch（2005），Nielsen/NetRatings(2005)及comScore（2007）进行的独立研究表明，30%以上的互联网用户在一个月内删除cookies。

用户拥有和共用多台电脑

用户行为对从cookies收集所信息的准确性有极大的影响。考虑以下场景：

同一个用户不同的电脑今天，人们通过多种方式——从公司、家里或像网吧这样的公共场所连入互联网。一个人从三台不同的电脑将导致记录三个cookie，现存的所有的网站分析方法都会将这些用户会话计算为惟一的。

不同的用户相同的电脑人们一直共用他们的电脑，特别是在家里，这意味着也共用cookies（除非不同的人每次都注销或重启电脑）。在一些情况下，人们故意删除cookies。

例如，网吧被设置为在每次会话后自动清除cookies，因此，即使一个访问者定期去这家网吧，使用同一台机器，网站分析方法每次仍将认为这个访问者是新的、不同的访问者。

潜伏期留下了不准确的可能性

一名访问者转化为客户的时间（潜伏期）对准确性有重要的影响。例如，大部分价值较低的商品，人们会立即或在最初访问网站7天之内购买。在这样短的用户来到和购买的时间内，网站分析法有最佳的机会捕捉访问者所有的页面浏览和行为信息，因此，能报告更准确的结果。

价值较高的商品在访问者变成顾客之前通常有一个更长的考虑时间。例如，在旅游或金融行业，最初访问与购买能有90天长的考虑期。在这段时间中，删除cookies、重新安装浏览器、更新操作系统、买一台新电脑或处理系统崩溃的风险增加了。发生其中之一都会导致在用户最终购买时被视为新访者。季节性差价、负面宣传、线下促销或发表博客文章或评论等网站外因素也将影响潜伏期。

线下拜访也会歪曲数据收集

将与用来测量用户行为的方法无关，但是却对数据准确性有威胁的问题，作为因素考虑进来也是很重要的。价值较高的商品，比如汽车、贷款、贷款抵押，人们通常首先在线上询价，然后在线下购买。将线下的购买与线上的访问者行为联系在一起是网站分析工具的长久存在的难题。目前，克服这一局限性的最佳方案是在线凭证方案，用户打印并携带这种凭证到你的店里能获取免费的礼品、升级或折扣。如果你更喜欢收到网上订单，那么，提供一些小激励，比如网上订单享受网上的独享价格、免邮费等等。

另一个需要考虑的问题是，如何跟踪你的线下营销活动。不将这一点考虑在内的话，由你的线下活动产生的访问者将被错误的分类或分组到其他的推介来源，因此，歪曲了数据。

如何测量线下营销行为将在第11章"现实世界的任务"中详细讨论。

校正删除或拒绝cookies的数据

计算删除或拒绝网站分析cookies的校正系数是很简单的。你所需要做的只是要求用户登录。用这种方法你可以计算惟一的登录ID数，用这个数字除以网站分析工具报告的独立用户数。所得的结果是一个能被应用于一系列数据（独立访客数、新访客数或回访数）的校正系数。幸好在我看来，需要用户登录的网站是比较少，因为，人们希望尽可能简单的免费获得信息。因此，尽管校正系数的计算很简单，但是，大多数时候你并没有登录数据来进行计算。幸运的是，有一小部分网站可以计算校正系数来揭示这一问题。这些网站包括网上银行、受欢迎的品牌，比如Amazon、FedEx和社交网站，在这类网站上，拥有一个账户并在访问网站时登录（最重要）对一个真实的用户是有益处的。

Sun Microsystems论坛（(http://forums.sun.com）是一个具体的例子，这是一个有将近100万贡献者的开发者社区。Paul Strupp和Garrett Clark2009年发表在http://blogs.sun.com/pstrupp/上的研究解释了一些有趣的数字。

当使用第三方cookies时：

· 20%的用户至少每个月删除（更准确的说是丢失）他们的测量cookies一次。

· 5%的用户阻止第三方测量cookies。

当使用第一方cookies时：

· 校正系数提高的83%。

· 每个月至少删除测量cookies的用户百分比减少到14%。

· 阻止第一方测量cookies的用户百分比降低到不足1%。

请注意这是技术娴熟的受众——他们可以毫不犹豫的删除/阻止个人cookies。

Paul自己强调了这项研究的一个有趣的现象，校正系数的值相对较小。即，当使用第一方cookie时，一个更精确地访问者数是报告值×0.83。把这一系数作为分析的一部分考虑进来，之前分析中，在一个月中使用一台以上的电脑访问论坛的用户中的30%将从数据中去掉。

这暗示多种设备访问比cookie删除更频繁。

将这一数据应用于你自身独立访客数的校正是很诱人的。但是，校正系数是cookie删除、多台电脑使用及访问者回访频率的复杂函数。这些因素肯定会随着你的具体网站的不同而不同。尽管如此，这仍是一个有用的经验法则。

比较不同服务提供商的数据

正如前面所示，实际上不能将一种收集数据的方法与另一种方法进行比较。这种比较简直是无效。但是，假定是两种可比较的数据收集方法——都是页面标签——能否获得一致性？

不幸的是，即使比较比较两个使用页面标签的服务提供商的数据也有困难。

下面几段内容描述了导致不同服务提供商之间数据差异的因素。

第一方 cookiesVS 第三方 cookies

这两者之间几乎没有相关，因为，用户、防火墙和反间谍软件对第三方cookies禁用率较高。例如，如果一个网站没有精简隐私原则，那么最新版本的微软IE将自动阻止第三方cookies。（看一下www.w3.org/P3P）。

页面标签：位置的思考

页面标签服务提供商通常推荐将页面标签刚好放置在HTML页面标签的前面，以确保页面因素，比如文本、图像先加载。这意味着来自服务提供商服务器的延迟不会影响页面加载。这里可能的问题是回访者，他们对网站导航更熟悉，能够很快的导航，在页面标签加载完成开始收集数据之前，已经点击了其他页面。很明显，延迟的时间越长，则差异越大。

TagMan.com在2009年研究了标签的位置。他们关于延迟效应的研究反映增加一秒的加载时间，将丢失大约10%的报告流量。另外，将Google Analytics的页面标签从页面的顶部移到顶部增加报告流量的20%。

Stone Temple Consulting在2007年进行了类似的研究（www.stonetemple.com/articles/analytics-report-august-2007-part2.shtml）。结果表明，设置在页面顶部与页面底部的页面标签的独立访问者的计算有4.3%的差异。这被归因为执行页面标签有1.4秒的差异。

另外，放置在页面顶部的JavaScript能影响放置在后面的JavaScript页面标签。大多数服务提供商的页面标签都能独立于其他JavaScript而工作，并且能与其他服务提供商的页面标签并行不悖——就像Stone Temple Consulting的报告中一样，页面放置了五个不同的服务提供商的标签。但是，在同一页上JavaScript的错误将引起浏览器脚本引擎停止，并阻止下面的JavaScript运行，包括页面标签。

你标记了所有的东西吗？

许多分析工具需要进行修改，以跟踪链接到文件比如PDFs、word文档、可执行文件下载或到其他网站的外链。修改到文件的链接将是一个手动过程。修改代表点击时的一个事件或动作，有时这被视为一个虚拟的页面浏览。比较不同服务提供商，需要在他们的特定代码中完成这个行为几次（通常是JavaScript）。考虑到无论什么时候在页面上设置标记，都有可能发生语法错误。如果经常更新，需要定期检查页面标签的有效性。

页面浏览：访问或访问者？

页面浏览可以方便快捷的跟踪；因为，它们只需要从页面到跟踪服务器的一次请求，在服务提供商之间是相似。问题是区别一次访问和一个访问者，因为，每一个服务提供商使用的算法不同，没有单一的算法提供同一个值。

Cookies：超时

允许的超时时间——访问者在页面上不活动的时间多长——在不同的服务提供商之间是不同的。大多数页面标签服务提供商使用延迟30分钟的访问者会话cookies。这意味着在连续浏览同一页面30分钟没有活动，就会被视为新的回访。但是，一些服务提供商提供了修改这一设置的选项。这样做将调整数据，因此，影响对所报道访问者的分析。其他cookies，诸如，存储推介源细节的cookies，有不同的超时量。例如，Google Analytics推介源的cookies将存储6个月。这些不同网站分析服务提供商之间超时设定上的差异，将显著影响他们报告的访问者数量。

页面标签代码劫持

根据你的服务提供商，你的页面标签编码可能被劫持、复制或在其他不相关的网站上执行。这种污染导致了你的报告中错误的页面浏览量。通过使用过滤器，你能确保报告仅是来自你的域的数据。

数据采样

这是从你的网站流量选择一个子集的过程。取样在统计分析中被广泛应用，是因为分析一个数据的子集与分析全部数据能得到一个很相近的结果，然而，在处理大量信息时，有显著的速度优势。不同的服务提供商可能使用不同的取样技术和原则，可能会导致数据偏差。

Google Analytics的数据采样技术思考在第五章"报告解释"的"理解数据采样"中讨论。

PDF 文件：特别考虑

对页面标签法来说，不是报告PDF下载完成，而事实上报告的是访问者点击PDF文件的下载链接。这是有重要的区别的，因为，我们无法知道访问者是否完成下载——比如，一个50页的PDF文件——的信息。因此，点击PDF链接只被报告为一次单独的事件或页面浏览。

注：这种情况对日志文件是不同的。当在浏览器中浏览PDF文件时，Adobe Reader每次下载一页，而不是全部。这与写入日志文件时有小小的不同，标注一个HTTP状态代码206（部分文件下载）。日志文件法能将每个写入的206状态代码视为个体的页面浏览。当所有PDF文件的下载完成后，会在日志文件中登录一个最终HTTP状态200标签（下载完成）。因此，日志文件法能将完整的50页的PDF文件报告为一个下载和50个页面浏览。

电子商务：负交易

所有的电子商务企业都得在某些时候处理退货，要么因为货物的损坏或出现问题，要么是订单错误或其他的原因。人们通常在网站分析报告中忘记计算这些退货。对一些服务提供商来说，这需要手动添加一些等价的负购买交易。另外一些需要重新处理电子商务数据文件。

无论使用哪种方法，网站访问者与内部系统的数据调整都不是天衣无缝的。例如，交易的取消或赊欠通常发生在原始购买之后很久，因此，在不同的报告阶段。

过滤器和设置：潜在的障碍

当在一个服务提供商的方法设置过滤器而另一个没有设置过滤器时，数据将有差异。一些工具不能设置与其他工具完全相同的过滤器，要么以一种不同的方式应用过滤器，要么在数据处理过程中的不同时期使用过滤器。

设想一下，例如，一个页面水平的过滤器从你的报告中排除了所有的错误页。访问指标比如停留时间、页面深度等等，是不是也调整则取决于服务提供商。这是因为，一些服务提供商分别处理页面水平的指标与访问者水平的指标。

时间差异

对于某一次访问者会话涉及的网站或网页停留时间的计算，包括如何计算最后一页的时间，对任何服务提供商来说都是一个难题。例如，在页面 A 上停留的时间是通过访问者页面 A 的时间戳与接下来的页面 B 时间戳求差计算出来的，等等。但是，如果没有页面 C；如果没有下一个时间戳，如何计算页面 B 的停留时间？

不同的服务提供商用不同的方法解决这一问题。一些在计算中忽略最后的页面浏览；其他的服务提供商使用onunload事件来为访问者关闭浏览器或去其他网站时添加一个时间戳。

两种都是无效的方法，尽管并不是每一个服务提供商都是用onunload法。一些服务提供商更喜欢忽略最后一页的原因在于，这被认为是最不准确的时间点观点——可能访问者被一些其他的事打断或者继续去做其他事而将其浏览器保持在当前的状态：许多用户都这样干；即，他们浏览完了以后，仅是将浏览器打开在最后一页，就接着运行了另一个应用程序。这样的少量页面流量将极大的歪曲网站和页面的停留时间计算；因此，大多数服务提供商避免这一问题。

注：Google Analytics在计算网站或页面停留时间时，忽略一次访问者会话中的最后的页面浏览。

处理频率

Google Analytics每个小时完成它的数据处理，并产生报告就是解释处理频率的最好例子。

但是，因为，从世界各地的数据收集服务器核对所有的日志文件需要时间，因此，报告将延迟3到4小时。在大多数情况下，这一个过程是流畅的，但是有些时候会失败。例如，如果日志文件的传输中断了，那么将只有部分日志文件得到处理。因为这一缘故，Google在每天结束后，会收集并重新处理24小时的数据。其他服务提供商也会如此，因此，不必关注在当天出现的不一致。

注：这也是为什么当你从报告中注意到"缺失数据"时不用恐慌的原因，例如，在上午10点到11点没有数据。这些数据将在每天结束时发生的数据再加工中获得。如果，你等了24小时后，数据仍然缺失，那你应在http://www.google.com/support/googleanalytics/bin/request.py联系Google Analytics的支持团队。

目标转化 VS 页面浏览：确立一致性

使用图2.4作为例子，假设5页是你定义的渠道的一部分（点击流路径），其中最后一步（第5步）是目标转化（购买）。在付款页，一个访问者返回上一页检查邮费（步骤A），然后接着完成支付。这名访问者对整个过程的便利很满意，接着，她使用完全相同的路径在同一次访问者会话中购买了第二件商品（步骤B）。

根据你所使用的服务提供商，这一过程将被以不同的方式计数，如下：

· 12次渠道页浏览、两次转化、两笔交易
· 10次渠道页浏览（忽略步骤A）、两次转化、两笔交易
· 五次渠道页浏览、两次转化、两笔交易
· 五次渠道页浏览、一次转化（忽略步骤B），两笔交易

图2.4 一个访问者访问网站、进入了五页的渠道，并完成了两次交易

大多数服务提供商，但不是全部，在报告中使用最后一种方法。即，访问者变成了购买者（一次转化）。这在一次会话中只能发生一次，因此，额外的转化（假设同一个目标）被忽略。为了使这样有效，渠道页也必须使用相同的方法。以这种方式，数据变得更加以访问者为中心。

注：在图2.4的例子中，页面浏览的总量等于12，将包含在所有综合浏览量的报告中。

只是渠道和目标转化报告将不同。

为什么 PPC 服务提供商的数据与网站分析报告不符

如果你正在使用点击付费（PPC）网站，通常你都会获得由每个网站提供的点击进入报告。通常，这些数字与网站分析报告的数据并不完全符合。以下部分描述了能引起这种情况的一些原因：

跟踪 URLs 丢失了 PPC 点击进入

需要在你的PPC账户中对跟踪URLs进行设置，以区分同一个推介域的非付费的搜索引擎访问者的点击进入与PPC点击进入，例如Google.com or Yahoo.com。跟踪URLs是在你的PPC账号中对目标网页URLs进行的简单设置，形式是www.mysite.com?source=adwords。安装过程中忘记设置跟踪URLs，或有时仅仅是分配不正确，都将导致这些访问被不正确的分配到非付费访问者。

页面加载时间缓慢

正如之前所谈论的，网站分析数据收集标签的最佳位置是在页面的底部——正好在标签的前面。如果你的PPC目标网页由于某些原因（服务器延迟、页面臃肿等等）下载缓慢，在数据分析标签有机会加载前，访问者可能点击离开，导航到网站的其他页面或其他网站。页面加载的时间越长，这种现象发生的可能性越大。判断页面加载时间长的基本原则是两秒钟（见http://www.akamai.com/html/about/press/releases/2009/press_091409.html）。

点击和访问：理解差异

请记住：PPC服务提供商比如Google AdWords测量点击。大多数网站分析工具测量能接受cookies的访问者。当你考虑cookies禁用、JavaScript错误和仅到达目标页就很快离开的访问者对网站分析数据的影响时，那通常不是同样的事情——在页面标签收集数据之前。因为这个缘故，网站分析工具倾向于比PPC网站轻微低估访问。

PPC：重要的账户调整

Google AdWords及其他PPC服务提供商自动监视无效和欺诈点击，并且逆向调整PPC测量。例如，某访问者有时会在较短的时间内点击你的广告（有意或无意）。Google AdWords研究了这个进入，并且去掉了额外的点击进入后向你收费。但是，网站分析工具不能进入这些系统因此记录了所有PPC访问者的记录。更多Google如何对待无效点击的信息，请关注：
http://adwords.google.com/support/bin/topic.py?topic=35.

关键字匹配：出价词 VS 搜索词

你在PPC账户中所选择的出价词与访问者所使用的、导致PPC广告展示的搜索词通常是不同的：想一下"广泛匹配"。例如，你能设置一个广告组指向目标词"鞋"，仅仅依靠广泛匹配来匹配所有包含词"鞋"的搜索词。这是你的出价词。某访问者使用搜索词"蓝鞋"，并且点击你的广告。网站分析服务提供商可以报告这个搜索词、出价词或者两者都有。

Google Adwords 导入延迟

在你的AdWords账号里，你能看到每小时更新的数据。这是因为广告主需要这些来控制预算。Google Analytics每天导入AdWords费用数据一次，这些数据是前一天23:59分之前-48到-24小时的数据，因此，AdWords的费用数据通常至少是24小时之前的。

为什么延迟？因为，这段时间允许AdWords的无效和欺诈点击的保护算法完成它们的工作，最终确定你账户内的点击进入量。因此，从报告的观点，不建议比较当天AdWords的访问者数量。这项建议适用于所有网站分析方法及所有PPC广告网站。

注：尽管大多数AdWords无效点击的更新发生在24小时内，但是，也可能更长时间。因为这个原因，即使没有其他的因素，你的PPC账户中报告的AdWords点击进入与你的网站分析报告中也不能完全匹配。

第三方广告跟踪重定向丢失跟踪 URLs

使用第三方广告跟踪系统，比如99click、ADform、Atlas Search、Blue Streak、DoubleClick、Efficient Frontier、以及SEM Director（甚至客户自己的跟踪系统），来跟踪你的网站的点击进入意味着你的访问者来自URL重定向。这使先前在你的广告公司登记的点击自动重定向访问者到你的网站的实际目标网页。这种两步跳的目的是用独立于你公司之外的跟踪网站收集访问者统计数据，通常是为了计费。因为，这一过程有短暂的延迟，这阻止了一些访问者登录到你的页面。结果是少量数据损失，因此，数据无法一致。

更重要也更普遍的的是，URL重定向会破坏网站分析工具添加到目标网页的跟踪参数。例如，你的目标网页可能看起来是这样：
http://www.j9p.com/?source=google&medium=ppc&campaign=Jan10。当添加第三方跟踪系统的重定向，应该是这样：
http://www.redirect.com?url=http://www.j9p.com?source=google&medium=ppc&campaign=Ja
n10。问题出现在第二个链接的第二个问号，因为，在任何有效的URL中不应多于一个问号。一些第三方跟踪系统能检测这种错误，并且去掉第二个问号及接下来的跟踪参数，导致广告系列数据的丢失。

一些第三方广告跟踪系统用#代替第二个问号，因此，URL能被正确处理。如果你不确定该怎么做，你能通过在第三方广告跟踪系统中编码目标网页URL来完全避免问题，比如，前面的例子的最终Landing Page应该是：错误！超链接引用无效。

正如下面描述的：http://www.w3schools.com/tags/ref_urlencode.asp。URLEncode批量修改的Excel文档下载，在文档中调用URLEncode函数就可以。

注：根据我的经验，PPC服务提供商报告与网站分析工出现差异的主要原因是这一部分讨论的第一个、第二个和最后一个问题。

· 跟踪URLs不能识别付费与免费访问者
· 页面加载缓慢
· 由于第三方广告跟踪重定向丢失数据

数据曲解：谎言、该死的谎言、统计数字

下面不是准确性问题。但是，正如马克·吐温在标题中指出的那样，数据通常不是那么容易解释的。看一下下面两个例子：

1．新访者+回访者并不等于全部访问者。

一种常见的误解是新访者和回访者之和应该等于全部访问者数。为什么不是这样呢？假设，某访问者某天第一次访问了，在同一天又访问了。对这一天来说，他既是新访者也是回访者。因此，这一天的报告，将显示两种访问者类型，尽管访问者的总数是一。

因此，最好根据"访问"类型考虑访问者类型——即第一次访问+重复访问等于总访问数。

2．一周里每天的独立访问者相加不等于这周独立访问者的总和。

设想，周一，你的博客有1000个独立访问者。事实上，一整周你只有这些独立访问者，因此，周二这1000个独立访问者又来看你新发布的博客帖子了。这种情况从周三一直持续到周日。

如果，你看一下这周每一天的独立访问者数，你会看到1000个独立访问者。但是，你不能说你在这一周有7000个独立访问者。因为，在这个例子中，一周的独立访问者数仍是1000。

为什么计算 uniques 没有意义

"uniques"这个词在网站分析中是网站独立访问者（唯一身份访问者）的缩写。即，有多少独立访问者访问了你的网站。问题是计算独立访问者的基础是有问题的，这使 uniques这个词没有意义。

正如在本章开头所讨论的，人们会丢失、阻止或删除 cookies——例如，将近 3 分之 1的跟踪 cookies 在四周内丢失。时间越长，发生的机会越大，这使 uniques 的同比是无效的。

另外，现在浏览器使删除 cookies 非常容易——看一下最新的 Firefox、Chrome 和 Internet Explorer 的浏览器的"匿名"功能。

但是，计算 uniques 的最大问题是人们使用多少种设备访问互联网。例如，考虑以下情形：

1、你和配偶正考虑你们的下一个假期。你的配偶先家里你们共用的电脑上查找了可能的地点，然后保存了一堆网站链接。

2、当天晚上，你也用这台电脑再看了一遍这些链接。你当天晚上没法决定，于是将列表用 email 发送到你的办公室，第二天，你在午饭时间接着考虑你的假期，再坐地铁回家的路上也用手机看了这些网站。

3、第三天你们又在朋友家再次搜索，在这里你们希望得到补充的意见。最后，你们回到家，用你们公用的电脑在晚上进行了预定。

这种情况是非常普遍的——特别是当费用较贵时，这意味着有一个较长的考虑期，从配偶、朋友或同事那里需求补充性意见（在本章开头讨论的 Sun Microsystems 的研究估计有30%的用户在一个月内使用多台电脑访问同一网站）。

简单来说，现在没有那种网站分析技术能准确跟踪这种情况，即将来自多个设备和涉及多人的数据混杂在一起，在近期也不可能出现这样一种技术。

这些限制导致当跟踪独立访问者时的极大误差。事实上，过大的误差使这些指标没有意义，并且在需要尽更精确的"访问数据"时应避免使用。也就是说，如果你必须使用独立访问者作为关键指标时，请确保强调趋势，而不是绝对数量。

SEO高级网站数据分析提升网站排名

上一页 | 返回目录 | 下一页