纷杂的长尾
图7-2用另一种方式示意了上述状况。随着尾巴向后延伸,信号-噪声比越来越低。所以,唯有在过滤器变得越来越强大的情况下,信号的质量才能保持不变,继续帮助消费者们找到他们真正想要的东西。
沿长尾向后看,信号-噪声比为什么越来越低?因为长尾中的东西实在太多,你正在寻找的东西被你不需要的那些东西掩盖住了。长尾中的东西为什么这么多?原因很简单:世界上的绝大多数事物都是长尾事物。
当我们生活在热门中心主义文化中时,我们很容易大大高估热门产品的市场份额。事实上,热门产品只是罕见的例外罢了。这就是纳西姆·塔勒布(Nassim Taleb)所说的那种“黑天鹅问题”。
这种提法源自于18世纪的苏格兰哲学家休谟(David Hume)。当时,他以黑天鹅为例解释了从观察结果中得出一般性法则的复杂之处。在提出我们现在所说的“休谟归纳问题”(Hume''s Problem of Induction)时,他问了这样一个问题:一个人在观察到多少只白天鹅之后才能断言所有的天鹅都是白色,黑色天鹅并不存在?100只?1000只?我们不知道。(黑天鹅问题并不只是一个假设性的比喻:在发现澳洲大陆之前,所有人都认为世界上只有白天鹅。直到有人首次看到了黑天鹅,这种观念才被舍弃。)
这里的问题在于,我们很难把罕见事件放到恰当的大背景中。在任意给定的一群人中都会有那么一两个富翁,还有某些人很聪明,某些人很幸运,但我们并不知道某一个人属于哪一类人。在《随机漫步的傻瓜》(Fooled by Randomness)一书中,塔勒布嘲笑了一本名为《隔壁的百万富翁》(The Millionaire Next Door)的畅销书。这本书总结了百万富翁们的投资技巧和工作习惯,号称你只要向他们学习,你也能变成富翁。但正如塔勒布所说,隔壁那个百万富翁的成功也有可能是随机性因素造成的,未必就是投资策略的功劳。
他是这样定义黑天鹅问题的:
一个随机性事件满足以下三个条件:重大影响、无法计算的概率、意外效应。首先,它一旦发生,就会造成与其本身不成比例的重大影响;其次,它的发生概率很小,而且根据发生前的可用信息也无法计算这个概率;第三,黑天鹅问题的恶性特征就是它的意外效应:在任意一次观察中,不会有任何有说服力的要素可以证明这个事件的发生概率正在提高。
我们完全可以把他的话用在那些热门产品上。
绝大多数产品的内容(从音乐到电影)都不是大热门。事实上,绝大多数内容离大热门这三个字都有十万八千里的距离,它们的顾客人数是百位数的,不是百万位数的:有时候这是因为它们本身不够好;有时候这是因为宣传力度不够或是创作者缺乏人脉背景;还有的时候,这是因为某些随机性因素制造了障碍,就像是随机性因素有时候能把最浅薄的新奇玩意儿变成大热门一样——想想《谁把狗放出来》(Who Let the Dogs Out)这首歌就知道了。
这只是所谓的“幂律”(power-law)分布的自然结果,在这种分布曲线中,少数事件的值域(不妨理解为销量)
较高,多数事件的值域较低。卖得好的东西寥寥无几,多数东西都卖得不好。(称它为幂律分布是因为这个曲线的方程是1/x,也就是x的-1次幂)。
既然多数东西都不会卖得太好,那么随着长尾曲线的下坠,内容总量自然呈上升趋势(你不喜欢的东西当然也就越来越多了)。表7-2是图书业2004年的一组实际数据,我们可以看到每一个销量范围内的品种数。
这种规律的结果显而易见:无论你正在寻找什么,你沿着长尾走得越远,不合你意的东西就越多。所以信号-噪声比才会越来越低,尽管你发现合意产品的概率往往会越来越大(如果你有好的搜索工具和过滤器的话)。这听起来很矛盾,但实际上并不矛盾。这只是一个需要过滤器去解决的问题。
销量范围 | 品种数 | 总销量 |
---|---|---|
1000000册以上 | 10 | 17396510 |
500000~999999册 | 22 | 13798299 |
250000~499999册 | 64 | 22252491 |
100000~249999册 | 324 | 46932031 |
50000~99999册 | 767 | 51858835 |
5000~49999册 | 23047 | 280000591 |
1000~4999册 | 67047 | 149093614 |
100~999册 | 202938 | 69548499 |
99册以下 | 948005 | 14346417 |
合计 | 120万 | 6.65亿以上 |
本书评论