14.2 消费者行为的大数据分析
消费者大数据分析在商业中已经获得了广泛应用,移动互联网时代许多创新的商业模式都建立在大数据分析的基础上。
另一方面,消费者大数据分析技术还处在发展之中,特别是,如何正确解读数据,得出有意义的消费者洞察,仍然需要人的智慧。本节为非技术专业学生提供大数据的相关背景,一般性介绍消费者行为大数据的分析流程和应用。
消费者行为大数据的分析流程
图表14—5简要说明了消费者的大数据分析如何帮助企业获得市场。通过用户多维度数据的收集,对其行为进行建模,为其画像,最后应用这些数据进行营销创新或精准广告推广等。[10]
从分析流程图可以看出,消费者行为的大数据分析包括以下三个层面的工作。
1 数据层:采集和处理数据
传统采集数据的过程一般是有限的、有意识的、结构化的,例如采用问卷调研的形式。你能采集到的数据一定是你能设想到的情况。数据的结构化较好。一般的数据库Mysql甚至Excel就能满足数据处理过程。
而互联网时代里,大数据的采集过程基本是无限的、无意识的、非结构化的数据采集,并且数据的采集可能是跨平台、跨不同终端的。各种纷繁复杂的行为数据以行为日志的形式上传到服务器。有专属的例如Hadoop,Mapreduce等工具。
2 业务层:建模分析数据
使用的数据分析模型,例如基本统计,机器学习,数据挖掘的分类、聚类、关联、预测等算法,传统数据和大数据的做法差别不大,银行、通信运营商、零售商早已熟练运用消费者的属性和行为数据来识别风险和付费可能性。但是由于数据量的极大扩增,算法也获得了极大的优化提升的空间。
3 应用层:解读数据
数据分析最重要的是解读。图表14—6中,用户画像和广告传播两步,都属于应用层。但用户画像这部分内容,属于基础解读,有了这部分解读,企业才能够在此基础上进行多样化的应用。
资料来源:Acxiom 公司。
传统上一般是定义营销问题之后,采集对应的数据,然后根据确定的建模或分析框架,对数据进行分析,验证假设,解读。解读的空间是有限的。而大数据提供了一种可能性,既可以根据营销问题,封闭性地去挖掘对应数据进行验证,也可以开放性地探索,得出一些可能与常识或经验判断完全相异的结论,可解读的点变得非常丰富。
延伸阅读14—1消费者大数据建模分析的基础
通过对消费者的行为足迹进行标签,让机器越来越认识每一个人,这也是后期建立模型进行分析的基础。
1 属性标签层
这些属性可以从人群属性(性别、年龄、职业、收入等),设备属性(设备价格、设备系统、设备型号等),运营商属性(中国移动、中国联通、中国电信等),城市属性(发展程度、人口数量、区域位置),商圈属性(功能、位置等)等几个主要的属性方式进行标签,属性标签数量的多少与一个平台的技术及经验有直接的关系,技术越成熟,抓取的属性越准确,经验越丰富,属性的分类就越合理。属性标签举例如图表14—7所示。
资料来源:AdChina公司相关资料。
2 行为标签层
是指经过对用户在特定时间段、位置范围内的登录网页或者App的行为分析而产生的标签层。行为标签层的分类依据行为发生的频次统计做出标签,如果用户的行为只是在某个时间段内产生过寥寥几次,并不会被列为一个标签,只有该行为的发生有一个规律的频次或周期出现才会被视为一个标签。比如通过经常玩手机游戏,经常使用旅游软件等细分出像商旅人群、手游人群、理财人群、爱车一族、化妆品受众、教育受众等。由于用户的行为方式多种多样,这类的标签会有成千上万个,对广告投放的精准性来讲无疑是一大优势。
3 目标人群层
目标人群层主要是根据属性标签层与行为标签层组合之后产生的标签层,这种组合会产生极大的标签量,同时一个用户被贴上多个标签之后就会变成一个综合标签体,从而保证了目标人群的精准性,例如某广告主需要定位在35岁左右的男性汽车受众,就可以通过第一层级的年龄、性别加上第二层级的汽车浏览行为组合后得到目标人群,从而定位出与该品牌最相关的人群,这样投放广告针对性极强,效果极佳。具体举例如图表14—8所示。
资料来源:AdChina公司相关资料。
消费者大数据分析可以解决的问题
对于消费者真实决策过程和购买过程的海量数据进行分析,具有很高的应用价值,能够解决营销整个价值流程中多方面的问题,如图表14—9所示。[11]
资料来源:整理自易观国际:《中国零售业大数据市场专题研究报告2014》。
总体来看,消费者大数据分析的应用可以分为长期和短期两个方面。[12] 以下分别介绍。
1 短期业绩导向的大数据应用
(1)个性化精准推荐。通过基于内容、基于用户行为、基于社交关系网络的数据积累,企业可以定位出用户的属性类型和购买习惯,为其个性化地推介可能喜欢的商品或内容。通过具有强大计算能力的云计算平台,推荐引擎能够根据购物网站上每位顾客的浏览和访问历史挖掘其个性化兴趣偏好,从而向不同的顾客展示个性化的页面和他们各自可能需要的商品。通过推荐引擎,购物网站不仅能改善顾客在网站上的浏览体验,还能提高网站的流量转化率、客单价,提升客户购买的品类数和多样性,延长客户生命周期。这是电商企业较多使用的手段,比如亚马逊、网飞、京东等。数据显示亚马逊有1/3的销量来自个性化推荐,可见这种大数据的应用对于业绩有直接影响。请参见“案例14—2:今日头条——大数据为每个用户建立‘兴趣DNA’模型”。
(2)精准广告。依托于消费者行为的数据,对其几乎所有上网行为进行个性化的深度分析,识别消费者的人口特征、行为特征,广告主可以通过广告实时竞价(RTB)技术,按其需求锁定目标受众,进行一对一传播,提供多通道投放,并按照效果付费。以前品牌经理“我不知道浪费的是哪一半”的担心再也不会存在,购买广告除了依托媒介购买人员的经验,每一步都有精准的数据呈现,这让企业想要传播的信息精确到达目标消费者,优化了广告效果,也让企业看到了过去可能被忽略的营销机会。请参见“延伸阅读14—2:网络精准广告”。
(3)实时监测传播效果,优化传播渠道决策。传统营销传播的事后调查评估方法,对于消费者反馈的获取很慢,及时性也很差,但是大数据可以做到近乎实时地提供各种传播效果反馈数据,信息详尽,并具有跟踪性,这对于营销传播的优化决策提供了巨大价值。
通过在不同的网页植入cookies,根据用户的互联网痕迹进行渠道营销效果优化,即根据互联网上顾客的行为轨迹来找出哪个营销渠道的顾客来源最多,哪个来源顾客实际购买量最多,是不是目标顾客等,从而调整营销资源在各个渠道的投放。
(4)销售预测和仓储管理。准确预测销量,可做到以销定产,一方面避免产品积压,增加成本,一方面减少缺货,以免影响业绩。通过数据分析预测销量,企业可以做到自动补货、提前发货或是退货准备,提高库存周转率,提升客户体验。
(5)精准促销。在促销方式的选择上,企业也更加明确对不同的消费者采用哪种促销方式比较好。通过消费者数据的收集和分析,企业可以判断出哪些顾客是价格敏感型的,针对性地采用一些价格折扣,推动购买;而对于那些价格不敏感但冲动型购买者,价值不高但漂亮的赠品可能更能让消费者从心动到行动。
2 长期品牌导向的大数据应用
(1)消费者洞察。通过行为数据,并结合社交媒体上的文本数据,能够获取到消费者对品牌和产品即时的看法和态度,可以看到一些以往没有考虑到的、隐藏的消费者需求和偏好,及时改进产品或者推出新产品。如研究者通过在线聊天的数据分析发现,垂直差异较大的产品(3C)常常基于客观因素被选择,消费选择的同质化程度较高,持续购买的稳定性较强;水平差异较小的产品(如衣服鞋帽)常常基于主观因素被选择,消费选择的异质化程度较高,但是长期购买的稳定性也较低。[13] 最新的基于Twitter数据的研究发现,人们在使用同样意义的网络字符表情时,个人主义国家的网友倾向于使用嘴巴为主导的表情,如-) ,而集体主义国家的网友则倾向于使用以眼睛为主导的表情,如^_^。[14] 美剧《纸牌屋》的成功也部分是由于应用大数据进行消费者洞察的结果。网飞是美国最大的视频点播服务提供商,掌握大量的观影习惯数据,譬如每个人按下暂停、停止观看或者快进的数据,喜欢某部剧的人还喜欢哪些剧,和导演和演员的关系等。网飞通过分析数据,决定翻拍广受大众(包括他们的用户)欢迎和评论家赞赏的 1990 年 BBC 迷你剧《纸牌屋》,而且它还发现,喜欢这个剧集的人也非常喜欢凯文·斯贝西(Kevin Spacey)参演,或者戴维·芬奇(David Fincher)导演的作品。也因此,它才有了结论,决定投资1亿美元翻拍一部两季共计 26 集有斯贝西和芬奇参加的同名剧。[15]
(2)顾客盈利能力分析和管理。对于交易信息的分析,可以得到顾客盈利贡献的分裂,为企业区分出哪些顾客是为企业带来较高收入和利润的,哪些顾客是高成本但是回报微薄甚至是负利润的,从而更好地将企业资源分配到优质的顾客上去,这也进一步明确了企业的目标市场。此外,有了大数据之后,对于顾客终身价值的预测可能会更加实时动态,并更加准确。
(3)消费者细分。通过将消费者的行为数据标签化和建模分析,可以进行更加精准、更全景化的消费者图像的描绘,定位出用户的属性类型和购买习惯,从而帮助企业进行市场细分,特别是可以做到基于行为变量的细分和基于个人的细分,对每个群体量体裁衣般地采取独特的行动。一对一的营销也提高了消费者的体验,增强了企业和顾客之间的关系。
(4)基于长期品牌意义的传播决策。传播除了促进即时的销售,最重要的一部分工作就是持之以恒地建立并保持与消费者之间有意义的关系,这种关系就是我们所熟知的“品牌的建立和维持”。
为了建立品牌的长期形象和消费者的品牌忠诚,传播不仅需要根据交易数据、浏览数据进行精准投放,还需要考虑媒介的组合、信息传播内容的选择以及挖潜新的潜在消费者。此时,大数据可以帮助企业进行媒体价值的评价、获得最优投放组合;帮助进行竞争品牌的市场分析和传播分析,挖掘潜在的消费者和沟通价值点;进行投放测试,找出受众最有共鸣的广告创意,对广告进行及时的判断和调整。
案例14—2今日头条——大数据为每个用户建立
“兴趣DNA”模型
一支没有新闻基因的创业团队,在短短两年内做出了一款注册用户已经2 2亿、日均活跃用户超过2 000万人的网上新闻产品——今日头条,成为2013-2014年移动新闻客户端大战中最大的黑马。
2012年 8 月,今日头条上线,用“生不逢时”形容它当时的境遇再合适不过了。彼时四大门户均已推出了自己的新闻客户端产品,其中搜狐、网易新闻客户端的用户规模更是已经接近
4. 000 万。虽然几大门户的新闻客户端之间还在贴身肉搏,但是对于刚刚踏上战场的今日头条来说,这场战争似乎已经结束了。对手是装备精良、割据一方的正规军,自己则是势单力薄的游击队,胜负看上去实在没什么悬念。
不过,在这场似乎只属于门户豪强的游戏里,剧情却起了变化。今日头条不仅顽强活了下来,还生生从对手那里抢下了一块不小的地盘。至2014年底,今日头条的注册用户超过2 2亿,日均活跃用户超过2 000万人,并且保持每月新增1 000 万以上的用户。
这是怎么做到的?
穿着新闻外衣的推荐引擎
虽然有着一个新闻性十足的名字,而且看上去与同类产品大同小异,但在骨子里,今日头条则完全是另外一个物种。与其将它称为新闻客户端,不如叫它推荐引擎或许更为准确,因为从出发点上,今日头条就与门户网站的新闻客户端截然不同。其创始人曾表示:“我的竞争对手不是同行。”
传统门户想要做的是一款提供新闻资讯的移动App,完成从个人电脑向移动客户端的过渡,而今日头条想做的却是一款基于移动互联网的推荐引擎,新闻资讯仅仅是它所承载的内容而已。用推荐引擎分发新闻,是对传统新闻门户工作方式的一次巨大颠覆。
传统的新闻门户都有着庞大的编辑团队,编辑从每天抓取到的海量新闻中,按照一定的价值判断标准,选择出一些所谓重要的、用户感兴趣的新闻推荐到首页,或者排在靠前的位置。人工推荐模式的背后所追求的是信息覆盖的广度,只有大家都感兴趣的新闻才能为网站带来足够多的流量,所以这就意味着一些小众的长尾信息需求无法得到满足。如果一位用户喜欢一支乏人问津的 NBA 弱旅,那他就很难在门户首页上看到这支球队的消息。因为放在首页的永远是那些战绩最好、最火热的球星和球队的消息。
想要解决长尾的信息需求,推荐引擎就成为最好的选择。
今日头条不用人工推荐,而采用机器学习的方式,利用推荐引擎个性化地分发信息。即根据每个人的阅读行为,建立每个人的“兴趣DNA”模型,为其精准推荐其感兴趣的新闻资讯,消费者看到的每一篇新闻,都是自己关心的。
今日头条可以采用用户已有的社交媒体账号登录,一旦绑定你的社交媒体账号,今日头条的推荐引擎就能迅速根据你账号的标签、好友、转发等信息分析出你大致的兴趣爱好,从而向你推荐相应的内容,而且,随着算法的不断进化以及用户使用时长的增加,这种推送也会变得愈发精准,越多人用越长时间,越好用。目前今日头条的用户中有一半都绑定了自己的社交媒体账号。
大数据为每个用户建立“兴趣DNA”模型
过去,传统媒体不可能得到用户数据,无法获知用户行为。主编很希望获得用户的反馈,但只能通过读者来信,通常一期杂志或者一期报纸有1 000封读者来信就是很高兴的事情了。或者只可能通过有限的用户访谈、调查。通过这种非在线的方式收集数据,信息的感知水平与移动App相比差别是非常大的。一个在线的App,每秒钟用户的反馈都可能是几千、几万。今日头条每天日志函数在100亿的规模,最后真正被使用的特征也有300多亿。
比如,当一个人在地铁中使用今日头条的时候,不仅是他在使用今日头条、在观察阅读数据,其实今日头条后面的系统也在观察他,观察他每一步的滑动,是否很快滑过了标题还是有所停留,认真阅读了还是粗略阅读了,是否参与朋友圈讨论。这些行为都会被系统感知到,系统再做实时调整。
获取到这些数据后,今日头条将数据分成几类:第一类是用户的动作特征,他的点击、停留、滑动、顶踩、评论、分享,这些是最主要的数据。第二类是用户的环境,他是在WiFi还是3 G环境,他是在北京还是上海,他是离开了常驻地还是在旅行状态,甚至包括白天还是晚上、今天的天气、是否节假日,都可以作为使用特征。第三类是用户的社交数据,比如用户用微博登录之后,可以获取他的微博身份,这些数据都会成为各种特征被系统学习到。更重要的是,系统将不仅使用这种单一特征,还会将这些特征组合,分析不同特征情况下用户有什么样的兴趣爱好。
今日头条将海量的高级特征和精细化特征组合,来建立多重模型组合,为每个用户形成兴趣图谱,进行推荐。高级特征是诸如“他是不是一个当地居民,是不是一个IT的重度用户,他使用的手机价格是多少”等特征,精细化特征是诸如“他过去对某篇文章或某个明星的点击行为,对他现在的阅读有什么影响”等。
今日头条每天产生100万条观察日志,而且观察的是2 000多万用户,对人们爱好的变化、新兴资讯在不同人之间受欢迎的程度等,有像上帝一样俯视的视角,能够从全局视角看到以往消费者调研难以看到的一些内容。比如在过去一年中,哪个事件被人们最快地遗忘了,哪个城市的人最喜欢哪个明星,通过大数据,机器都能知道。
资料来源:1 《互联网渗透传统行业O2O借势升温》,http://read.haosou.com/article/?id=ae1268232518c64ad0c42c9ab0d39f09 mediaId=10512。
2. 《借机器学习给产品带来的价值》,http://read.haosou.com/article/?id=75644aa14dc9b0d7 mediaId=10616。
3. 《野蛮人与新物种》,http://www.geekpark.net/topics/199757。
4. 《要像造纸术那样改变信息传播方式》,http://www.dnkb.com.cn/archive/info/20141225/080823147617813_1.shtml。
讨论题:
1. 你使用了该App或相似的App吗,你喜欢它这么了解你吗?为什么?
2. 今日头条对个体的精准了解,除了帮助它分发新闻,还可以有什么应用?
延伸阅读14—2网络精准广告
让我们先想象一个情境:你坐在电脑前,在淘宝上搜索了运动鞋,随便浏览了几个店铺,比如店铺A和店铺B,看了几款鞋,没有下定决心。关了网页之后,你打开视频网站看最近在追的电视剧,突然发现,页面的右边栏正好在推送店铺C的运动鞋,款式和你刚才看的几款鞋有些类似,正好是你喜欢的类型,你很感兴趣,点击了这个广告,然后买了这双鞋。
为什么刚刚点击过、搜索过、浏览过的商品,其相关的广告会精确出现在你面前?这就是互联网精准广告(targeted advertising)。
RTB技术,使得广告交易平台、需求方平台、供应方平台和数据管理平台各环节协作配合完成高效精准的广告投放全过程。整个过程完全由计算机程序执行,瞬间即可完成。具体过程如下:
第1步:受众访问互联网媒体,浏览页面时产生相应的行为数据(即cookie)。
第2步:作为资源方的供应方平台(SSP)在接收到受众的行为数据后迅速向广告交易平台(ad exchange)提交一个相应的广告位代码,同时由数据管理平台(DMP)判断受众属性并向需求方平台(DSP)发送竞价请求。
第3步:需求方平台收到广告交易平台的竞价请求后,立即通过实时竞价交易方式确定出价最高的广告主。
第4步:出价高的广告主获得展示机会,并将广告送达给目标受众。具体如图表14—10所示。
资料来源:CTR。
在广告交易平台中,商品为待展示的广告位,竞价者为代表广告主的需求方平台。多个广告需求方同时参与竞价,价高者胜出,即可将广告内容投放至广告位送达目标受众。
在这种精准广告投放模式下,传统的网络广告投放模式逐渐转型为程序化的自动购买,如图表14—11所示。其中,广告交易平台、需求方平台、供应方平台和数据管理平台作为不可缺少的产业环节,各自扮演着非常重要的角色:
资料来源:陈运红:《数字营销系列专题》,见2014年6月《齐鲁证券研究报告》。
需求方平台:服务于广告主,在广告交易平台中通过RTB的交易模式对目标受众进行购买,在提高广告效能的同时节约广告预算开支。
数据管理平台:把分散的第一方、第三方数据进行整合,纳入统一的技术平台,并利用这些数据进行标准化和细分,从而判断受众属性,是RTB 交易模式运营的基本。
广告交易平台:“证券化”的广告交易平台模式,使广告主和互联网媒体如买卖股票般进行广告位交易。在广告交易平台中,商品为待展示的广告位。目前,通过交易的广告位以展示类广告为主。
供应方平台:服务于媒体方,整合互联网媒体资源,专注于流量变现优化、广告位优化、展示有效性优化等。供应商平台可以充分利用媒体的库存资源,使媒体主获得更高的收益。
精准广告产业链中各环节的盈利来自如下方面:
广告交易平台:作为互联网广告位的交易场所,广告交易平台主要通过向需求方平台及供应方平台/媒体收取“会员费”来获取盈利,如同证券交易所一样。
需求方平台:作为实现RTB 交易模式最为关键的环节, 需求方平台企业的盈利主要来自提供广告投放服务而收取的费用。
供应方平台:服务于媒体资源的供应方平台主要的盈利模式为向互联网媒体资源收取代理费。
数据管理平台:广告交易平台产业链中盈利能力较弱的环节,主要通过向数据使用方收费的方式创造盈利。
精准广告带来的网络广告业的变化如下:
(1)重塑展示广告购买模式:从买广告位到买人群。RTB技术实现了对特定目标受众的购买,代替了媒体位置购买,达到了精准化投放效果。在传统的广告交易环境下,广告主无法精确抓住有效目标受众,因此造成广告投放预算的浪费。RTB实现了目标受众购买,可帮广告主大大提高广告投放的精准度,降低网络广告的无效预算,从而减少浪费,降低成本。201 3年,Econsultancy联合Rubicon Project对650位广告主和广告代理公司进行调研发现,62%的受访者认为RTB带来的明显益处是效果提升,54%的人认为RTB减少了媒介购买的浪费,53%的人认为RTB使得单个客户获取成本降低,46%的人认为RTB带来了更好的定向能力(见图表14—12)。
资料来源:《广告主:RTB提升了广告表现》,http://www.199it.com/archives/156241.html。
(2)RTB缩短了广告投放优化周期,实时的动态优化得以实现。RTB交易带来的改变除了人群定向购买,最关键突破还在于实时竞价。在传统营销的提前包断的模式下,广告投放优化的间隔周期比较长。传统模式下需要更久的时间才能拿到投放结果数据,优化投放也需要更漫长的人工谈判实现广告位购买等环节。而通过RTB,看似复杂的一系列购买过程从用户点击网站至看到页面上的内容和广告,瞬间即可完成。这种程序化购买模式取代人工谈价,将投放过程变得更加高效。同时,RTB 模式下,投放数据是实时可看的,3 分钟之后就能知道投放效果数据,进而实现实时投放优化。
(3)精准人群定向技术提高媒体的长尾流量价值,实现双赢。在广告网络的环境下,媒体的长尾库存流量变现价值较低,而RTB 交易模式下,通过人群定向技术,提高精准度,进而实现长尾媒体的价值提升,整体提高网络媒体收益。目前,国内与广告交易平台对接的媒体资源以长尾流量为主,RTB 模式的不断成熟使得国内长尾网络媒体资源得以充分的利用。
资料来源:
1. 陈运红:《数字营销系列专题》,见2014年6月《齐鲁证券研究报告》。
2. 《力美别星:2015年移动DSP的发展》,http://www.meihuainfo/today/post/post_ae280a70-5b16-4346-b3c5-8c1b86878be8.aspx。
3. 《图说Ad Exchange广告交易模式》,http://www.rtbchina.com/info-graph-ad-exchange.html。
4. 《重定向广告是什么?》,http://www.zhihu.com/question/21737987。
本书评论