安居多伦多
  • 多市生活
    • 多市生活
    • 加国税务
    • 旅游度假
    • 生活安全
    • 行车安全
    • 窍门集锦
  • 多市书苑
    • 热门
    • 小说
    • 教育
  • 家居信息
    • 家居信息
    • 房屋保养
    • 房屋贷款
    • 房屋租赁
    • 房屋建筑
    • 房前屋后
    • 家居风水
  • 健康保健
    • 健康保健
    • 饮食起居
    • 食品安全
    • 健身锻炼
  • 书苑账户
    • 书苑登入
    • 书苑注册
    • 忘记书苑密码
    • 书苑账户信息
    • 关于我们
    • 联系我们
    • 隐私政策
多伦多书苑
在线书籍:随时阅读,随身听书。
所有书籍 | 人文 | 人物 | 人生 | 健康 | 儿童 | 医学 | 历史 | 历史 | 古典 | 哲学宗教 | 商业 | 外国 | 寓言 | 小说 | 教育 | 风水 | 管理 | 语言 |
为使本公益资源网站能继续提供免费阅读,请勿屏蔽广告。谢谢!报告弹出广告被滥用。
  1. 安居多伦多
  2. 网上书苑
  3. 经济
  4. 商业
  5. 智能商业

智能商业

2021-11-24 0人点赞 0条评论
点赞
x
语速1.0: 2.0
进度0:

上一页   |   返回目录   |   下一页

04 智能商业双螺旋之二:数据智能

无数据,不智能;无智能,不商业。人工智能是一场技术革命,它必然会将越来越多的商业智能化。未来数据智能将成为商业的基础,而智能商业也将成为数据时代的全新的商业范式。在我看来,要想把数据智能融入具体商业,要做好三件事:数据化、算法化和产品化。

数据化:商业创新的基础

可以预见,未来随着科技的进步和时间的推移,商业必将面临全面的智能化。那么究竟什么是智能化呢?其实“智能”一词,在不同时期和不同科技水平下,有不同的具体含义。

对于当下的商业而言,智能化指的是商业决策会越来越多地依赖机器学习,依赖人工智能。机器将逐步取代人,在越来越多的商业决策上扮演非常重要的角色,它能取得的效果远远超过今天人工运作产生的效果。

其实,如今的智能商业还处在萌芽阶段,相对于传统商业的优势,它在很多领域的优势还不太明显。然而即便通过现有的案例,我们也看到了这一趋势的巨大力量。伴随着互联网技术,特别是物联网、数据科学和计算能力持续的高速发展,几乎可以断言,基于数据智能的商业必将超越1913年横空出世的福特流水线,给人类整体的生产力带来一次根本性的巨大突破。

正是在这个意义上,我们强调,这是一场商业模式的范式革命。未来10年,最大的商业价值就是如何创造一个个智能商业,带来用户体验的飞跃。

众所周知,小微企业的贷款业务一直是一个世界级难题。由于信息的收集、分析和审核需要巨大的成本,导致贷不贷、贷多少、收多少利息等问题困扰了无数的贷款机构。

但蚂蚁小贷这个成立时间并不长的公司,彻底改变了这一局面。短短几年时间内,它已经累计服务了上百万淘宝和阿里巴巴的卖家,这些卖家的平均贷款额大约为5万元,多不过百万元,少的只有几百元。他们不仅没有靠谱的抵押,有些甚至连基本的账目都没有,更匪夷所思的是,他们甚至不需要见到信贷经理。

事实上,蚂蚁小贷所有的信息采集和决策都由计算机后台来完成——商家在线上提交贷款申请,几秒钟内系统自动审批;审批后,贷款几乎可以实时地汇入卖家账户。虽然是无人信贷,但蚂蚁小贷的坏账率却显著低于传统银行的平均水平。

蚂蚁小贷能做到这些,主要归功于互联网。它能够分享潜在客户的诸多数据,比如这些淘宝卖家正在卖哪些商品、生意好不好、经营店铺是否勤快、之前是否有过不诚信行为,甚至还有他是否喜欢玩网游、卖家朋友的信用度是否高等。

这些数据的丰富度、准确度,远高于传统银行能采集到的贷款者的信息。

如果我们更全面地检视蚂蚁小贷的业务,就会发现它做了三件关键的事:特定商业场景的数据化、忠实于商业逻辑的算法及其迭代优化,以及将数据智能与商业场景无缝融合的产品。这三件事融会贯通、相互包含,在反馈闭环中共同演化,这就是未来智能商业的样貌。

所谓数据化,不仅包括客户的经营数据,还有更多维度的数据被记录、分析和融入,构成了对客户全方位的描摹。数据初始化是一件高成本和困难的事情,仅仅是最简单的客户性别数据就包含了十几套标准,诸如身份证上登记的性别、实际经营者的性别、行为特征显示出的性别等。这些数据各有价值,但传统方法又无法使它们融合,故需要创新的方法才能合理使用。[1]与此同时,数据化更是一件高收益的事情。例如,“客户对经营的投入程度” 这一很有价值的指标,传统金融机构几乎没有任何有效的获取方法。然而在互联网的语境下,早上几点卖家在旺旺上线了,买家的询问在几秒钟内能得到回复,这些数据都可以很直观地反映出卖家的投入度。

“数据化”本质上是将一种现象转变为可量化形式的过程。它来源于人类测量、记录和分析世界的渴望,是文明进步的基础。维克托·迈尔–舍恩伯格和肯尼思· 库克耶在《大数据时代》一书中对人类的数据化历史做了充满洞察的描述,“计量和记录一起促成了数据的诞生,它们是数据化最早的根基”。从早期人类文明的结绳记事开始,到5000多年前两河流域的先民用度量衡来计量长度和重量,再到公元1世纪由印度发明、阿拉伯人改进的十进制数字,这些都是人类数据化征程最初却伟大的起步。这几步也一直延续到卢卡·帕乔利时期,他用复式记账法奠定了标准数据记录法的基础,这是第一次用数据直接反映生意的盈亏。计算机技术的出现,尤其是互联网技术的快速发展,更是推动了数据化的新一波更加汹涌澎湃的浪潮。

我们已经看到,自己在互联网上留下的每一处“足迹”都被数据化地记录下来,成为各种应用推送个性化服务的关键依据。脸书实现了人际关系的数据化,带来了很多全新的应用,例如通过分析选举前用户的行为数据来“计算”选民的投票倾向,成为有史以来最准确的选前民调。

我们还看到文字被数据化、地理方位被数据化、情绪感受被数据化。与我们每个人更息息相关的是身体健康状况的数据化,Zeo公司(一家睡眠管理设备创业公司)完成了世界上最大的睡眠活动数据库;Asthmapolis(一家哮喘病医疗服务机构)通过一个呼吸器,一方面记录哮喘病人的发病数据,另一方面进行GPS定位,从而分析特定环境对哮喘病情的影响;一款名叫iTerm的手机应用通过手机内置的测震仪记录人们身体的颤动数据,来预防和付诸治疗帕金森病和其他神经系统疾病;更不用说已经广泛普及的手环对人体基本健康状况数据的全天候记录。

互联网技术使我们终于可以低成本、全方位地记录数据,而只有当我们拥有了足够大量、足够多维度的“大数据”时,才可能真正客观、真实而深刻地理解我们周遭的环境、事物的本原以及我们自己。

这是激动人心的历史性努力。本质上,就如同蒸汽机是我们进入工业文明的第一步、电是我们迈入电气化的现代工业的第一步,数据化毫无疑问是我们进入以数据智能为核心的智能商业世界的第一步,也是我们这个时代最重要的创造之一。

有效的数据初始化是大数据创造价值至关重要的第一步。可以说,没有数据的初始化,就没有后继的商业创新。而成本高昂的数据初始化工作能否创造巨大的客户价值,就成为当下海量创业项目能否存活立足的重要考验。企业家的创造性也将在这一领域中大放异彩。

蚂蚁小贷的故事

假设一家信贷机构要开展一项全新的信贷业务。信贷对象为小微企业或个人从业者,行业千奇百怪,地域遍布全国,这些企业和个人的成本结构、利润率不详,基本没有财务报表,没有信用记录,也没有有价值的抵押物。

业务要求:同时为百万级客户服务;单笔数额不超过100万元,贷款期限为几天到一年;实时审核贷款,实时发放;坏账率不能超过行业平均水平。

传统银行会怎么做?

大体如下:开发一套针对小额信贷的中央风控流程;建立遍布全国的物理网点;设计先进的调查问卷,银行的内部系统支持移动设备实时输入问卷结果,运用打分卡技术进行风险评估;要求对方提供抵押或担保;人工审核。

这是目前小额贷款业务的通行做法,但所有的传统机构都面临同样的困难:相较于每笔贷款的金额,收集客户信息的成本实在太高。

蚂蚁小贷做到了什么?

全线上流程,实时放贷(从客户输入贷款金额到拿到贷款,不超过1分钟);机器自动放贷,无物理网点,无客户经理;平均单笔贷款低于5万元,少的只有几百元(传统的小贷机构单笔贷款一般不低于50万元);每年为超过40万客户服务;无须抵押和担保;坏账率不高于2%。

蚂蚁小贷是中国第一款智能金融产品。它做了三件关键的事:小微贷款业务的数据化,用算法完成风险评估,以及将数据智能与小贷场景无缝融合的产品,即数据、算法、产品三位一体地提供服务。

归功于互联网,蚂蚁小贷能够分享潜在客户的诸多数据,比如这些淘宝卖家正在卖哪些商品、生意好不好,又比如卖家经营店铺勤快与否(客服旺旺的回复速度、每天经营时间的长短等)、之前是否有过不诚信的行为,等等。这些数据的丰富度、准确度和规模都远高于传统机构所能采集到的信息。

蚂蚁小贷的算法工程师建立了三套机器学习的算法模型来处理这些海量数据,即偿贷能力模型(相关经营数据)、偿贷意愿模型(客户风险偏好及信用度)、定价模型(价格偏好及策略),给每位客户进行风险评级和定价。

与传统金融机构的数据分析不同,基于在线数据,算法模型能够进行实时迭代。一方面,新数据不断涌入,客户的每一单交易、每一次上线、每一次还款,原则上每时每刻都在改变他的分值。

另一方面,算法模型自身也在迭代。事实上,客户借还款的数据,会实时反馈到蚂蚁小贷的数据池中,多个算法模型据此实时优化:哪些维度的指标应当被纳入或清除出模型,客户的哪些行为特质应该被赋予更高的权重,在不同的情形下哪些算法模型有更高的准确度。在蚂蚁小贷,这些算法模型更新的频率以“周” 计算,而即便在金融数据化程度极高的美国,一次算法更新往往也需要6个月。

最后,蚂蚁小贷还将数据智能融入小微贷款这一商业场景中,设计出一款高效的互联网产品。淘宝卖家可以在店铺运营平台上直接申请贷款,如同在谷歌的搜索框输入关键字一样简单。这个贷款页面也是机器算法的反馈通道,数据实时更新,算法不断迭代。

事实上,在卖家提出贷款申请前,蚂蚁小贷的后台机器集群已经根据他在淘宝上的行为数据,对他进行了风险评估,并预先授信。所以,可以实现实时审核,自动放款。

在这个过程中,客户的数据越来越多,数据维度越来越丰富,参数越来越准,算法模型越来越有效,风险控制的成本越来越低,信贷对象的体验越来越好,覆盖的贷款用户也越来越广。整个业务进入高速发展的正向循环。更重要的是,这是一个基于数据和算法,且自动的智能化用户体验提升过程,商业效率也得到了极大提升。

蚂蚁小贷是智能商业的一个经典案例。信贷如此古老而复杂的商业活动,被抽象、极简地表达成了一个人机交互的输入框;传统上烦琐得令人望而生畏的信贷流程,变成了“输入信贷需求—机器做出决定—资金自动汇入”三个简单的动作;过去高度依赖人的判断力的贷款审核,变成了由机器自动决定。

小额贷款成为一项数据驱动的智能业务。

算法化:智能商业的“引擎”,而非“工具”我们提到算法时,常常会接上另一个词——“引擎”。这是一个奇妙的比喻,因为如果我们将数据看作是DT(data technology,数据处理技术)时代的一桶高标号汽油,那么算法无疑就是这台引擎。只有算法才能让数据中的能量得以完全喷发出来,为智能商业这辆“汽车”推进加速。

搜索是第一个数据和算法驱动的互联网产品,使我们每个人都可以在海量的互联网数据中找到最相关的信息。谷歌的成功正发源于其创始人提出的PageRank算法。谷歌创造的另一个功能强大的算法是其在线广告市场引擎——pay per click(点击付费广告),每天都有价值10亿美元以上的在线广告通过这一算法投放到最合适的观众面前。

在商业语境下,算法就是一组反映了产品逻辑和市场机制的计算指令的集合。完成了商业场景的数据化之后,算法就是提炼数据价值的思路,而DT时代的数据价值就是商业价值。如同谷歌正在做的,我们每个人打开过的那些商品的页面、网购的某件商品,都无疑是数据的“金矿”,但只有当在线广告的算法引擎从中挖掘出每件商品的潜在买家,并据此投放广告时,这座数据金矿的价值才真正被开发出来。

算法看似高精尖,但实际上,算法在我们的日常生活中早已无所不在。不仅是手机和汽车,在房子里、电器里、玩具里都藏有算法。现在的银行是错综复杂、规模巨大的算法聚合,只是当中会有人时不时地微调一下罢了。世界上主要的股票、期货市场,看似有无数的交易员以各种手势不知疲倦地报价买卖,但真正“ 不知疲倦”地记录各种数据,做出空单或者多单决策的同样是算法,而交易员常常只是算法决策的执行者。算法制定飞机航程,然后把飞机开走;算法管理厂房,进行贸易,控制货物流通,兑现利润,甚至做账。

Polyphonic(一家针对音乐和唱片公司的技术研发公司)开发的算法用数学函数解构歌曲的曲调、节奏、和弦进程、声音饱满度等指标,来预测一首新歌能否流行。有一个名不见经传的歌手的新专辑,据算法分析,该专辑14首歌中有9首能登上流行排行榜,连写这个算法的工程师都觉得难以置信。这张名为《跟我远走高飞》(Come Away with Me)的专辑最终热销2000万张,那名叫诺拉·琼斯(Norah Jones)的歌手当年获得5项格莱美奖。

设计一套算法并非易事,工程师需要以机器可读的语言编写,然后进行千丝万缕的测试,找到复杂编码中的每一个问题。久而久之,计算机工程师研发了无数个互相关联、互相依赖的算法,形成了编码的生态系统。然而这套生态系统中的复杂程度日增,系统中的小问题也会迅速蔓延。算法与算法之间的相互作用,乃至算法本身,其复杂程度开始胜过人类的脑容量。不夸张地说,如果有一天一切算法都骤然失灵,那世界即便谈不上毁灭,也会了无生趣。

算法是什么?让我们回到这个基础问题上。算法是按照设定程序运行以获得理想结果的一套指令。

人类可见的最早算法来自两河流域的苏美尔人,他们留下的一块距今4600年的泥板上刻着一段文字,写的是利用小型称量工具,在人数不定的一群人中平均分配几千公斤谷物可重复使用的方法。计算机的发明使算法的功能被极大提升,因为在做重复性工作时,计算机显然更具优势,而人们要做的是运用计算机语言将众多极为简单的指令组成非常复杂的逻辑推理链条。譬如,做蛋糕的时候该加一小勺白糖,人可以执行,计算机可不行,它首先必须知道白糖是什么;其次,“ 一小勺”的量不够精确;最后,计算机也不知道怎么“加”,从如何拿起勺子到如何移动勺子再到如何把勺子里的白糖倒到碗里,计算机都需要明确的指示才能执行。可见,算法是一种严苛的标准。

不过,随着算法对我们日常生活的渗入,一个小错误就可以击垮整个系统,导致火箭陨落、电网崩溃、市场坍塌,前两者我们或许还没见到实例,但是因为算法的一个小错误引发连锁反应导致市场崩盘的惨剧确实发生过。2010年5月6日,美国股市就曾因为计算机算法停止竞价,导致股价大幅下跌,市场崩溃,这种情况被人们称为“闪电崩盘”。

那么怎样避免这样的情形再次发生?怎样让算法越来越聪明?怎样让算法超越人类既有经验,创造出前所未有的价值?这些领域都有巨大的发展空间。

算法是“机器学习”的核心——笨机器用笨办法,靠着算法的持续迭代优化,变得越来越聪明。即便是一个非常粗糙的算法模型,也可以在实时在线、全本记录的数据中,通过没有预判和方向的数据探索,来发现那些广泛潜伏但我们无从察觉的关系结构,并持续优化。

这是算法的又一次决定性的跃升。[2] 也是在这次跃升中,数据对算法的巨大作用被充分显现出来。任何一个算法模型,尤其是能够自我学习、自我优化的算法模型,比如股票市场分析模型或者巧克力爱好者口味偏好模型,都承担着在成千上万个可能的因素中寻找出所隐藏着的联系的艰巨任务。这些可能因素中有些具有决定性的价值,有些却是彻底的“噪声”,而且,它们还在实时发生着变化。

所以算法真正要准确地预测股价,或是猜对某种朗姆酒口味巧克力的受欢迎程度,就必须通过分析海量数据来实现,必须在实时更新的数据中快速迭代优化。

机器学习的原材料是数据,数据越多越好。并且机器学习能够克服各种复杂情况,只要数据足够丰富,简单的学习算法可以轻松编写百万行长的新算法,工程师的工作轻松多了。工业革命使得体力劳动自动化,信息革命使得脑力劳动自动化,而机器学习使得自动化过程本身自动化。战胜围棋本身并没有什么商业价值,但它带来了算法的突破,而这种突破肯定可以被应用到不同的商业场景中。

数据时代的智能商业对算法提出了全新的要求:算法的迭代方向、参数工程等,都必须与商业逻辑、机制设计,甚至价值观融合为一。当算法迭代优化时,决定其方向的不仅是数据和机器本身的特性,更包含了我们对商业本质的理解、对人性的洞察和对创造未来商业新样貌的理想。

这就是我们将算法称为智能商业的“引擎”而非“工具”的关键理由,它是智能的核心。基于数据和算法,完成“机器学习”,实现“人工智能”。第三次工业革命发展到今天,计算方法已经产生了从量变到质变的飞跃,可以说是数据时代最根本的特征。

产品化:数据智能和商业场景的最终载体

其实,人工智能只是人类的一个工具。智能商业的核心特征就是能主动地了解用户,通过学习不断提升用户体验。而真正把用户、数据和算法创造性地连接起来的是“产品”,这也是互联网时代特别强调产品重要性的根本原因。

产品和数据、算法的互补作用可以形象地比喻成“端+云”。“端”就是产品,是与用户完成个性化、实时、海量、低成本互动的端口,它不仅直接完成用户体验,同时使数据记录和用户反馈闭环得以发生,和“云”互动;而“云”则是数据聚合、算法计算的平台,它通过算法优化,更好地揣摩用户需求、提升用户体验。作为“端”的产品,具备以下三大关键作用。

产品设计直接影响用户体验

产品的功能是否齐全、界面是否友好以及交换是否自然,都是产品能否取得成功的关键因素。苹果公司这10年的成功,特别是iPhone的跨时代意义,充分显示了这一点;谷歌也是如此,超简洁的搜索框一经问世就立刻俘获了所有用户的心,人们的口口相传,为其带来了早期的高速发展。

上传:将“端”的行为数据向“云”反馈产品是用户通过行为数据向“云”上的数据智能进行反馈、实现数据增值和算法优化的通道。用户的真实需求常常是无法直接加以表达的,但是他们的行为不会骗人。用户的每一次行为都成为一次数据反馈,算法在这样一次次的反馈中敏捷迭代,一次次更加接近用户的真实需求。

下达:将“云”的数据智能传递到“端”产品是将“云”上的数据智能传递给用户、为用户带来价值的通道。事实上,在智能商业的“云”和“端”之间,客户的产品体验绝不仅仅来自端上的UI(用户界面)互动,而更多地决定于“云”上的数据智能。

例如,用户在淘宝的体验不仅是搜索是否好用、类目是否合理、导航是否有效等,更重要的是用户能否高效地从几十亿件商品、千万级卖家中快速找到自己需要的商品,甚至还有惊喜,而这取决于“云”上的数据智能。不通过数据和产品的紧密融合,不通过“云”上的数据智能实时发挥作用,真正意义上的客户体验持续提升是根本无法想象的,就好像我们根本无法想象传统的金融服务能在几秒钟内完成对客户的贷款一样。

上传下达,双“管”齐下,数据闭环靠产品互动实现,而产品体验依赖于数据智能,数据和产品合二为一。一切的数据智能体系,都必须最终融合在功效直接、交互友好、价值明确的互联网产品上,其智能的价值才能真正体现出来。

万物互联之“广”和数据智能之“深”,其价值都集中体现在互联网产品上。通过创造性的产品设计,既把数据智能的价值不折不扣地传递给用户,又使用户低成本、高频度地进行反馈,从而使数据智能持续提升。实际上,这里所说的“产品”已不止于“端”的概念,从更广泛的意义上说,互联网产品是一种包含了“云”的智能和“端”的体验的完整互联网服务,它是数据智能和商业场景紧密融合的最终载体,也必将取代营销,成为商业运营的关键。

因此,智能商业的成功,最关键的一步往往是一个极富想象力的创新产品:针对某个用户问题,定义了全新的用户体验方式,同时启动了数据智能的引擎,持续提升用户体验。这样的智能商业才是对传统商业的颠覆,才能真正实现降维攻击,胜者一骑绝尘,败者万劫不复。谷歌超越雅虎、脸书超越MySpace(一个社交网站)、优步颠覆出租车行业等,莫不如此。

数据化、算法化加上产品化构成了智能商业的三大基石。例如谷歌,其搜索引擎的三大核心,一是网页内容的数据化,二是基于PageRank的算法引擎,三是谷歌巨大的产品创新——极为简洁的搜索框和基于相关性排序的结果页。然而这还不够,要让智能商业一天比一天更聪明,还有一样东西不可或缺——反馈闭环。

用户行为通过产品的“端”实时反馈到数据智能的“云”上,“云”上的优化结果又通过“端”实时提升用户体验。在这样的反馈闭环中,数据既是高速流动的介质,又持续增值;算法既是推动反馈闭环运转的引擎,又持续优化;产品既是反馈闭环的载体,又持续改进功能,在为用户提供更好的产品体验的同时,也促使数据反馈更低成本、高效率地发生。

一言以蔽之,数据化、算法化和产品化就是在反馈闭环中完成了智能商业的“ 三位一体”的。智能交通体系是另一个例子。以无人驾驶汽车为代表的整体智能交通体系已经不是科幻,谷歌首次实现了根据路况数据设计路线,本质上就是将关于路线选择的算法在线了,而今天在美国,无人驾驶汽车已经上路试验,就是汽车这个“端”的全面智能化。

在中国,阿里巴巴最新的实践则是交通“云”的全面智能化。依据各方面交通数据的整体打通,预测未来一小时里的每一个路口可能的交通状况,进而对接城市交通指挥系统,有的放矢。在北京这样复杂的路况下,此套体系的预测准确率超过95%。其中,数据化、算法迭代和产品同样在反馈闭环中实现了三位一体。

智能交通体系首先以一连串事物的数据化为前提,包括地理位置的数据化、车况的数据化、天气的数据化,以及红绿灯、分道线、行人的数据化等;其次,它还是算法实时优化的结果——不仅是车况本身的优化,更是整体智能交通体系的优化;再次,它当然离不开从汽车到红绿灯等种种产品的智能化;最后,它更是众多数据反馈闭环的集合体——路况数据使车辆实时优化行车路线,周遭环境数据使车辆实时决定行驶速度,乘客身体状况的数据使车辆实时调整车窗开合。

本质上,商业从一开始就是基于某种反馈闭环的,从而了解客户所需,提供相应的产品或服务。然而,不论是发挥商业天分猜测客户需求,还是通过市场调查听取客户需求,都始终失之于准确、困之于成本。不过,到今天,当客户可以通过全本实时的数据把他们的需求直接告诉商家时,当商家可以凭借敏捷迭代的算法引擎精确满足客户的需求时,当产品借助互联网的巨大能量成为数据智能和用户实时互动的端口时,我们终于可以说,我们找到了促使这个反馈闭环成本更低、效率更高,甚至自动运转的颠覆性工具。它可以被视作数据智能的“永动机”,只要有在线的互动,有数据的反馈,这台机器就永不停歇地学习,实时敏捷地进行优化。

数据、算法、产品在反馈闭环中“三位一体”,唯有如此,智能商业才能完成对传统商业的降维打击,DT时代的商业跃升才有发力点。

活数据:让反馈成为闭环

我们之所以花费大量精力去了解、分析有关商业智能的知识和案例,绝非单纯为了满足我们的好奇心和求知欲。将这些理念同我们自身的工作和事业相连接,让自己能够赢在起跑线上,才是我们最终的目的。所以,如果这些理念不能平稳地着陆与实现,一切就都只是纸上谈兵,毫无价值。

因此,如何才能帮助一个企业在数据方面取得足够的成功?怎样利用数据智能真正把自己的企业变成一个精准商业的模型?类似这样的问题才应是我们关注的焦点。这里我们就将重点介绍一个在实操方面很有价值的新概念——活数据。

大数据是近年来我们经常听到的一个概念,它的特征是:大量、多样、快速、高质量。但我们会发现,这4个词只是在描述两个事实——数据的“大”与“快”,这些并不能帮助我们更好地进行商业决策。难道我们对数据的需求仅仅停留在“大”与“快”这两个方面吗?我们到底应该怎样去使用它呢?

想要让数据与现实生活无缝衔接,就需要数据在线,实时记录而不是主动采集;要不断更新,随时可用来产生洞察;需要在实际业务场景中被灵活使用,驱动下一个决策的产生。这个概念我称为“活数据”。

“活”的两层含义

这里提到的“活”字,有以下两层含义。

1.数据是“活”的

“活数据”一定是始终在线且不断更新的,可以随时被使用。

2.数据需要被灵活使用

“活数据”在不断地被消化、处理,产生增值服务,同时又能产生更多的数据,形成数据回流。

“活数据”的三大重要特征

了解了“活”字的具体含义之后,我们再来看看“活数据”的三大重要特征。

1.全本记录,而非样本抽查

虽然按照统计学的方法,一个随机样本也可以在相当程度上推导出全局的特征,但商业的环境是动态的,始终处于不断变化的过程之中,一个间隔很长时间才收集到的样本,充其量只能将静态的一部分描述出来,并不足以支撑商业决策的全部需求。

众所周知,在传统时代收集数据是一件极其麻烦的事情。首先得先整理出问题,随后设计合理的问卷调查,再有针对性地找人专门填问卷,这样才有可能收集到一些对商业决策有些许帮助的数据。但互联网的第一步就是连接、在线,你只要让自己的业务处于在线状态,就会得到巨大的好处。要知道,你的用户的所有行为都会在互联网上留下清晰的印迹,而将这些行为直接记录下来,就能够让你对这个用户进行全面而深刻的了解。

淘宝并不需要经常性地组织抽样调查,去询问用户对淘宝的服务是否满意。

淘宝的每一个用户在登录后,后续的所有行为都会被自动记录下来。他们看了哪些商品、在某一款商品的详情页上停留了多长时间、最后购买了何种商品,这些数据都会被自动记录下来。这种不加选择全本记录的方式,毫无疑问意味着巨大的数据记录成本。因此,今天我们谈论“活数据”的最大前提,一定是数据记录成本的大幅下降。这个前提如果无法得到满足,“活数据”的概念不谈也罢,因为它无法落地。

2.先有数据,后有洞察

传统市场调查方法的第一步是整理问题,如果你想了解一个问题,或者想测试某一个假设,你就要根据这个问题去收集相关的数据。其中最麻烦的地方在于,一旦你发现自己遗漏了一些问题,或者产生了一些新问题,这个过程就必须推倒重来,从头收集相关的数据和信息。

但是在“活数据”时代,市场调查的整个过程被颠倒了。在越来越多的人口中,可以听到这样的说法:“我们重视的是相关性,而不是因果性。”由于数据存储和计算成本足够低,我们可以把所有相关数据都记录下来,在业务的发展过程中去看哪些数据的使用能够让我们更好地进行洞察,能够帮助我们重新进行商业决策。简而言之,就是先有数据记录,再有分析和洞察。这样做的最大好处,是避免了事后出现新的需要调查的问题而被迫进行重复作业,这种传统方式所带来的成本是巨大的。

3.数据就是决策

数据就是决策。也就是说,数据智能的引擎机器要能够直接做决策,而不是传统的利用数据分析来支持人的决策。如果数据仅仅被用来支持人的决策,那便无法形成真正的闭环,不具备大规模复制推广的价值。

举个例子,如今很多企业不太理解数据工程师跟商业智能(BI)分析师的区别。其实,BI是business intelligence的缩写,也就是所谓的商业分析部门,规模稍微大一点的公司都有这个部门。BI分析师最核心的工作就是研究数据,然后将数据分析成一个个报告,支持高管做出某些商业决策。这里提到的数据其实是离线的,目的是支持决策,并非我们正在讨论的“活数据”的概念,真正的“活数据”一定要能将数据本身产生的洞察直接变成商业决策。

说到这里,让我再以淘宝为例。如果用户在淘宝上通过关键字搜寻自己想要的商品,那么他第一眼会看到什么、在第一次点击之后再给他看什么,类似这样的决策其实都是机器自主完成的。用户看到的一切其实都是机器想让他看到的,都是通过数据智能的算法自动形成的,不存在任何人为干预。

实话实说,早期我们也走了不少弯路。那时,为了帮助淘宝卖家进行数据化运营,我们的数据部门会不断地为卖家后台推送数据分析报告,然而收效甚微。

后来我们发现,数据部门推送的这些数据,不仅使用率很低,就连打开率也不高,很多淘宝卖家甚至看不懂这些数据分析报告。在得出这一结论后,我们猛然意识到,其实卖家真正需要的不是去理解这些晦涩庞杂的数据,而是让数据直接帮助他们更快更好地做出决策,让他们的运营效率产生质的飞跃。

所以,我们第一个比较成功的产品就是在卖家的后台装了一个行动按钮。只要卖家点击一下这个按钮,整个店铺的陈列展现就会被自动优化,从而带动销售额的提升。对于卖家来说,这样的操作再简单不过,只需要点击一下鼠标即可完成。这个产品其实就是淘宝的后台通过“活数据”的运营,对海量数据进行算法分析,最后智能化地帮助卖家自动优化店铺展现,实际上就是让卖家的店铺展现智能化了。如果不是依靠机器和算法,仅凭人力来完成如此庞大且快捷的决策过程,估计连爱因斯坦也无法办到。

以上三大特征结合在一起,也就形成了反馈闭环的概念。只有“活数据”,才能让整个反馈闭环顺畅运作。你跑业务的时候自然会产生数据,这些数据会被自动、全部地记录下来,然后经过算法处理直接形成决策,用以指导你的业务,并通过客户反馈不断地优化你的决策。如此一来,整个企业的业务发展就走上了反馈闭环的正向循环,也就是走上了智能商业的发展道路。

如果从“活数据”的角度来考虑商业运营的话,感受便会很不一样。现在有很多人一听到“大数据”这个词,就会觉得和自己没有太大的关系——“我就是个小公司,数据量也不大,你们讲的那一套理念跟我没有任何直接关系”。但是,如果从“活数据”的角度去思考,你会明白数据量的大小只是个相对概念。如果让数据成为你业务中的自然组成部分,让机器成为你决策中的一个环节,你的商业行为就会走入智能化的快车道。

企业智能化 = 在线化 + 自动化

谈到智能商业,相信很多人会问:到底怎样才能赶上这个智能化的浪潮?我要做些什么?其实,智能化的浪潮并不像我们想象中的那样抽象,也绝非虚无缥缈、不可落地的事情,其核心就在于你能否创新性地实现产品化,把你的核心业务流程在线化。通过这种方式,全本记录用户数据便有了实现的可能。接下来要做的事情十分简单,你只需要在那些大型互联网企业提供的算法工具包里挑一个适合你的算法即可。

产品提供反馈闭环,数据作为原料,交给算法去处理,三位一体,你的业务就变成了一个智能业务,你的商业有了数据智能这一核心引擎,你就能跑在竞争对手之前。能否做到这些,决定着未来大部分企业的生死,如今国内有很多优秀的企业已经先行一步。

下面,我想和大家分享一个案例——流利说。

“流利说”创立于2012年9月,创始团队有三个人,都是理工科技术男。“流利说”的创始地与湖畔花园(阿里巴巴创始地)仅一街之隔。成立之初,这三位理工男首先做了一个简单至极的口语练习工具。通过这个工具,“流利说”成功积累了第一批用户,并且逐步形成了自己的社群。

社群形成以后,“流利说”沉淀了很多的内容。值得一提的是,他们的内容基本上是自演的,而且他们所找的是外国人,以此来确保文字和录音的规范性。发展至今,“流利说”已经拥有超过5000万的用户群体,其中1/3是中小学生,1/3是大学生,另外的1/3则是成年人,其中以白领居多。

我与“流利说”的缘分源自一个朋友。一次偶然的机会,我和这个朋友在机场相遇。他花了15分钟为我介绍了“流利说”的案例,我听完后的第一感觉是这个案例太漂亮了!无论是时间、地点、人物还是事情,都恰到好处地演绎了数据智能的创新应用。

之后,这个朋友又和我谈起了对这个公司的看法,我当时的反应是:“这个公司应该拥有50亿美元的潜力。”朋友对于我的说法并不赞同,他认为成人教育中的口语教育是一个较小的细分市场,在这样的市场内做出一个市值50亿美元的公司几乎是天方夜谭。就此问题,我们两个人还展开了一次争论。我觉得这个案例值得深入研究。因此,我们又和团队专门为此进行了两次交流,其间我确实又学到了很多东西。

关于“流利说”,我想和大家分享以下两点感悟。

在正确的时间、正确的方向做正确的事2012年创业时期,“流利说”恰逢移动AI、云计算和大数据三大趋势的结合,所以才会有这样一个产品的诞生。试想,当时如果没有智能手机,没有麦克风语音输入,没有人工智能技术的发展……那么,语音识别甚至语音识别之后的语音语料处理,包括匹配、辨别、评测就都没有了基础。可以说“流利说”是在合适的时间找到了一个合适的切入点,撬动市场的可能性也就因此大了许多。

事实上,我们在实际生活中不难发现,大多数成功的企业,不管它们当时有意还是无意,它们的成功都暗合了很多当时的大趋势和一些基本的商业规律,这是非常重要的。所以我们在湖畔开玩笑时经常讲,校董们分享的都是失败的案例,是希望大家少踩“坑”,但是教授就必须能够研究透,能够讲明白成功背后的原因,只有这种背后的东西才能帮助大家走得远,才能最后走向真正的卓越。

企业智能化

需要学习口语时,大多数人通常都会想到找老师约课,由老师来安排课程的方向和频次,却并不知道自己要学的到底是什么。针对这个问题,“流利说”找到了一个巧妙的解决方向——数据智能,它不仅有效实现了课程的在线化,还成功将其变成了一个个性化的学习课程,有效实现了智能商业的初步闭环。

其实无论是哪个行业,只要是想做大、做强,搭上智能化的顺风车就都是殊途同归的,需要完成的事情也都是一样的。我们完全可以把“流利说”这个教育行业的案例当成一个普适性的案例来看。通过它,我总结了企业智能化的两大步骤。

1.核心业务在线化

让企业智能化,对于绝大部分企业来说,第一步往往就是实现核心业务的在线化。

“流利说”的定位并不是一个评测公司,他们所做的口语练习工具,其实就是数据和用户的入口。他们最初所做的App,实际上就是一个和用户交流的界面,是一个数据收集器。利用它,“流利说”将用户录的每一条语音都进行记录,以使其逐步演变成一个世界上最大的“中国人说英语”的口语数据库。如今,“流利说” 对于中国人自然语言识别准确率已经居全球领先水平。

由于智能手机的出现,口语学习实际上已经完成了数字化的过程,“流利说” 将更多的力量集中于软件化的攻关上,也就是将大家习以为常的行为变成一个模型,再用软件将其贯通起来。但是在更多的场合下,核心业务的在线化是你首先应当考虑的事情,也就是运用IoT技术让线下场景变成线上场景。

最简单的例子是摄像头。由于摄像头的存在,我们才可以把场景录下来。如果这个摄像头是孤立的,那么它并没有多大的价值;但如果这个摄像头是联网的,那么它记录下来的视频就能够快速地在互联网上传播,价值得到了成倍的提升;如果这个摄像头后面还接了一个智能引擎,那它就能够进行人脸识别和ID(身份标识)匹配。

举个例子,如果将一个线下实体店和淘宝或者微信的数据打通,就能够轻松知道一个人在淘宝上的ID或者微信号是什么,可以将线下的独立个体转化成线上可以识别的人,这就是数字化的过程。这中间有硬件、互联网和算法的相互作用,但其核心是把一个线下的场景映射到一个在线的场景中。通过数字化和软件化两大步骤,将传统的服务搬到线上,这是企业智能化的第一步。

2.业务环节自动化

实现核心业务在线化之后,接下来要做的第二步是完成自动化的过程。对于“ 流利说”而言,也就是将学口语变成一个非常简单的自动化过程。你的录音都会得到系统的反馈,你可以针对反馈不断提升自己的口语水平,也可以随时调整课程的进度,这其实就是机器人AI老师的概念。它是用机器决策取代了传统的老师反馈和课程改进,而这个过程需要的就是前文提到的数字化和软件化。

只要这两步能够顺利跑起来,不管你企业的规模,也不管你所在的领域,你就是一个互联网时代的新物种,你就能登上智能商业的快车,比别人更快演化。

2014年,“流利说”做了一个自适应的学习系统。这个系统可以把用户学习的数据输入到引擎中,引擎背后连接的是一个很大的内容库,然后把内容库中的每一个算法,穿针引线般给每个用户穿上不同的“珠子”。简单来说,就是根据用户学习的轨迹,为其创造比较个性化的学习体验。

在教育这一领域中,“流利说”可以说挑了一块最难啃的骨头。因为用户中有很大部分是成年人,要知道教育对于成年人来说并不是刚需。但“流利说”还是能够发展壮大,其中的奥妙自然不言而喻。在“AI+教育”这一领域,“流利说”有三个核心,即团队、数据和技术。其实用户是不直接消费数据和技术的,他们消费的是产品。所以就需要产品能够为用户提供足够好的体验,能够切实解决用户的问题,为用户创造价值。教育本身很重要的一点就是内容,内容不是冰冷的死物,“ 流利说”通过算法和机器引擎让内容“活”了起来,变成了一个标准化产品。

所谓企业智能化,简单而言就是“能学习的决策机器”,不但能够做决策,就连决策的效率和效果也可以通过学习的闭环不断进行优化改进,这当然需要数据和算法的支撑。我们可以看到,在“流利说”这个场景下,三位创始人从创业之初便对数据有着较为深刻的理解,将一款移动产品变为了数据输入的极佳入口,运用算法为输入的口语进行识别、打分和反馈。与此同时,还让产品保持快速的迭代优化,不断提升用户体验,从而取得了今天的成绩。

不可否认,“流利说”的成功有着特定的天时地利因素,但绝非无法复制。在某个特定的业务场景下,通过在线化和自动化形成智能商业的初步闭环,这是接下来最值得大家去研究的事情。


  1. 这个看似非常简单的问题,只能用机器学习的方法解决,而且这个“解决” 不是事先确定解决方案,而要看不同场景下调用哪个数据的效果更好。
  2. 算法的突破往往依靠数学的发展。

上一页   |   返回目录   |   下一页

类似书籍

鞋狗
鞋狗
轻公司
轻公司
关于商业,你所知道的都是陷阱
关于商业,你所知道的都是陷阱
卡耐基经商之道
卡耐基经商之道
金字塔原理:思考、表达和解决问题的逻辑
金字塔原理:思考、表达和解决问题的逻辑
精进:如何成为一个很厉害的人
精进:如何成为一个很厉害的人
Author:

标签: 暂无
最后更新:2022-05-21
< 上一篇
下一篇 >

本书评论

取消回复

©2021 安居多伦多 - 版权所有

本站由 好事来 Hostlike.com 提供技术支持。