从《向商业分析要效益——百家号创号开篇词》里,我们谈到了数据是企业经营中可利用的三大要素之一。然而数据本身往往是没有什么直接价值的——也就是说,数据需经过加工处理,产生某种对企业有价值的信息或知识才有意义。对企业而言,真正感兴趣的是怎样才能从“数据”转变成“信息”和“知识”。此外,对于“数字化”这样宏观又比较抽象的概念,企业在落地数字化转型时到底该聚焦何处?本篇文章里,我将从商业分析的“体”和“用”,试做一番论述,帮助读者溯流从源。
一般而言,数据一旦被保存下来,就可以提供两个基本的功用。一个是“可追踪”,一个是“可处理”。可追踪使我们能够建立一套监测系统,用于判断并确认商业过程是否符合我们的期望。可处理使我们能够建立一套分析系统,用于从商业过程中提炼出有价值的信息和知识。
不过真正要实现这两套系统,通常并不容易,并且建立的过程还有一些门道需要注意。首先一个容易意识到的重要问题是数据质量。很容易理解,数据如果有错误或者缺失,那么它的利用价值就低,甚至完全无法利用。比如某家企业通过调查收集,整理了一份优质意向客户清单。如果这份清单里关于客户的重要基本信息都是正确且齐全的,这份清单的价值不言而喻。但如果这些信息不全甚至有错误呢?它的价值立即形同鸡肋。另一个稍微隐晦的关于数据质量的例子和数据效度(Validity)有关。假设某家企业有一个业务,从初次接洽潜在客户到最终成交,需要经历若干次邀约交流。公司的销售人员会在公司的销售系统帮助下,最终实现签单。为了更好地总结出一套高效的成交流程,经公司的管理层研究讨论,最终决定将业务过程中关键节点部分记录下来。它运行了一段时间,形成了若干数据记录。这段业务数据记录看起来可能像这样。
图1销售员邀约客户记录假设公司利用这样一份数据,经过分析挖掘,发现邀约3次以上的客户,其成交率达到了65%,而与之形成鲜明对比的是,邀约不到3次的客户成交率只有30%。所以公司要求销售总监组织销售精英,将邀约3次以上的案例整理出一份标准执行过程SOP,供销售团队全体成员遵守执行。显然公司的目的是为了提升企业销售效率,这样做似乎也很好地对商业分析中“领域知识”、“数据”这两个要素进行了运用。但是有业务经验的朋友,可能会提出这样的现实问题:有的同事因为社交网络强大,他谈的订单,实际上一次邀约也不需要。关系较好的客户往往会很爽快地马上签单。而之所以还会邀约客户,完全只是请已经决定签单的客户来公司走两到三次过场。而实际上没有这样销售网络资源的同事,他通常需要邀约至少6次才能实现签单。这才是真实的经邀约后实现签单的销售情况。另一方面,对成交签单无望的同事,因为心灰意懒,也就通常努力2-3次邀约后,就放弃了对潜在客户的进一步攻势。现在公司想通过SOP为销售团队提供一套销售过程标准参考,初衷是好的。但是对于想实现成交的销售同事而言,更希望能够掌握每次邀约客户时,销售人员应该做到哪些关键动作,才能真正促成交易。而缺乏销售经验的同事,可能就对该隐藏问题毫无觉察。换言之,就是企业收集的数据是否真的有用,是否真的能够反映问题实质。数据质量本身就是一个庞大的话题,它包括了:数据一致性、信度、效度、冗余度、噪声等各种内容,并且已经有“数据治理”这样的专业专门来处理有关问题。在后面的文章里,我们还会探讨它。
搭建数据监测和处理系统时,第二个重要的基础性问题是关于数据采集。数据采集是一个大难题,直到今天也是这样。对一个商业过程,我们希望能够把该过程中一些重要的,能反映商业本质的指标如实地保存下来,供我们监测和处理分析使用。但遗憾的是,对于现实中的具体商业模式,我们可利用的收集手段还比较有限。比如一些企业的管理者,很可能思考过怎样把优秀销售人员的销售过程记录下来,以便事后分析为什么该销售员能如此成功,期望从中找出一些既有共性,又紧贴公司具体业务环境的“最佳实践”动作。但这样的愿望目前只能打折扣。比如国内已经有一些帮助销售团队进行管理和优化的SaaS软件,主要作用是帮助管理者建立一个从商机收集到最终成交签单的销售漏斗,从每个环节的漏斗绩效指标出发,优化销售流程。但是一些关键细节,如销售员的拓客、签单等技巧则无法追踪,只能靠人与人之间的交流获取。不过情况也在逐渐变化。由于互联网技术早已深入人心,很多业务的履行模式已经可以逐渐线上化,这给业务数据的收集带来了新的可能。因为互联网业务与传统线下业务的本质区别,就在于前者可以将用户行为记录下来。这个叫做“网络日志”的东西,是使互联网企业独领风骚的真正缘由。让我们用电商行业,和更为传统的线下零售业做一个简单对比,就能对此有一个深刻而又直观的理解。为什么在零售领域,电商在过去20年里从一个新生儿,一骑绝尘,成长为今天的独角兽?很明显它有一个传统零售无法企及的能力:记录用户行为。至于像其它什么电商具有长尾特征,可以24小时经营,给顾客一种新的消费体验等等理由,不过是锦上添花的说辞。一个用户从登录电商网站开始,其点击、浏览、购买(购物车)、支付等一系列动作都会被网站记录下来。这些数据经过处理和分析,可以勾画出这名用户的完整消费路径。比如电商企业可以发现一名顾客在挑选一件商品时,反复犹豫,但最终还是在三天后把它加入到购物车,并痛快地付了钱。当众多这样的用户消费路径汇集后,一个生动又复杂的消费市场就展现在电商企业面前。企业既有动机又有能力对这些从日志数据中分析出来的信息和知识进行研究和利用,于是它可以做得越来越好——可以策划更有吸引力的活动,销售用户更青睐的产品,等等。运营迭代呈现了正反馈。相比之下,传统线下零售商与顾客面对面接触的时间,只有可怜巴巴的几秒钟到几十分钟。这么短的时间里,想要了解一名顾客细微的购物需求实际上难度很大。而且当顾客离开后,零售商也就几乎完全失去了对顾客的影响。所以以前,稍有点零售能力的店铺,都很依赖有经验的销售员/导购员,因为企业寄希望于这些富有经验的导购员,在与顾客接触的短暂时间里,尽量现场说服顾客,诱导其付钱买下商品。可是顾客显然不喜欢这样,也并不是每个走进商店的顾客都想马上拿下某件商品。他也许只是想了解下,了解清楚后再考虑要不要买。所以可以说在细粒度的水平上,传统零售企业真正影响顾客的能力是受限的。而且即使有时做出了正确的反应,也往往是慢半拍。时间拉回到当下,这对当前从事传统行业的企业有什么启示呢?我的一个提议就是:想方设法把企业的业务过程记录下来,办法是通过构建一个线上的产品,就像电商企业需要一个网店那样。目前只有互联网行业有完整的技术和方法记录用户行为数据。所以只要把你的业务像互联网产品那样在线处理你就达到目标了,因为你的真实目的是收集业务过程数据。今天,随着5G、物联网等技术不断接近落地,企业收集数据的手段确实越来越多,因为传感器、网络技术、移动设备能够使你做到以前不可想象的事。但这不意味着任何业务模式都有实际办法收集到想要的数据,想一想前面我们举例的销售员执行业务过程的那个例子。所以你需要考虑怎样设计企业的业务流程,使得在这个流程里,恰好能够在某个环节,收集对你而言有价值的数据。
当然,现在想收集数据的企业实际是越来越多,而整个社会对数据隐私的保护意识也在同步增强。这是一个好事。企业应该考虑收集对自己有价值的数据,这句话的意思并不是说企业可以随心所欲收集数据。在这个问题上,有责任和远见的企业应当恪守自己的社会伦理责任。整个社会也应该共同探讨怎样保护个人和企业数据隐私。数据隐私同样是一个极大的话题,涉及到法律等商业分析之外的领域,这些领域并非我们这些非法律、社会专业人士仅凭自己的经验就可以说得清楚。我们只能在适当的时机再次探讨相关话题,但请大家务必认识到,数据隐私应当被保护,而不是滥用。
收集好数据,并经过一些处理,使数据质量达到要求后,我们就可以搭建一些分析系统,试着从业务数据中挖掘点什么了。这个环节通常可能是建立一些模型,然后将数据输入这些模型,看看得出什么有价值的结论。如果没有什么发现,要么再换一批数据看看,要么换个模型继续探索。一些算法可能会在这个阶段亮相。有些读者可能对其津津乐道,但其实算法并不是必须的。从最简单的四则运算,到复杂的令人眼花缭乱的算法模型,每种选择都有可能。选择的标准取决于我们的目的。笼统地讲,即看企业的目的是监测,还是洞察。如果是为了监测,那么企业通常需要的是建立一套报表、仪表板系统,也就是今天人们相对更熟悉的BI。虽然商业智能(BI)这个词原本的内涵远不止这么单一,但是当前实践中的此类系统,大都重点是对各维度的数据进行聚合计算,具体地说就是做四则运算——比如求和,稍微复杂点的,会涉及到一些统计量数的运用,比如平均值,中位数什么的,以方便追踪、监测业务指标。看到这里,有些使用过某类BI系统的读者可能心存一些困惑,认为BI不过是名不副实的花哨玩意,所谓的分析只是提供了一堆自己原本就知道的东西,或者产出的一堆数据结论在实际业务中没什么用。这种情况的确是事实,但症结并非在于BI“无能”,而是使用的方法有问题。
如果要用于监测,企业在搭建BI系统之前,应当首先建立一套描述当前业务特征的指标体系。这些指标应当如实地反映当前业务的核心目标,从战略层到具体运营层,它就像一棵树,可以逐层分解,并相互支撑。人们已经为如何提炼出一套有效的指标体系,总结出了多种方法框架。比如AARRR模型,漏斗模型,金字塔模型,影响图等等。这些方法框架,结合行业和企业独特的领域知识,形成了很有针对性的阶段性指标体系。
而有了这样一套指标体系,加上BI系统也还不够。因为对于指标,还有一个重要的准备工作是需要制定判断指标是否异常的标准,即阈值。如果接触过质量控制(QC)的读者,可能很熟悉SPC这一工具。对制造业这种追求工艺和良率稳定的行业来说,SPC是非常重要的工具。但是SPC的方法对于其它行业,尤其是面对充满变数的一般商业企业来说,并不适合。所以怎样为一些重要的指标设定阈值?一般来说有三种方法,一是靠人为经验主观设定;二是借鉴足够长一段时间内指标的具体表现来人为设定;三是通过商业分析。让我举一个例子来说明。
每家企业总会有销售指标可以追踪监测,比如每天的订单量或订单额。通常情况下,这类指标都会有一个正常的波动。假设一家企业的管理层在研究每月的订单量,如果看到目前为止,之前的个别月订单量看起来有些偏低。而截止到当前,订单总量距离年底计划目标确实还有一定差距时,为了避免年底计划目标失败,管理层将需要怎么做?这在很多企业都是常见的工作决策场景。不少企业的做法是为了确保年底目标达标,避免节外生枝,从现在开始就进行主动干预。比如经管理层成员反复讨论,开始设计新的销售刺激计划,向客户传递新的优惠*策。这样做是否真的解决问题呢?未必。而且由于主动进行了干预,可能对原有的销售成果带来了伤害,企业还不得不安排销售员向一些客户做出解释。这些都是实际上降低企业效率的做法。假如企业准备好了指标体系、BI系统,对指标的阈值也做了合理的设定,那么在审查订单量时,就可以对订单量指标进行判断,个别月的较低表现究竟是市场正常波动的体现,还是真的发生了什么?如果是后者,管理层进行针对性研究讨论,设计主动干预的对策才是正确的。但如果是前者,主动干预就成了自我干扰,只会产生业务上的无谓消耗。阈值的设定,在商业分析中可以利用统计等相关技术进行估计,并根据实际业务的监测反馈不断调整。这样做,BI系统就不再看起来那么无用了。相反,它成了企业业务的体检仪、预警器。
到这里,让我们稍停留片刻,对前面的内容做一个简单的总结。企业根据监测或洞察的需要,可以将业务数据记录下来。因为数据一旦被保存下来,其本身就具有“可追踪”和“可处理”的特点。为了构建一套监测或洞察系统,企业必须要考虑到数据收集、数据质量、数据处理等这些环节的问题。一个相对完整的数据系统看起来是这样的。
图2企业建立数据系统要考虑哪些问题除了BI、指标这类“监测”型系统,企业在大量的决策问题上也可以得到商业分析的支持。这里有很多分析的方法可以利用。人们经过总结,把分析分成了三类,分别是:描述性分析、预测分析和规定性分析。鉴于在实践中的运用,我个人对这样的分类增加了一项,叫诊断分析。下面我分别简要介绍它们。
描述性分析(DescriptiveAnalytics),就是通常不做预先的假设,而是直接对数据进行探索分析,直到找出对企业有价值的信息和知识。统计分析就是一种经典的描述性分析。从描述性统计分析到统计推断,这些统计方法很可能挖掘出对企业有重要价值的结论。曾经有一个客户对他的网店(跨境toB)运营数据有疑虑。他担心网店转化率降低了。作为网店经营者,