数据平台的诱惑


 2015-04-28 16:47:25       763

“一个企业的大数据应用的好,一定要做好两点:第一、业务模式和技术模式要匹配,第二、管理模式要和技术模式匹配。多数企业的大数据应用星星点火,将大数据作为一个技术工具进行考虑,这是一个很大的误区”——中粮置地研策部总监张岩

正文:在大数据的诱惑下,不少机构和公司纷纷组建自己的数据平台,满足市场和顾客的需求,同时亦面临各种挑战。

以国内某知名医院为例,该医院在疾病分析上希望采用大数据的分析,以期了解病人发病的原因,优化症状背后的治疗方案等。但是由于医疗机构本身诸多问题,包括医疗器械的数据采用问题、各部门的数据共享问题、以及对于数据的分析还不够成熟,故无法进行更深入的应用。而另一家中医院采用大数据对中医治疗方子进行分析,由于中医本身无标准化诊断、医生本身对于疾病的认识不同,很难形成规范的治疗方案。

在某种程度上,构建数据平台本身的挑战,更多来源于如何在数据平台上,进行业务和技术很好结合。很多人熟悉朝阳大悦城的大数据案例,作为操盘手的中粮置地研策部总监张岩是一个懂商业和技术的复合CIO。他认为,CIO必须了解商业,才能解读数据背后的含义。在这个前提下才能构建一个能发挥价值的数据平台。“一个企业的大数据应用的好,一定要做好两点:第一、业务模式和技术模式要匹配,第二、管理模式要和技术模式匹配。”他表示,“多数企业的大数据应用星星点火,将大数据作为一个技术工具进行考虑,这是一个很大的误区”。

构建大数据战略

大悦城被广泛传播的典型案例是,朝阳大悦城在今年三八节发起“你休假,我发薪”的活动,通过微博、微信等新媒体方式,向北京的女白领发出,在三八节当天到朝阳大悦城放松半天的邀请,朝阳大悦城将支付女白领们休假半天(按照北京平均半天的工资标准计算)所损失的工资。活动引起了众多女性白领的热情参与和转发。这次活动有过万人次参与,其中微博3000多人,微信6000多人。 在这次活动中转发量最多的前20名女孩领到了半天工资,在朝阳大悦城公开的照片中,有的女孩又惊喜又兴奋;有的女孩拿着工资乐开了怀。朝阳大悦城在这个活动中,仅仅投入3000元,但是这个活动效果却非常显著,在三八节那天,大悦城和平常相比,客流量增长50%,销售额增长将近70%。

“在三八节之前我们对数据进行分析发现,有很多的年轻白领在微博微信上非常活跃,传播力非常强。”张岩表示“但是对比大悦城的消费数据后发现,这部分人群每一笔的消费额度不太高,但是到店频率非常高”。IT团队通过数据分析的结论是,这是企业里刚刚参加工作的年轻女孩,非常希望在三八节这一天放假,但是工作压力很大,很多公司不放假。为此他们策划了这个营销活动,带来很好的传播效应。 

张岩认为,推行以大数据战略非常重要,大悦城从三个层面构建大数据的应用:第一个层面是,首先确立大数据的应用战略,抛掉技术概念,首先从商业的基础层面研究购物中心的商业模式,购物中心的商业模式是由大悦城、品牌商、消费者三者组成。大悦城与品牌商之间是租赁者和商铺的关系,而大悦城与消费者之间是品牌营销关系,消费者与品牌商之间是购买关系。从这一业务模型推导到技术层面看,大悦城面向品牌商时,大悦城需要判断品牌商的价值和层级;大悦城面向消费者时,大悦城需要研究消费者的消费客群和行为。同时大悦城关注品牌商与消费者的关系,大悦城还需要对消费者的消费行为进行分析。在这个前提下,大悦城进行大数据应用是水到渠成的需求。

在第二个层面上,大悦城在商业逻辑下构建了一个完整的分析体系。一个商铺的销售主要受以上三个因素的影响—— 一个商铺的销售额=客流量×转化率×客单价,接下来需要将三个因素逐层进行分解,比如要研究客流量,需要研究车流系统、POS系统、MIS管理系统等数据,大悦城据此分析是受品牌吸引力不够的影响,还是没上新货的影响、或受推广活动影响等因素影响。并且还会对这些影响因素划分权重,如果受品牌吸引力的影响,应该由招商部门负责改进;如果受货品影响,应该由运营部门负责改进,如果受到推广活动的影响,那么应该由市场部门负责改进。

最后,在第三个层面上,大悦城会对商户和消费者的的价值进行细化分析,通过对商户的价值分析,可以获知一个商户属于什么级别。而通过对消费者进行价值分析,可以将消费者分成若干类别,比如是销售贡献型,还是传播贡献型。通过以上三层的分析架构,大悦城可以对整体的市场活动提供很好的支撑。

给用户需要的数据产品

淘宝迂回构建数据平台的方式亦印象深刻,值得企业借鉴。淘宝的数据团队并不为内部的业务部门提供数据服务,而是为需要数据的卖家等外部用户提供产品化的数据服务,他们希望提供一些方便的可视化数据产品,让用户自己去发现商业的规律。

他们在构建数据平台的过程中,遇到的挑战在于如何梳理数据,以及如何为数据平台构建一个清晰有逻辑的数据架构。淘宝拥有国内电子商务最大的交易数据量,在淘宝所有数据里,有超过50%的数据属于非结构化/半结构化的数据。在构建数据软件平台中,他们面临最棘手的数据处理和整合的问题。因为淘宝具有多样化的数据内容,包括日志型数据、文本型数据、关系型数据;并且数据来源也很广泛包括有商品维度、卖家维度、买家维度,同时这些数据分布在不同的数据库中。淘宝的数据团队首先将原始数据进行规范化处理,将大多数非结构化的数据尽量转为结构化数据,比如将用户行为这一非结构化数据进行结构化数据处理。这些工作量非常庞大;同时淘宝需要确立数据存储规则,将所有数据保留下来。

同时,为了构建一个合理的数据平台,淘宝确立了一个严密的数据商业逻辑,数据团队创造一种树形方式对数据进行梳理。所有数据都基于这棵“树”进行组织,并以“树”的方式展示给用户,用户获取数据的方式就像从一颗树的高处到末端根系,获得商品的从行业、类目、品牌、产品,到属性、店铺、商品等所有完整的信息。淘宝在数据平台上的做法打破常规做法。过去企业经常会将数据放置在不同的数据库中,最终呈现给用户的是没有商业逻辑的不完整的数据。这种做法将分布在不同数据库中的数据关联起来,让数据变得更加聪明。

2010年3月28日,他们推出淘宝第一个基于全量数据的数据产品——“数据魔方”,卖家可以查询行业宏观情况、品牌的市场状况、消费者行为等数据。2012年4月18日,数据团队又推出第二款产品 ——“淘宝指数”,这款产品进一步延展了淘宝生态圈的用户群,卖家、第三方研究机构、媒体机构都可以免费使用这款产品。 

淘宝数据团队在构建数据平台中面临不少挑战:在淘宝这样一个巨量交易平台上,满足用户的数据请求和处理,是非常具有挑战性的工作,淘宝需要为用户呈现商品和店铺信息的实时变化情况,在技术上进行数据的实时和循环计算,并满足高并发的查询,以及在用户网络环境有限情况下数据请求的问题,这些问题是在传统数据平台非常罕见的问题。

综上所述,玩转数据平台的企业,都是真正理解商业的团队在操盘此事,他们根据商业逻辑,抽丝剥茧,逐步构建这一平台很好的支撑业务的发展。

相关阅读: