大数据培训新三板挂牌机构 股票代码:837906 | EN CN
阿里巴巴菜鸟级数据产品经理半年回顾总结篇
干货教程:如何绘制业务流程图(二)
干货教程:如何绘制业务流程图(一)
技术贴:如何在数据库中秘密地查询隐私数据
攻略教程:信息图(infographic)是怎么做出来的?
分析师一定要看!用数据讲故事的五个步骤
技术篇:怎样玩转千万级别的数据?
北漂书生:大数据时代SEO数据如何搜集和分析
干货,从十大问题重新认识并读懂互联网
相似图片搜索、算法、识别的原理解析(下)
相似图片搜索、算法、识别的原理解析(上)
制作信息图时请遵循这10条原则
提高表格可读性的一些技巧,适用于Excel、PPT等数据报表
实用教程:如何让Excel图表更具“商务气质”?
一张数据信息图是这样制作完成的
菜鸟读财报,如何从上市公司财报中挖情报?
北大数据分析老鸟写给学弟们一封信
如何一步一步制作出高品质数据信息图?
总结:海量数据分析处理的十个方法
【实战经验】数据分析师如何了解老板真正想法?
零售业数据分析那些事儿
数据分析时l常用电子表格公式【大全】
用数据来告诉你 上市公司财报的秘密
这12个数据能 帮你搞定淘宝店铺
首席工程师揭秘:LinkedIn大数据后台是如何运作的?(四)
首席工程师揭秘:LinkedIn大数据后台是如何运作的?(三)
首席工程师揭秘:LinkedIn大数据后台是如何运作的?(二)
首席工程师揭秘:LinkedIn大数据后台是如何运作的?(一)
淘宝网店从激活到挽留,4步走玩转数据营销
文案怎样写才有意思、不空洞、打动人?
入门级扫盲贴:数据分析的步骤有哪些?
关系即数据,论社交媒体的关系转换
数据的力量,苹果教你用数据鄙视竞争对手
谁说文科生不能做数据分析?数据分析入行→技能提升→优势
产品运营数据分析——SPSS数据分组案例
如何追踪iPhone和iPad等移动设备的用户行为数据?
阿里巴巴中国站:用户满意度指标权重计算方法
广告中的AdNetwork、AdExchange、DSP、SSP、RTB和DMP是什么?
信息图制作教程:关于数值的表现
为什么大数据会如此轰动?(值得深度的文章)
多图技术贴:深入浅出解析大数据平台架构
面板数据分析中标准误的估计修正——根据Peterson (2009)的归纳
财务官、投资人、CIO看过来:给企业数据定价
推荐系统中常用算法 以及优点缺点对比
探索Weotta搜索引擎背后的大数据技术
如何识别虚假数据?
为什么我们像驯化小狗那样驯化算法
程序员必须知道的10大基础实用算法及其讲解
电子商务:最影响转化率的九大要素
如何迅速成为一名数据分析师?
想从事大数据、海量数据处理相关的工作,如何自学打基础?
如何用亚马逊弹性MapReduce分析大数据?
译文:机器学习算法基础知识
给hadoop新手的一封信:Hadoop入门自学及对就业的帮助
从入门到精通,我是这样学习算法的
小商家,从老客户身上获取的数据才更有意义
13页PPT讲述:大数据下网站数据分析应用
40页PPT详解:京东大数据基础构架与创新应用
67页PPT解密搜索引擎背后的大技术:知识图谱,大数据语义链接的基石
营销洞察力——10个营销度量指标
技术篇:前端数据之美如何展示?
董飞:美国大数据工程师面试攻略【PPT】
easel:如何制作好的信息图——来自专家的顶级技巧
大数据实操:以3D打印机为例,如何知道卖点有没有市场需求?
大数据建模 需要了解的九大形式
用户画像数据建模方法
从规划开始,公司or企业如何入手和实施大数据?
干货:商品信息数据分析和展现系统的设计与开发
高手教你用Excel制作百度迁徙数据地图
50篇干货:淘宝店/电子商务如何玩转数据分析?
精华索引:大数据实际应用案例50篇
验证最小化可行产品 (MVP) 的 15 种方法
干货:数据分析师的完整知识结构
大数据技术Hadoop面试题,看看你能答对多少?答案在后面
用SPSS做数据分析?先弄懂SPSS的基础知识吧
怎样做出优秀的扁平化设计风格PPT? 扁平化PPT设计手册#3
解答│做大数据过程中遇到的13个问题
40页PPT│社交网络发展的新动力:大数据与众包
以Amazon、豆瓣网为例,探索推荐引擎内部的秘密#1
怎样做出优秀的扁平化设计风格PPT?#2
怎样做出优秀的扁平化设计风格PPT?#1
36页PPT│大数据分析关键技术在腾讯的应用服务创新
如何丰满地做SWOT分析?
【35页PPT】TalkingData研发副总阎志涛:移动互联网大数据处理系统架构
27页PPT|以珍爱网为例,如何构建有业务价值的数据分析系统?
国外数据新闻资源分享
21页PPT重磅发布:Mariana——腾讯深度学习平台的进展与应用
从0到100——知乎架构变迁史
PPT解读:百度大数据质量保障方案探索
45页PPT|大数据环境下实现一个O2O通用推荐引擎的实践
从数据看豆瓣兴衰
深度学习系列:解密最接近人脑的智能学习机器——深度学习及并行化实现(四)
重磅推荐:129页PPT讲述移动时代创业黄金法则 via:腾讯企鹅智酷
重磅推荐:大数据工程师飞林沙的年终总结&算法数据的思考
OpenKN——网络大数据时代的知识计算引擎
大数据下城市计算的典型应用
技术贴:大数据告诉你,如何给微信公众号文章取标题?
你的QQ暴露了你的心——QQ大数据及其应用介绍PPT
如何从企业报表看企业的生存能力?
实用的大数据技巧合集
技术帝揭秘:充电宝是如何盗取你的个人隐私的?
重磅!50页PPT揭秘腾讯大数据平台与推荐应用架构
原创教程:饼图之复合饼图与双层饼图(1)
PPT:大数据时代的设计特点——不了解这个你做不了今天的设计
教程贴:如何用方程式写春联?
原创教程:如何用Excel制作简易动态对比图
深度译文:机器学习那些事
教程帖:数学之美——手把手教你用Excel画心(动态图)
董老师走进斯坦福,聊聊硅谷创业公司和大数据的事儿(附课件PPT下载)
【限时】年度钜献,108个大数据文档PDF开放下载
董飞专栏:大数据入门——大数据相关技术、Hadoop生态、LinkedIn内部实战
亿级用户下的新浪微博平台架构
一张图了解磁盘里的数据结构
浅析数据化设计思维在阿里系产品的应用
美团推荐算法实践
一个P2P创业公司有哪些部门,都是做什么的?
一个P2P平台的详细运营框架是怎样的?
机器学习中的算法——决策树模型组合之随机森林与GBDT
神经网络简史
58页PPT看懂互联网趋势,大数据/物联网/云计算/4G都有了
广点通背后的大数据技术秘密——大规模主题模型建模及其在腾讯业务中的应用(附PPT)
微信红包之CBA实践PPT——移动互联网海量访问系统设计
一文读懂机器学习,大数据/自然语言处理/算法全有了……
搜狐新闻客户端的背后大数据技术原理——推荐系统(PPT)
原创教程:用Excel做动态双层饼图
半小时读懂PMP私有广告交易市场
怎样分析样本调研数据(译)
PPT:支付宝背后的大数据技术——DataLab、Higo的实践及应用
大数据技术人员的工具包——开源大数据处理工具list(限时下载)
计算机视觉:随机森林算法在人体识别中的应用
24页PPT:机器学习——支持向量机SVM简介(附下载)
互联网高手教你如何搜集你想要的信息
深度:对地观测大数据处理、挑战与思考
原创教程:用Excel做饼图之复合饼图与双层饼图(2)
移动大数据时代: 无线网络的挑战与机遇(附pdf下载)
Excel使用技巧——25招必学秘技
【年度热门】加上这些 Excel 技能点,秒杀众人(多图)
原创教程:用Excel做纵向折线图
知识图谱——机器大脑中的知识库
何明科专栏:用数据化的方式解析投资条款
DT时代,如何用大数据分析创造商业价值(23页PPT)
MIT牛人梳理脉络详解宏伟现代数据体系
你的老婆是怎么算出来的?揭秘佳缘用户推荐系统
飞林沙:商品推荐算法&推荐解释
PPT:如何成为真正的数据架构师?(附下载)
开源大数据查询分析引擎现状
董飞专栏:打造数据产品必知秘籍
译文:如何做强大又漂亮的信息图
如何使用Amazon Machine Learning构建机器学习预测模型
如何运用数据协助货架管理(内附26张PPT)
SVM算法
主流大数据系统在后台的层次角色及数据流向
PPT:阿里全息大数据构建与应用
人脸识别技术大总结——Face Detection & Alignment
教程:用Excel制作成对条形图
易观智库:大数据下的用户分析及用户画像(18页PPT附下载)
技术向:如何设计企业级大数据分析平台?
电商数据分析基础指标体系
IBM SPSS Modeler 决策树之银行行销预测应用分析
拓扑数据分析与机器学习的相互促进
基于 R 语言和 SPSS 的决策树算法介绍及应用
用php做爬虫 百万级别知乎用户数据爬取与分析
另类新浪微博基本数据采集方法
以10万+阅读的文章为例 教你做微信公众号的运营数据分析
破解数据三大难题:变现?交易?隐私?
微店的大数据平台建设实践与探讨
阿里巴巴PPT:大数据基础建议及产品应用之道
基于社会媒体的预测技术
人工智能简史
技巧:演讲中怎样用数据说话
马云和小贝选谁做老公?写给非数据人的数据世界入门指南
掘金大数据产业链:上游资源+中游技术+下游应用
原创教程:手把手教你用Excel做多层折线图
销售分析:如何从数据指标发现背后的故事
如何一步步从数据产品菜鸟走到骨干数据产品
也来谈谈微博的用户画像
行走在网格之间:微博用户关系模型
如何拍出和明星一样美爆的自拍照?斯坦福大学用卷积神经网络建模告诉你
运营商如何玩转大数据? 浙江移动云计算和大数据实践(PPT附下载)
大数据分析的集中化之路 建设银行大数据应用实践PPT
腾讯防刷负责人:基于用户画像大数据的电商防刷架构
创业提案的逻辑
友盟分享 | 移动大数据平台架构思想以及实践经验
寻路推荐 豆瓣推荐系统实践之路
“小数据”的统计学
重磅!8大策略让你对抗机器学习数据集里的不均衡数据
小团队撬动大数据——当当推荐团队的机器学习实践
微博推荐架构的演进
科普文 手把手教你微信公众号数据分析
信息图制作的六个注意点
【权利的游戏】剧透新玩法:情理之中?意料之外
推荐系统(Recommender System)的技术基础
核心算法 谷歌如何从网络的大海里捞到针
Quora数据科学家和机器学习工程师是如何合作的
阿里巴巴PPT:大数据下的数据安全
数据建模那点事儿
全民拥抱Docker云–Lhotse系统经验分享
实时股票分析系统的架构与算法
架构师必看 京东咚咚架构演进
什么叫对数据敏感?怎样做数据分析?
推荐系统基础知识储备
刘德寰:数据科学的整合与细分 数据科学的七个危险趋势(视频)
实际工作中,如何做简单的数据分析?
分布式前置机器学习在威胁情报中的应用(附PPT下载)
数据科学 怎样进行大数据的入门级学习?
扛住100亿次请求 如何做一个“有把握”的春晚红包系统?(PPT下载)
从 LinkedIn 的数据处理机制学习数据架构
大数据会如何改变管理咨询公司(I)
优秀大数据GitHub项目一览
生硬的数字和数据新闻:这么近,那么远
经典大数据架构案例:酷狗音乐的大数据平台重构(长文)
揭秘中兴大数据在银行领域的系统部署
基于大数据的用户画像构建(理论篇)
【R】支持向量机模型实现
数据图处处有陷阱?五个例子教你辨真伪
如何用R绘制地图
你确定你真的懂用户画像?
数据模型需要多少训练数据?
【接地气】01 数据报表的颜色怎么配
游戏价值和数据分析新思路
【R】异常值检测
快的打车架构实践
豆瓣还是朋友圈:大数据、新方法和日常问
PPT数据图表,怎么做才好看?
大道至简的数据体系构建方法论
数据的误区及自身业务
新浪微博的用户画像是怎样构建的?
面试干货!21个必知数据科学面试题和答案part1(1-11)
易观智库:中国大数据产业生态图谱2016(附下载)
Airbnb的数据基础架构
50PB海量数据排序,谷歌是这么做的
大数据时代工程师如何应对–今日头条走进硅谷技术讲座
D3.js教学记(下)
D3.js教学记(上)
飞林沙:企业级服务公司如何赚钱?只有平台级产品才有大数据的理论
一个母婴电子商务网站的大数据平台及机器学习实践
7大板块 组成数据分析师的完整知识结构
干货:SaaS领域如何分析收入增长?
学术 | 词嵌入的类比特性有实用意义吗?
6个用好大数据的秘诀
一个数据库外行眼中的微信优化 (附专家补充)
大数据调研,如何实现快全准?
数据大师Olivier Grisel给志向高远的数据科学家的指引
数据堂肖永红:数据交易的是使用权或数据的增值,而不是数据本身(PPT附下载)
淘宝商品详情平台化思考与实践
刘译璟:百分点大数据理念和实践(图文+PPT下载)
如何快速搞定一份看起来还不错的演示文档?
【BABY夜谈大数据】决策树
数据驱动设计:数据处理流程、分析方法和实战案例
美图数据总监:Facebook的法宝,我们在产品中怎么用?
树的内核:量化树结构化数据之间的相似性
拿到用户数据之后,LinkedIn怎么赚钱?
GrowingIO张溪梦:增长黑客的核心 企业应该重视产品留存率(附PPT下载)
[译]Airbnb是如何使用数据理解用户旅行体验的?
微博推荐数据服务代理: hyper_proxy的设计和实现
星图数据谷熠:消费领域DaaS 大数据重构未来商业游戏规则(附PPT下载)
鲍忠铁:TalkingData大数据技术与应用实践(PPT下载)
【干货教材】数据分析VS业务分析需求
九枝兰专访:数字营销的核心—企业如何使用数据管理平台(DMP)进行精准营销
我们的应用系统是如何支撑千万级别用户的
R应用空间数据科学
Excel进行高级数据分析(上)
Excel进行高级数据分析(下)
国内各大互联网公司2.0版技术站点收集
网站数据分析思路导图
大数据分析报表设计开发要素
大数据需要的12个工具 推荐
YARN/MRv2 Resource Manager深入剖析—NM管理
YARN/MRv2 Resource Manager深入剖析—RMApp状态机分析
Hadoop 1.0与Hadoop 2.0资源管理方案对比
Hadoop 2.0中单点故障解决方案总结
Hadoop 2.0 (YARN)中的安全机制概述
Hadoop 新特性、改进、优化和Bug分析系列1:YARN-378
Hadoop 新特性、改进、优化和Bug分析系列2:YARN-45
Hadoop 新特性、改进、优化和Bug分析系列3:YARN-392
Hadoop版本选择探讨
探究提高Hadoop稳定性与性能的方法
《Effective C++》读书笔记(第一部分)
Hadoop分布式环境下的数据抽样
Hadoop计算能力调度器算法解析
如何编写Hadoop调度器
数据结构之红黑树
Hadoop pipes设计原理
《C++ Primer plus》学习笔记之”类”
《C++ Primer plus》学习笔记之”类继承”
《C++ Primer plus》学习笔记之”C++中的代码重用”
《C++ Primer plus》学习笔记之”异常”
《C++ Primer plus》学习笔记之”RTTI”
Hadoop pipes编程
Hadoop Streaming高级编程
《C++ Primer plus》学习笔记之”标准模板库”
《C++ Primer plus》学习笔记之”输入输出库”
Linux Shell 命令总结
算法之图搜索算法(一)
awk使用总结
素数判定算法
《C++ Primer plus》学习笔记之“函数探幽”
使用Thrift RPC编写程序
如何在Hadoop上编写MapReduce程序
怎样从10亿查询词找出出现频率最高的10个

从规划开始,公司or企业如何入手和实施大数据?

于2017-04-01由小牛君创建

分享到:


大数据

很多公司的大数据规划付之阙如,本文将告诉你如何入手和实施。

问题所在

“大数据”及高级分析带来的技术挑战与组织挑战,很容易导致企业采用成本高昂却低效的解决方法,或就此陷入。

为什么重要

数据挖掘正成为日益重要的技术优势。如果一开始的数据规划就没步上正轨,日后在竞争中很可能落于下风。

如何实施

精心制定大数据规划。好规划可推动公司战略层面的决策,如筛选关键投资和项目取舍。这样的计划应聚焦三大核心因素:

  • 收集并整合海量的新数据,以挖掘出新洞察
  • 选择先进数据分析模式以优化运营,并预测商业决策的结果
  • 创建易于使用的工具,将模型输出转化为具体的行动,并培训关键岗位的员工

大数据和高级分析带给企业的好处毋庸置疑。通过对成功案例的持续研究,我们发现一旦大数据和分析技术被深入应用,可为企业带来比竞争对手高出5到6个百分点的生产力和利润1。全新的数据驱动型业务、对运营方式的透彻了解、更精确的预测以及更快速的测试等等,的确对企业很有吸引力。

但是要实现这些目标并不容易。需要大量投入资金,以及管理层的重大承诺。首席信息官强调要彻底改造数据架构和应用。外部供应商大力推销黑盒子模型的无穷威力,宣称该模型能通过破解非结构化数据找到因果关系。业务经理则苦思冥想,坚持要一开始就知道,投入以及给组织架构形成的潜在冲击究竟能够产生多大的收益。

答案很简单,就是要扎扎实实地制定规划。根据我们的经验,大多数公司并没有花应有的时间来创建一个数据、分析、一线工具和员工如何共同创造商业价值的简单计划。该计划的作用在于提供一种通用语言,让高管、技术专家、数据科学家和部门主管能够一起讨论最大的收益来自哪里,并且选择两到三个领域着手行动起来。这和管理层制定公司战略的历程有着异曲同工之妙。40年前,会制定周全翔实战略计划的公司只是少数。其中一部分领先者取得了卓越的成果。不久之后,大多数企业也掌握了当时新出现的计划制定工具和框架。再说现在,几乎没有公司在一开始就制定数据和分析计划。但我们相信,越来越多的高管很快就会意识到,制定大数据规划是实现大数据潜力必不可少的第一步。

高质量战略规划的核心在于,凸显企业必须做出的关键决策或取舍,并明确企业必须优先考虑的举措。例如,哪些业务应投入最多资金,应该强调更高的收益还是更快的增长,以及需要哪些能力以确保强劲的业绩。在大数据和分析计划推行的初期,企业应该解决类似这样的问题:选择需要整合的内外部数据,从一大堆潜在的分析模型和工具中找出最能够支持商业目标的那部分,并培育相应的组织能力。

成功地做出以上取舍,需要公司高层进行跨部门的战略对话,以确立投资重点,平衡速度、成本和接受度,并为一线互动创造条件。如果制定的计划能够解决这些关键问题,那么实现具体商业成果的可能性会更大,也可为高管层带来足够的信心。

大数据计划的内容

成功的规划应聚焦于三大核心要素。

数据

制定收集和整合数据的策略非常关键。企业忙于收集信息,但是BU横向或职能部门纵向经常出现各自为政的问题。关键的数据可能存在于过去的IT系统中,且涵盖客户服务、定价和供应链等各个领域。关键信息经常以非结构化格式散落于公司外部,例如社交网络的对话,更加剧了问题的复杂性。

要让这些信息成为长期资产,通常需要大力投入建设新数据能力。规划可以强调,未来需要对数据架构进行大规模重组:包括对混乱的数据库进行筛选(将交易从分析报告中剥离出来),创建清晰的“黄金来源”2数据,并实施能够有系统地保持准确性的数据治理标准。

一种信息在企业中仅存储一次,以保证其准确性的做法。

就短期而言,有的企业可以采用更简易的方法:将问题外包给数据专家,由他们使用云系统软件整合足够的数据,以抓住最初的分析机会。

分析模型

整合数据本身并不会创造价值。需要高级的分析模型来实现数据驱动的优化(例如员工排班表或运输网络)或预测(例如航班延误情况,或根据购买历史、在线行为来预测客户的需要及行动)。计划必须能够识别以下情况:模型可以在哪些领域创造额外的商业价值,谁需要使用模型,以及模型在组织内推广时如何避免不一致和不必要的数据重复。

和新的数据来源一样,企业最终会希望将这些模型连在一起,解决跨职能或跨BU的、更大范围内的优化问题。事实上,一个计划可能需要数据分析“工厂”,从一系列不断增加的变量中组合一系列模型,然后实施系统以进行追踪。虽然模型可能极其强大,但也必须抵御完美分析的诱惑:太多变量将增加复杂性,让模型的应用和维护变得更加困难。

工具

模型输出的内容可能非常丰富,但是只有当经理(很多情况下是一线员工)能够理解并使用它时,这些内容才有价值。太复杂的输出可能难以把握,甚至不被信任。企业需要的是易于使用的工具,能够将数据整合到日常的流程,并将模型输出转换为具体的流程,例如员工排班的清晰界面,呼叫中心的交叉营销建议,或营销经理作出实时打折决定的方法。很多企业没有考虑或规划这一步骤,最后发现经理和基层员工不会使用新模型,其有效性自然会大打折扣。

要促进数据、模型和工具的发展,组织能力也是一大关键推手。很多战略规划之所以失败,原因就在于组织缺乏实施的能力。因此,如果组织缺乏合适的人才或能力,大数据计划的结果很可能会令人失望。企业需要一张路线图,按照合理的规模和构成来建设人才库。最好的计划还将进一步讲述如何培养数据科学家、分析建模师和一线员工,让他们在新的富含数据和工具的环境下发挥自身才华并努力实现更好的业绩。

具备这些要素后,企业就可以制定综合的大数据计划(见下图)。当然,不同行业在分析方法、决策支持工具和业务价值的来源等细节上皆有所不同。但值得注意的是,所有行业都具有结构相似性:绝大多数企业都需要为主要的数据整合活动制定计划。这是因为,很多最具价值的模型和工具(如下图右边显示)在建立时会越来越多地使用海量的数据来源(如下图左边显示)。一般来说,这些来源将包括来自客户(或病人)、交易或运营的内部数据,以及来自价值链或在线合作伙伴的外部信息。此外,未来还可能来自内嵌于物体的传感器。

大数据

为了建立一个优化治疗和住院系统的模型,一家医疗保健行业的企业可能需要整合一系列患者和人口信息、药品效果数据、医疗设备投入以及医院的成本数据。而一家运输企业可能需要整合实时定价信息、GPS和气象资料以及员工的劳动生产率,以预测哪些航线、船只和货物组合能够产生最高的经济效益。

三大挑战

根据我们的经验,大数据规划要引起总部高层领导的注意,包括确定投资重点、平衡速度和成本、确保一线员工认可。这些内容听上去很耳熟,因为它们也是很多战略计划的组成部分。但是大数据和高级分析规划还有一些重要的不同之处。

1. 投资重点和业务战略的匹配

制定大数据规划的一个普遍难题是如何将不同领域的交易、运营和客户互动等数据整合起来。整合工作能够带来强有力的商业判断,但是要建立新的数据架构、开发尽可能多的模型和工具,其投入巨大,因此应有所选择。对于低成本、高销量的零售商,可以通过门店销售数据来预测库存和劳动力成本,以维持低价。而与之相比,高端、高水平服务的零售商则需要进行更高的投资并对客户数据进行汇总,以推广客户忠诚度项目,吸引客户选择利润更高的产品,并提供定制服务。

就微观层面而言,这是选择投资重点所面临的挑战:两种方法听上去都不错,事实上也完全符合企业各自的业务需求。可想而知,这些方法也吸引了其他零售商的注意。那么在资源缺乏的情况时,如何在这些可能性(或其他可能性)中做出选择?

在确定投资重点时,没有什么能够代替高管团队的积极参与。在一家消费品公司,首席信息官通过大数据、建模和培训等建立了价值创建潜在来源的热图,范围涵盖了公司所有业务系统的投资选择。这份热图让公司高管获得了扎实的数据基础,启发他们开展讨论并进行明智的取舍。尽管讨论成果并不是一份完整的计划,但一定是计划成功的开始。

再来看一家大型银行的例子。为了解决一个市场问题,该银行建立了一支由首席信息官、首席市场官和BU负责人组成的团队。银行家们对直接营销活动的结果表示不满,因为成本居高不下,新产品的接受度却令人失望。他们发现问题的核心在于各自为政的市场营销方法。单个BU对客户的财务背景和偏好不加考虑,向银行所有客户群推销多种产品。那些可能最需要投资服务的客户获得的却是存款产品的信息,反之亦然。

为了解决这个问题,高管团队决定收集企业数据库中的所有信息,包括收入水平、产品历史、风险档案等方面的数据。中央数据库让银行能够有针对性地向客户提供他们可能更需要的产品或服务,从而提高了业务点击率和营销活动的效益。很多企业都会需要强大的计划流程来凸显类似的投资机会,并推动高管层拿出应有的参与度。

2. 平衡速度、成本和接受度

对于那些“拥有”企业数据和分析策略的高管而言,自然而然的反应是迅速开启行动模式。一旦确定了某些投资重点,就不难找到开发相关应用和算法模型经验的软件及分析供应商。和内部开发的定制模型相比,这些套装系统(包括定价、库存管理、劳动力排班等)价格便宜,且易于安装。但是它们毕竟不能和根据实际业务案例创建的应用相比,很难充分调动起经理们的积极性。系统有没有结合具体行业和企业的业务特点,这在很大程度上决定了数据项目是否会成功。因此,为了尽量平衡可承受的成本和在现实业务中实施的速度(包括容易忽视的风险和组织敏感度),需要给计划第二个维度。

忽略这一步骤的代价是什么,请看一家试图提高小企业核保业务的银行的经历。分析团队希望赶紧采取行动,因此匆匆忙忙建立了一个模型,但缺少计划流程,也没有让充分了解业务的关键利益相关方参与进来。这个模型在理论上的测试很成功,但是实际上完全不可行,银行为此损失惨重。管理层希望从头再来,要求BU领导重新尝试。修改后的模型建立在较为完整的数据的基础上,其架构反映出不同客户细分的差异,因此预测能力更好,最终减少了损失。这个例子告诉我们,大数据规划面临的管理挑战至少和技术挑战一样大,没有捷径可走,必须付出努力,让业务人员和数据专家通力合作,找出问题所在。

一家货运公司的关键问题是如何在新数据/分析工具的潜在收益和业务风险之间找到平衡。当数据专家提议使用和客户行为、定价和排班等相关的新模型时,由于已经习惯于现有的运营导向模型,高级经理们表示反对,且特别提出,昂贵的新数据方法是否会扰乱顺畅的排班操作。数据经理于是在一个区域试点了开发原型(使用少量数据组和初步的电子表格分析),这才消除了大家的担忧。有时候,确实有必要采取 “奔跑之前先学走路”的战术以达到平衡,这也可以是计划的一个组成部分。一家健康险公司面临的关键挑战则是缓解内部利益相关方的担忧。公司设计的黑盒子模型在检测历史数据时,能够非常准确地识别高于平均住院风险的慢性病患者。但临床总监认为,不能单靠一个不透明的分析模型来确定哪些患者应该接受昂贵的预防性治疗方案。最终,该保险公司选择了一个更为简单和透明的数据和分析方法,在当前实践的基础上进行了改进,但是牺牲了一些准确性,结果可能使更多患者有资格接受治疗。在数据规划的早期提出不同意见并进行权衡,可以节约时间,避免惨重损失。

最终,有些规划工作需要在降低成本的愿望(通过标准化)和反映业务现状的需求(通过组合数据和建模)之间找到平衡点。就零售行业而言,企业拥有独特的客户基础,有不同的定价方式来优化销量和利润,也有着日常的销售模式和库存需求。比如,一家零售商很快以低成本建立了一套标准化的推荐商品模型3, 然后为网络渠道制定了具体的推荐方案。但是,为了开发更加成熟的模型来预测区域性和季节性的购买模式并优化供应链运营,这家零售商必须从社交媒体上收集非结构化的消费者数据,选择内部的运营数据,同时按产品和门店的概念定制预测算法。一个平衡的大数据规划需要这样的组合方法。

基于分析客户购买历史的算法,一种预测客户可能购买的下一个产品或服务的模型。

3. 确保重视一线部门的参与度和能力培养

一家航空公司在大力投入开发新的定价工具之后,发现收益管理分析师的生产效率仍然低于预期。问题出在哪里呢?工具太过复杂,没有人用得来。另一家健康险公司则出现了不同的问题,医生们抵制一种使治疗方案更经济的网络应用。他们表示,如果非要使用这种新系统,就必须为某些疾病提供能够维持患者信任的治疗方案,这一点他们认为非常重要。

出现这些问题的企业忽视了大数据规划的第三个要素:调动组织的积极性。正如我们在描述大数据规划的基本要素时所说的,计划的第一步是建立一线主管能够理解的分析模型。这种模型必须和易于使用的决策支持工具(可以称之为制胜工具)相连接,并通过流程让经理们对模型输出运用自身经验进行判断。虽然少数分析方法(例如基本的销售预测)是自动化的,只需要有限的一线员工参与,但大多数分析方法如果没有管理层的支持就不会成功。

上述航空公司重新设计的定价工具的软件界面,仅仅包括主要航线上竞争对手和产能利用率方面10—15种规则驱动的原型。一家零售商的情况与此类似,如果他们的商品价格比竞争对手网站上的价格高,就会出现提醒买家注意的信号,并允许买家自行定价。另一家零售商的经理现在能根据以往的销售数据、天气预报和计划好的特卖活动,用平板电脑预测一天内每小时所需要的店员人数。

创建这种员工易于使用的工具仅仅是第一步。关注有效实施所需的组织能力也非常重要。多数公司认为,95%的大数据投入应该用于数据本身和建模。但是很多经理并没有很强的分析背景,如果不能培养一线经理的能力并进行相关培训,这些投入很可能收不到效果。因此大数据计划的一条基本规律是,数据/建模和培训的投入是一半对一半。

部分投入应该用于培养“双模”经理,他们既懂业务,又深谙如何运用数据和工具做出更好、更有分析依据的决策。有这样的能力傍身,经理自然盼望有用武之地。企业还应该建立奖励机制,吸引分析能力强的业务领导担任数据工作负责人,并鼓励部门之间传播点子。一家快递公司发现分析型人才散落在各个部门里,于是将他们集中在一起,为全公司提供服务。

计划制定以后,执行就比较容易了:可以按部就班地整合数据、启动试点项目、创建新工具并展开培训。在推动业务价值的清晰愿景下,不太可能遇到资金问题或内部抵制。当然,随着时间的推移,最初的计划到了将来也会有所调整。事实上,大数据和分析的一个主要益处就在于,您现在能学到以前闻所未闻的业务知识。

这可能和战略规划又有着相似之处。在很多组织中,正规的年度“教科书式” 战略规划流程已转变为持续性、参与更广泛的动态流程。数据和分析计划太重要了,不可能束之高阁。但这是明天才要面对的问题。现在的状况是,大数据规划尚付之阙如。高管层的行动越快,企业就越有可能从数据中获取真正的竞争优势。

三位作者谨向Toos Daruvala,Amit Garg和David Kang对本文的贡献表示由衷感谢。via:麦肯锡季刊

Stefan Biesdorf 是麦肯锡全球董事,常驻慕尼黑分公司;

David Court是麦肯锡全球资深董事,常驻达拉斯分公司;

Paul Willmott是麦肯锡全球资深董事,常驻伦敦分公司。

End.