首家大数据培训挂牌机构 股票代码:837906 | EN CN
阿里巴巴菜鸟级数据产品经理半年回顾总结篇
干货教程:如何绘制业务流程图(二)
干货教程:如何绘制业务流程图(一)
技术贴:如何在数据库中秘密地查询隐私数据
攻略教程:信息图(infographic)是怎么做出来的?
分析师一定要看!用数据讲故事的五个步骤
技术篇:怎样玩转千万级别的数据?
北漂书生:大数据时代SEO数据如何搜集和分析
干货,从十大问题重新认识并读懂互联网
相似图片搜索、算法、识别的原理解析(下)
相似图片搜索、算法、识别的原理解析(上)
制作信息图时请遵循这10条原则
提高表格可读性的一些技巧,适用于Excel、PPT等数据报表
实用教程:如何让Excel图表更具“商务气质”?
一张数据信息图是这样制作完成的
菜鸟读财报,如何从上市公司财报中挖情报?
北大数据分析老鸟写给学弟们一封信
如何一步一步制作出高品质数据信息图?
总结:海量数据分析处理的十个方法
【实战经验】数据分析师如何了解老板真正想法?
零售业数据分析那些事儿
数据分析时l常用电子表格公式【大全】
用数据来告诉你 上市公司财报的秘密
这12个数据能 帮你搞定淘宝店铺
首席工程师揭秘:LinkedIn大数据后台是如何运作的?(四)
首席工程师揭秘:LinkedIn大数据后台是如何运作的?(三)
首席工程师揭秘:LinkedIn大数据后台是如何运作的?(二)
首席工程师揭秘:LinkedIn大数据后台是如何运作的?(一)
淘宝网店从激活到挽留,4步走玩转数据营销
文案怎样写才有意思、不空洞、打动人?
入门级扫盲贴:数据分析的步骤有哪些?
关系即数据,论社交媒体的关系转换
数据的力量,苹果教你用数据鄙视竞争对手
谁说文科生不能做数据分析?数据分析入行→技能提升→优势
产品运营数据分析——SPSS数据分组案例
如何追踪iPhone和iPad等移动设备的用户行为数据?
阿里巴巴中国站:用户满意度指标权重计算方法
广告中的AdNetwork、AdExchange、DSP、SSP、RTB和DMP是什么?
信息图制作教程:关于数值的表现
为什么大数据会如此轰动?(值得深度的文章)
多图技术贴:深入浅出解析大数据平台架构
面板数据分析中标准误的估计修正——根据Peterson (2009)的归纳
财务官、投资人、CIO看过来:给企业数据定价
推荐系统中常用算法 以及优点缺点对比
探索Weotta搜索引擎背后的大数据技术
如何识别虚假数据?
为什么我们像驯化小狗那样驯化算法
程序员必须知道的10大基础实用算法及其讲解
电子商务:最影响转化率的九大要素
如何迅速成为一名数据分析师?
想从事大数据、海量数据处理相关的工作,如何自学打基础?
如何用亚马逊弹性MapReduce分析大数据?
译文:机器学习算法基础知识
给hadoop新手的一封信:Hadoop入门自学及对就业的帮助
从入门到精通,我是这样学习算法的
小商家,从老客户身上获取的数据才更有意义
13页PPT讲述:大数据下网站数据分析应用
40页PPT详解:京东大数据基础构架与创新应用
67页PPT解密搜索引擎背后的大技术:知识图谱,大数据语义链接的基石
营销洞察力——10个营销度量指标
技术篇:前端数据之美如何展示?
董飞:美国大数据工程师面试攻略【PPT】
easel:如何制作好的信息图——来自专家的顶级技巧
大数据实操:以3D打印机为例,如何知道卖点有没有市场需求?
大数据建模 需要了解的九大形式
用户画像数据建模方法
从规划开始,公司or企业如何入手和实施大数据?
干货:商品信息数据分析和展现系统的设计与开发
高手教你用Excel制作百度迁徙数据地图
50篇干货:淘宝店/电子商务如何玩转数据分析?
精华索引:大数据实际应用案例50篇
验证最小化可行产品 (MVP) 的 15 种方法
干货:数据分析师的完整知识结构
大数据技术Hadoop面试题,看看你能答对多少?答案在后面
用SPSS做数据分析?先弄懂SPSS的基础知识吧
怎样做出优秀的扁平化设计风格PPT? 扁平化PPT设计手册#3
解答│做大数据过程中遇到的13个问题
40页PPT│社交网络发展的新动力:大数据与众包
以Amazon、豆瓣网为例,探索推荐引擎内部的秘密#1
怎样做出优秀的扁平化设计风格PPT?#2
怎样做出优秀的扁平化设计风格PPT?#1
36页PPT│大数据分析关键技术在腾讯的应用服务创新
如何丰满地做SWOT分析?
【35页PPT】TalkingData研发副总阎志涛:移动互联网大数据处理系统架构
27页PPT|以珍爱网为例,如何构建有业务价值的数据分析系统?
国外数据新闻资源分享
21页PPT重磅发布:Mariana——腾讯深度学习平台的进展与应用
从0到100——知乎架构变迁史
PPT解读:百度大数据质量保障方案探索
45页PPT|大数据环境下实现一个O2O通用推荐引擎的实践
从数据看豆瓣兴衰
深度学习系列:解密最接近人脑的智能学习机器——深度学习及并行化实现(四)
重磅推荐:129页PPT讲述移动时代创业黄金法则 via:腾讯企鹅智酷
重磅推荐:大数据工程师飞林沙的年终总结&算法数据的思考
OpenKN——网络大数据时代的知识计算引擎
大数据下城市计算的典型应用
技术贴:大数据告诉你,如何给微信公众号文章取标题?
你的QQ暴露了你的心——QQ大数据及其应用介绍PPT
如何从企业报表看企业的生存能力?
实用的大数据技巧合集
技术帝揭秘:充电宝是如何盗取你的个人隐私的?
重磅!50页PPT揭秘腾讯大数据平台与推荐应用架构
原创教程:饼图之复合饼图与双层饼图(1)
PPT:大数据时代的设计特点——不了解这个你做不了今天的设计
教程贴:如何用方程式写春联?
原创教程:如何用Excel制作简易动态对比图
深度译文:机器学习那些事
教程帖:数学之美——手把手教你用Excel画心(动态图)
董老师走进斯坦福,聊聊硅谷创业公司和大数据的事儿(附课件PPT下载)
【限时】年度钜献,108个大数据文档PDF开放下载
董飞专栏:大数据入门——大数据相关技术、Hadoop生态、LinkedIn内部实战
亿级用户下的新浪微博平台架构
一张图了解磁盘里的数据结构
浅析数据化设计思维在阿里系产品的应用
美团推荐算法实践
一个P2P创业公司有哪些部门,都是做什么的?
一个P2P平台的详细运营框架是怎样的?
机器学习中的算法——决策树模型组合之随机森林与GBDT
神经网络简史
58页PPT看懂互联网趋势,大数据/物联网/云计算/4G都有了
广点通背后的大数据技术秘密——大规模主题模型建模及其在腾讯业务中的应用(附PPT)
微信红包之CBA实践PPT——移动互联网海量访问系统设计
一文读懂机器学习,大数据/自然语言处理/算法全有了……
搜狐新闻客户端的背后大数据技术原理——推荐系统(PPT)
原创教程:用Excel做动态双层饼图
半小时读懂PMP私有广告交易市场
怎样分析样本调研数据(译)
PPT:支付宝背后的大数据技术——DataLab、Higo的实践及应用
大数据技术人员的工具包——开源大数据处理工具list(限时下载)
计算机视觉:随机森林算法在人体识别中的应用
24页PPT:机器学习——支持向量机SVM简介(附下载)
互联网高手教你如何搜集你想要的信息
深度:对地观测大数据处理、挑战与思考
原创教程:用Excel做饼图之复合饼图与双层饼图(2)
移动大数据时代: 无线网络的挑战与机遇(附pdf下载)
Excel使用技巧——25招必学秘技
【年度热门】加上这些 Excel 技能点,秒杀众人(多图)
原创教程:用Excel做纵向折线图
知识图谱——机器大脑中的知识库
何明科专栏:用数据化的方式解析投资条款
DT时代,如何用大数据分析创造商业价值(23页PPT)
MIT牛人梳理脉络详解宏伟现代数据体系
你的老婆是怎么算出来的?揭秘佳缘用户推荐系统
飞林沙:商品推荐算法&推荐解释
PPT:如何成为真正的数据架构师?(附下载)
开源大数据查询分析引擎现状
董飞专栏:打造数据产品必知秘籍
译文:如何做强大又漂亮的信息图
如何使用Amazon Machine Learning构建机器学习预测模型
如何运用数据协助货架管理(内附26张PPT)
SVM算法
主流大数据系统在后台的层次角色及数据流向
PPT:阿里全息大数据构建与应用
人脸识别技术大总结——Face Detection & Alignment
教程:用Excel制作成对条形图
易观智库:大数据下的用户分析及用户画像(18页PPT附下载)
技术向:如何设计企业级大数据分析平台?
电商数据分析基础指标体系
IBM SPSS Modeler 决策树之银行行销预测应用分析
拓扑数据分析与机器学习的相互促进
基于 R 语言和 SPSS 的决策树算法介绍及应用
用php做爬虫 百万级别知乎用户数据爬取与分析
另类新浪微博基本数据采集方法
以10万+阅读的文章为例 教你做微信公众号的运营数据分析
破解数据三大难题:变现?交易?隐私?
微店的大数据平台建设实践与探讨
阿里巴巴PPT:大数据基础建议及产品应用之道
基于社会媒体的预测技术
人工智能简史
技巧:演讲中怎样用数据说话
马云和小贝选谁做老公?写给非数据人的数据世界入门指南
掘金大数据产业链:上游资源+中游技术+下游应用
原创教程:手把手教你用Excel做多层折线图
销售分析:如何从数据指标发现背后的故事
如何一步步从数据产品菜鸟走到骨干数据产品
也来谈谈微博的用户画像
行走在网格之间:微博用户关系模型
如何拍出和明星一样美爆的自拍照?斯坦福大学用卷积神经网络建模告诉你
运营商如何玩转大数据? 浙江移动云计算和大数据实践(PPT附下载)
大数据分析的集中化之路 建设银行大数据应用实践PPT
腾讯防刷负责人:基于用户画像大数据的电商防刷架构
创业提案的逻辑
友盟分享 | 移动大数据平台架构思想以及实践经验
寻路推荐 豆瓣推荐系统实践之路
“小数据”的统计学
重磅!8大策略让你对抗机器学习数据集里的不均衡数据
小团队撬动大数据——当当推荐团队的机器学习实践
微博推荐架构的演进
科普文 手把手教你微信公众号数据分析
信息图制作的六个注意点
【权利的游戏】剧透新玩法:情理之中?意料之外
推荐系统(Recommender System)的技术基础
核心算法 谷歌如何从网络的大海里捞到针
Quora数据科学家和机器学习工程师是如何合作的
阿里巴巴PPT:大数据下的数据安全
数据建模那点事儿
全民拥抱Docker云–Lhotse系统经验分享
实时股票分析系统的架构与算法
架构师必看 京东咚咚架构演进
什么叫对数据敏感?怎样做数据分析?
推荐系统基础知识储备
刘德寰:数据科学的整合与细分 数据科学的七个危险趋势(视频)
实际工作中,如何做简单的数据分析?
分布式前置机器学习在威胁情报中的应用(附PPT下载)
数据科学 怎样进行大数据的入门级学习?
扛住100亿次请求 如何做一个“有把握”的春晚红包系统?(PPT下载)
从 LinkedIn 的数据处理机制学习数据架构
大数据会如何改变管理咨询公司(I)
优秀大数据GitHub项目一览
生硬的数字和数据新闻:这么近,那么远
经典大数据架构案例:酷狗音乐的大数据平台重构(长文)
揭秘中兴大数据在银行领域的系统部署
基于大数据的用户画像构建(理论篇)
【R】支持向量机模型实现
数据图处处有陷阱?五个例子教你辨真伪
如何用R绘制地图
你确定你真的懂用户画像?
数据模型需要多少训练数据?
【接地气】01 数据报表的颜色怎么配
游戏价值和数据分析新思路
【R】异常值检测
快的打车架构实践
豆瓣还是朋友圈:大数据、新方法和日常问
PPT数据图表,怎么做才好看?
大道至简的数据体系构建方法论
数据的误区及自身业务
新浪微博的用户画像是怎样构建的?
面试干货!21个必知数据科学面试题和答案part1(1-11)
易观智库:中国大数据产业生态图谱2016(附下载)
Airbnb的数据基础架构
50PB海量数据排序,谷歌是这么做的
大数据时代工程师如何应对–今日头条走进硅谷技术讲座
D3.js教学记(下)
D3.js教学记(上)
飞林沙:企业级服务公司如何赚钱?只有平台级产品才有大数据的理论
一个母婴电子商务网站的大数据平台及机器学习实践
7大板块 组成数据分析师的完整知识结构
干货:SaaS领域如何分析收入增长?
学术 | 词嵌入的类比特性有实用意义吗?
6个用好大数据的秘诀
一个数据库外行眼中的微信优化 (附专家补充)
大数据调研,如何实现快全准?
数据大师Olivier Grisel给志向高远的数据科学家的指引
数据堂肖永红:数据交易的是使用权或数据的增值,而不是数据本身(PPT附下载)
淘宝商品详情平台化思考与实践
刘译璟:百分点大数据理念和实践(图文+PPT下载)
如何快速搞定一份看起来还不错的演示文档?
【BABY夜谈大数据】决策树
数据驱动设计:数据处理流程、分析方法和实战案例
美图数据总监:Facebook的法宝,我们在产品中怎么用?
树的内核:量化树结构化数据之间的相似性
拿到用户数据之后,LinkedIn怎么赚钱?
GrowingIO张溪梦:增长黑客的核心 企业应该重视产品留存率(附PPT下载)
[译]Airbnb是如何使用数据理解用户旅行体验的?
微博推荐数据服务代理: hyper_proxy的设计和实现
星图数据谷熠:消费领域DaaS 大数据重构未来商业游戏规则(附PPT下载)
鲍忠铁:TalkingData大数据技术与应用实践(PPT下载)
【干货教材】数据分析VS业务分析需求
九枝兰专访:数字营销的核心—企业如何使用数据管理平台(DMP)进行精准营销
我们的应用系统是如何支撑千万级别用户的
R应用空间数据科学
Excel进行高级数据分析(上)
Excel进行高级数据分析(下)
国内各大互联网公司2.0版技术站点收集
网站数据分析思路导图
大数据分析报表设计开发要素
大数据需要的12个工具 推荐
YARN/MRv2 Resource Manager深入剖析—NM管理
YARN/MRv2 Resource Manager深入剖析—RMApp状态机分析
Hadoop 1.0与Hadoop 2.0资源管理方案对比
Hadoop 2.0中单点故障解决方案总结
Hadoop 2.0 (YARN)中的安全机制概述
Hadoop 新特性、改进、优化和Bug分析系列1:YARN-378
Hadoop 新特性、改进、优化和Bug分析系列2:YARN-45
Hadoop 新特性、改进、优化和Bug分析系列3:YARN-392
Hadoop版本选择探讨
探究提高Hadoop稳定性与性能的方法
《Effective C++》读书笔记(第一部分)
Hadoop分布式环境下的数据抽样
Hadoop计算能力调度器算法解析
如何编写Hadoop调度器
数据结构之红黑树
Hadoop pipes设计原理
《C++ Primer plus》学习笔记之”类”
《C++ Primer plus》学习笔记之”类继承”
《C++ Primer plus》学习笔记之”C++中的代码重用”
《C++ Primer plus》学习笔记之”异常”
《C++ Primer plus》学习笔记之”RTTI”
Hadoop pipes编程
Hadoop Streaming高级编程
《C++ Primer plus》学习笔记之”标准模板库”
《C++ Primer plus》学习笔记之”输入输出库”
Linux Shell 命令总结
算法之图搜索算法(一)
awk使用总结
素数判定算法
《C++ Primer plus》学习笔记之“函数探幽”
使用Thrift RPC编写程序
如何在Hadoop上编写MapReduce程序
怎样从10亿查询词找出出现频率最高的10个

鲍忠铁:TalkingData大数据技术与应用实践(PPT下载)

于2017-04-01由小牛君创建

分享到:


3月6日下午14:00,由大数据培训,就上小牛学堂主办『大数据应用与实践』主题沙龙在北京中关村创业大街3W咖啡成功举行。来自国内外上百家多家大数据企业代表参加了本次活动,并针对大数据商业应用问题展开了激励的讨论。

活动现场,TalkingData首席布道师鲍忠铁先生为大家做了《TalkingData 大数据技术与应用实践》的分享。

鲍忠铁先生的演讲主要是从大数据技术架构开始的,他说,数据科学是将数据转化为行动的艺术,不同人的视角将带来大数据不同的商业模式。他绘声绘色地为大家介绍了TalkingData旗下产品TD DMP 3.0的逻辑架构和整体技术架构。他说,企业正在从产品为中心转向以客户为中心,而移动互联网正在成为线上商业的主流 ,移动App已经成为客户和数据的入口。他为现场的朋友揭开了移动大数据的神秘面纱。

鲍忠铁

下面是详细的报道及PPT图文直播,另外,我们将在文章末尾放出PPT下载链接。

今天很开心在这里跟大家分享有关TalkingData大数据的理念和实践.

数据科学是什么呢?这是现在非常热的词,数据科学有很多的解释。

Data Science is the art of turning data into actions. This is accomplished through the creation of data products, which provide actionable information without exposing decision makers to the underlying data or analytics (e.g., buy/sell strategies for financial instruments, a set of actions to improve product yield, or steps to improve product marketing).

但是现在有一本书对数据科学的解释,我们TalkingData认为是最恰当的,并且这本书也成为我们公司的必读书。

大数据

如果你从事大数据产业,你一定要读《Data Science》。大数据对数据产业推动的意义,大家看这本书,因为我今天主要分享我们的经验和案例。

Data Science touches every aspect of our lives on a daily basis. When we visit the doctor, drive our cars, get on an airplane, or shop for services, Data Science is changing the way we interact with and explore our world.

数据覆盖了我们生活的方方面面,特别是移动互联网时代到来之后,传感器遍布所有的环境。在我们不知不觉的情况下,所有的数据通过传感器已经到了某些大数据厂商的手中。大数据

数据、技术和系统,我想从三个角度看,大家对数据的看法。世界上只有四种数据,大家可以想像,你认为有第五类的数据也可以。做数据的人和做技术的人、做开发的人和做应用的人他们的视角是不一样的。做数据的人他想数据是什么形式进来的,是小批量进来的,还是大批量进来的。做技术的人想我怎么处理这些数据,怎么存储这些数据。做应用的人想这些数据能帮我做什么,这些数据到底对我有什么商业价值,这些数据对我的业务有什么应用场景。因为我不是做数据的,我不会从数据的算法和模型角度,也不会从数据存储和计算的角度出发。我今天分享的更多是从应用场景的角度出发。

数据科学的成熟度,最初是收集数据,收集完了数据以后我们描述这些数据,然后做一些数据挖掘和数据发现。最后做一些预测,整个大数据产业中,最后是做一些决策。现在在整个链中做的最好的、成熟度最好的是IBM在整个大数据行业,我们谈到了AI。大多数中国的企业还处于这样一个阶段,就是预测的阶段。大家把自己的数据收集起来,把它打成标签,打成标签之后做一些关联分析,看看有没有一些相关性,有没有一些数据场景的应用。至于预测和我们的决策,现在做的还不够,未来还有很大的空间增长。

大数据

刚才从数据的角度和技术的角度、应用的角度看数据的三个层次,这是比较早的数据架构。但是TalkingData在技术和数据处理方面是行业里面最好的。因为我们大概有2PB的数据,我们有数据科学家和自己的开发团队,我们有好的环境,各种算法、各种模型和各种计算。技术都可以在这个环节验证。我们也探讨了自己独特的技术,我们也有一些自己的技术专利,我们有数据科学家讲一些有关数据挖掘、模型建设和数据处理的知识,以及数据处理的流程和算法。

刚才肖总(数据堂联合创始人/副总裁肖永红先生)也说了,大数据企业最核心的还是技术。数据是我们TalkingData的信仰,但是技术是我们实现这个信仰的工具,应用是我们带给所有企业的价值。

回到主题来,今天主要跟大家分享数据应用场景以及我们对数据的信仰。互联网公司在过去几年一直处于行业领先的地位,到处都是发现互联网公司对传统行业的挑战。互联网公司它最核心的价值是什么,我在公布答案之前请大家再想想。其实它最核心的就是知人性、办人事,所有的互联网公司特别了解用户的体验,包括BAT,百度90%的收入都来源于广告,阿里可能有70%左右,腾讯稍微差一点可能有40%到50%左右。

这些企业它为什么有这么大的广告市场,就是因为它有用户,它为什么有这么多用户,就是因为它有这么大的流量,它为什么有这么大流量,因为它有这么多渠道。最核心的东西它把数据玩的很转,它通过数据了解了人性、了解了你的需求、场景,它通过这些转化成流量。

大数据

我们一直跟合作伙伴、客户和朋友分享,人将会成为企业的中心。在移动互联网时代到来之前,产品是企业的中心。比如说企业生产一个产品的时候或者我发布一个产品的时候,我开个小会找产品或者是找个专家推到市场上,这个产品获得了很大的收入,这样的话公司业绩增长了。但是现在不行了,现在所有的人分化的特别厉害,每个人特别追逐个性。所以说在过去的年代里,我们会看到很多人穿同样的衣服、同样的鞋,喜欢看同样的电影,喜欢看同样的书。但是现在人群分化了,每个人的兴趣和每个人群的需求都不同了。

如果企业还是以产品为中心的话,你只能面向这几百人中的一个。但是你以人群为中心的话,你面向的将是所有的客户,所以我们是以人群为中心经营你的客户。

未来的世界是属于谁,可能不属于我,属于80后和90后,这两个人群加在一起在中国有4亿人口,这些人是整个中国未来主要的财富拥有者和财富的消耗者。所以说所有的企业在你的产品战略上、市场战略上、营销战略上和销售战略上,还有你的客户服务战略上,你要围绕这群人80后、90后进行设计,这时候数据分析往往会带来你更多的发现。

我们去银行的网点和其他的网点看,特别是到商场。发现年轻的客户很少到网点办业务了,到网点办业务大多都是45岁以上的,这些人去哪里办业务呢?都是通过APP办业务。我们认为移动互联网成为整个线上商业的主流,2015年11月11号结束之后,各家电商公布了自己整个电商销售的总额,从各家公布的数字可以看出,现在在整个电商行业,移动互联网整个销售占比已经达到70%,阿里稍微低一点是68%,京东已经超过70%。所以说未来移动互联网是所有在线商业的主流。

大数据

既然移动互联网成为在线商业的主流之后,我们会看到一个人他的衣食住行、教育、投资、旅游,整个人所有消费的行为、投资的行为都被APP包围了,这些APP有90%是客户嵌入了SDK为我们提供数据。我们认为移动APP已经成为整个客户和数据的入口,如果一个企业想接触到他的客户,在过去你可以通过你的线下网点,可以通过在线的广告。但是在未来,你的APP就成为你接触客户唯一的入口。所以说大家如果做企业可能会把重心移到移动互联网上。

现在整个宣传部已经让很多媒体集团要求做纸制媒体的,像报纸、晨报要求他们强制上移动互联网,因为他们发现年轻人的阅读习惯已经改变了。最牛的计算机世界,最高峰的时候一个月发行量有十万,现在只有几千了,这是一个时代的变迁。

大数据

既然APP成为所有的数据和客户的入口,移动大数据它可以做什么?它有什么商业价值,它怎么帮助企业洞察客户,这是我们可以看到的。首先移动大数据有几类数据,一类数据是传感器数据,大家用iPhone有六个传感器,三星有八个传感器,当你打电话放到耳朵边的时候屏幕暗了,三星的数据未来会成为主流。所谓的物联网其实也是三星的数据。

还有线下聚集的POI数据,你去星巴克代表你愿意喝星巴克的合肥,你吃川菜,你去旅游代表你的个性爱好,还有一些移动渠道,看你你经常看今日头条、E点资讯,还是网易新闻,还是用户特点,你是愿意社交、电商,还是玩游戏,所有都是移动大数据可以揭示出来的应用场景或者是特点。根据其他的场景,再结合移动大数据,可能会产生一些商业的价值应用,这个在探讨,也在应用。

我们既然讨论数据,移动大数据可以从这几个纬度看洞察用户,包括你的行为、兴趣、消费、职业、品牌、消费层次,这些都可以进行一些预测,描述你一个人的特点。

大数据

花两分钟做一下广告,可能大家都清楚TalkingData,但是就我的职业而言,我还是要介绍一下TalkingData。现在我们有海量的数据覆盖中国28亿智能设备,包括手机、手环、电视和其他的智能设备。实际上我们从后台看到月活大概只有十几个亿,基本上手机的寿命在过去两年中,我们统计大概是24个月,去年我们发现从24个月变成了18个月。对于90后已经变成了12个月,手机的生命周期衰减是非常快的。

我们覆盖中国TOP APP100覆盖了30%,IOS游戏中我们覆盖了40%,我们有10万款应用,我们每天上传10TB的数据,有600多个新增的标签,我们会为一些客户提供具有价值标签的数据。我们有工具,统计分析平台、广告检测、推送、大数据管理平台,其实我们还有可视化的Mpush。

大数据

所有的工具可以为金融企业或者是其他的企业地产、零售进行私有化部署。因为金融企业对数据的敏感度隐私把握比较强,它不希望数据上云,所以我们对他们进行私有化部署。我们可以提供大数据采集处理和分析变现的工具。

最后,我们在过去的一年中,实际上我们发现,我们把标签数据跟客户打通之后,把工具给客户了。但是发现它不像移动互联网这些人会玩数据,他不懂,它的工具就能用20%的功能,它根本不知道LTV、WAU这些词是什么意义,他根本不知道从数据分析跟商业价值之间有什么联系,哪些数据是它的KPI,哪些数据可以预测它的商业增长或者是预测它的商业衰落,这时候我们发现我们需要帮它。我们从大概从产品、渠道、用户、内容几个方面帮他们做移动咨询,帮他们做运营,用我们的数据、工具、人才深入到它的业务里面帮它做数据分析,帮他做建模,帮他做业务提升,并且已经取得了成效。

大部分做移动咨询的人来自于移动互联网游戏公司,大家知道游戏公司和其他互联网公司的特点是不一样的。其他的互联网公司靠用户的积累,靠流量变现。手游公司或者是游戏公司完全靠流水,完全靠付费,完全靠用户在游戏里面花钱。所以他们对用户的体验是非常关注的,如果一个手游游戏,我们有一个421的定律,一个手游游戏不在两个星期之内拿到一百万的用户,你基本上会死掉。如果一个手游游戏,隔日的留存里低于20%你也要死掉,所以说用户的经营对游戏公司来讲是非常重要的。

大数据

除了我们的数据平台咨询之后,我们有自己的方法论,大家还可以看一本书叫《精细化分析》,这本书会介绍海盗法则,我们2012年把海盗法则引入到中国。实际上我们到传统企业看了之后,除了3A3R之后我们也提出了商业意识的领域。

大数据

所以说我们利用3A3R论帮助所有的企业向移动互联网进军玩转移动互联网,这个时候我们发现很多企业,包括传统企业,我们面临了以金融、地产、零售、商旅、航旅,他们不知道他的日活多少是好的,他不知道留存率多少是好的,他不知道月活和年活,我们会在未来找一些典型的企业帮他们做行业的白皮书。有了这些标准和行业白皮书会指导这些企业怎么引导客户,这是我们的专业咨询服务。我们可以做战略,可以做运营,也可以做数据运营。

这是我们过去做的成果展示,经过三个月的时间,通过我们的数据分析、运营和实际建模,以及通过我们的活动策划,以及通过我们的APP测评、用户体验的提升,对整个企业有一个非常大的提升,在用户、渠道、产品和跨界合作活动中有这样的价值。TalkingData的愿景让所有的企业包括互联网企业了解数字化运营的环境,了解如何用数字来提升它的业务,了解它的应用,来洞察它的客户,这就是我们的愿景。

刚才也提到了,在客户跟企业之间,过去是直接联系的,现在隔了一个墙,这个墙就是移动APP或者是移动互联网,我们就是移动互联网的大数据服务提供商。我们帮所有的企业提供工具、数据、人才和其他的服务。

最后我们帮助企业洞察客户,触达客户和经营客户,这是我们帮企业带来的价值。我们在经营客户中基本每个单子都是百万以上的,这是我们去年一年做的。这是典型的客户案例,某信用卡中心某个APP,这个APP经过我们的数据和工具、运营咨询以后,它现在已经成为金融行业的TOPAPP,它的可活可以达到330万,装机有1000万,每个月给企业创造的净利润是两个亿,这经营好APP带来的商业价值。

大数据

接下来我跟大家再分享一下,我们认为数据在哪些场景,在哪些应用上可以给企业带来价值。一是老客经营,在精益分析这本书里面,我们看到线上的获客成本从四千块变成八百块,就是老客经营和新客获取。如果你数据用的好,你可以提高精准营销,我们帮助一个直销银行获客,在没有数据的时候一万个设备只有38个设备转化成客户,有数据以后第一次是380个,第二次是450个,整个转化率会提高10倍,这个30倍不是我们的案例,30倍是搜狗自己对外宣称他的精准营销的提升率可以达到30倍。

精准营销跟大家分享一个经验,精准营销转化率达到5%,如果你想提升到7%、10%甚至是20%,这时候你的广告投入是前面的几倍,如果大家做数字推广和数字转化营销。如果你得到5%的客户转化率已经是最好的了。包括我们看到亚马逊的推荐引擎,包括我们看到阿里淘宝推荐引擎,包括我们看到百度搜索推荐引擎,它们的转化率也就是6%到8%之间。

最后一个是跨境营销,数据分析可以看到客户在其他领域的兴趣爱好,利用这种兴趣爱好进行跨境营销,这是信用卡和游戏之间的跨境营销,互相导流,互相带用户,最大的价值不是说给游戏带来了多少个用户,给信用卡增加了多少用户,最大的价值是激活了40%的休眠客户,休眠客户的价值对企业来讲非常高。包括我们所谓的四大国有银行或者是五大国有银行,休眠客户占比基本上超过了1/3,有的可能会超过50%,APP的月活只有40%。

大数据

另外一个场景是市场调研,过去的市场调研包括我们做人口统计,过去我们国家做人口统计的时候都是在每个城市找一些典型小区,找几千人做一些样本,做一些采集。根据样本的数据推测整体的数据,包括你的收入、年龄构成、家庭人口、教育程度,以及整个家庭资产,过去都是小样本的。在大数据时代,我们已经有这种能力和技术实现全样本量的采集,通过全样本量的采集,我们做市场调研不会像以前发那么多问卷,我们可能会短时间内收集到很大的样本,经过计算以后,得到一个更接近真实全量数据的统计信息,大家有时间可以到TalkingData上看一下行业分析报告,这是过去所有做市场调查的公司所不能达到的。几个亿的样本和几百万的样本,你得出来的信息和真实度肯定是不一样的。

剩下的是行业洞察,我们讲一个案例,我们发现我们挑了五加在纳斯达克上市的移动游戏公司,我们用它的日活做了一个趋势,做了一个K线,两个K线一比,基本上相关率达到80%。但是最核心的东西是我们用它的日活率做的K线,我的曲线和股票表现的曲线有80%的相关度,并且比它提前量天预测股票。

大数据

另外,我们也会做一些企业的估值,比如说我们在移动互联网企业,很多并购,包括我们知道的美团和大众点评、携程和去哪儿,他们会到我们那里做一些净调拿一些真实的数据。我们也会跟市场调研机构成立一些基金,做智能手机行业的洞察报告,我们也做行业分析,这就是数据利用全样本或者是接近全样本数据或者是大样本数据我们能找到真实的数据。

还有一个是数据在房地产的应用,过去有些数据到三线城市做房地产的开发,当地政府非常希望他来开发,这时候他把户籍人口做土地价值最重要的参考。实际上企业开发好房子之后发现,这个地方是人口导出的地方,很多人在旁边的镇上已经按落落户,三十万人口可能留守的只有十几万人口,他开发的房地产根本卖不出去。这个时候如果用我们的解决方案,我们可以看到这块区域每天会进来多少设备,每天会出去多少设备,每天留在这里沉淀了多少设备,这些设备的标签,它的收入、消费、爱好、画像,通过这些信息可以影响土地的决策和土地购买的方式,我们已经跟很多房地产厂商合作,也跟一些规划院合作。

大数据

包括利用这些数据可以做商铺的规划,这个小区到底是以年轻人为主,我是以娱乐多一点,还是以餐饮多一点,通过数据可以告诉企业。然后是社区O2O打通,这是万达提出来的,在过去所有的房地产房子卖完之后卖掉了赚差价,这个小区里面有几十万的用户,这些用户其实也是非常大的金矿。我可不可以通过社区旁边的商户打通社区的O2O,比如说你去美容、健身和看电影的时候通过APP预定,你吃饭的时候也可以通过APP预定结帐,整个消费场景用APP打通,我有数据可以给商户贷款,我研究用户可以帮助商户推荐广告,这是社区O2O的打通,现在所有的商业地产都在做这件事情,包括我们知道碧桂园、恒达、万达、万科都在做这些事情。

这是选址,大家比较清楚,ATM、连锁店铺、连锁的酒店,最典型的是肯德基和麦当劳,安排八个人看一个星期,看客流量,最后统计一下如果周客流量超过十万,我就在这里办个点,麦当劳更很。现在有大数据,你可以通过大数据判断,在这个十字路口每天有多少设备流过,这些人的消费能力,他是外来的,还是本地的,他愿意吃什么口味的,他的年龄分布,然后来决定你办不办这个点,开不开这个连锁店。

大数据

最后是银行,大家知道这几年经济形势不太好,银行是走下坡的,他们的坏账率比较高,这时候它所有的战略中心要向移动端转移,要向零售金融转移。它要经营好客户,它要发展手机银行、直销银行,发展移动战略,它需要知道它的客户消费倾向和消费的爱好,这时候用我们的数据结合它自己的数据。在解决大数据应用的时候,中国最好的数据,就是在政府,其次是在运营商,其次在BAT,所有大数据应用场景,最好的数据就是第一方的数据。因为第一方的数据跟业务的结合度非常高,用银行的数据,其实我们结合外部的移动数据可以洞察到它的用户,找到它潜在的用户。

大数据

我举两三个场景,有一些是国内的,有一些是国外的,有一些信用卡公司,它想发白金信用卡,这些人都比较高端,他怎么找到这些白金信用卡呢?他采取数据的输入跟别人合作,如果这个人坐了一个航空公司的飞机,过去一年之内飞了三次国外,并且坐的是头等舱,我给他发白金信用卡。他跟自己的数据分析,发现在他的银行里面有很多人交了很多的物业费,比如说他交三千块钱以上的物业费,这些人在银行存款很低,说明有高资产的人群其实没有把钱存到他那里,他找人营销把资产拿过来。包括民生银行的阿拉丁就是典型的数据库营销,他可以根据外部的数据结合,银行现在正在面临很多互联网金融的挑战,很多银行的客户第一天发孔子,第二天把钱转走了,这些钱干吗去了?他结合我们的数据发现,有一批人他的钱一到工资卡账户上之后第二天转走了,接下来两三天他的余额宝特别活跃,说明他把钱从银行的环境中转到互联网理财,他用直销银行的产品比余额宝两倍的利率吸引他,把钱再从外部的互联网金融的平台再吸引到银行里面。数据的结合加上场景,可以帮助银行创造一些业务收入。

民生银行的阿拉丁是我们在银行里面看到比较好的商业应用的动态,蒲公英上线不到一年给他增加了将近400亿的存款,增加了100多亿的贷款。我们的数据其实也可以帮助银行找到消费人群、旅游人群和潜在购买房人群。

在互联网金融、消费金融,所有的信用损失60%以上来源于恶意欺诈,占了整个互联网金融或者是消费金融损失的一半以上。这些恶意欺诈已经成为了产业,过去羊毛党已经成为一个产业,恶意欺诈已经成为一个网络犯罪的产业,这些人会在淘宝上花五十块钱买真实的身份证号、真实的手机号,去各个金融互联网站注册骗贷款。

大数据

这些人有几个特征,第一个特征是团伙作案,他可能聚集在一个小区里面,同时在几个网站上借款,一旦成功以后就撤离小区。第二个是这些人他用于诈骗或者是欺诈的手机设备,跟它生活的手机设备是分开的,它的手机设备上只会装借款端,会装一些密码破解软件,他不会装自己的微信、游戏和新闻客户端,这是一个特点。

另外他会用虚假的信息,比如说我是北京国贸工作的员工,其实他根本没有在那里出现过。所有这些信息,其实利用移动大数据,我们是可以帮互联网金融公司,帮信用卡公司去做一些反欺诈的检测,这个已经在我们的客户那里得到应用,我们的数据帮他们做一些反欺诈的侦测。但是我们的数据只是他反欺诈的收入,它会有更多的数据。

大数据

再跟大家分享一个大数据隐私的问题,你拿了我的信息,在我不知情的情况下如果出卖给第三方是不是侵犯了我的隐私。如果是这种情况一定是侵犯了隐私。我们看在中国谁有最敏感的信息,有一个叫芝麻信用的公司它有最敏感的信息,它有你的手机号、家庭住址、收入、家人的信息。

但是如果他在你授权的情况下,使用这些信息的话,比如说你去贷款,你去互联网消费公司贷款,你去信用卡公司贷款或者你去住旅店、办签证,你都需要用芝麻信用做你个人信用的评测,这个时候是在你授权的前提下,芝麻信用调用你的信息给了你为你提供的商户、服务商或者是金融机构,在这种情况下是不侵犯隐私的。所以说我们把大数据隐私做一个界限,如果在消费者授权的情况下,你在外面的数据被有资质的机构,比如说做征信的公司被用到的不算侵犯隐私。但是你的隐私数据没有得到你的授权,被别人卖掉了或者用作商业用途,这种情况严重的侵犯个人隐私,我今天的分享就到这里,谢谢。

完整版PPT下载:TalkingData 大数据技术与应用实践.ppt

End.