要谈起大数据,必然要提到BAT等互联网公司,它们在大数据领域是先发者,不过这也很正常,因为它本身是有数据基因的,其天然的在线性,其血液中流淌着BIT的血,并通过BIT的形式来售卖自己的产品和服务,它如果不提大数据,不提DT,反倒是不正常了,况且他的数据处理能力和应用成熟度也是领先的。但是,从对整个社会的价值角度讲,其数据也是很受局限的,而运营商的数据也许更有代表性和竞争力。
先来说说BAT等互联网公司的大数据,其数据存在局部性、割裂性、封闭性和全面性等问题哦,当然这仅代表个人观点,如有异议,欢迎大家探讨:
(1)数据局部性:互联网公司的数据还是相互割裂的,比如淘宝只有淘宝的售卖数据,京东也一样,即使淘宝联合京东,他也只有在线销售的数据,它并没有百度搜索的数据,没有一家互联网公司的数据能够代表全局,具有战略眼光的互联网公司当然意识到这一点,当前的收购兼并相当程度是为数据而来。
(2)数据割裂性:互联网的数据整合困难,比如你在百度搜索了裤子,又在淘宝买了裤子,你的行为数据在两个地方以不同的形式存储,百度用了张三ID来代表你,而淘宝会用李四ID来代表你,但谁都不知道这是同一个人,还有广告个推的COOKIE等技术,也是短期的,不稳定的,当前大家都看得到很多互联网业务都依托QQ账号注册,非常方便,其实一定程度也反映了QQ希望ID融合的思路,互联网公司数据建模中的一个核心就是各类数据ID的统一。
(3)数据封闭性:很少有互联网公司愿意开放自己的数据,毕竟这是他的资产,是核心竞争力所在,因此所提的开放更多是商业模式层面和应用层面,而绝对不是指数据,“你来合作,数据给我”,现在互联网公司还是更多的在搜集数据,即使开放了一些,主要也是一些高度收敛的数据,当然一些互联网公司会相互合作交换数据,但这与开放无关,当前环境下,如何让互联网公司能够开放共享数据,从而推进社会的进步是值得研究的课题。
(4)数据全面性:在客户、业务、时间、空间等多个层次上,互联网公司的数据受限于自身的业务,其数据的范围和深度都是有限的,某宝也许对于线上购物用户有一定的刻画,但对于搜索领域、社交领域等很多互联网领域的信息仍然一无所知,同时其在空间、ID贯通上天生数据上的软肋,使得其对于人物兴趣偏好的客户还是比较片面的,以前某宝不是分析出来新疆的泳衣卖得好吗,但如果你深问为什么,可能只能回答也许新疆人好奇呗,但其实这个答案也许是瞎掰,我们只有知道买衣服的人从事什么职业,有什么特征,才能推测出具体的原因,从而制定更好的销售策略,谁知道买得人是不是个批发商啊或中间商呢。
当然,BAT等互联网公司的数据也具有自己的优势,比如对于自己从事的垂直领域数据具有较大的发言权,但从全面性、完整性等角度讲,运营商的数据也许更有代表性和竞争力,为什么呢?
客观的来说,运营商的数据资源是比较全面的,基于这类数据,能更立体的描述客户,也许还能回答我们在移动互联网时代最为关注的三个问题?我是谁,我在哪里,我在干什么,这是很多企业的数据难以比拟的。
下面就从技术、业务角度简要解读下最具价值的运营商的八类数据(当然运营商的数据远不止于此),这些数据在运营商内是被安全保存的,用户不用担心个人隐私会被泄露,如果要开放这些数据,也需要征得个人的同意和授权,我仅仅希望通过运营商的数据的一些解释来表明,运营商大数据对于未来社会的推动作用是巨大的:
1.位置
其实运营商有多种定位客户的手段,潜力很大。
(1)以手机附着的基站位置来判定用户的位置,城镇的误差在几百米,农村、山区在1公里以上。
(2)以MR数据来判定用户的位置,主要基于多个基站与手机的信号的距离衰减来定位,目前误差已可以做到几十米。
(3)WLAN热点定位、应急车、无人飞机等等:也许是几米哦。
因此,并不是运营商不拥有精准的位置数据,更多的在于投入成本的考虑,比如MR数据,涉及所有基站测量数据的搜集整合,会涉及系统的标准化和扩容。
但通过运营商的位置等信息,可以帮助用户带来生活的极大便利,举个例子,比如你想买房吧,买在哪个地段呢,以前你可能只能依赖于特定的媒体或房产商的忽悠,但卖瓜的说瓜好到底有多少真实性呢?,你可不希望所住的小区基本是一帮小年轻,每天三更半夜的活动,你也不希望每天听到广场舞,你希望是高端商务区,周边邻居用户好歹是一群白领,又比如政府想规划一条路啊,想建立一个发电站啊,企业想开个店啊,广告主想租一个户外媒体广告啊,所有的场景大家都希望了解周边的人群情况,判断下这些人群是否是你的目标客户哦,而所有这些,运营商的数据就可以帮到忙。
2.身份
当前国家要求手机实名认证,无论是手机、宽带都会提供更多的信息,数据的准确度是很高的。也许银行会说我的客户资料更靠谱吧,但运营商不仅客户信息覆盖完整,还可以基于实际行为进行验证,这是一般银行及其它企业无法比拟的。通过身份信息,可以帮助金融机构快速的判定用户的信用程度,贷款也许不再像以前那么困难,在银行,小贷,保险,投资各个领域,运营商的数据都具有极大的应用潜力,可以有效推进社会诚心体系的建立,阿里现在推出了芝麻信用,实际上就是通过身份相关信息的分析,来测算你的信用程度,从而为不同用户提供不同等级的服务。
3.上网
移动互联网时代大家将衣食住行信息都搬到了线上,所有的上网数据都以BIT的方式传给运营商以便计费,包括访问了什么网址,下载了什么应用,访问了什么内容等,这些信息都蕴藏着极大的价值,堪称网上生活的记录仪,当前部分运营商业开始尝试提供访问明细详单查询服务,以帮助用户理解自己的上网消费行为,不仅如此,在用户允许的条件下,运营商基于这些数据的挖掘,还可以高效的撮合需求方和提供方,比如帮助女性化妆品公司将它的新产品推荐给喜欢时髦化妆的女性,而不是乱发广告,帮助出版商向用户推荐他感兴趣的书,而不是将卖的最火的玄幻类书籍推荐给一个老人读者,让垃圾广告滚蛋吧,这个就是大数据的魅力,可以真正做到个性化服务。
4.社交
运营商拥有天然的社交数据,即通信交往圈(含语音,短信及彩信等),在一定程度上,其粘性是远高于QQ等交往圈的。
(1)通信交往圈:基于通信交往圈的大小,主被叫,时间序列,很容易得到任何一个用户的社交特征,比如某人的影响力,人与人之间的亲密程度,人群之间的上下属关系,甚至可以得到人脉路径,理论上,任何两个人都可以通过多个中间人的传递而认识对方哦。
(2)簇群网络:中国移动话务经营近几年最成功的产品是什么?,那就是推出了虚拟网,家庭网,亲情网,校讯通系列以簇群为核心的产品,这些产品一方面极大的提升了存量客户的稳定度,另外一方面,基于这些数据天然的形成了以工作,家庭和朋友的社交网络,这些社交数据是运营商巨大的金矿哦。
相信未来,通过用户之间的历史交往分析,能帮助找到遗失的朋友和曾经的用户,让志同道合的朋友聚合在一起,让陌生的双方有缘千里来相会;通过历史的连接,可以追踪到失信用户的踪迹,帮助维护公司正当权益;通过社交异动分析,可以找到欺诈电话和欺诈用户的规律,让欺诈无处遁形,从而让社会更加和谐。有次路过相亲大会,发现有大量的人聚集在那里,还在到处贴小纸条招亲哦,如果有了大数据,我想一定会让大家更快找到心仪的对象。
5.支出
用户每月愿意在通信上怎么花钱,能够深刻的反映用户的很多特征。
(1)支付能力:ARPU即用户每月的消费总额(当然周期也可以到每天),这个数据很有价值,因为它一定程度代表了某人的消费能力,我们曾经将这个数据作为重要变量以区分商务人士,发现其效果远远好于其他注册的一些信息,一些消费的变化还能微妙的感觉用户,比如每到月底有些用户的消费会突然降下来,说明这个用户属于消费敏感型哦。
(2)消费类型:运营商有客户最为详实的消费账单,账单中的每个费用项是有业务含义的,比如流量费,短信费、语音费、新业务费等等,这些信息都能反映用户的一些特征,比如流量很多说明喜欢上网,没流量说明是老人、打工仔、农民的可能性会大点。
通过用户支出额度、支付及时性、欠费情况等的分析,可以构建用户信用模型,为金融企业提供风控服务,通过消费类型的判断,可以帮助更好的刻画用户,让企业减少广告投放的盲目性,比如一个ARPU不到30元的男性用户就不要考虑投放宝马汽车广告了,一个消费敏感型的用户商家可以考虑多发些打折优惠券,说不定他会更感兴趣。
6.通信
运营商通过每次通信行为数据(包括语音,短信或彩信)的记录进行计费,这个数据其实也有很大的价值,除了可以了解用户的通信使用情况(比如本地,漫游,长途,国际等),还可以通过对端解读更多的信息,从而为用户提供更为便利的服务,比如运营商发现用户喜欢煲电话粥,就会推荐虚拟网,亲情网等产品,让大家享受更为便捷的通信服务,实际上,未来,运营商可以联合更多的企业,为用户提供更多贴心的服务,比如发现用户经常打快餐电话,会结合位置推荐适合你的快餐店,同时将快餐企业的优惠券及时推送给你,让每个人都能享受到价格公道的服务。当然,通信中蕴藏的巨大数据价值还有待我们去挖掘,这里仅作抛砖引玉。
7.终端
移动互联网时代,我们每天面对最多的是什么,终端,是的,掌握了终端的数据,你就理解了很多行为,也理解了终端产业的发展,而运营商天然就有终端的基因。
(1)手机终端:基于移动通信协议,每次你使用通信业务,你的终端信息就需要上传到运营商的网络中,并被忠实的记录下来,这个信息我们一般叫作(IMEI),是这款终端全球的唯一标识。每个厂家在生产终端时,都有自己特定的IMEI的格式,这就是在当前移动互联网中准确识别你终端型号的基础,任何终端的使用,变更,都被运营商系统准确的记录下来,因此,关于终端的大多数分析运营商都能做哦。
(2)平板终端/PC:如果你通过固话宽带上网,我们的系统记录的是你的网卡标识MAC,照样能够识别出你哦,也许你会说MAC无法判别PC或PAD型号吧,好吧,我告诉你浏览网页的时候还有个数据叫UA,他暴露了你的终端型号哦,甚至是操作系统。 基于这些数据,能帮助各类企业理解终端产业的发展情况,比如任何一款终端的使用情况,用户使用特征,发展趋势,用户换机周期等等,从而帮助终端企业改进产品,从而为用户带来更喜爱的产品;还能维护公平正义,杜绝一些终端厂商销售造假,比如双11销量的造假,在运营商的数据里,有真实的用户终端使用记录,是否造假,一查就明哦。
8.时序
基于运营商数据的多样性,比如通过用户上网,位置,通话等行为按照时间排列,可以了解更多规律,从而提供更多服务。比如,基于大量通话时序分析可以找到诈骗电话和短信的规律,从而实现精准的定位,在欺诈发生的时刻进行拦截,这些规律包括某个电话交往圈很多,对端都不一样,每次通话模式类似等;也可以对于防止银行卡盗刷提供支持,比如发现当前刷卡的POS机所处位置时间与该卡归属户主号码当前所处位置时间无法匹配等。
当然,运营商的大数据远不止于上面几类,其大数据全面性、多维性、中立性、完整性是其它企业很难比拟的,而且通过这些不同维度数据的交叉关联,可以创造更多的新数据和新价值。当前国家发布了《促进大数据发展的规划纲要》,将数据上升到国家基础性战略资源的高度,提出要加强顶层设计和头筹协调,大力推动公共数据互联网开放共享,消除信息孤岛,很多省也提出了推动大数据产业的相关举措,比如贵州成立了国内首家大数据交易所。
作为大数据的拥有者,运营商更应该承担其相应的责任,在确保客户信息安全的条件下,通过开放共享的方式,积极参与大数据生态体系的建立,通过创造大数据价值应用,有效得连接个人,企业和政府,让大数据真正服务于社会。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21