大数据如何改变世界?不尽数据滚滚来
世纪之初,全球化概念大热,弗里德曼告诉人们,世界是平的。大数据来袭的今天,人们越来越感觉,世界是透明的。大数据让社会生活更便捷的同时,也把人们的生活痕迹印刻在互联网上。挑战与机遇并存,价值与风险同在,如何趋利避害用好这把双刃剑,将考验人类智慧。
凡有井水处,皆谈大数据。关于大数据,先说个段子。
必胜客店的电话铃响了,客服人员拿起电话,通过会员卡号,顾客的住址电话一目了然。客服婉拒了海鲜披萨的点餐要求,因为顾客的胆固醇偏高。客服接着又推荐了低脂健康食谱,因为顾客上周刚从图书馆借走一本书《低脂健康食谱》。
接下来的对话更有精彩,容我录下来——
顾客:可以刷卡吗?
客服:对不起,您的信用卡已经刷爆了,您现在还欠银行4807元,而且还不包括房贷利息。
顾客:那我先去附近的提款机提款。
客服:根据记录,您已经超过今日提款限额。
顾客:算了,你们直接把披萨送到我家吧,家里有现金。你们多久送到?
客服:大约30分钟。如果您不想等,可以自己骑车来。
顾客:为什么?
客服:根据全球定位系统的车辆行驶自动跟踪系统记录,您有一辆摩托车正行驶在我们店附近。
顾客当即晕倒。
希望读者不要晕倒。没错,这就是街谈巷议的大数据。在这个愈来愈讲究用数字说话的时代,大数据的概念始终如盛夏般火热。即使在冬季,仍会有“春运大数据”、“双12消费大数据”这样吸引眼睛的消息跳跃在媒体头条。
什么是大数据
大数据这个IT行业术语,通俗点来说,就是巨量数据集合。
再具体一点?那就是麦肯锡全球研究所给出的定义:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
大数据之前,人们喜欢抽样调查,随机抽取的捷径。有了大数据,就可以采用所有数据进行分析处理。
比如说,一张小小公交卡。北京公交一卡通每天产生4千万条刷卡记录,分析这些刷卡记录,可以清晰了解北京市民的出行规律,以有效改善城市交通。
再举个商铺选址的例子,对大数据概念的理解会更加一目了然。
南京路上的先施公司,是老上海永远无法抹去的风景。1914年,侨商黄焕南去上海选址时,南京路还比较冷清,他派人到各路口,用数豆子的办法测定人流量,最后决定在南京路北兴建先施公司。
黄焕南为新店选址的办法,当时堪称机智。后来,人们通过统计网站拉数据的方法,费时费力费钱,还未必十分精准。而且,如果选址的范围扩展到全国城市,个人和小团队仅凭商业直觉和有限的知识是远远不够的,这时候,就需要大数据登场了,利用商业地理数据进行商业选址及消费者地理细分让难题迎刃而解。
打开手机地图,我们在手机APP上的位置信息最后都进入了各大公司的后台,人流量、人流方向、人流随时间变化,通过实时路况或热力图,一目了然,这些数据,正好可以用来做新店选址。
除了地图,还有强大的搜索引擎。当将搜索+LBS技术打通后,倘若地处城乡结合部的上海闵行区频繁出现“火锅”关键词搜索后,海底捞、小天鹅们可以适时考虑开家分店了。
透过选址一件事,可以看出,大数据技术的战略意义不仅在于掌握庞大的数据信息,还在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
大数据的应用
“广西的人最爱点赞,河北人最爱看段子,最关心时政的是山西人,最关注八卦的是天津。”
这组有趣的数据,是今日头条根据用户习惯得出的。上线刚4年的今日头条,恰是一款基于数据化挖掘的个性化信息推荐引擎,目前已经累计用户5.5亿,日活跃用户超过了6000万,成为增长最快的资讯类客户端。
过去是依靠人总结知识,现在可以通过系统、学习用户的行为特征来储存智慧。当你拿着手机每看一篇文章,你的每一次点击和搜索,各种行为,都会被记录下来产生数据,形成推送——这是今日头条带来的启示。
还有比今日头条更精准的算法,发生在美国明尼苏达州。
在明州,一家塔吉特门店被客户投诉,原因是一位中年男子指控塔吉特将婴儿产品优惠券寄给他的女儿,一个高中生。但没多久男子来电道歉,因为女儿经他逼问后坦承自己真的怀孕了。塔吉特百货靠着分析用户所有的购物数据,然后通过相关关系分析得出事情的真实状况。
说到购物数据分析,太平洋西岸的义乌商人也毫不逊色。11月9日,美国总统选举结果揭晓,共和党总统候选人唐纳德·特朗普赢得总统选举,将成为美国第四十五任总统。这个多少有些出人意料的结果,其实精明的义乌人早就预测到了。
原来,美国大选大量竞选的旗帜都是浙江义乌制造的。川普和希拉里两种旗帜,谁的订单量大,说明谁的支持度高。旗帜工厂的小老板,根据双方竞选旗订单的大数据预测特朗普必胜,惊呆了一帮吃瓜群众。
上述三则案例,是再真实不过的大数据运用。大数据究竟给我们带来什么,答案不言自明。
我们就是生活在这样一个数据时代,阅读、购物、看病、旅游,打电话、刷微博、聊QQ、用微信,都在不断产生新数据。大数据已经与我们的工作生活息息相关、须臾难离。
没有人会否认,大数据时代已经来临,并将深刻地改变着人们的工作和生活。走进KTV,点歌机推荐的歌曲都是你的“拿手菜”;开车上路,可以避开“红蚯蚓”选择畅通路;网上购物,电商会预判用户的消费需求,提前在离用户最近的社区储备商品,大大缩短送货时间……细细一想,都是大数据在背后帮你。
放眼世界,洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生;google流感趋势利用搜索关键词预测禽流感的散布;麻省理工学院利用手机定位数据和交通数据建立城市规划。
有没有小小数据在手,世界尽在掌握的感觉?
大数据技术已在交通、医疗、金融、制造、通讯、推荐系统等行业中得到了广泛深度应用,大数据加速制造业转型,大数据助力交通更加便捷高效,大数据驱动金融精细化运营,大数据助推精准医疗快速发展……通过运用数据来催生新的服务,这是正在实现的改变,而不再是一张画饼。
大数据的发展趋势
种种迹象显示,从最初的大数据定义之争,到挖掘大数据应用价值、协商合作方向,大数据产业已经进入务实发展阶段。
务实发展也让人们对大数据的思考渐趋冷静:大数据尽管运用领域广阔,也没必要神话,它就是互联网发展到现今阶段的一种特征而已。在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,为人类创造更多的价值。
简单来说一下云计算,这是个和大数据形影不离的“小伙伴”。
技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据无法用单台的计算机进行处理,必须采用
分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。可以说,大数据相当于海量数据的“数据库”,云计算相当于计算机和操作系统,将大量的硬件资源虚拟化后在进行分配使用。
整体来看,未来的趋势是,云计算作为计算资源的底层,支撑着上层的大数据处理,而大数据的发展趋势是,实时交互式的查询效率和分析能力,“动一下鼠标就可以在秒级操作PB级别的数据”。
科普一下,PB是较高级的存储单位。1PB=1024TB。1TB=1024G。
之所以提到云计算,是因为,大数据与云计算的深度结合在将来会更加紧密。
自2013年开始,大数据技术已开始和云计算技术紧密结合,预计未来两者关系将更为密切。除此之外,物联网、移动互联网等新兴计算形态,也将一齐助力大数据革命,让大数据营销发挥出更大的影响力。
大河奔涌,泥沙俱下,大数据的丰富,势必会带来大量低质量数据。想要成功,数据用户需要理解原始数据与数据分析之间的差距,从而消除低质量数据并通过商业智能获得更佳决策。所以,采用自助式商业智能工具进行大数据处理的企业将会脱颖而出。
大数据的野蛮成长,还会带来不少负面影响:未来几年数据泄露事件会接二连三,除非数据在源头就能够得到安全保障,企业需要从新的角度来确保自身以及客户数据的安全。
当然,数据泄露并不能阻拦数据科学成为一门专门学科的步伐。未来,各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。与此同时,基于数据这个基础平台,将建立起跨领域的数据共享平台,之后,数据共享将扩展到企业层面,并且成为未来产业的核心一环。
大数据让社会生活更智慧的同时,也把人们的生活痕迹印刻在互联网上。人们会担心,自己生活在四面透明的鱼缸里,难有秘密。网络安全,挑战与机遇并存,价值与风险同在,如何趋利避害用好这把双刃剑,将考验人类智慧。
大数据让世界更美好,这个时代愿景,随着防护手段的升级,会逐渐实现。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31