大数据是一种有着真正未来的趋势_数据分析师
我们是从什么时候开始进入大数据时代的?也许是从第一台智能手机被研发出来之日开始,也许是从Facebook、Twitter等社交网站诞生之日开始,也许是从大容量存储设备的制造成本降低之日开始,也许是从非结构化数据的有效分析模型的构建之日开始……我们无从确认,但我们可以理一理这一系列事件的发展顺序,也许我们能从中发现点什么。随着科技环境的巨变,首先是个人电脑的全球普及,然后是移动智能终端的盛行,随之而来的是社交网络的爆炸式发展,还有物联网在政府、企业组织的积极倡导下迅猛的发展,当然,传感技术在其间功不可没,数以千万计的联网传感器节点分布在交通、汽车、工业、公用事业和零售部门。还有存储技术的发展等,这些都让数据的生产和收集的能力和速度都得到大幅的提升。然后还有非结构化/半结构化数据的有效分析模型的构建,相关软硬件的支撑,让数据的分析能力得到大幅的提升。数据多了,形式复杂了,数据的获取正在变得越来越细致,也越来越个人化。与此相对立的,数据的传送、分享和访问能力也得到彻底变革。
中国有句古语“雁过尚且留声,人生岂能无痕“,出于对利益的追逐,出于对市场的占领,出于对客户的洞察,过去人们使用各种终端的难以被描述的自以为毫无意义的行为在今天被他们事无巨细地详尽地记录、保存了下来,而且这不是某一时刻的单一行为,而是持续性的实时行为,同时,网民、手机用户在增加,终端数量、终端类型在增加,网站、应用在增加,与此同时,社会上的各行各业,从电信、IT业,到金融、证券、保险、航空、酒店服务业等,地球上的各种存在,从每个人到每棵树、每朵花乃至每粒沙子,无一例外地都在成为大数据的生成者。于是,在量和面上的双重积累,数据从产生的源头开始进入爆炸式的增长阶段。
也许以上所述未必能让你直观地了解大数据时代的形象,以下是我在网上找到的一些比较直接的数字:无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据,数以亿计用户的互联网服务时时刻刻在产生巨量的交互,全球资料量在十年间就增加了60倍以上,一分钟内Twitter上新发的信息数超过10万,在Facebook上有超过600万的浏览量,每天产生的数据为2.5 quintillion。信息量每年正以最少59%速度在递增,到2020年世界上的数据存储总额将达到35 ZB。而更关键的是,这些信息不再是单纯的数字和文字,它包括比文字更复杂的图片、音频和视频。
好吧,回到最开始的问题,要界定“我们是从什么时候开始进入大数据时代的”或许比较困难,但如果哪一天你在浏览网页时发现页面推出的个性化广告框里的商品正是你数天前在视频中曾经与你朋友说起过的某样你很喜欢的物品时,你就可以确认你已经陷入了大数据时代。
现在,我们都知道“大数据”已经来了,但是我们还存有疑问:大数据究竟只是一个时髦的概念,还是一个无可逆转的趋势?这么多年来我们经历了太多的科技热点,而真正有着未来的只是小数,我们需要分辨出哪些是未来的趋势,哪些是时髦的概念。这是一个谨慎的问题,事关行业的巨额投资,事关企业的成本投入,甚至事关很多人的职业选择。关于这个问题,我想可以从以下几个关键点进行判断:第一,能否产生价值;第二,是否具有生命力;第三,是否不容易被替代。
关于大数据的价值,之后会有单独的篇章来论述,在此不详细展开来谈,只作“能/否”的判断。了解客户的需求,这对任何行业任何企业来说都是至关重要,如何了解?必经的方法是通过数据分析。现在数据越来越大,越来越复杂,增长越来越快,而竞争的压力,创新的需求,业务规划的需求对数据处理的实时性、有效性又提出了更高要求,过去传统的数据分析技术已经跟不上数据发展的步伐,在这样的背景下,大数据技术就应运而生了。通过大数据,人们可以对非结构化/半结构化数据进行实时监测和分析,从而制定相应的产品和服务推广方案,因此,我们可以判断,大数据是能产生价值的。
是否具有生命力关键在于看其立足的土壤是否能保证足够的养分供给或能量补充,以及是否有足够的生长空间。对大数据而言,其立足的土壤是指投入到大数据中,为大数据的发展提供动力的众多企业,如大数据的重要倡导者 – IBM、EMC,生成大数据的源头 – 苹果,生成大数据的介质 – Facebook、Twitter,大数据的汇集地 – 亚马逊,还有Google这样的大数据集大成者,当然大数据的“土壤”远远不止这些,还有包括众多的大数据技术的开发者,大数据分析服务提供商,大数据可视化服务提供商,大数据众包模式参与者等等,这个队伍还在逐渐的发展壮大。随着众多公司的加入,源源不绝地提供给大数据发展所需的养分,其他行业的发展(如传感技术,存储技术)也给大数据提供相当给力的能量补充。
生长空间对大数据而言是指应用大数据的企业和组织。根据IBM的调查发现,83%的CIO认为商业智能分析逐渐成为企业的最高战略。而国际研究顾问机构Gartner则表示,大数据将带动2012年280亿美元的全球IT支出,2013年带动之IT支出规模可望进一步增至340亿美元。越来越多企业意识到大数据对于企业发展的重要性,也越来越多企业愿意将成本投放到大数据的应用上,决策将日益基于数据和分析而作出,而并非基于经验和直觉。因此,我们可以认为大数据具有庞大的生长空间。
综合以上两点,我们可以得出大数据具有蓬勃的生命力的结论。
考量一个事物是否会被轻易替代,关键在于看其是否具有同类型的竞争者,其核心竞争力是否鲜明,其与竞品的边界是清晰还是模糊。举个例子,上网本之所以被市场迅速淘汰,原因在于其与同类型竞争者(笔记本电脑,平板电脑)相比核心竞争力较弱,而区分的边界相对模糊,在功能上趋近笔记本电脑而又弱于笔电,在便捷程度,娱乐性方面趋近平板电脑而又弱于平板电脑,因此其被淘汰是在情理之中。回到大数据上,大数据与数据虽然只是一字之差,但其内涵则是相差迥异(大数据与数据的区别下篇会重点提到,在此不详述),相互不具有替代性。而目前在处理巨量复杂数据上,尚未出现竞争者(由于目前大数据还是一个内涵庞大的概念,可以预料将来必然会分裂,细化,届时将出现大数据框架内的竞争双方)。根据Gartner的预期,目前大数据的领先企业到2015年底会开始把大数据的经验,深入应用于其架构和业务中,到2018年,当传统解决方案亦具有新特色和功能以更灵活地因应不同容量、种类和速度的需求,大数据解决方案的领先优势会逐渐减少。然而,大数据解决方案目前具备的技术、实行方法和工具仍会延续,因为领先企业已具体落实设计原则和取得必要的技术以将解决巨量复杂数据的问题视为惯常的弹性。因此,我们可以初步判断,大数据在之后相对长的一段时间内不容易被替代。
综合以上三个关键点,我们可以判断大数据不是一个时髦的概念,而是一个具有真正未来的趋势。
除此之外,或许我们还需要一些佐证,以下两个案例均可从另一个角度说明大数据是一个趋势(案例来源于网络)。
佐证1:美国政府认识到了一个国家拥有数据的规模,活性及解释运用的能力将成为综合国力的重要组成部分:今年3月奥巴马宣布以2亿美元投资大数据领域,美国政府将数据定义为“未来的新石油”,未来对数据的占有和控制甚至将成为继陆权、海权、空权之外另一个国家核心资产。
佐证2:IBM较早预见到了大数据的商业机遇并果断布局,进而成功地完成从PC厂商向商业智能服务商的转型。纵观IBM近5年来的大手笔收购多与大数据有关:07年IBM收购了商务智能软件供应商Congnos;09年IBM收购著名的统计分析软件SPSS;10年IBM收购数据库分析供应商Netezza……这一系列布局,为IBM业绩带来了稳定高速的增长。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13