大数据的关键不是“大”,而是你真的需要它吗?
诸如我们听到的、看到的和正在自觉或不自觉地参与的,大数据已成为一项大工程,它无处不在。我们对待它就像在迎接自己的终生伴侣,兴奋之情溢于言表。每个人都在想:“嘿,大数据时代来了,我能从中得到什么好处呢?”从社交媒体、初创公司到北京的中关村,人们都在研究和部署大数据。
但是,正如前面我们提到的,大数据不是无源之水,你需要一个充足的理由来为它打开大门,让它进入你的世界;同时,你还需要为此付出不菲的代价。大多数公司缺乏预算,它们花不了大价钱来部署大数据技术解决方案,也请不起相关团队和大数据工程师。
大数据首先是一项产业,根据一份报告显示,2012年大数据带动了全球近300亿美元的IT支出,预计再过4年这个数字将超过2500亿美元。还有许多新兴国家难以预料的市场空间没有计算在内。要知道,这几乎是一个中等发达国家的全年国内经济总产值了。
那些使用大数据的辉煌案例到处都是,但距离某些特定人群总是如此遥远。比如,脸书的推广人员骄傲地说,他们每天要存储大约100TB的用户数据;美国国家安全局(NSA)每天要处理约24TB的数据。惊人的数字!确实令我们印象深刻。可是处理这些数据所需要的成本是多少呢?根据一项公开资料显示,NSA需要为45天的数据存储服务支付超过百万美元的费用,这个成本还在继续增加。在我几年的走访中,大多数公司的CIO也对我说,他们的预算支付不起大数据部署的成本。
所以,这是昂贵的门槛——公司如果想获得大数据服务,第一件要解决的事情就是提供充足的财务预算。
没钱?对不起,这不是卖白菜,也不是批发廉价商品或请几个经理人那么简单。因此我经常听到人们抱怨:“大数据太贵了!”个人和企业都在仰天叹息,但同时又充满渴望。问题是,你真的需要它吗?
数据存储和处理的成本如此之高,成本变成了阻碍每一个人拥抱大数据的最大障碍,就像其他一切新生事物一样。以至于我们普通人——中小企业需要寻求其他的解决方案,让规模较小的公司和个体不被“大数据”拒之门外。
方案一:大数据的关键不是“大”。
大数据就一定“大”吗?虽然全球最大的科技公司都需要和PB级规模的数据打交道,它们当之无愧地成为对海量数据处理达到星级服务的用户。然而,我们的研究也表明,另外有95%的公司通常只需要使用0.5TB到40TB的数据,甚至更少。
脸书和NSA的故事并不能拿来作为普及版案例,它们不是常态。事实是,大公司的方案没有必要成为中小公司效仿的版本。在全美有5万多家公司的员工只有20到500人,它们大部分都有解决数据问题的需求,但它们并没有向脸书和NSA看齐,去建立一个成本高昂的数据帝国。
所以你看到,大数据市场最大的需求并不是那些居于世界前500强的大公司,而是排名在500到5万之间的公司。我们为何只关注那些极少数的例外,而忽视了普通的需求者呢?
将自己排除在PB级规模数据需求的用户之外,我们才有可能找到真正的方案。当大数据向我们走来时,我们应尽可能选择一个较小的接口,一样能享受同等的服务和便捷。
方案二:确定你是否真的需要它。
在向人们普及大数据时我经常在想,如果我们改变了大数据的定义,会发生什么?换一个角度,用更宏观的思维来思考它,你就能够跳出来,站在自我需求的角度去进行思考。
我们不妨这样考虑:“大数据是一种主观状态,它描述的是一个公司(个人)的基础架构(现状)无法满足其对于数据处理的需求时的情形。”
从某种意义上来说,这个判断是“灰色”的,可能没有人们想象的那么灿烂美好。没有需求就不需要大数据。不过它更贴近事实:不是所有人都必须与大数据时代接轨,当你看到它扑面而来时,你要做的第一件事是确定自己是否真的需要它,然后再采取恰当的行动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13