大数据应该也必将走下神坛_数据分析师培训
2013年,大数据[注]在中国异常火爆,有人认为2013年是中国的大数据元年,结合自己的学习和了解,谈几点心得。
一、大数据应用的分类和实例
目前业界对大数据的描述五花八门,但其实大数据应用主要分为两大类:一类是通过大数据来治理国家,这方面倡导的主要以学者涂子沛为主流;另一类就是大数据商业应用,提高商业效益和价值。
涂子沛先生先后写了两本书《大数据》、《数据之颠》;这两本书在国内的政商界引起过较大的反响。但看完他的书,通篇讲的是美国的信息开放、美国采用数据治理国家的过程及感想。结合他的这两本,以及本人近期看的《蓝血十杰》中的案例,简要说明一下大数据治国的案例。
美国是大数据治国做得最好的,其最早的应用就是人口普查,为什么要进行人口普查呢?主要是为了分配参议院的权利席位,每10年开展一次全国人口普查,然后对各州的参议院席位按人口比例进行分配;后来由于农业、工业生产的需要,逐步将普查扩展到农业、工业等多个领域。
美国是一个发现问题后很善于解决问题的国家,二战刚开始时,前线作战指挥官连战争中死亡和杀敌的数据都无法精准掌握,后勤补给更是一团乱麻,于是就有蓝血十杰之一的桑顿牵头,通过哈佛商学院定制培养,组建5000多人的统计管制处,这个部门其实就是用大数据的方法,对美国空军的各种飞机、备件、弹药武器等进行统计分析,并精准的投放到前线,有力的保障了前线的作战;深层次的就是精准分析那种飞机的作战性能,得出B17比B19更适合轰炸日本,为作战提供参谋,其实他们应用的就是今天所说的大数据。
还有一个案例就是911发生后,小布什紧急问周边的人员世贸大厦里面有多少人上班,死亡多少人,周边没有一个人能精准说出来,有人说13000多,有人说 3000多。911后,美国政府就建立了一个信息系统,这个系统能精准统计每个企业办公地址,企业的人员分布,每个住宅楼的家庭人数,这个系统后来为人口流动能提供依据,如果再次发生911,美国就能知道哪个大楼里面大致有多少人在办公,晚上哪个住宅发生火灾,那个楼里面大致住着多少人,这个系统通过对人员的流动还能预测经济运行健康情况等。
在大数据商业开发应用方面,目前主导的很多企业都在开展这些工作,特别是互联网公司走在行业的前列,如Google的无人驾驶汽车,Google、 Baidu、Taobao等开展精准营销、还有沃尔玛的尿布与啤酒的故事,淘宝对经济危机的提前预测、Goole对流行病的提前预测等。这些都是基于海量数据等归纳统计分析的结果。
二、大数据应该也必将走下神坛
大数据概念被吵得很热,很多人觉得很神秘,很高深,甚至有专家呼吁国家层面加大产业的投入,不能让大数据的技术落后,其实我倒是觉得大数据没有那么神秘高深,它必将走下神坛。
我认为,大数据是以“化石能源”为基础的这波工业经济发展到顶峰之后,人口红利已到尽头,靠规模取胜的时代已去,其他手段都难以大幅提升效益的情况下,通过精细化、精准化的数据分析做精做细就成了产业发展的必然。
任何事物发展都是倒置的抛物线,当整个全球经济、一个国家、一个产业处在爆发增长阶段,靠规模效应就能获得好的收益,就像20~10年前通信行业一样,发展一个用户就100%赠钱,谁会提精细化运作、流量经营。只有当用户发展遇到天花板、竞争异常激烈之后,大家才发现,粗暴式发展不行了,就需要经营出效益,就需要精细化。
当前的国际、国内无论是治国、还是工农商经济发展都遇到了瓶颈,各行各业大量的产能过剩,靠提高产量发展获得经济收益的时代一去不返了,所以一些经济学家提出了大数据。
大数据说白了,就是对过去的大量数据进行精准分析,归纳统计,精耕细作,他是改变过去那种粗犷的发展模式,向精细化要效益。所以它压根就不神秘,不高端,只是一个思维和行动方式的转变。
基于这种考虑,国家与其给钱扶持,不如给政策扶持,可以学习美国奥巴马政府,完善立法,如颁布《信息公开法》,引导国家机器、企业、个人强化精细化的意识,完善数据采集、共享、开放、应用的产业环境。
三、大数据是一个细致的技术活
基于上面我的分析,大数据是其他手段都用尽,而采用的从内部要效益的技术活,所以大数据还真是一个难度很高的技术活。
这个就好比一个学生,从60分努力提升到90分相对比较容易,而从90分提高到100分就是很难的活了。
而大数据就是一个从90分提高到100分的活,大家要想到,当前国际产业届,从60分提到90分的事情大家都想完了,早就干了。
这就好比,汽车行业,其实烧汽油让热能转化成动能让汽车跑起来这活,能量转化效益已提高到极致了,谁都难以找到一个好的办法将能量转化效益再提高10%, 除非进行能源革新,在汽油这事上可能性不大了。所以从节省能源的角度就有人提出无人驾驶,智能控制,减少因为人的原因造成的能源损失,当然节省能源只是无人驾驶汽车目的的一个方面。
四、大数据将应用到各行各业
当今社会,国家的竞争最主要的是经济实力的竞争,所以将治国和经济生活的界线其实很难划分的,治国也是为了经济服务,特别是目前国内的环境,我觉得中国的大数据可能最先在商业领域应用,然后倒逼应用到国家的治理之中,将来,我们的衣食住行都离不开大数据,因为当社会解决了生产力与人民需要之间的矛盾,国家发展到一定富裕阶段,人们的物质文化生活需要得到极大满足之后,靠人口红利的粗犷式发展模式必将转变,这就是政府提出的产业转型,其实转变的方式就是各行各业做精、做深、做细,因此所谓的大数据的思维模式必将在我们的农、工、商各行各业应用。
农业:国家现在的食物生产完全是粗犷式的,猪肉、葱、姜暴涨暴跌,如果应用大数据,这些问题将大幅减少,政府可以将全国、各个地区的各种食材需求、消费、生产、流通建立数据库,公开上网,可以精准指导各个地区的生产、调配、消费。这个事美国政府早就干了,可喜的国内生猪养殖已开始这么做了,所以近几年猪肉没有像以前那样暴涨暴跌了。
工业:现在国内的各行各业生产过剩,钢筋、水泥等都过剩,温氏内阁不是通过抑制产能,而且通过扩大应用消耗来救市。如果应用大数据,其实可以将各个地区的钢筋、水泥需求量化的,将这些信息公开就可以很好的指导工业生产了。美国其实也是这么干的。
商业:这方面的例子就更多了,最典型的就是电商的崛起对电脑城、家电连锁、传统商场、超市的冲击了。现在去电脑城,那个萧条简直让人无法相信。这些商业信息的公开,其实是有利于政府对商圈的规划、商业机构的招商、资金资源的最优流动和配置。
五、大数据将带来几个行业快速发展
首先是IDC行业的发展,目前中国的数据总量是250PB,而欧洲是4000PB、美国是3500PB.而且未来随着移动互联网、物联网、车联网、各种传感器的应用,数据采集存储处理的需求空间十分巨大。
其次是带来数据挖掘领域的崛起,有人嘲笑“现在有一台服务器就叫大数据”,其实这种以数据规模来衡量大数据是片面的,未来的大数据将应用在各行各业,比方说全国的不动产统计系统可能就很庞大,而未来针对个人的健康监控系统规模就很小,将来每个人可以将自己每天的吃喝拉撒睡数据进行统计分析,实时监控个人的健康状况,这个也是大数据啊。
再就是与数据相关的各种智能:如人工智能、无人驾驶、智能城市等,这些东西就是通过数据处理、分析、应用来替代人工,提高行业效益。
六、任重道远、且行且珍惜
奥巴马政府对大数据异常重视,将其定位为国家战略,从立法、政策制定、组织匹配、产业扶持等各个方面推动大数据的应用。
而我国政界目前仍是“雷声大、雨点小”,可喜的是这届政府比较开明,有几个可喜的事件:1、今年三月习总带队七常委考察中关村,重点听取李彦宏、雷军讲解大数据;2、主管工业的汪洋副总理多次提到大数据,其在广东主政期间,大力推动政务公开;3、北京市政府已开始开放部分数据信息,开信息开放先河。
当然国内的环境还很不健全,主要是法律、政策等方面很不健全,民间出现信任危机,导致信息公开、共享、合作的气氛不健全。
最后用两句流行的话做结语:“前途是光明的,道路是曲折的”,“且行且珍惜!”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析工作中,你可能经常遇到这样的问题: 从浏览到消费的转化率一直很低,那到底该优化哪里呢? 如果你要投放广告该怎么 ...
2025-02-25近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的,尤 ...
2025-02-25挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-25在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-25以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-25“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-25在数据分析中,地图是一种非常直观的可视化工具,能够帮助我们更好地理解数据在地理空间上的分布情况。无论是展示销售数据、人口 ...
2025-02-25春风拂面,金三银四的求职季如期而至。谁都想在这场竞争里拿下心仪offer。 一份亮眼简历是求职敲门砖,面试紧张则可能让机会溜 ...
2025-02-24当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03