大数据:21世纪的淘金热也是新污染源_数据分析师
网络是虚拟的,但是信息技术的环境成本,可不是虚拟的。 来听听法国IT专家Jean-Marc Pierson和Laurent Lefèvre如何解读大数据的污染性。
贸易、金融、卫生、交通、文化、科学……大数据无所不在,对于许多人来说它代表21世纪的石油。
每天,大数据产业的版图不断扩张,全球数以百万计的直接就业机会与此相关。但是我们似乎忽视了一个事实:一切都是有代价的。大数据的代价是环保。这种虚拟、远程信息的背后,是实实在在的基础设施,是高能耗、高碳影响。大数据具有污染性,无须讳言。
庞大的基础设施
大数据,关乎数据的生产、采集、存储、分析和可视化。高德纳及大部分大数据产业公司,使用3V来描述大数据:Volume(大小)、Velocity(输入输出速度)、Variety(多样性)。有机构在3V之外定义了第4个V:Veracity(真实性)。大数据如潮水般涌来,以前所未有的速度与规模改变着我们的世界。2015年,大数据的体量将达到1021字节,用来存储这些数据的基础设备也达到前所未有的规模。
别忘了存储只是第一步,还要处理呢。以谷歌为例,数以百万计的文件被编上索引,以方便用户搜索;同时,分析这些数据,以向用户提供广告内容。为了实现这些数据处理,据估计,谷歌拥有超过100万台服务器。其他三个网络巨头:亚马逊、微软、Facebook,也是如此。基础设施或自建或租用,小型的企业和机构往往借助成千上万相互关联的设备,完成数据采集与分析。
能源需求要遏制
由法国国家科学研究中心创建的Écoinfo服务组合工程,再次提醒我们信息技术是高能耗产业、温室气体大户。在Écoinfo使用阶段,大数据的基本要素可分为三类:终端设备,网络,数据中心;2013年每一类都消耗了约40吉瓦电力。(什么概念?福岛第一核电站,设有六个机组,总发电量为4.7吉瓦。)这样的电力消耗,对气候的影响不难想见,即使碳排放量取决于国家的能源结构(法国2月份,34克CO2/每千瓦时)。
有了觉悟,我们就可以采取措施,提高基础设施的计算、沟通、存储能力,在设备的设计与回收上运用创新科技,在保证服务质量的同时减少能耗。
作为污染源的大数据可以减少其他污染源吗?
可以!大数据分析可以优化工业生产过程,从而减少碳排放;农民可以通过传感器和卫星图像实时接收庄稼信息,让灌溉与施肥恰到好处,不产生浪费。
简单的数据收集与运用还可能导致行为的改变。在美国波特兰,某个社区安装了传感器来测量周边空气质量并在网上公布,比环境保护局测得的数据更精准;根据这样的开放数据,人们减少了在汽车污染高峰时出行。去年,北京市政府与IBM达成合作协议,希望利用大数据处理能力治理雾霾。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的,尤 ...
2025-02-25挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-25在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-25以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-25“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-25在数据分析中,地图是一种非常直观的可视化工具,能够帮助我们更好地理解数据在地理空间上的分布情况。无论是展示销售数据、人口 ...
2025-02-25春风拂面,金三银四的求职季如期而至。谁都想在这场竞争里拿下心仪offer。 一份亮眼简历是求职敲门砖,面试紧张则可能让机会溜 ...
2025-02-24当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02