观点| 不迷信不盲从!不要夸大数据中心的作用
当今社会,科技发展突飞猛进,数据中心作为一种新型基础设施,已成为支撑城市建设和经济运行的中枢系统。随着“网络强国”战略的全面实施和新型城镇化步伐的加快,城市数据中心的作用和战略价值将更加突出。为此,各省市积极抢抓新一代信息基础设施建设的重要机遇,加快城市级数据中心的建设布局,大力支撑新型智慧城市建设,且希望借机带动新兴产业的发展。
随着物联网、云计算、大数据、“互联网+”等新信息技术的快速发展与广泛应用,信息资源成为了战略性资源,积极推动经济社会向数字化、智能化、智慧化转型升级。城市数据中心规划建设受到了社会各界的广泛关注,针对数据中心建设运行的先进性、安全性、规范性、效益性研究也全面展开。近几年,我国制定出台了“宽带中国”、“互联网+”、“信息消费”、“信息惠民”以及大数据、云计算等一系列政策文件,极大刺激了对数据中心的需求,尤其是各省市新型智慧城市的建设,更是把城市数据中心的地位提升到了一个新的高度。
随着我国互联网+、云计算和大数据产业的快速发展,数据中心产业也进入了大规模规划建设与发展阶段。各省市根据国家相关政策文件,加快制定实施新兴产业发展与数据中心建设规划,各地方政府大力加强招商引资力度,积极推动城市级云数据中心建设,同时三大运营商、大型“互联网+”企业、信息通信设备制造商以及国际IT巨头等纷纷投入到各种模式的数据中心建设浪潮之中抢占数据中心的巨大市场份额,这也推动了各种数据中心的急剧发展。目前,三大运营商在我国295个地级以上城市数据中心建设覆盖率达到了90%以上,近1/3的大型数据中心有集中在北上广等发达城市,其中中国移动在各地的数据中心密集开工,到2016数据中心全网机柜突破10万架,中国联通将在全国规划建设十大云数据中心,总机架数将超过25万架。据统计,目前我国每年新增数据中心投资规模大约在1000亿元人民币左右,主要包含服务器、网络设备、信息安全设备以及基础设施产品等,预计到达2020年,我国数据中心保有量将超过8万个,总面积将超过3000万平米。
随着我国对城市数据中心的重视以及相关企业的积极参与,城市数据中心建设规模快速扩大,对我国信息化的快速发展与信息经济的融合创新起到了重要支撑作用。与此同时,城市数据中心也出现了盲目建设的现象,不仅虚火上升,且软肋明显,严重造成了城市数据中心的重复建设与社会资源浪费。
第一,城市数据中心市场虚火较大。由于各省市信息化建设步伐的加快,以及培育云计算、大数据等新兴产业的经济发展需求,就造成了各地市不断加大招商引智规模,大力加强以云计算技术为核心的城市数据中心,几乎每个城市至少有2个数据中心,多的达到5个以上,数据中心热带来了非常明显的虚火。事实上,城市数据中心应该发挥云计算技术的优势,有效整合现有数据中心的服务器资源,提高资源利用率。但现实情况确是反其道而行之,不断规划建设大量的云计算中心,存在很大的盲目性,造成数据中心严重过剩。
第二,城市数据中心建设带来巨大资源损耗。数据中心建设不仅带来服务器、网络设备及相关基础设施的损耗,长期运营也将带来巨大的电力损耗。事实上,目前数据中心的能源消耗是非常大的,据统计,规模为100个机架的数据中心来说,加上数据中心的空调、新风、照明、其他电力能耗,每年电力耗能将达到100万度以上。据预测,到2020年我国数据中心能耗将达到1000亿度,这将带来巨大的能源消耗压力。
第三,城市数据中心资源没有充分发挥价值。由于数据中心建设规模的迅速扩大及低水平运营,造成了城市数据中心资源的浪费,没有真正发挥其作用,这也成为了我国数据中心普遍存在的软肋。一方面,数据中心产能过剩造成投产率低,数据统计表明超大型数据中心的投产率1.8%,大型数据中心投产率21.5%,中小型数据中心投产率40%,到2016年数据中心的平均投产率约为50%左右。另一方面,由于地理位置以及经济发展水平的差异,造成了各数据中心业务量的严重不均衡,缺乏真正大数据的安全存储与开发应用,进一步造成了大量数据中心资源的闲置。
第四,城市数据中心普遍存在缺乏数据的现象。城市数据中心运行服务的基础是数据,但缺乏数据应用的数据中心比比皆是。由于长期以来我国缺乏数据资源管理和应用的基础,制度缺乏、数据缺失现象比较严重,这就造成了数据采集、比对、共享、开放的难度超出了想象,打破“信息孤岛”举步维艰。所以,在推进新型智慧城市建设过程中,各地并没有考虑到实际情况,基本上第一步都是先建城市数据中心,但数据资源梳理入库和整合共享无法按计划推进,城市数据中心的数据资源量十分有限,不仅无法实施有效的交换共享,大数据的决策支持更是奢望。
第五,城市数据中心缺少标准化的数据管理系统。近年来,随着政府数据资源整合共享力度的不断加大,城市数据中心的功能也在快速升级,在负责电子政务网络与各部门应用系统存储基础上,加快推动政府数据资源的整合与开发利用。由于缺乏统一的标准规范及数据中心基础管理系统,各城市数据中心基本上都是根据各个IT公司的解决方案搭建数据管理与应用系统,模式多样、功能不一、架构自定,不仅造成了新的区域孤岛,且带来了公共信息资源管理的混乱,使数据资源的价值大打折扣。这已成为我国城市数据中心建设存在的最大软肋,直接影响各地市信息化发展水平,极大制约新型智慧城市建设及“互联网++政务服务”的实施。
第一,合理布局。根据我国城市数据中心建设现状及未来趋势,进一步修改完善国家关于数据中心建设布局方面的政策文件,按照交通区位、环境资源、业务需求等指标进行合理布局,充分发挥区域城市数据中心的作用。
第二,总量控制。加强对国家、省、市、县各级政府以及企业对城市数据中心需求量的科学评估,实施城市数据中心与存储设备的总量控制,逐渐淘汰多余的数据中心,避免造成重复建设与资源浪费。
第三,区域共享。加强对“互联网+政府服务”模式以及各级政府数据中心价值的研究,科学制定城市数据中心的建设运营模式,不允许地级以下城市建设数据中心,统一共享区域地级市城市数据中心存储资源,加强统一协调,实现资源共享,减少重复建设。
第四,市场导向。利用市场的手段加强对城市数据中心市场的调控,根据城市数据中心的不同建设规模,加强绿色数据中心建设,提高数据中心安全系数,使城市数据中心走上科学的发展道路。
第五,规范建设。加强城市数据中心管理与应用系统的标准化建设,积极推广政务大数据智能管理系统,严格数据资源梳理、数据清单制定、元数据标准化管理、数据资源目录管理以及信息资源库架构管理等流程,实现城市数据中心标准化建设,真正发挥城市数据中心的作用。
针对我国城市数据中心建设运营方面存在的问题和软肋,中国信息协会副会长胡小明对大数据建设与使用热潮中存在的一系列问题进行了更深入的剖析。
1 灰色的数据空间
数据空间是灰色的
大数据热透全国之时,需要强调数据并不等于真实世界。将现实抽象为数字需要忽略许多信息,例如必须忽略统计对象间的差别才能进行统计,难以数字化的信息在数据空间中是没有位置的,容易数字化的信息则占据了太大的空间,数据空间无法全面反映世界,靠大数据技术就能认识世界的想法并不靠谱。
认识无止境,不断有新问题产生
互联网之前人们认为决策水平不高是因信息不足、缺乏信息共享,互联网实现了信息爆炸、推动了全球信息共享之后,决策水平依然不高,人们发觉原因竟然是信息过多使人迷惑,信息不足与信息过度后果是一样的。如今人们认为决策水平低是因为缺乏大数据分析,有了大数据分析决策水平一定能提高吗?不一定,过多依赖大数据分析同样会拉低决策水平。
不要迷信工具,工具自带局限性
经验告诉我们不能迷信工具,正如不能迷信包治百病的灵丹妙药一样,任何工具都会带来先天的局限性,大数据技术也是一样,都有其致命的灯下黑,如果不能回避其薄弱点而盲目夸大其作用,会比没有大数据技术更糟,大数据技术的欺骗能力与造福能力不相上下。
不要迷信数据,数据到价值的距离漫长
数据世界并不能替代真实世界,只靠数据决策和只靠地图打仗一样不靠谱。数据本身并无价值,只在对实现目标有贡献时才产生价值。数据价值实现还依赖使用者的眼光、数据处理的能力,从数据到价值的路程太漫长,大部分数据很难实现其价值。外部互联网数据资源日益丰富不断增加对数据中心的竞争力,使政府决策对数据中心的依赖度也不断下降。
2 大数据应用的局限
不是所有的信息都能数字化
大数据技术能够充分挖掘大量数据中所包含的信息以支持政府决策,但是过分依赖大数据会产生另一种片面性。因为并不是所有的信息都能够数字化,在宏观决策中很多重要的信息恰恰是很难数字化的,例如未来趋势、社会的情绪、团队的士气、人们的欲望以及这些因素的相互作用等都难以用数据表达,大数据善于表述某方面精准信息却容易忽略全面的信息,并不比拍脑袋决策强到哪里。
巨大的数据量是以业务面狭窄为代价的
不能以为数据规模大所包含的信息就一定重要,其实数据量越大涉及的领域越窄,因为只有在狭窄的领域中才能形成巨大的数据量,从其中挖掘出来的信息也带有领域狭窄的局限性,其所预测的范围也会狭窄,因此大数据预测适合于局部性、专业性领域。
因数据源缺乏产生的局限性
大数据应用的实际困难经常来自数据源缺乏,因为大数据的收集成本太高,无法像统计调查那样为收集数据而设计调查方案,大数据主要是来自大规模业务工作的副产品,如移动通信的联网数据、互联网搜索数据、电子商务数据、社交网络数据等等,大数据应用对数据源的依赖性限制了应用的普及,在很多情况下大数据应用远不如常规小数据应用方便。
大数据并不适合大决策
大数据应用对优化城市管理有很大贡献,特别在某些专业化领域,如金融风险防范、刑事案件侦破、用户产品推荐、广告效果优化等等,但是大数据技术并不适合于政府高层决策,大数据应用并不能使政府高层决策科学化,高层决策更关注全面的态势,而大数据信息视野太窄只适合具体业务应用,更重要的是,高层决策要面对许多不确定性问题,大数据处理不确定性问题不如有经验的领导人处理得好。
3 数据整合的意义
大数据、小数据整合方法不同
数据整合是数据中心的核心工作,小数据的整合主要是原始数据的整合,数据整合主要是不同部门的业务处理数据,按照处理的对象链接起来,并进行数据核对,确保数据的精准对接,以支持政府的精细化服务。小数据的整合是政府数据整合的重点。
大数据的整合主要是大数据处理结果的整合,大数据处理成本很高,减少使用时的再处理是非常重要的,大数据处理的结果可以浓缩为报表、可视化展示等多种形式以方便后续应用,针对具体目标的搜索数据可以整理成数据库,如信用库、用户库、黑名单等,方便查询。
小数据整合的价值
政府业务数据的整合将有效提升数据的价值,业务数据的产生只反映该业务部门的视角,这对于掌握服务对象(人、企业、项目等等)的全面情况是不够的,如果能够将各部门积累的业务数据整合起来就会产生对服务对象全面、精准的认识,对管理与服务的改进有重要意义。信息本质是事物间的相互关系,关系是多维的、网状的,只有整合起来才能反映关系的全面属性。
政府精细化管理依赖小数据整合
政府的管理与服务工作主要通过各部门规范化业务来实现,而业务数据就是这种管理与服务的记录,业务数据成为进一步服务的依据,相关业务数据整合一体对于政府的精细化管理有着重要意义,数据精准是管理精准的基础,当工作人员对服务对象信息能够全面调用之时,服务会更精准、更快速,用户会少跑腿,用户欺诈行为也会大大减少。
大数据整合的两个方向
大数据整合的目的是降低数据再利用的成本。大数据应用有宏观与微观两个不同方向,其数据整合也有两种模式,统计模式与搜索模式。统计模式对应宏观应用,其目的是挖掘数据整体的信息,认识属性间的相关关系,用于政府宏观决策。大数据应用成果多以报表或可视化态势图来表示。数据中心的大数据整合业务主要是这种模式。
搜索模式对应大数据的微观应用,关注焦点是个体行为信息,如个别用户的消费习性、行为规律等。这种模式大量用于安全风险防范(如反恐、破案、金融安全等)。搜索模式多以数据库形式提供查询(如用户CRM、个人征信库、黑名单等)。以搜索为中心的大数据整合十分复杂,多由专业机构承担,一般不作为数据中心的主要业务。
4 数据中心如何生存
不要夸大数据中心的作用
智慧城市的宣传过分夸大了数据中心的作用,为数据中心设立达不到的标准对其发展是不利的。互联网使数据资源由稀缺变为过剩,宏观决策的信息渠道日益广阔,以提供数据为宗旨的数据中心作用也日益下降,政府决策对数据中心依赖性下降不可避免,数据中心的生存空间被压缩。
政府基层服务主要是业务数据的精确使用,不受互联网信息膨胀的冲击,未来数据中心的价值将更多体现在政府基层服务的精细化改进上,加强对基层的数据服务是数据中心重要的生存之路。
大数据应用是挂一漏万的
依照目前的宣传大数据几乎可以解决政府的一切问题,从经济预测到反恐破案都能胜任,事实并非如此,首先大数据源的准备就是难题,大数据任务很分散,每项任务都是非常复杂的工程,很难用一种规范化流程来降低成本,大数据应用成为挂一漏万的示范项目,很难实现规范化经营,只有找到规模化、重复率高的应用领域,大数据应用才能变为有规模效益的经营。
数据中心成长要借助于规模化业务
数据中心的成长不能只靠初始投资,持续的业务收入更重要,数据中心的业务能力是大量实际任务训练的结果,数据中心需要伴随着业务的成长而成熟,未经大规模业务锤炼的数据中心只是中看不中用的。
大数据、云计算业务的领先公司亚马逊、谷歌、阿里巴巴等,其业务能力都是借助于公司内部业务而成长的,内部应用的锻炼促进了大数据应用技术的成熟,其后才逐步对外服务,形成大数据与云计算服务产业。
站稳脚跟是数据中心的当务之急
城市数据中心最要紧的是先能站稳脚跟,使贡献大于政府的投入,这样才有进一步发展的可能。选择恰当的业务起步非常重要,唯有真实的需求才能锻炼队伍,数据中心才能学会生存,进而求得发展。从专业化的业务起步是有益的,专门做好一件事会容易得多,技术积累效率也高,数据中心不能浮躁,一个领域做好了再拓展新领域不迟。
5 数据中心不要以城市大脑自居
数据中心要有自知之明
数据中心的作用永远达不到媒体宣传的那么神奇,建设者要有自知之明,防止以后的被动。数据中心的资源、经费、人才是有限的,在未来的三、五年内能够在电子政务领域做成几件事就不错了,国家四大基础数据库建设了十五年处境依然艰难,各地小数据的精准化工程推进都不轻松,更不要说大数据整合了。
城市数据中心被媒体捧为“城市大脑”并不妥,历史上的城市是自然而然地发展起来的,沉淀了千年的智慧,不见“城市大脑”何在,城市智慧早已分布式存在着,不是靠数据中心的出现城市才有了智慧。
城市智慧是自组织的涌现
城市智慧存在于城市的机制之中,存在于城市各方面资源的配套与合作之中,城市的高效率来自社会组织的精细配合,来自生产方式与技术的积累,这些都是城市的智慧,而这些智慧的产生并不是政府能操纵的,它是社会自组织创新的结果,城市智慧是广大居民自组织创新涌现出来的新状态,城市智慧是以网络形态、分布的模式渗透在城市的各行各业之中。
智慧是一种生态
聪明、智能是同一层次的概念,它们是具体的工作方式,我们可以更聪明地做好一件事,建好一个智能系统,但这样做并不等于就智慧了,智慧是更高层次的概念,它是大量聪明行为、智能产品涌现出来的整体状态,城市智慧更像是一种生态,是一种有利于产生聪明与智能的生态环境。这种有助于创新繁荣生态环境不是大数据中心能代表的,我们需要从网络与生态视角来认识城市智慧,所谓“城市大脑”其实是一个分布式、网络化的系统。
数据中心要做好自己的事
城市的智慧是城市居民长期自组织创新积累的结果,政府工作的智能化也只是智慧城市大量智能化工程的一部分,政府应当认真集中精力做好自身业务的智能化,数据中心要把份内工作做好去服务他人,正确认识“城市大脑”的网络属性将有助于调动全社会的积极性,共同建设智慧城市。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析领域,Excel作为一种普及率极高且功能强大的工具,无疑为无数专业人士提供了便捷的解决方案。尽管Excel自带了丰富的功 ...
2025-01-17在这个瞬息万变的时代,许多人都在寻找能让他们脱颖而出的职业。而数据分析师,作为大数据和人工智能时代的热门职业,自然吸引了 ...
2025-01-14Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09在如今这个信息爆炸的时代,数据已然成为企业的生命线。无论是科技公司还是传统行业,数据分析正在深刻地影响着商业决策以及未来 ...
2025-01-08“数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而言,数据指标体 ...
2025-01-07在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-06在现代企业中,数据分析师扮演着至关重要的角色。每天都有大量数据涌入,从社交媒体到交易平台,数据以空前的速度和规模生成。面 ...
2025-01-06在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02在当今的数字化时代,数据分析师扮演着一个至关重要的角色。他们如同现代企业的“解密专家”,通过解析数据为企业提供决策支持。 ...
2025-01-02数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪 ...
2024-12-31数据分析,听起来好像是技术大咖的专属技能,但其实是一项人人都能学会的职场硬核能力!今天,我们来聊聊数据分析的核心流程,拆 ...
2024-12-31提到数据分析,你脑海里可能会浮现出一群“数字控”抱着电脑,在海量数据里疯狂敲代码的画面。但事实是,数据分析并没有你想象的 ...
2024-12-31关于数据分析师是否会成为失业高危职业,近年来的讨论层出不穷。在这个快速变化的时代,技术进步让人既兴奋又不安。今天,我们从 ...
2024-12-30