揭开政府大数据应用的面纱
“大数据将从一个时髦的概念走进我们生活中的方方面面。帮助我们更好地认识世界,认识自己,构建全新的社会关系。”清华大学数据科学研究院执行副院长韩亦舜说。
“《关于促进大数据发展的行动纲要》(以下简称《行动纲要》)标志着大数据在我国的发展与应用已经上升到国家战略层面。”赛迪顾问分析师卢敏说,“《行动纲要》明确指出推动政府大数据开放、共享和安全的重要性。而要使《行动纲要》中的内容尽快成为促进大数据发展和推进大数据应用的实际行动,还有很多问题要解决。”
数据潜在利用价值高
《行动纲要》涉及三个关键词:共享、开放、安全。卢敏指出,三个关键词背后指向三个问题:“共享”指向为什么要加快政府大数据公开的进程,“开放”指向企业创新的动力源在哪里,“安全”指向如何保护个人隐私和信息安全。
“政府大数据公开的目的是改善民生,企业创新的目的是促进结构转型,信息安全建设的目的是完善法律。三个关键词分别指向社会、经济、法律等不同领域。由此看来,大数据产业牵一发而动全身。”卢敏说。
共享、开放、安全的出发点和落脚点都指向政府大数据的开放共享、研究与应用、示范影响效应等。我们不禁要问,政府大数据的价值究竟何在?
就数量而言,BAT(百度、阿里、腾讯)拥有数以亿计的用户量,但这与政府大数据规模相比,可谓小巫见大巫。卢敏介绍说:“粗略估算,全国政府大数据加起来至少也有数百甚至上千个阿里巴巴的体量。”
至于政府大数据的质量,则可以通过和BAT企业对比来说明。据介绍,百度拥有庞大的用户搜索记录,每个网民都会留下众多记录,但这些数据较为单一,不进行关联应用就无法显示价值;腾讯的优势在于拥有数以亿计的QQ和微信用户量以及更庞大的社交数据,但这些数据目前仅局限于营销应用;阿里的交易数据似乎价值更高,但也只是局限在电商领域以及外延应用。“BAT的共同短板在于数据种类的单一化程度较高。”卢敏说。
政府大数据涉及工商、税务、司法、交通、医疗、教育、通信等等领域,数据的种类繁多,关联性强、统计规格较为统一,便于应用处理。九次方大数据创始人王叁寿曾表示“政府的数据事关百姓生活的方方面面,数据的利用价值也最高”。
开放标准待建立
真正的大数据除了量大,另一个特点是变化多,如图片、视频、大段文字这些不能用数字化处理的数据,属于非结构化数据。只有非结构化的数据才更具有开发价值。
政府的很多数据,例如人口、户籍等,属于结构化数据,离非结构化的大数据概念还有一定距离。但就目前阶段来看,政府推动大数据产业发展仍有现实意义。
通过与大数据紧密相连的互联网,在市民服务设施众包、提高政府监督职能等方面,百姓能够参与进来。“政府信息的开放共享,有助于提高政府的公信力。”韩亦舜说。
政府数据的开放,不但能帮助政府提高自身透明度并提升治理能力和效率,也是促进经济发展和社会创新的重要推力。然而,在政府数据资源共享开放工程当中,数据的开放程度与开放内容的标准,目前似乎并没有定论。
复旦大学国际关系与公共事务学院副教授郑磊在《中国开放政府数据平台研究:框架、现状与建议》一文中提出,经过样本的数据采集分析,截至2015年5月,各地开放政府数据实践共计公开了1963个数据集。其中公开数据最多的是武汉(635个),最少的则是贵州(17个)。
努力打造大数据产业新高地的贵州,在政府数据开放方面面临着新的挑战。
郑磊指出,中国开放政府数据实践存在的问题主要有目前开放的数据量少、价值低、可机读比例低,开放的多为静态数据,数据授权协议条款含糊,缺乏便捷的数据获取渠道,缺乏高质量的数据应用,缺乏便捷、及时、有效、公开的互动交流等。
“《行动纲要》为信息开放共享指明了出路,但是政府大数据如何应用,还要看接下来的行动和规则制定。”卢敏说。
针对问题,郑磊建议加强管理架构建设,制定相关政策与工作机会,提高领导支持能力,基于社会需求开放高价值数据、展现数据应用,提升数据开放性与可机读比例,规范数据更新周期,落实数据更新工作,完善数据授权协议,降低数据获取与互动门槛,推动有效公开的沟通。
数据利用如何破冰
目前,一些发达国家政府在数据开放方面走在了前面,甚至把数据开放当做执政自信的标志,公开一些政府日常消费方面的支出供市民监督。
我国政府数据利用方面特别是数据共享方面确实存在一些误区。一方面说到开放就好像完全没有隐私,另一方面安全问题又成为了数据开放的最大障碍。
韩亦舜认为,政府数据开放要在实践中摸索前进。先把政府部门内部及部门之间数据共享的工作做起来。对社会的数据开放共享,先从方便百姓生活又不是很敏感的数据开始。特别是涉及公共安全、公共利益的数据,提供公共服务的机构或企业有义务在一定前提条件下开放,“这样一些可以预警、预防的群体性事件就能够避免”。
韩亦舜指出,按照流行的大数据的几个“V”(大量、高速、多样、价值)或者多源异构的定义来衡量,政府的部分数据,还属于结构化数据,离大数据概念还有差异。但没有必要拘泥于大数据的定义,只要政府充分运用数据的挖掘利用,提高政府治理能力,提高科学决策能力,受益的将是全社会。
在政府开放数据方面,韩亦舜建议,各级政府都以数据应用为导向,需要什么数据就共享什么数据。虽然,与大数据的开发共享还有距离,但确实是数据应用的可行路径。
韩亦舜说,相信越多的人从数据开放中获益,就会有更多的人愿意开放数据。
背景资料
《关于促进大数据发展的行动纲要》
主要内容及对产业的部署
《行动纲要》的内容可以概括为“三位一体”,即围绕全面推动我国大数据发展和应用,加快建设数据强国这一总体目标,确定三大重点任务:一是加快政府数据开放共享,推动资源整合,提升治理能力;二是推动产业创新发展,培育新业态,助力经济转型;三是健全大数据安全保障体系,强化安全支撑,提高管理水平,促进健康发展。围绕这“三位一体”,具体明确了五大目标、七项措施、十大工程。并且据此细化分解出76项具体任务,确定了每项任务的具体责任部门和进度安排,确保《行动纲要》的落地和实施。
五个目标:一是打造精准治理、多方协作的社会治理新模式;二是建立运行平稳、安全高效的经济运行新机制;三是构建以人为本、惠及全民的民生服务新体系;四是开启大众创业、万众创新的创新驱动新格局;五是培育高端智能、新兴繁荣的产业发展新生态。
七项措施:完善组织实施机制、加快法规制度建设、健全市场发展机制、建立标准规范体系、加大财政金融支持、加快专业人才培养、促进国际交流合作。
十项工程:政府数据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程、公共服务大数据工程、工业和新兴产业大数据工程、现代农业大数据工程、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力提升工程、网络和大数据安全保障工程。
按照国务院的部署,工业和信息化部主要负责推动大数据产业发展,培育新兴业态,助力经济转型,包括推进大数据核心技术攻关、健全产品体系、完善产业链和发展环境、推进工业及新兴产业大数据应用,同时做好信息安全和规范管理等的相关工作。重点组织实施十大工程中的“大数据关键技术及产品研发与产业化工程”“大数据产业支撑能力提升工程”“工业和新兴产业大数据工程”三项工程。
数据分析咨询请扫描二维码
统计学基础 - 理解统计学的基本概念和方法是数据分析师必备的技能之一。统计学为他们提供了处理数据、进行推断和建模的基础。 数 ...
2024-11-25数据分析师在如今信息爆炸的时代扮演着至关重要的角色。他们不仅需要具备扎实的数据分析技能,还需要不断学习和适应不断发展的技 ...
2024-11-25数据分析师的工作职责涉及多个关键方面,从数据的获取到处理、分析再到可视化,旨在为企业的决策提供有力支持。让我们深入了解数 ...
2024-11-25数据分析师:洞察力量的引擎 数据分析师的兴起 数据分析师行业目前正处于快速发展阶段,市场需求持续增长,薪资水平也有所提升。 ...
2024-11-25数据收集与整理 - 从各种来源收集数据,清洗和整理以确保数据质量和可用性。 数据分析与建模 - 运用统计学方法和机器学习模型对 ...
2024-11-25数据分析是当今社会中不可或缺的一项技能,涵盖了广泛的工具和技术。其中,掌握各种数据处理函数对于数据分析师至关重要。本文将 ...
2024-11-25“大数据治理”是一个涵盖广泛的复杂概念,其核心在于确保大规模、多样化的数据资源能够被有效管理和利用。不仅涉及数据的采集、 ...
2024-11-25一、引言 背景介绍 随着信息技术的快速发展和互联网的普及,大数据已经成为现代社会的重要资产。大数据的兴起不仅推动了各行各业 ...
2024-11-25《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22