大数据时代的中国政治学:机遇挑战与应对之策
大数据的浪潮正在席卷全球,并深刻地影响和改变中国的社会政治生态。大数据技术正在重塑政治学的主流研究范式,为政治学的发展提供全新机遇的同时,也带来严峻的挑战。在国家治理现代化的中国逻辑中,合适的治理技术既是国家治理体系现代化的关键载体,也是切实推动国家治理能力现代化的有效媒介。大数据技术能够优化国家治理的生态环境,拓展治理体制机制的弹性空间,是诱发制度创新与治理转型的重要源泉。数据分析师通过对大数据海量数据的关联性分析,可以更为科学地研判和预测人类政治生活的运动轨迹和发展趋向,为理解人类政治行为和政治现象提供全新的技术支撑,是提升中国政治学研究科学化、规范化水平的重要契机。中国的政治学者应该热情拥抱大数据时代的到来,未雨绸缪,积极寻求应对之策,有力推进国家治理现代化实践与政治学学术发展之间的良性互动。
一、大数据技术开创政治学研究的新时代
人类社会已正式进入大数据时代。大数据(BigData)是在物联网与
云计算之后发展出来的全新的技术革命。作为研究数据科学的技术权威和最早洞见大数据时代发展趋势的舍恩伯格教授认为,大数据是人类获得新认知和创造新价值的源泉,也是改变市场、组织机构,以及政府与公民关系的方法[1]。在现代信息社会中,人类生产的数据不仅在规模上呈指数级增长,更为重要的是数据种类繁多,既有结构化信息,又有文本、图片、视频、音频、邮件、交易信息、社交网络信息等非结构化信息,而且要求数据分析师快速地采集和处理各种数据[2]。数据来源多元,数据的复杂性大幅提升,数据之间的交互性和关联性强,通过数据的整合、分析和开放而实现的数据开发价值随之也越来越大。同时,大数据蕴含了丰富的时空信息,数据更新、存储、传输速度快,实时性强,大数据技术善于管理和分析动态变化的数据流。随着现代信息技术的发展,人类开始拥有前所未有的能力来使用和处理海量的数据,
数据分析师在海量数据中发现新知识和创造新价值,从而为社会带来“大知识”“大科技”“大利润”和“大智能”等发展机遇[3]。而{
数据分析师培训}大数据技术是一种从各种各样类型的巨量数据中,快速获得有价值信息,并将其应用到相关领域的技术,通常与数据分析与挖掘、
数据仓库、
文本挖掘、关联数据、
云计算、物联网等技术联系在一起,采集数据的工具、平台和数据分析系统是大数据技术的核心构成要件。大数据时代的到来对自然科学和人文社会科学,包括政治学的研究带来了极其深远的影响。
(一)大数据技术塑造人类政治生活新景观,拓展政治学研究空间
大数据日益成为影响现实政治的关键因素和不容忽视的重要力量。2010年底的“阿拉伯之春”就是源于网络社交平台。以脸书(Facebook)、推特(Twitter)等为代表的新媒体在这场社会运动的酝酿、组织、爆发、升级等各个环节均发挥了关键性作用,扮演着信息传播、动员组织、全球呼应等重要角色。大数据作为“颠覆性创新”,深刻地改变了国家权力与公民权利的关系,带来了“数据的民主化”,有助于建设更具高效性、创新性和透明性的现代国家治理体系。目前,国际学术界积极将大数据应用于全球治理、国家治理、社会治理、公共服务和政治稳定等领域的学术研究工作。大数据作为人类的仪表盘,成为一个帮助人们有效治理贫困、犯罪和环境污染等问题的智能工具。如联合国于2009年发起的全球脉动计划,通过对网络空间海量数据的挖掘和
统计分析,预测各国的失业率、疾病暴发、政治动乱等现象,以此作为国际组织有效行动的重要依据。国家安全部门可以通过大数据技术来定位恐怖分子的踪迹,甚至可以了解多少人和哪些人的政治情绪正在由温和变得激进,并“算出”谁可能会采取对社会公共利益有害的行动,通过有效监控社会情绪提升社会治理水平[4]。
通过电脑对互联网上的海量博客文章、政治演讲、新闻报道加以
统计分析,从而展开趋势研判,大数据技术能够帮助人们更好地理解人类政治行为,给国家和社会治理带来革命性变化,大数据技术正在触及人类政治生活的大量核心领域。大数据在提高政策描述和强化政策预测能力方面具有强大潜力。借助大数据技术,尤其是个体、群体、城市以及国家层面的大规模时间序列数据的实时获取,研究者对公共政策的描述和评估在时间和空间上变得更为丰富,在数量更多、质量更好的数据基础上,公共政策的成本-收益分析将更具适用性和科学性。大数据时代塑造了新的人类政治景观,将政治活动场域从现实空间扩展到虚拟空间,不断重构着国家和社会的关系,影响着政府、政党、社会组织、公民等政治行为主体的互动关系模式。大数据技术为以往“不可研究”或“难以研究”的问题提供了辅助性的技术分析手段,促使政治学研究与计算科学、网络科学的结合,极大地拓展政治学问题的研究空间。
(二)大数据技术更新政治学的研究方法,形成政治学研究新的主流范式
政治学作为一门独立的学科,主要基于其自身所具有的一套独立的方法和理论。方法是获取知识的重要手段,研究方法的创新是推动理论创新和学科发展的关键途径。大数据一出现即挑战着传统的社会科学研究方法论,悄然引发政治学、经济学等学科全方位的方法论变革。《自然》《科学》等杂志分别组织专刊讨论大数据对社会科学研究范式的挑战和价值。大数据时代的政治学研究将不再需要模型和假设,而是利用超级计算直接分析海量数据,发现相关关系,从而获得新知识,形成数据密集型科学研究的“第四范式”。有学者认为,随着计算社会科学(ComputationalSocialScience)的兴起,人们将在前所未有的深度和广度上采集和利用数据为社会科学研究服务[5]。大数据带来的社会科学范式的转换,集中体现为大数据带来了更便捷的数据收集技术,社会科学与计算科学、网络科学相结合,正在向“计算社会科学”和“网络社会科学”(E-SocialScience)的方向转变[6]。大数据政治学至少在方法创新和学科发展两大领域的五个方面具有独特价值:更便捷、更廉价、更大规模的数据采集;数据分析学新方法的引入;定量与定性方法的整合;政治学与计算科学、信息科学等跨学科研究;数据民主化所推进的政治知识平民化的传播和普及[7]。随着政治大数据的快速增长,未来的一切政治现象、政治过程和政治问题,都可以通过更加精确而科学的定量方法予以分析解决。大数据技术为我们的生活创造了前所未有的可量化的维度,过去不可计量、难以存储、不易分析和不方便共享的很多东西被数据化,通过数据采集、数据储存、数据分析和数据管理,大数据为大范围、中时段、长时段的定量分析提供了现实可能[8]。
另外,抽样误差曾经是长期困扰社会科学研究的重要难题,而全样本作为大数据最重要的
特征,甚至可以将抽样误差降至为零。在大数据推动政治学研究范式转换的过程中,技术进步、学科间融合、新数据分析技术的应用、新的国家、商业和社会组织环境都会加速这种范式转换。具体体现为:在研究视角上,实现不同学科间研究方法、理论及测量的整合;在研究方法上,不再需要构建精巧的研究设计来模拟现实,而是可以直接获取人类行为和互动的基本信息,会逐渐模糊田野研究和实验研究之间的界线;在样本选择上,大数据可以突破传统抽样调查的样本限制,大幅度提高数据的采集频率[7]。大数据技术不仅为深入探析选举政治、公民政治心理与行为、政治发展等传统政治现象提供了有效的工具箱,更为挖掘信息时代的互联网政治、新社会运动、移民政治、认同政治等新兴政治现象更新了方法和理论视角,形成以定量研究为主的政治学研究新范式。
(三)大数据技术为政治学大规模的跨学科协作研究提供了新的可能性
大数据技术构建了完善而丰富的数据集和分析工具,各种数据的可用性、共享性和协作性大大增强,为政治学与其他学科的学者之间的大规模协作提供了新的可能。新时期的政治学研究需要汇集专业领域、数据管理、数据分析和项目协作四大技能,亟需学科跨度较大的专业学者共同协作。大数据技术能够便捷地将政治学研究与自然科学、技术科学紧密结合起来,有效运用自然和技术科学的最新成果及研究手段,推动跨学科的交叉、渗透和融合,使之成为了解人类政治生活客观实际的必要手段和可行途径。正是大数据的巨量档案资料和空前丰富的内容,推动了政治学、社会学、经济学、思想文化史和生活史研究的重大突破和交叉融合,为公民政治心理和行为倾向、政治期望和利益诉求的研究提供了坚实的实证研究基础。目前,政治大数据源自呼叫详细记录、智能设备和传感器信息、GPS地理定位映射的数据,以及各种图像文件、Web文本和点击流数据、评价数据、电子邮件等构成的政治信息,是根植于一个复杂社会系统环境中的数据基石。政治学研究者需要密切关注政治大数据的关联性分析,精准聚焦政治现象与经济、文化、社会、教育、生态领域之间的交互关系,以此为基础精准分析我们身处的社会未来会出现什么样的政治现象和政治发展趋势,会发生什么样的政治事件以及如何去应对和处理变革时代的治理危机和治理风险等。毋庸置疑,政治数据的大规模产生使得政治学的跨学科研究显得愈加重要。
政治学已经日益成为一个数据密集型学科。随着移动互联网和物联网的发展,带来了诸如微博、社交网站、GPS定位、传感器等多种政治性数据的来源,以文档和表格形式保存的传统政治数据被70%至85%的数据是以图片、音频、视频网络日志、定位信息、链接信息等非结构化和半结构化的政治大数据所替代。非结构化数据增多,信息质量参差不齐,对数据的收集、处理和综合运用更加依赖计算机的辅助。通过大数据技术的成功运用,从多样性和关联性分析中挖掘数据背后的有益信息,提升对社会经济发展的预测能力,将改变人民的日常生活、企业决策和国家治理的面貌,增强政治学研究对于国家和社会治理现代化实践的指导作用。大数据时代涌现新的政治现象,塑造新的政治关系,人类将在前所未有的深度和广度上采集和利用数据为政治学的学术研究服务,大数据技术对现实的政治发展和政治学的学科发展必将产生深远影响,开创政治学研究的新时代。
二、大数据时代中国政治学发展的全新机遇
大数据方法的出现和运用在一定程度上可以穿透政治现象的复杂性和特殊性,提升人类对政治发展客观规律的认知力和洞察力,为中国政治学的研究者提供深刻而丰富的洞见,并为其理论创新奠定坚实的数据和资料支撑。有学者认为,大数据时代的技术具有政治属性,能够变革国家与社会关系,重塑公民参与模式,对政党与选举、社会运动、地方民主、公共机构和全球治理都产生重大影响[9]。在中国国家治理现代化的历史和现实逻辑中,科学技术能够提高经济发展水平,从而增强政治合法性。互联网对国家和社会同时进行了赋权,两者都能从其发展中受益。现代信息技术的发展产生了分权的效果,为国家和社会创造了一个新的基础结构,最终重塑了国家和社会[10]。大数据改变了传统的政治关系,拓展国家与社会之间的互动范围;公民参与渠道多元化,弥散的数据资源广泛分布在政府、市场和社会组织中,对现实的政治发展过程和中国政治学的学术研究均产生了重大影响。大数据时代中国政治学发展的全新机遇主要体现在以下三个方面。
(一)大数据时代为中国政治学的学科发展提供良好契机
经过30多年的发展,中国政治学的研究对象和研究内容渐趋明确,政治学特有的问题意识、概念和理论体系初步形成,与社会学、经济学、心理学、人类学、传播学、信息科学等诸多学科的结合日趋紧密,交叉融合程度加深。然而,由于基础性数据资料的搜集、整理和分析技术有限,中国政治学长期关注定性研究和规范研究,研究范围有限,研究内容陈旧,理论体系单薄,学术研究的专业化和科学化水平不高。在大数据时代,社交媒体的相继问世拉开互联网崭新时代——Web2.0,互联网开始成为人们实时互动、在线交流的基本载体。随着信息技术的发展,对于非结构化数据的处理、挖掘和
统计分析能力得以大幅度提升,过去不可计量、难以存储、不易分析和不便共享的许多资料被数据化,为政治学吸收和借鉴其他学科的研究方法、研究成果提供更为宽广的渠道。如在中国政治学的研究中,政治学与传播学相结合的政治网络营销,除了利用互联网新媒体进行政治宣传之外,主要是如何更好地处理网络舆情,即通过网络平台获取舆情、分析舆情、掌握舆情和影响舆情[11]。在大数据时代,网络成为政治生活的重要场域,直接改造着政府与公民间的互动模式,并给中国的舆情治理带来了严重挑战。互联网和自媒体的信息更新速度快,信息量实现了质的增长,且交互性极强,突破了地域、空间、身份的限制,社会各阶层的观点、情绪和诉求在网络空间中迅速集聚、碰撞、流传,信息呈网状传播,容易诱发重大舆情危机,对国家治理和社会稳定构成严峻挑战。网络政治、政治传播、舆情治理成为中国政治学研究的新领域。
同时,大数据强化了数据之间的相关关系,数据之间的关联性分析能够更好地捕捉现在和预测未来。对现实政治问题的理解不需要建立在假设的基础上,专注于政治现象的产生机制和内在机理,而是通过海量数据直接构建理论分析模型,科学预测政治事件可能的未来走向。近年来,通过网络引发的群体性事件层出不穷,对政府治理和社会稳定造成负面消极影响。大数据技术可以通过对网页浏览、论坛留言、微博转发等网络舆情的深度分析,有效预测如恐怖主义和骚乱活动等突发事件,在应对突发性安全事件之时,有效降低各种危机带来的灾难和损失[7]。针对大数据对国家和社会治理的强力塑造,中国政治学除了对国家与社会关系、中央与地方关系、执政党建设、现代国家制度建设、政府职能转变和机构改革、治理体制改革和治理机制创新等问题的研究外,更应该强调对政治数据的采集、储存、分析和管理,以及对大范围、中时段、长时段的政治现象和政治事件的定量分析,强化政治大数据之间的关联性分析,实时把握政治关系的动态变迁和政治主体的行为模式与行动逻辑,提升政治学研究的科学预测能力,以坚实的学理基础为国家智库建设贡献学科智慧。
(二)大数据时代助力和推动中国政治学研究方法的创新与变革
“还原论”作为过去几个世纪一直主宰政治学研究的主流范式,视个体为人类政治现象和政治事务的唯一研究单元。事实证明,对个体的研究越多,并不能相应增进对整个社会和政治系统的科学理解,甚至可能离社会真实与系统真谛相去甚远。在研究方法创新方面,大数据技术对政治学研究的核心贡献主要体现在:
第一,大数据时代最大的转变就是放弃对因果关系的渴求,转而关注各种相关关系,引导人们只需要知道“是什么”,而不需要知道“为什么”。这将颠覆千百年来人类的思维习惯,对人类认知模式和与世界交流的方式提出全新挑战。第二,大数据方法革新了政治学研究中数据获取与管理的既有模式。在传统的政治学研究范式中,个案研究、抽样法、问卷法、实验法等研究方法在中国政治学研究中扮演重要角色,这些方法对于发现政治现象、理解政治行为和政治心理具有重要意义。然而,随着信息技术的发展,研究者从海量的数据中获取人类政治行为和互动的基本信息,关注事物之间的相关性,不再需要通过研究设计来模拟现实,田野研究和样本分析下降为辅助工具。在样本选择上,政治大数据可以突破传统抽样调查的样本限制,直接对总体的全部数据进行分析处理,获取研究对象的具体信息。同时,随着
数据挖掘技术的发展,历史文本、社交媒体、多媒体等结构化、非结构化的数据都成为政治学研究的对象。另外,研究者过去所注重的控制变量选择变得更为多元,实验设计可以设定更多条件,能够在很大程度上解决政治学研究普遍性、可控性和现实性三者之间难以同时实现的困境。第三,
机器学习、
数据挖掘等数据分析学(DataAnalytics)的发展空前催化了政治学研究方法的创新,诸如自动文本分析、主题模型、情感分析等前沿方法被及时应用于政治学研究[7]。第四,大数据技术强化了定量方法与定性方法的对话。大数据方法可以有效利用定量技术分析大规模的定性资料,同时运用定性方法来呈现和阐释定量分析结果,实现两种方法的整合。大数据将量化研究广泛引入各种政治问题研究之中,使研究对象更加精确化,从而揭示规律,理清关系,预测事物发展趋势。
(三)大数据技术将极大地扩展中国政治学研究的内容
在大数据时代,从研究空间上看,中国政治学将从政治实体研究走向虚拟空间研究。传统上对国家、政党、政府、社会组织等的研究,主要关注制度建设、国家治理的体制机制创新。随着大数据时代的到来,政治网络营销、政治传播、舆情治理和社会监管等研究领域得到发展。在门户网站、网络论坛、社交平台等公共空间充斥着大量文本、视频等结构化和非结构化信息,政治大数据的分析能够提升政治学者对社会舆论的动态把握能力,预先防范和纾解新媒体诱发的各种社会运动和突发性事件。同时,大数据对政府的治理理念、治理范式、治理内容和治理手段产生不同程度的影响,推动“智能政府”建设[12]。
在政治传播研究方面,有学者通过追踪《广州日报》和《南方周末》从2002年12月至2003年6月间的全部报道来分析政府干预对于“非典事件”曝光的影响,发现影响“非典”曝光率的三种主要机制是:宣传部门委任报刊主编;在各个层级发布指令和通告;传播领导人在特定场合的直接指示[13]。在网络政治研究方面,有学者通过对2198个博客从2010年8月30日至11月7日的发帖内容进行文本分析,发现在涉及腐败、环保、领土争端等由主流媒体发起的议题时,政府对于参与者的评论、批评和正式行动会表现得较为宽容,网络参与起到了—种“安全阀”效应;而当议题超前或涉及敏感领域,如城乡差异、宗教问题时,过多讨论则会加剧社会紧张和不安,发帖者也更可能遭到严格的审查[14]。另有学者首创性地使用自动文本分析技术,对2011年上半年1400多个网站的上百万个帖子进行内容分析,并将其归入不同的议题领域。相比于其他议题,中国政府的审查机构对批评政府、领导人和政策的帖子的删帖率较低;而无论内容为何,有可能导致集体行动或强化社会动员的帖子成为政府审查的主要对象,防止潜在的集体行动是政府审查的主要动机[15]。大数据是一个以数据为战略资产的时代,掌握了数据意味着拥有影响力,弥散的数据资源分布在社会、市场中,每个个体都可以发声,使社会朝着更加个性化、民主化、开放化方向发展,对社会组织、企业和公民行为的研究成为政治学研究的新领域,大数据技术为微观政治行为的研究开辟新方向。
大数据方法在中国政治学中具有广阔的应用前景和开发潜力。中国学者已经启动利用大数据方法开展国家治理、政府质量、社会治理、政治传播和互联网政治的研究,并取得了初步成果。如有学者通过对网络问政平台中公民与政府行为记录的大数据分析,考察网络空间的公民诉求表达与政府回应性。发现时空因素、议题归属和诉求表达方式是影响政府回应性的主要变量,分别反映着网络空间政治互动三要素(制度、政府和公民)的演进和互动策略[16]。更有学者立足于自然科学、人文社会科学的交叉融合和集成创新,广泛运用世界银行、联合国组织、世界经济论坛、经合组织等权威机构的大数据,综合运用背景分析法、
数据挖掘法、
神经网络算法、社会计算等方法,展开对“国家健康”问题的研究[17]。事实上,每一场技术变革的盛宴都会推动政治学学科的发展,对政治学的研究方法、研究内容产生重大影响。在大数据时代,通过对政治大数据的收集、处理、存储和整合,不仅为深入分析政治行为、社会运动等传统政治现象提供新工具,也为互联网政治、政治传播、舆情治理等新兴领域创造新的分析方法和构建新的理论,有利于推进中国国家和社会治理的现代化进程。
三、大数据时代中国政治学研究面临的主要挑战
将现有大数据方法应用于政治学等社会科学的研究也面临若干重要挑战。大数据时代对数据的收集、存储和分析的能力要求非常高,对政治学者的知识结构、分析技术和数据处理能力提出了极高的要求,中国政治学传统的数据处理技术、研究方法和理论建构均难以适应于政治大数据的分析。大数据时代中国政治学研究面临的主要挑战具体体现在:
(一)大数据技术容易导致数据崇拜,中国政治学研究可能面临定性研究与定量研究、数据分析和理论建构两张皮的困境
大数据将量化研究广泛引入各种政治问题的研究之中,但也容易导致数据崇拜,只注重通过政治大数据分析事物之间的相关性,缺乏对基础理论和因果关系的挖掘。事实上,任何量化的东西,都有其适用性的边界,数据仅仅是构建理论的工具和手段,政治学学术研究的最终目的还在于通过把握人类政治生活的运动规律以构建科学的概念与理论体系。同时,目前各种政治学数据库所选取的数据,不仅存在数据信息本身的局限,还有数据库建立者自身人为设定的
数据挖掘标准和分析技术与支撑学术研究的信息资料应该具备的普遍性、客观性与中立性之间的矛盾。在政治大数据库的使用过程中,选择多少样本,选择什么类型的样本,亦关涉研究者的主观性。在中国政治学的发展过程中,不能将量化研究的意义无限夸大,定量研究须与定性研究相结合,才更有可能提升研究成果的科学含量。
另外,数据崇拜容易导致研究者在数据海洋中迷失自我,热衷于对技术的掌握,而忽视对理论和现实问题的分析把握,为“数据”而“数据”。大数据关注相关关系和关联性分析,可以在不需要了解某些政治现象内部运作机制之时,就可以通过各种海量的政治数据来描绘和测量政治现象之间的互动关系,在探求“是什么”而不是“为什么”的基础上更好地了解政治现状和预测未来发展趋势,甚至认定相关关系优于因果关系。然而,通过探求因果关系、实现因果推论、利用我们已知的知识来了解我们未知的世界,以发现人类政治生活的内在机理是政治学研究的最终目标。大数据强调相关性而非因果性的研究取向限制了其探究因果关系的能力,缺乏发现因果关系的优势,应该将大数据分析与实验设计、参与观察相结合来获取有价值的知识,实现数据分析与理论建构的良性互动。
(二)目前的中国政治学者严重缺乏大数据意识,也缺乏大数据分析的技术和人才
我国的数据资源虽然丰富,但由于长期缺乏数据文化,收集数据、分析数据和使用数据的意识淡薄。目前,中国拥有的互联网用户和手机用户都是世界上最多的,而互联网和手机都是产生数据的重要来源。因此,中国政治学研究缺乏的不是可供收集的数据,也不是收集数据的手段,而是收集数据的意识。我国的政治大数据不系统、更不具有连续性,很多数据都没有长期的积累,妨碍了研究者对历时性长时段政治变迁问题的研究,难以从历史的对比中找寻规律。长期以来,政治学研究者强烈依赖经验和直觉,用数据描述事实、构建理论的意识不强,大概重于精确、因果关系重于相关关系、预防重于预测成为研究者的思维惯习。事实上,
数据仓库、
数据挖掘的开展是一个多专家合作的过程,要求相关人员既熟悉本单位业务和需求,具备相关专业知识和经验,同时又了解大数据技术[18]。
此外,应用大数据方法不仅需要强大的数据采集和存储技术,而且需要开发数据分析学、预测分析学等数据分析和计算技术,熟练掌握和应用这些技术对于政治学研究者而言是不容小觑的挑战。而我国的政治学学科内部严重缺乏大数据专业技术人才,研究人员中真正能够运用政治大数据技术的可谓少之又少。在中国政治学的研究中,由于研究者数据获取、
数据挖掘、数据整合、数据使用技术的缺乏,大数据的价值未能得到充分体现,阻碍了政治大数据的开发和利用。强化政治学与计算科学、信息科学的跨学科合作,培育政治学领域的大数据分析人才是当务之急。
(三)基于数据安全,导致数据开放性、透明性不足,影响数据信度与效度,不利于政治学者对中国政治现象的准确把握
在大数据时代,数据安全问题是国家治理的重大难题,数据库的泄露将给政府、市场、社会以及公民造成巨大的损害,如2014年爆发的“棱镜门”事件就是例证。商业机构和公共机构掌握的大数据既涉及到个人隐私,也涉及到利益分配等问题,数据向研究者全面开放几乎是不可能的。为了维护数据的安全性,必然以牺牲数据的开放性和透明性为代价,而数据开放性、透明性的不足必然影响政治大数据的信度与效度,缺乏透明性和开放性极大地限制着大数据方法的应用。同时,大数据的核心挑战在于广受关注的数据信息缺乏科学研究的效度和信度。也就是说,大数据时代的数据测量存有“大数据分析的陷阱”,面临严重的信度和效度问题,存在不可忽视的预测误差。大数据分析的陷阱主要源于:第一,“大数据傲慢”,即研究者假定大数据是传统数据采集和分析方法的替代而不是补充。然而,大数据并不意味着人们可以忽视信度、效度和数据相依等基本测量问题。第二,出于经济和政治利益的考虑,大数据提供者或使用者经常性地调整数据算法,导致研究者不仅无法获得稳定且可比的测量数据,更缺乏对数据生成过程的基本知识。第三,在大数据面前,研究者处于被动态势,因为大数据提供者或使用者所提供的数据并不稳定且具有可比性的测量数据不多,研究者缺乏对数据生成过程的基本知识,而且所使用的数据极有可能是经过特殊处理、有意篡改、未能反映事件原貌的错误数据,数据质量相对较差,有用数据信息很少[7]。在互联网和各种数据库平台,很多数据相互复制、重复引用、价值不高,有些有用的信息却没有经过任何整理与加工,组织零散、格式特殊,难以提取和利用,从而影响政治学研究成果的可信度。数据质量是影响政治学研究科学化水平的重要变量,也是有效理解政治现象、准确把握政治生活运动规律的前提条件。政治大数据开放性和透明性的不足直接影响了中国政治数据信息缺乏科学研究应该具备的效度和信度,制约了政治学者对中国政治现象的准确把握和未来发展趋势的科学研判。
我国正处于现代化转型和全面构建现代国家治理体系的关键时期,中国政治学理应为现实的中国政治发展提供足够的学术养料和学理支撑。大数据时代的到来为中国政治学研究提供了千载难逢的机遇,运用更为精确的数据分析技术增进对现实政治的理解,精准把握政治事物之内在关联,探寻中国政治发展的内在逻辑与一般规律,为国家治理现代化提供坚实的理论指导。同时,中国政治学及其研究者在大数据时代显现出明显的不适应性,对政治大数据收集、使用和分析的意识淡薄,政治数据收集的系统性不足、信度效度不高、连续性不强等问题频现,同时大数据分析的技术人才严重缺乏,直接制约了中国政治学的学术发展和理论建构。
四、大数据时代中国政治学发展的应对之策
积极应对大数据技术对国家安全提出的严峻挑战,实乃中国政治学发展的关键议题。为了顺应大数据时代国家治理的客观要求,我国成立了国家安全和信息化领导小组,积极致力于将大数据方法应用于推进国家治理体系和治理能力的现代化。大数据时代推进中国政治学发展的具体应对之策表现为:
(一)立足中国现实,破除数据迷信,实现研究方法与理论构建创新的有机结合,提高政治学对现实政治的解释力
国家治理问题是当下中国政治学研究的关键议题,大数据技术为国家治理现代化提供支点支撑与技术保障。利用可视化分析、
数据挖掘算法、预测性分析对结构化和非结构化的政治大数据进行快速处理并获取有价值的信息,能够有效提升国家治理能力。中国政治学亟需加强对执政党治理体系、政府治理体系、市场治理体系和社会治理体系的研究,全面系统地理性评估治理制度的运行效果,探索治理体制机制运行的内在机理,为中国特色社会主义制度的完善和巩固提供理论指导。但是,在压力型体制下,官员为了晋升而盲目追求政绩,政治锦标赛模式下的数据收集存在瞒报、少报、漏报、不报行为,报喜不报忧,政府统计数据含金量严重不足[19]。同时,政府、商业和社会组织常常基于数据安全问题,中国公共信息的开放度和透明性严重不足,政治大数据的信度和效度不高,信息扭曲和数据失真往往误导学术研究。中国政治学要破除数据迷信,综合运用学者的常识、直觉和理性,反复比对各种数据来源,同时以参与观察、抽样调查、深度访谈等传统研究方法为补充,增强研究资料的真实性和可信度。更为重要的是,中国政治学研究者要加强理论自觉,提升学术话语体系和理论体系的创新能力,直面中国政治发展和国家治理的现实问题,在研究方法和理论体系双重创新的过程中不断提升政治学对现实政治的解释力。
(二)加强学科队伍建设和人才培养,加强跨学科交流协作,形成多学科优势互补、共同促进与成长的格局
大数据时代对政治学者提出了新要求,需要掌握从海量数据中挖掘有价值信息和数据信息的管理、存储和分析能力,为政治学研究提供坚实的数据支撑。政治大数据将催生一种新型职业——政治数据分析师,而且具有丰富经验的政治大数据分析人才将成为学术研究、政治应用、公共服务和辅助决策等领域的稀缺资源,政治大数据将驱动政治学的学术研究、政治应用和公共服务的大变革与大转型。面对大数据时代的到来,政治学研究者应加强对
数据挖掘、
统计分析、自然语言处理以及
机器学习等技术方法的培训与学习,提高数据的处理和分析能力,加强与国外学者的对话交流。大数据技术加深了各学科之间的交流空间,科学技术的发展促进了学科之间内部的交叉融合,中国政治学的发展亟需汲取自然科学、计算科学、信息科学发展的最新成果和养料,大力推进政治学交叉学科的成长与发展。为了更好应对大数据时代的挑战,各个学科之间需要共建一个所有学科能够共享的巨型数据库,形成历时性共时性的数据链,丰富各学科的数据量,提高数据使用质量,达到数据共享,为社会科学研究提供有价值的数据信息,促进各学科的共同成长与进步。
(三)将大数据技术上升为国家战略,通过资金扶持和政策供给以促进中国政治学的大繁荣与大发展
政治数据的资源化,使得政治大数据成为所有公民和政治学研究者的重要战略资源,激发公民的政治参与热情和政治学者的研究灵感。大数据技术蕴含着重要的战略意义,我国政府应当加大投资研发力度,积极将“大数据战略”上升为国家战略。中国政治学的发展与国家建设的战略目标紧密相关,为现实的政治发展与国家治理提供政策建议和学理支持是每个政治学者责无旁贷的义务。面对大数据时代的严峻挑战,党和政府应该积极出台相关法律法规和政策制度,聚国家之力收集更多数据,实现政治大数据在学者与政府部门之间的共享。此外,各级政府及其职能部门应该转变治理理念,除了涉及国家利益和公共安全的数据不宜公布之外,应将社会治理、行政行为、公共服务、市场和社会监管等领域的数据向民众与学者公开,为中国政治学的发展构筑扎实的数据资料支撑。同时,云处理是政治大数据的基础性设施,
云计算技术是产生政治大数据的基础性平台,需要政府资金的大力资助。政府有关部门应该联合建立中国政治大数据及政治云平台,更好地发挥政治大数据和政治云在国家安全和网络空间安全以及在经济和社会发展中的重要作用。因此,国家应当制定政治大数据研究开发的战略规划,将政治大数据的研究成果融入到国家治理和社会治理的各个领域和环节,通过资金支持和政策供给促进政治学学科的大发展与大繁荣。
随着大数据技术的快速发展,政治大数据很有可能激发政治学研究范式的革命。政治学者的思维应该随之进行适应性调整,以实现研究方法和理论建构双重创新的有机互动。随着
数据挖掘、
机器学习、人工智能和3D打印等相关技术的发展,中国政治学研究的对象和方法将实现由传统的1.0时代向2.0时代的跨越。中国政治学的研究亟需加强与自然科学、计算科学、信息科学和其他人文社会科学如心理学、社会学、经济学之间的跨学科协作,增加学科之间的优势互补和协同创新,弥补自身研究方法的不足,扩宽研究视野,大力提升学术研究的科学化规范化水平。政治学研究者也需要在认清自身缺陷的同时,理性看待大数据所引发的技术进步,扎根于中国政治现实,夯实政治学科的理论基础,构建符合中国国情、能够解决现实政治问题和预测中国政治未来发展趋势的政治学理论体系。
五、结论
大数据时代是将海量、多样化、流动速度快且实时性强的数据视为核心资产的时代,政府、企业、社会组织和公民的行为习惯、偏好选择等都可被视为是高度数据化的。大数据将带来一场社会变革,特别是国家和社会治理领域的变革,大数据技术已经开始逐渐渗透到中国国家治理的各个层面,对国家治理理念、治理体系和治理工具等产生深远影响。大数据为政治学研究提供了全新的发展机遇,有利于创新政治学研究方法和理论体系,拓展政治学的问题领域和研究空间,更好地为现实的国家治理和政治发展服务。然而,大数据的基础设施建设、技术与人才保障的缺失,数据的标准化、开放性与透明度的不足,相关的数据管理制度尚不健全,研究者大数据意识缺乏、分析技能不够等难题影响着中国政治学的进一步发展。为了更好发挥大数据对现代国家建设、政治学研究的服务支撑作用,既要强化政治学自身的学科建设和基础理论研究,加强学科之间的交流与协作,更要从国家层面将政治大数据上升为国家战略,提供学科大发展与大繁荣的政策支持和资金扶持,为中国政治学研究打造更高更好的数据平台,实现中国政治发展与政治学学科发展之间的良性互动。
数据分析师培训
CDA数据分析师考试相关入口一览(建议收藏):
▷ 想报名CDA认证考试,点击>>>
“CDA报名”
了解CDA考试详情;
▷ 想加入CDA考试题库,点击>>> “CDA题库” 了解CDA考试详情;
▷ 想学习CDA考试教材,点击>>> “CDA教材” 了解CDA考试详情;
▷ 想查询CDA考试成绩,点击>>> “CDA成绩” 了解CDA考试详情;
▷ 想了解CDA考试含金量,点击>>> “CDA含金量” 了解CDA考试详情;
▷ 想获取CDA考试时间/费用/条件/大纲/通过率,点击 >>>“CDA考试官网” 了解CDA考试详情;