高校教育是如何运用大数据的
大数据的发展使得很多行业面临着挑战,如何提升对海量数据的整合、分析和运用能力?已经成为教育部门急需思考的重要问题。本期的专题研究将从“大数据在高校信息化中的应用”、“量化自我支持的个性化学习”、“高校学籍预警机制”等方面来阐述大数据时代教育信息化工作的新思路,希望能为相关研究者提供借鉴。
一、引言
自从人类社会进入信息时代后,数据作为信息时代独一无二的传递媒介,在我们的生活中无处不在。特别是随着互联网和物联网的快速发展,似乎一切都可以被数据化、被记录。曾经静静躺在各种媒介中的数据,开始爆发出惊人的价值和巨大的信息量,这引起了越来越多人的关注和重视。人类已经迈入一个深度挖掘数据内在信息和核心价值的大数据时代。
在这场大数据的浪潮中,高校扮演着重要角色,既是大数据时代的参与者,也是大数据发展的推动者。高校能够利用自己所掌握的大量数据和信息资源,在教育和研究工作中发挥出举足轻重的作用,这也是顺应大数据时代发展趋势、推动自身信息化建设和发展的一个良好契机。
美国政府为了顺应并推动大数据这一趋势,于2012年3月宣布投资2亿美元启动“大数据研究和发展计划”,把大数据研究和生产计划提高到国家战略层面。2014年4月,美国联邦教育部宣布从财政预算中拿出2500万美元用于教育数据挖掘和分析。我国也十分重视大数据在高校教育中的发展。《国家中长期教育改革和发展规划纲要(2010-2020年)》明确提出,在加快教育信息化进程中要“加强优质教育资源开发与应用……促进优质教育资源普及共享”。《国民经济和社会发展第十二个五年规划纲要》提出,“重点研究……海量信息处理及知识挖掘的理论与方法……”
我国在高校研究大数据的条件更是得天独厚。据国家统计局2014年2月公布的数据显示,我国目前在校大学生达2468.1万人。2013年我国网民近30%使用过在线教育产品,市场空间巨大。未来几年中国在线教育市场将保持每年30%以上的增速。预计到2017年,我国在线教育市场规模将会突破1600亿元。
然而在大数据风暴以迅雷不及掩耳之势席卷全球各个行业的时候,我们却充满了疑惑,毕竟大数据本身尚未发展成熟,如何将它合理应用到高校领域还是值得深思的。本文将从高校中的大数据来源入手,分析高校大数据具有的特征,探讨大数据将对高校信息资源共享发挥的作用,深入挖掘大数据在高校信息化建设应用中的挑战,以探寻合理的策略实现大数据时代高校间资源共享,推动教育信息化的全面建设。
二、高校中的大数据
1.大数据是什么
(1)大数据的概念及目标
最早提出“大数据”时代到来的是全球知名资讯公司麦肯锡。麦肯锡[1]称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波的生产率增长和消费者盈余浪潮的到来。”Gartner[2]于2012年对大数据做出如下定义:“大数据是大量、高速及多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力与优化处理。”维基百科对大数据的定义则简单明了:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。[3]
无论哪种定义实际都强调大数据的目标:①获取知识与推测趋势;②掌握个性化特征;③通过分析辨识真相。因此,大数据技术的战略意义不在于掌握庞大的数据信息,而在于通过将各种数据集合并后的分析得出大量额外的有价值信息和数据关系,帮助指导人们优化自身的决策和行为方式。
(2)大数据与传统数据的区别
信息的大爆炸不断提醒着我们,未来将会因大数据技术而改变。与传统数据相比,大数据之所以如此受人追捧,是因为其具有天然优势。两者最本质区别在于:①数据采集的来源不同。传统的数据库只是采集基本数据信息,使用数据自身含义,没有利用数据的附加价值。而大数据来源于对传统数据的提取和分析,更强调数据之间的关联性,主要研究数据间的关系;②数据应用的方向不同。传统的数据库主要对数据进行存储和查询,以对过去产生的数据进行保存为核心。大数据对事物发展的预测为核心思想,通过对海量数据进行分析,得到未来发展趋势或者推断将来的可能性。
2.高校中的大数据
(1)高校中的数据源
高校是一个每时每刻都会产生大量数据的地方。自从我国推行教育信息化以来,这些数据大部分被记录保存了下来。比如人事、教学、财务等部门的基本业务数据,网络教学课件和视频、网络远程教育教学资源的多媒体数据,学生教师上论坛、微博、微信等社交网络产生的网络行为数据,校园网内连接无线网络而感知的位置数据等。
伴随着高校教育信息化建设程度的不断深入和加强,比以往更多的海量数据被积累保存,这对于高校来说,是一笔宝贵的财富。这些海量数据并不是单纯的数据积累、记录和保存,其潜在的价值将会对现代化高校建设产生积极重要的意义。例如,通过对“课堂、成绩、就业”等方面数据的统筹分析,能够在一定程度上对传统教育领域的授课和学习模式的改革给予指导和建议,通过学生的图书借阅历史和选课信息综合判断学生的兴趣爱好。在这个信息就是金钱的时代,大数据技术的应用将会在高校教育信息化中起到越来越重要的作用。如何充分利用数据价值,使其为学校管理、教学、服务等工作提供有益帮助,将是本文重点研究的内容。
(2)高校中大数据的特点
对于大数据关注,往往过分集中于“大”的特点,而忽略了处理大数据所必须面对的一个难题:未经处理的碎片数据是造成大数据价值密度低的直接原因。在高校内部围绕着教师或学生服务和管理产生的数据也具有“碎片化”的特点。这一点王左利在他的论文中也提到了。[4]同时他还总结了大数据的另一个特点——持续性。“持续性”体现了校园科研、教学和管理业务的规律。必须基于长期、持续的数据进行统计分析,靠短期数据分析获得的结论对指导教育教学改革无益。
而笔者认为,高校的数据还体现了另外一个特点——多维度。“多维度”能够表征校园活动参与个体的完整状态。如,对一位学生而言,学习成绩反映学习效果;借书种类反映兴趣爱好;一卡通消费情况反映家庭状况;上网轨迹反映思想动态等。只有将多维度的数据进行有效整合,通过建立量化分析模型,反映一个学生的生活习惯与学习进步的相互关系,才能清晰全面地分析学生个体。
3.大数据教育与传统教育相比的优势
通过讨论大数据与传统数据的不同以及高校数据源的特点,发现在大数据影响下的教育与传统教育相比具有诸多优势,主要体现在以下三个方面:
数据采集:传统教育数据的采集方式来源于调查问卷、心理测试等。采集标准和规则均已完善。而大数据的采集是过程式的,它关注着学生在校数据的整个生命周期,关注着学生在校生活的每一个微观表现。
策略决策:传统数据诠释宏观、整体的教育状况,用于影响教育政策决策;大数据透析微观、个体的学生在课堂上的状况,用于调整教育行为进而实现个性化教育。
评估误差:传统数据来源于阶段性的、针对性的评估,其采样过程可能有系统误差;大数据采用微观持续性记录方式,采样的方式误差较小。
三、大数据在高校教育信息化建设的应用
随着互联网技术的迅速发展,大数据带来的信息风暴正在改变我们的生活、工作和思维。那么,当这场风暴席卷高校的时候,到底会给高校教育信息化建设带来哪些变革呢?高校是数据生产大户,中国高校数量多而且规模大,万人以上的大学非常多,在高校里上学的学生从招生、学籍、选课、成绩、饭堂、活动等方面产生大量的数据。在大数据时代,只有用好这些数据,才能更好地帮助教学、科研、学生管理等工作,大大提高高校的信息化水平。
1.教学评估
大数据分析可以应用于教育中的数据挖掘。目前教育机构已经积累了大量数据,使研究者有更多的新机会探究学生学习环境和状态。通过监测这些信息,形成教育大数据库,全面掌握学生学习的全过程,发现学生的学习常态。通过数据流的变动分析,总结教育规律、调整教学内容和教学模式,客观全面地评价学生学习成果和自身的教学成果。
2.个体分析
对于教育领域来说,大数据的应用让研究个体学习也成为了可能,让专门培养和针对性训练成为可能。通过学校数据中心分析学生的各类信息,如考试成绩的变化、借阅图书的种类、一卡通消费额度等信息,综合性地分析判断学生的状态。根据分析结果,对于不同的学生因地制宜地制定相应的教学模式、培养方案。另外,也可以借助学校的微信公众平台为学生推送其感兴趣的资讯信息。
3.舆情预测
学生中存在的问题和困惑,往往最先通过网络显露和传播。如果学生的意见和建议得不到重视或延误解决,就可能在网上形成炒作,个体情绪可能传染到群体,演变为群体的不满情绪,使网络成为舆论的放大器。通过分析学生网络访问轨迹实现积累监测,利用其需求、行为、动向等众多数据资源加强舆情分析和预警。另外,通过对学生数据的追踪和分析,能够发现情绪不稳定的学生或者受不法分子蛊惑的学生,及时将有可能发生的悲剧扼杀在摇篮里。因此,精准的预测分析能提升舆情管理工作水平,提高校园管理水平。
总之,大数据的教育应用可以为学生提供一个量身定做的个性化学习环境、一个灵活调整的可控教育系统、一个教育问题早期预警系统,为教师了解学生学习途径和方法提供了崭新的、可视的、可量化的新手段。
四、大数据在高校教育信息化应用中的挑战
1.从技术层面来看
(1)数据源的可用性
关于大数据的一个普遍观点是,数据自己可以说明一切,数据自身就是事实。但实际情况是,如果不仔细甄别,数据也会欺骗,就像人们有时会被自己的双眼欺骗一样。高质量数据的获取是确保信息可用性的重要前提。[5]高校数据的来源多种多样,包括各职能部门的基本业务数据、教学资源的多媒体数据、使用网络的行为数据、无线网络感知的位置数据等。数据模态千差万别,如关系数据、标量数据、图数据、流数据、XML数据、矢量数据等。既有重复性数据,又有冗余性数据,质量参次不齐,加工整理困难。这些校园化数据是否可用给大数据在高校中的推进带来极大的挑战。
(2)数据融合的可行性
众所周知,数据不融合就发挥不出数据的潜在价值,高校大数据面临的一个重要问题就是数据融合。作为高等院校,大数据的融合应该走在前列,必须彻底打通数据孤岛,将各个业务充分整合。然而,由于传统的业务系统缺乏长期规划,采用的技术包罗万象。据调研发现,目前高校所采用的数据库包括Oracle、Sybase、Microsoft SQL Server、Mysql、Visual FoxProd等。有些学校或部门甚至没有数据库,而是采用Excel管理数据。在这种基础上实现数据的有效融合,形成高质量的大数据,对于融合技术是一个重要的挑战。
(3)数据分析的持续性
教育的规律有时很难理清,成功的个体也未必能够简单复制,评价教育本身的指标都有一定程度的缺陷,需要几年甚至更长期的监测和不断的更正。因此,高校中的大数据分析,不仅仅是横向的对比,如职能部门间、兄弟院校间,更需要纵向历史数据的对比。无论是数据收集、数据清洗还是数据挖掘的模型,都需要随着每天产生的大量详实而琐碎的数据信息进行调整和修正,这也是一个不小的挑战。
(4)数据挖掘的复杂性
大数据分析无疑是整个大数据时代的核心所在,因为大数据的价值就产生于数据分析过程中。在高校大数据的应用中,无论是做个性分析还是舆情预测,都需要构建特定的挖掘模型。教育行业因为其特殊性,传统的分析技术如数据挖掘、机器学习、统计分析等并不能完全满足高校大数据分析的需求,因此,需要在数据预处理、算法模型、评价指标等方面做出调整。当然,数据挖掘的复杂性,不仅是高校大数据所面临的挑战,也是整个大数据领域的巨大挑战。
2.从实施层面来看
(1)数据共享意识
大数据时代需要海量数据作为基础,高校中的大数据,其中很大一部分来源于各职能部门。而现状是大量的数据分布在各个互相独立的职能部门中,甚至大量的信息资源成为了个别部门的私有财产。造成这种状况的原因一方面是因为年代久远,数据整理工作难度较大、工作优先级较低;另一方面是业务部门并不清楚哪些数据是可以被分享的、哪些数据是不能被分享的。归根结底,还是资源分享的意识不够。然而,信息资源只有在相互流动、形成规模效应的前提下才能够发挥出最大的价值,因此,还需要加强高校的数据共享意识。
(2)人员配备与组织结构
高校内部对于各职能部门间信息资源规划缺位,导致了建设进度不同、资源投入有差距、各部门各显神通一窝蜂建设,增加了数据资源共享共用的壁垒。在大力推行教育信息化之前,很多学校并没有专门的信息化部门,技术人员储备不足,甚至没有。高校大数据的推行需要一批既懂得相关技术,又熟悉业务流程的技术人员。人才的匮乏也是非常不利的一点因素——相比于商业环境下对研究实效的追逐,教育研究的缓慢与空洞显得相形见绌。
(3)个人隐私保护
教育说到底是一个交互的过程,交互的内容收集一定程度上与隐私等是矛盾的。目前大数据的发展仍然面临着许多问题,安全与隐私问题是人们公认的关键问题之一,如教师的工资收入,学生的生活习惯、好友联络情况、阅读习惯、检索习惯等。多项案例实际说明,即使无害的数据被大量收集后,也会暴露个人隐私。如何做到大数据采集与用户隐私保护的平衡是一个很重要的研究课题。
五、大数据在高校教育信息化应用中的策略
1.建立科学的数据规划
在教育信息化发展历程中,高校早期缺乏信息化的意识,积累的数据质量参次不齐。即使在大数据时代的今天,信息化工作人员对于数据规划意识依然朦胧。只是简单地意识到所有的数据都是有用的,但是具体怎么用,哪些可以共享,并没有明确的规划。通过总体的科学数据规划所得到的数据模型将是富有生命力的,在长达数年之内,它们可以凭借微小的调整和增加,就可适用于多种类型的系统和数据库。所以,拥有一个数据的长期规划是非常必要的。
2.加强数据的质量管理
数据质量是数据分析结论有效性和准确性的基础,也是最重要的前提和保障。对于大数据在高校的应用,数据的质量管理需要考虑以下几个关键问题。一是数据收集阶段的标准化、全面化、高效化。既要满足收集速度和精度要求,又需要满足数据来源的质量要求。从数据源头保证数据质量。二是数据清洗过程中的合理化和精确化。去除大量的噪声数据,精确地提取有效数据,保证数据处理过程中的高质量。在此基础之上,建立良好的数据管理机制,包括加强数据标准建设、重视历史数据积累、学习数据处理技术等,以求在数据准备阶段提高数据质量。
3.构建“上推下主”的体制
高校的管理体制规定着机构设置、职责运行和权限划分,高校中推行大数据共享和应用,显然要涉及对传统管理模式所形成的利益关系调整,因而需要触及体制调整与改革。只有从顶层部门进行全面、细致、强力的规划推动,才能减少乃至消除职能部门间资源共享的屏障。信息化部门应借助自身在技术层面的优势,整合各业务系统数据,形成数据中心,变被动为主动地去维护数据。同时,也要为学校职能部门等不同层次的用户提供定制的主题数据分析。各学科职能部门也要充分沟通和配合,及时反馈和跟进。只有通过这种顶层推动、信息部门主导的模式进行体制改革,才能有效地推进大数据在高校中的应用。
六、总结与展望
在大数据以“迅雷不及掩耳”之势席卷各个行业的时候,笔者更加关注大数据在高校信息化建设中的推进。本文通过讨论高校中的数据源和数据的特点,探讨大数据技术在高校中如何应用,并从技术和实施两个层面分析大数据在高校教育信息化建设中所面临的挑战以及相应的解决策略。
随着对大数据理解和应用的深入,我们期待看到大数据技术为高校信息化建设带来更多的活力。也希望能够抛砖引玉,给更多关注高校信息化建设中大数据的研究以帮助和启发,同时,也希望真正让大数据应用融入到校园生活的每一个角落里来,更好地服务于广大师生。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 8-1 Pandas 数据重塑 - 数据变形 数据重塑(Reshaping) 数据重塑,顾名思义就是给数据做各种变 ...
2024-11-26统计学基础 - 理解统计学的基本概念和方法是数据分析师必备的技能之一。统计学为他们提供了处理数据、进行推断和建模的基础。 数 ...
2024-11-25数据分析师在如今信息爆炸的时代扮演着至关重要的角色。他们不仅需要具备扎实的数据分析技能,还需要不断学习和适应不断发展的技 ...
2024-11-25数据分析师的工作职责涉及多个关键方面,从数据的获取到处理、分析再到可视化,旨在为企业的决策提供有力支持。让我们深入了解数 ...
2024-11-25数据分析师:洞察力量的引擎 数据分析师的兴起 数据分析师行业目前正处于快速发展阶段,市场需求持续增长,薪资水平也有所提升。 ...
2024-11-25数据收集与整理 - 从各种来源收集数据,清洗和整理以确保数据质量和可用性。 数据分析与建模 - 运用统计学方法和机器学习模型对 ...
2024-11-25数据分析是当今社会中不可或缺的一项技能,涵盖了广泛的工具和技术。其中,掌握各种数据处理函数对于数据分析师至关重要。本文将 ...
2024-11-25“大数据治理”是一个涵盖广泛的复杂概念,其核心在于确保大规模、多样化的数据资源能够被有效管理和利用。不仅涉及数据的采集、 ...
2024-11-25一、引言 背景介绍 随着信息技术的快速发展和互联网的普及,大数据已经成为现代社会的重要资产。大数据的兴起不仅推动了各行各业 ...
2024-11-25《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22