高校信息化的发展已历经三十年。从信息化建设阶段来看,可以分为四个阶段:
第一阶段以设备和网络为建设核心,譬如“电教中心”、“计算机中心”;
第二阶段以数字化校园建设为核心,譬如 “智慧教室”,“在线教学平台”;
第三阶段以数据为核心,譬如有些学校已经把“网络信息中心”更名为“大数据中心”;
第四阶段为已建立智慧大脑、人工智能的问题解决平台的发展阶段,譬如自动解答海量疑问、智能办理校内业务、建立人工智能问题解决平台等。
现阶段不少高校都处于信息化建设的第三阶段,今天我也主要基于此阶段,进行高校数据分析有效性探讨。
结合永洪在高教行业的具体客户应用,我整理了一些如何提升高校数据分析有效性要点和大家分享。
一是要确定战略目标。
是面向校领导层级的顶层驾驶舱,面向教务管理领导的单刀深入之教务管理,面向更多职能部门之教务、学生、图书馆、招就及科研管理,还是面向广义智慧校园之安全、空间、资产和能源管理?
又或是以上各种排列组合?我们的数据目标是什么?是否需要形成长期数据资产,数据共享?数据现状包括数量和质量又是怎样的?项目资金预算是怎样的?当期,中长期目标分别是怎样的?数仓、大数据平台甚至数据中台、BI怎么选择?
就像做课题设计一样,这些都需要在项目初期研判并确定。这个确定的过程要运用顶层设计方法,结合学校所处信息化建设阶段、业务系统数据情况及可以得到的相关财力、人力资源进行目标确定及整体规划。
好比装修项目,如果财力、人力、物力各方面条件完备,自是可以功能性能兼顾,从硬装到软装都来个豪华版,比如大数据平台建设一步到位,各数据主题应用也来个“百花齐放”。
但现实往往不那么丰满,比如当前各业务系统数据比较完备,但数据质量很差,学校有长远的数据应用规划,财力尚可但不很充裕,那当期首先可以建设数仓,完成数据治理,在此基础上选择需要的典型业务场景进行数据分析,后期再进一步建设大数据平台及进行更多报表开发。
再可能现实很骨感,什么都不完备,财力也很有限,那就可以以相对成熟业务系统为切入点,快速完成数据治理,小步轻走,实现“精瘦”化数据应用,数仓/大数据平台建设及系统性报表开发都在后期规划。
二是不要贪多。
首先分析主题不要贪多,即使业务系统数据完善,也不一定要纳入当期数据建设体系,原则是执行层面和目标严格一致。
以我们一个客户为例,近两年都一致深耕教务主题,因为其主体目标是提升学校教学质量及办学水平。事实证明通过对教务管理深度数据应用,切实提升了教务管理水平进而提升了办学水平。
再者是分析指标不要贪多。比如一卡通消费分析可以对学生消费时间、消费类别、消费金额、消费类别/金额和学生成绩关联性分析,是不是以上指标都需要呢?不是。
假设我们的目标是通过一卡通分析找到在生活上需要关怀的学生,那我们只需要着重看消费金额即可,譬如对月消费金额低于某个值的学生进行一卡通充值补助。“有舍才有得”,阶段内过于分散的目标和庞大的数据分析体系会分散精力,不利于数据应用落地及目标达成。
三是将“将数据进行到底”。
还是以上面提到的我们致力于教务分析的客户为例,我在和客户相关负责人就数据应用情况进行回访过程中,客户有句话让我印象非常深刻:“越用越准” 。我理解“越用越准”首先是主题定义、模型构建及指标定义准,再是发现问题准,最终辅助决策准。
“将数据进行到底”意味着主题定义及模型构建准确性。比如我们要做学业预警分析,是只看学生学业成绩来进行预警吗?传统方式可能是,但这还不够。
我们可以构建一个模型,从学生学业成绩、上课行为如出勤率、图书馆行为如图书馆进出次数/时长/图书借阅次数、上网行为如上网时长、活动参与等多方面构建一个基于学生行为的学业预警分析模型,因为只专注学业成绩很多时候看到即是结果,更多做到“预警”中的“警”,而基于以上模型能提供更多的预警信息,更好做到“预警”中的“预”。
“将数据进行到底”还意味着指标定义准确性。
以教师工作量指标定义为例,需要结合课程难度,上课学生数,是否有辅讲,节次等计算出来,才能相对准确地反映教师工作量。
怎么设置课程难度呢?可以设立教师专家组,请其设置不同课程难度系数。假设高等数学难度系数被设置为1.x, 某语言类学科难度系数被设置为0.x。还可以结合历年学科各方评教情况建立模型进行难度系数设置。
不要小看一个小小的指标定义,教师工作量是评教的重要因素之一,而评教的公平公正性,对教师队伍的激励性,对教学质量提升的重要性,再上升对学校办学水平的重要性影响程度都很大。
“将数据进行到底”还意味着什么?
除此之外高校数据分析有效性还有哪些要点呢?我们将在《浅谈高校数据分析之有效性》下篇继续和大家探讨,届时还将结合典型场景剖析如何有效构建高效场景化分析体系。欢迎关注。
暂无数据