京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代审计技术方法的发展趋势
自上世纪80年代初国家审计机关建立以来,国家审计职能与审计范围随着经济发展而不断扩大。而随着信息化时代的到来,国家审计的外部环境也发生了显著变化,财政、税务等国家机构、企事业单位以及与国计民生密切相关的重要行业都逐步实现了会计电算化,因而,审计部门顺应大数据时代的发展趋势开展大数据审计已经势在必行。本文首先简要介绍大数据时代的背景,然后对大数据特征进行一个简要的总结,接着论述一下大数据审计的必然性以及我们开展大数据审计应当关注的几个问题,最后展望审计部门在大数据时代审计技术方法的发展趋势。
步入新世纪以来,信息技术迅猛发展,与之相伴随的是给整个社会带来了一场生产生活方式以及思维模式的变革,从而使我们的工作生活环境发生了巨大的变化,大数据已经成为与石油相媲美的一项战略资源,可以说,大数据时代已经到来。国家审计机关作为与数据密切接触的部门,必将会迎来大数据时代所带来的机遇与挑战。面对大数据时代这一发展趋势,国家审计机关已经开展了“金审工程”一期、二期,并部署了三期工程。“金审工程”的稳步推进,必将有助于实现国家审计的“免疫系统”功能,充分发挥国家审计在国家治理体系中的基础性作用。
一、大数据的特征
在“云计算”、“物联网”等信息化时代的新名词冲击着我们大脑的同时,“大数据”也已悄然进入了我们的视野,并成为了我们工作生活中一个不容忽视的名词。但是,究竟什么是“大数据”?尚没有学者给出一个明确的定义,人们也无法尝试给出一个定义,因为随着大数据时代的发展,“大数据”的内涵和外延也在不断扩大。因而,我们只能从大数据的基本特征来进行一个把握。根据大数据的一系列研究成果,我们可以将大数据概括为以下四个特征:
第一,数据体量巨大。根据国际数据公司2011年发布的权威报告显示,信息数据正以每两年增长一倍的速度上升,以2011年为例,当年全球数据总量高达1.8万亿GB,而十年之后将增至35万亿GB。这样的大数据意味着什么?如果把这些数据全部记入书中,可以覆盖美国52次,存储在光盘里可以堆成5堆,每一堆都可以抵达月球。
第二,数据快速变化。大数据时代的各类信息变化迅速,特别是涉及到电子商务领域的信息。以网上交易为例,交易时间的短暂性导致交易信息会瞬间消失,如果相关信息需求者不能对交易信息进行及时采集分析,就会丧失数据的时效性,从而使数据丧失价值。因而在数据处理方面就有了著名的“一秒定律”,即要在秒级时间内给出分析结果,否则数据就会丧失其利用价值。
第三,数据类型多样。数据类型的多样化也让数据类型分为结构化数据与非结构化数据。传统的信息环境下,我们主要面对的是结构化数据,例如财务数据。但是在大数据背景下,我们面对的则更多的是非结构化数据,包括音频、视频、图片、地理位置信息等。这些数据随着信息技术的发展不断地更新演变,也对数据的处理能力提出了更高的要求。
第四,价值密度低。大数据仅仅有海量数据还是远远不够的,数据本身还要具有价值性,而且价值的高低与数据总量的大小往往成反比。价值密度低并不是说数据库本身是没有价值的,而是针对大数据本身,就拿视频为例,长时间的视频监控里,对于信息需求者来说可能仅仅也就有几秒钟的视频有用。因而如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。
二、大数据审计的必然性
(一)国家审计外部环境的变化。就拿基层审计机关为例,传统的审计组织管理模式主要实行以单一的审计小组进行“单兵作战”的方式开展审计工作,从而导致各个小组之间缺乏有效的沟通,数据也无法进行有效的利用与整合。但是大数据时代的到来改变了国家审计的外部环境,一方面数据规模逐渐扩大,另一方面被审计单位的数据化水平逐渐提高。因而一方面传统的审计组织模式无法实现数据资源的有效共享以及实时跟踪,另一方面审计组内部也缺乏信息技术运用的专门人才。因而审计资源无法得到充分整合发挥,增加了审计成本与风险。
(二)国家审计职能的拓宽。国家审计属于经济监督体系的一个重要环节,在整个国家治理结构中扮演一个重要角色,审计部门已经习惯于对被审计单位的财政收支以及财务收支进行审计监督。人类进入大数据时代以来,审计部门面对大数据带来的挑战越来越严峻,国家审计作为一个开放的系统,与其他子系统保持着密切的联系,能够接触到政府各部门、各行各业的数据。通过大数据技术的支持,审计部门的审计职能已经不仅仅停留于问题的揭示、监督以及披露阶段,而是通过对相关数据的整理分析,揭示数据背后隐藏的体制机制性问题。
(三)审计监督全覆盖的必然要求。2015年12月,中共中央办公厅、国务院办公厅印发的《关于实行审计全覆盖的实施意见》第七条“创新审计技术方法”,提出审计机关要构建大数据审计工作模式;要建立健全数据定期报送制度;要构建国家审计数据系统和数字化审计平台;要探索建立审计实时监督系统,实施联网审计等。这表明,国家层面对大数据时代背景下实行审计监督全覆盖已经做出了明确的要求,大数据技术是推动审计监督全覆盖的有力武器与必然要求。
三、大数据审计应当关注的几个问题
(一)大数据安全问题。大数据时代审计机关不得不面对信息安全方面的挑战。诚然,大数据是一项宝贵的审计资源,通过大数据审计可以分析被审计单位的潜在问题,进行风险预防,更好地发挥审计职能。但是审计机关获得的审计数据也随时面临着信息泄露的风险,以基层审计机关为例,大部分的基层审计机关还是习惯于运用外网办公,而外网则很容易受到黑客的入侵,如果不法分子将这些数据进行非法利用,后果不堪设想。
(二)数据共享问题。如今基本上所有的被审计单位都已经实现了会计电算化,但是因为各种各样的原因部门之间无法实现数据信息的共享,审计机关对被审计单位开展审计时,被审计单位也有可能对数据资料进行选择性提供,这就不利于审计工作的正常开展,更不利于审计职能的充分发挥。因而,从政府整体层面上应当打破这种利益藩篱,实行数据跨部门流动的管理机制,实现数据共享。
(三)大数据平台问题。数据的支撑是开展大数据审计的关键,因而审计系统应当从整体层面上将目前存在的简便易行的大数据分析工具进行整合,从而形成大数据分析平台供审计人员使用,使信息的粗放式发展向集约式发展转变。同时,应当试行将审计的大数据平台与财政、税务、金融等大数据平台进行对接,建立由政府主导、审计部门主推、相关部门参与的大数据共享平台,将一个个“信息孤岛”有机连接起来。
四、大数据时代审计技术方法的发展趋势
(一)单一事后审计向事中与事后审计相结合。传统的国家审计往往是在被审计单位经济业务完成以后才开展审计,而且主要依赖于被审计单位提供的财务会计资料来进行审计,因而往往是通过对财务数据的审查来发现问题,从而造成了“局部反映整体”这一突出问题,并且具有明显的滞后性。然而在大数据这一时代背景下,被审计单位的所有经济活动基本都以数据形式来进行反映,因而这就为审计部门开展事中与事后审计创造了便利条件,规避了抽样审计带来的审计风险,从多角度深层次的挖掘数据信息价值,实现审计的预防与监督职能。
(二)单一现场审计向现场与远程审计相结合。传统的国家审计面对的都是被审计单位的小量数据,因而审计部门往往以科室为单位向被审计单位派出审计组开展现场审计。但是面对大数据时代的海量数据,这无疑给审计组现场审计带来了压力与负担。因而大数据时代背景下的联网审计使得审计机关可以通过被审计单位的数据终端实现对被审计单位业务的实时监测,对潜在风险进行及时评估,进行常态化、信息化的跟踪审计,从时间上实现审计监督全覆盖,从而更好地实现审计事后监督向事前预警转变,实现国家经济资源的有效配置,减少经济资源的损耗浪费。
(三)单一静态审计向静态与动态审计相结合。传统的国家审计往往是对已经形成的会计数据资料进行静态审计,而静态审计不利于对被审计单位的动态数据进行分析,因而不利于揭示被审计单位的潜在风险,无法实现审计的风险预防职能。大数据审计技术给我们审计机关带来了技术与思想观念上的变革,部分地区已经构建了实时监控、动态监控的审计系统,开始向持续性审计、动态审计进行转变,提高审计的质量和效率。因而大数据时代的到来必将使我们传统的静态审计转变为风险导向型审计,通过动态审计更好的履行审计职能。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24