大数据安全面临系列挑战_数据分析师
随着大数据时代的到来,数据的收集和存储更加方便,同时跨境流动更加频繁,安全问题愈发凸显。我国在发展大数据产业的过程中,部分企业收集用户数据的使用权限边界界定不清,用户隐私和权益遭受侵害,一些重要数据被非法倒卖、流向他国,安全威胁已经从个人层面上升至国家安全层面,亟须引起重视。
安全风险不断提升 隐私保护内涵拓展
伴随网络化社会的不断发展和技术水平的不断提升,大数据安全风险也不断增加。首先,网络化社会无处不在的智能终端、互动频繁的社交网络和超大容量的数字化存储,为获取和存储大数据提供了一个开放、互联的平台。基于云计算的网络化社会,使分布在不同地区的资源可以快速整合、动态配置,实现数据集合的共建共享。但这一平台的开放性,也使得蕴含海量信息和潜在价值的大数据更容易吸引黑客的攻击。对于攻击者而言,由于这些信息的相互关联,用相对低的成本便可获得“滚雪球”般的收益。
同时,技术的发展也增加了安全风险。计算机网络技术和人工智能的发展,服务器、防火墙、无线路由等网络设备和数据挖掘应用系统的广泛应用,为大数据自动收集效率和智能动态分析提供了方便,但也增加了大数据的安全风险。一方面,由于对大数据的安全控制力度不够,应用程序编程接口的访问权限控制以及密钥生成、存储和管理方面的不足都可能造成数据泄露;另一方面,攻击技术不断提高,大数据本身可能成为一个可被持续攻击的载体,隐藏其中的恶意软件和病毒代码很难被发现。
2014年8月,中国互联网协会发布的《中国网民权益保护调查报告(2014)》显示,2013年7月至2014年7月,中国网民因各类侵权遭受的损失合计约1434亿元,其中直接经济损失约为1093亿元。
大量事实表明,如果不能妥善处理大数据安全问题,将对用户的隐私造成极大的侵害。专家介绍,根据保护内容的不同,用户隐私保护可细分为位置隐私保护、标识符匿名保护、连接关系匿名保护等。而与传统的网络安全内容不同,在大数据时代,人们面临的威胁除了个人隐私泄露,还包括基于大数据对人们状态和行为的预测。
被誉为“大数据商业应用第一人”的英国专家维克托·迈尔·舍恩伯格在《大数据时代》一书中举例说,某零售商通过历史记录分析,比家长更早知道其女儿已经怀孕的事实,并向其邮寄相关广告信息。这种针对人们状态和行为的预测,实际上也涉及一种重要的用户隐私。
此外,一些企业认为,经过匿名处理后,信息不包含用户的标示符就可以公开发布。但事实上,仅通过匿名保护难以达到隐私保护目标。例如,美国某公司曾公布匿名处理后的三个月内部分搜索历史,供人们分析使用。虽然个人相关标识信息被精心处理过,但通过其中某些记录项还是可以准确地定位到具体的个人。《纽约时报》随即公布其识别出一位62岁的寡居妇人,家里养了三条狗,患有某种疾病。
另一个相似的例子是,著名的DVD租赁商Netflix曾公布约50万用户的租赁信息,悬赏100万美元征集算法,以期提高电影推荐系统的准确度。但是当上述信息与其他数据源结合时,部分用户还是被识别出来。
专家介绍说,目前用户数据的收集、存储、管理与使用等均缺乏规范,更缺乏监管,主要依靠企业自律,用户无法确定自己隐私信息的用途。全球权威大数据专家阿莱克斯·彭特兰教授,针对大数据安全提出了“数据上的新决议”三原则,即用户有权拥有自己的数据,有权掌控数据的使用,有权销毁或贡献自己的数据。
跨境流动风险加剧 数据倒卖凸显监管缺失
本刊记者了解到,目前一些外国企业正在大量收集和分析我国用户的大数据资料。美国微软公司推出智能聊天机器人“小冰”,通过其强大的大数据分析技术能力,收集和分析了中国6亿多网民多年来的聊天记录。目前微软“小冰”已同米聊、易信等多家我国即时通讯工具进行合作开发,通过分析用户聊天内容进行商业开发。
最高人民法院中国应用法学研究所所长孙佑海说,虽然微软公司承诺仅将“小冰”收集的数据传输到云端,并不保存,但实际上无人知晓微软公司是否真的不保存数据,即便不存储数据,美国情报部门仍然可以在通信信道上监听,这将给我国的网络信息安全带来巨大隐患。
孙佑海指出,网络空间的资源分配权一直掌握在美国政府控制下的“互联网名称与数字地址分配机构”(ICANN)手中。目前,我国和ICANN签订的入网协议并未对外公开,从台湾网络资讯中心(TWNIC)和ICANN共同签署的入网协议的内容来看,根本没有防止监控和窃取入网国家和地区的网络信息等安全保障方面的约定。
我国一些网络运营商和企业将收集而来的数据信息进行大数据分析,分门别类整理后销售给他人,为自己牟取巨大利益,给用户带来巨大的安全隐患。
本刊记者采访发现,除了多年前就十分普遍的手机信息泄露,当前网上非法倒卖银行卡信息的行为也变得十分猖獗,严重威胁到国家金融安全。而对倒卖银行卡信息的行为,目前我国并没有相应的刑法罪名,且行政处罚又缺乏明确的法律依据,只能依据居民身份证法对违法使用身份证办理银行卡的行为处以200元以下的罚款,违法成本极低,客观上助长了违法行为的肆虐。
对于国家安全和公共安全,我国建立了对信息和信息载体按照重要等级分级保护的“信息安全等级保护”制度。但孙佑海指出,该制度因缺乏法律依据,贯彻执行情况并不理想。涉及国家安全和公共安全的重点岗位和人员的范围不够明确,网络信息安全保护工作的重点不够突出,一些重点岗位人员既缺乏网络信息安全保护的意识,也缺少网络信息安全的专业技能,更缺乏网络信息安全的保护措施。
数据无界线万物互联带来新问题
在传统的PC互联网时代,电脑连接还有明显的边界,需通过线缆连接,这时的安全问题可以靠防病毒、查杀流氓软件、防火墙等进行防御;但进入到互联网新阶段,特别是移动互联网时代,手机等终端打破了对网络边界的定义,手机和个人隐私信息联系在一起,安全问题变得更加严重。
中国工程院院士邬贺铨说,万物互联时代的设备连接和数据规模都达到了前所未有的程度,不仅手机、电脑、电视机等传统信息化设备将连入网络,家用电器和工厂设备、基础设施等也将逐步成为互联网的端点,远超出传统边界网络安全防御的范围;云计算提高了IT资源使用效率,但其动态虚拟化管理方式、强大的计算与存储能力,也会引发新的安全问题,给安全管理体系带来巨大冲击。
对此,业内人士指出,移动设备的普及正吸引网络黑暗势力将目标转至移动终端,现有的安全防护手段逐渐失去效力,传统的系统安全、边界安全已无法防卫以“数据窃取”和“大数据污染”为目的的恶意威胁,必须以大数据为核心,构建全新的信息安全防护体系。重塑信息安全要遵循三个基本原则,即以保护用户隐私和数据安全为前提,明确用户对信息数据的所有权,明确企业对信息数据的保障义务,并保障用户在信息交换和使用时的知情权,这是万物互联时代保护信息安全的基础。
业内人士认为,大数据的安全应用目前仍多停留于想法,仍需进一步探究如何落地。大数据首先应建设一套规范且灵活的建设标准与运行机制,规范化建设可以促进大数据管理过程的正规有序,实现各级各类信息系统的网络互联、数据集成、资源共享,在统一的安全规范框架下运行。
此外,可考虑建立以数据为中心的安全系统。基于云计算的大数据存储在云共享环境中,为了大数据的所有者可以对大数据使用进行统一控制,可以通过建设一个基于异构数据为中心的安全方法,从系统管理上保证大数据的安全。
还须看到,规范固然重要,如果太过于死板,是不利于安全对抗的,攻击本身就是一种很灵活的过程,安全对抗需要保持高敏感度,在大小对抗中不断完善这个体系。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31本人基本情况: 学校及专业:厦门大学经济学院应用统计 实习经历:快手数据分析、字节数据分析、百度数据分析 Offer情况:北京 ...
2025-01-3001专家简介 徐杨老师,CDA数据科学研究院教研副总监,主要负责CDA认证项目以及机器学习/人工智能类课程的研发与授课,负责过中 ...
2025-01-29持证人简介 郭畅,CDA数据分析师二级持证人,安徽大学毕业,目前就职于徽商银行总行大数据部,两年工作经验,主要参与两项跨部 ...
2025-01-282025年刚开启,知乎上就出现了一个热帖: 2024年突然出现的经济下行,使各行各业都感觉到压力山大。有人说,大环境越来越不好了 ...
2025-01-27在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-01-26数据指标体系 “数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而 ...
2025-01-26在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-25俗话说的好“文不如表,表不如图”,图的信息传达效率很高,是数据汇报、数据展示的重要手段。好的数据展示不仅需要有图,还要选 ...
2025-01-24数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪70 ...
2025-01-24又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-23“用户旅程分析”概念 用户旅程图又叫做用户体验地图,它是用于描述用户在与产品或服务互动的过程中所经历的各个阶段、触点和情 ...
2025-01-22在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-22