大数据时代,谁能阻止信息泄露_大数据培训
大数据及云计算技术从热词到落地,从企业到个人都在享受其带来的福利,数据存储、计算、整合及利用为许多企业带来商机,也为个人提供了更为便捷的互联网服务。但与此同时,用户存储在云端的个人信息数据安全也面临着极大的挑战。
“泄密门”频发
2014年12月底,春运售票初期,铁路客户服务中心12306网站被曝出大量用户数据泄露并在网上传播售卖,这些用户数据包括13万条账号、密码、手机、身份证号、邮箱地址等个人私密信息。一时间,互联网上个人隐私安全及其保护的话题再次成为关注焦点。12306“泄密门”并不单一,近两年,同类事件层出不穷:
2014年3月,乌云漏洞平台曝出在线旅游服务平台携程网支付系统存在技术漏洞,安全支付日志可下载,导致大量用户银行卡信息泄露,这些信息包括持卡人姓名、身份证信息、银行卡号、卡CVV码(即卡号、有效期和服务约束代码生成的3位或4位数字)以及6位卡Bin(用于支付的6位数字)等。
2014年4月,某黑客对国内两家大型物流公司内部系统发起网络攻击,非法获取快递用户个人信息1400多万条,并出售给不法分子。这些个人信息包括用户的姓名、联系电话以及住址等。
2014年5月,电商网站eBay要求近1.28亿活跃用户全部重新设置个人账号密码,eBay透露这是因为黑客能从eBay获取用户密码、电话号码、地址及其他个人数据。
2014年9月,黑客采取突破密码尝试次数的方式破解了众多好莱坞女星的iCloud账号,从而引发了全球轰动的“好莱坞艳照门”事件。虽然事后苹果紧急修复了该黑客利用的漏洞,但该事件足以让云服务上用户隐私的保护获得足够重视。
以上事件仅是具有代表性的个人信息泄露事件。在互联网技术高度发达的今天,几乎所有人都在使用各式各样的互联网服务,我们已经与互联网服务融为一体,从昵称、姓名到银行账号、密码,几乎所有信息都存在于互联网的各类云端、服务器中,个人信息随时都可能遭遇泄露或被窃取。这些个人信息按照敏感与重要程度可分为四类:个人身份信息、个人行为信息、个人隐私信息和个人账号信息(见表1),其重要性呈逐层递增状,如个人账号信息一旦泄露,前面三类信息的获取相对来说轻而易举。并且,个人隐私具有极大的商业价值,容易成为猎取目标,以“个人行为信息”为例,此类信息的收集及应用最直接的表现是在电子商务网络广告中,无论微博还是门户网站,我们通常会发现广告位置展现的是我们曾在电子商务网站上浏览过的商品或类似商品,更不用说如果“个人账号信息”被盗取可能带来的损害。
谁是“泄密者”?
尽管互联网应用服务商、网站服务商及云服务提供商皆承诺能够保护用户数据信息,但互联网环境下没有所谓的百分之百的安全。低级手段如内部人员偷盗售卖数据,高级手段如黑客攻破服务商系统盗取数据等,都是用户数据泄露的罪魁祸首。
1. 服务商内部人员偷盗售卖
内部人员偷盗售卖数据是典型的非技术用户信息泄露方式,但此类方式难以避免,防不胜防。任何一家服务提供商都无法保证其接触用户个人信息数据的员工能够为道德规范所约束,在利益诱惑下,个别员工铤而走险通常难以避免。如2013年11月,从事电商工作的张某因“涉嫌非法获取公民个人信息罪”被杭州市公安局西湖分局刑事拘留。随后,此案牵出某宝前技术员工李某,李某利用工作之便在2010年分多次在公司后台下载了超过20G的用户资料,并与两名同伙将用户信息多次出售给电商公司、数据公司。这些用户资料包括用户真实姓名、手机、电子邮箱、家庭住址、消费记录等。
2. 网络服务安全漏洞被利用
互联网服务由于其特殊性,总是存在有安全漏洞。可以说没有不存在安全漏洞的互联网服务,只是没有被发现而已。
我们来看网站服务方面的安全漏洞情况分析,360互联网安全中心最新发布的《2014年中国网站安全报告》显示,在接受360网站安全监测平台扫描的164.2万个网站中,存在安全漏洞的网站为61.7万个,占扫描网站总数的37.6%。其中,存在高危安全漏洞的网站共有27.9万个,占扫描网站总数的17.0%(见图1)。
由于不同漏洞对网站安全性影响有所不同,360互联网安全中心将网站安全漏洞划分为高危、中危和低危三个级别。其中高危安全漏洞可以让黑客取得服务器控制权限,可以对网站进行肆意更改;中危安全漏洞会造成黑客入侵网站,且可以篡改部分数据;而低危安全漏洞允许黑客扫描网站数据信息,也可能给网站带来危害。
由此可见,我们日常访问的网站中,超过三分之一的网站都存在安全漏洞,而这些漏洞,随时都可能成为个人信息数据泄露的发力点。网络服务的安全漏洞,一方面是由安全技术人员发掘找出,如上述360互联网安全中心通过扫描发现的安全漏洞,这些漏洞会被厂商知晓并修复;另一方面是被黑客发现,如果是白帽子黑客,如在360补天漏洞响应平台上的白帽子黑客,则会提交给厂商进行修复,但如果是抱有恶意的黑客,则可能借机窃取用户数据信息。
网络服务安全漏洞中破坏性最强的莫过于通用性网络软件/服务/协议的漏洞,如在2014年4月曝出的“心脏滴血(HeartBleed)”重大安全漏洞。OpenSSL是为网络通信提供安全及数据完整性的一种安全协议,囊括了主要的密码算法、常用的密钥和证书封装管理功能以及SSL协议。多数SSL加密网站是用名为OpenSSL的开源软件包,而在OpenSSL源代码中发现的“心脏滴血”安全漏洞,可以让黑客每次从服务器或客户端内存中获取最大64K的数据内容。由于OpenSSL是互联网应用最广泛的安全传输协议,被网银、在线支付、电商网站、门户网站、电子邮件等重要网站广泛使用。因此,该漏洞会造成黑客可以从使用OpenSSL协议的网路服务上盗取大量用户数据信息。
3. 木马、钓鱼网站恶意盗取
木马在PC互联网时代最为常见,黑客通过网络入侵、软件安装包伪装等方式将木马放置到用户个人电脑中,然后通过木马盗取用户电脑上的个人信息、账号等。得益于免费杀毒软件的出现,杀毒软件普及率大大提升,现在木马病毒已经越来越少。但在移动互联网时代,偶尔还会出现伪装成手机应用的木马病毒出现,多数存在于Android操作系统环境中。
钓鱼网站无论在PC互联网时代还是如今的移动互联网时代都屡禁不止,它们通常是向用户发送与大型正规网站、服务网站类似的钓鱼网站地址,用户一旦打开登陆并输入账号密码,账号密码便会被不法分子收集利用。
打造“杀手锏”
个人隐私保护在大数据时代变得愈发艰难,从个人角度来讲,想要规避隐私泄漏风险,首先要提高个人账号密码复杂度,尤其是涉及支付类网络服务的账号密码要使用非常用密码,对能够进行多重密码保护的账号尽可能的完成多重保护操作;其次是下载软件或手机应用时要选择正规下载站点或应用商店,尤其是Android用户,不要随便安装不明应用;最后是要养成良好的上网习惯,谨慎提交个人信息,对于安装的手机应用服务,可查看设置权限,禁止获取不必要的个人数据信息。
而从厂商方面来讲,此处引用360公司董事长兼CEO周鸿祎在2014年互联网安全大会上提出的用户信息安全三原则作为指导。他表示,在大数据来临的时代,在憧憬大数据产生商业效应的同时,也应考虑如何保护用户信息,并提出了三原则:
第一,用户信息是用户个人资产。用户在使用厂商设备、软件及服务所产生的数据与信息,应该是用户个人资产,虽然存储在厂商的服务器或云端,但从所有权方面讲应该明确地属于用户,是用户财产。
第二,厂商获取用户数据信息,用户要有选择权、知情权和拒绝权。大数据时代,厂商为用户提供服务同时,会从用户身上获取大量数据信息。对此用户要有知情权,并且,厂商要得到用户授权才能使用用户信息,用户要有选择权、有拒绝权。
第三,安全责任原则。有人认为网络信息安全只是互联网安全公司的事,是杀毒软件的事。但在大数据时代,任何一家互联网公司,包括做可穿戴硬件的公司,都会变成一个互联网服务公司,用户使用这些硬件、服务都会产生大量的数据。所以,任何一家互联网公司都有责任保护用户信息安全,要在云端对用户数据进行足够强度加密,包括安全存储和安全传输。
结语
互联网刚兴起时,有人说,你不知道互联网另一端坐的是一个人还是一条狗。在大数据及云计算落地应用的现在,我们不但可以知道另一端是不是一条狗,还可以知道是雪纳瑞还是萨摩耶。
云端信息数据量还在不断膨胀,文字、图片以及视频的数量在不断增加,这些数字化事物看似凌乱不堪,但如果某一天被泄露或窃取,稍加梳理,也许我们最不为人知最隐私的一面就会曝光于世。那时,你就是一只藏獒,也只是一只被扒光了皮的狗。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 2 Pandas数据类型 Pandas 有两种自己独有的基本数据结构。需要注意的是,它固然有着两种数据 ...
2024-11-01《Python数据分析极简入门》 第2节 1 Pandas简介 说好开始学Python,怎么到了Pandas? 前面说过,既然定义为极简入门,我们只抓 ...
2024-10-31在当今数据驱动的世界中,数据科学与工程专业的重要性愈发凸显。无论是推动技术进步,还是在商业决策中提供精准分析,这一专业都 ...
2024-10-30在当今信息爆炸的时代,数据已成为企业决策和战略制定的核心资源。爬虫工程师因此成为数据获取和挖掘的关键角色。本文将详细介绍 ...
2024-10-30在当今数据驱动的世界中,数据分析是揭示商业洞察和推动决策的核心力量。选择合适的数据分析工具对于数据专业人士而言至关重要。 ...
2024-10-30能源企业在全球经济和环境保护双重压力下,正面临前所未有的挑战与机遇。数字化转型作为应对这些挑战的关键手段,正在深刻变革传 ...
2024-10-30近年来,随着数据科学的逐步发展,Python语言的使用率也越来越高,不仅可以做数据处理,网页开发,更是数据科学、机器学习、深度 ...
2024-10-30大数据分析师证书 针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。 ...
2024-10-30《Python数据分析极简入门》 附:Anaconda安装教程 注:分Windows系统下安装和MacOS系统安装 1. Windows系统下安装 第一步清华大 ...
2024-10-29拥抱数据分析的世界 - 成为一名数据分析工程师是一个充满挑战和机遇的职业选择。要成功地进入这个领域,你需要掌握一系列关键技 ...
2024-10-28降本增效:管理战略的关键 企业管理中的降本增效不仅是一项重要的战略举措,更是激发竞争力、提高盈利能力的关键。这一理念在当 ...
2024-10-28企业数字化是指利用数字技术和信息化手段,对企业的各个方面进行改造和优化,以提升生产效率、服务质量和市场竞争力的过程。实现 ...
2024-10-28数据科学专业毕业后,毕业生可以选择从事多种不同的岗位和领域。数据科学是一个快速发展且广泛应用的领域,毕业生在企业、学术界 ...
2024-10-28学习数据科学与大数据技术是当今职业发展中至关重要的一环。从基础到高级,以下是一些建议的课程路径: 基础课程: Python编程 ...
2024-10-28在信息技术和数据科学领域,数据架构师扮演着至关重要的角色。他们负责设计和管理企业中复杂的数据基础设施,以支持数据驱动的决 ...
2024-10-28进入21世纪以来,随着信息技术的迅猛发展,大数据已经成为全球最具影响力的技术之一,并成为企业数字化转型的核心驱动力。大数据 ...
2024-10-28随着科技的迅猛发展,数字化转型已成为现代企业保持竞争力和推动增长的关键战略之一。数字化不仅仅是技术的应用,它代表着一种全 ...
2024-10-28银行业正处于一个前所未有的数字化转型时期。在数字经济的驱动下,金融科技如大数据、人工智能、生物识别、物联网和云计算等技术 ...
2024-10-28数据分析可视化是一门艺术与科学相结合的技术,其主要目标是将复杂的数据变得更易于理解和分析。通过将数据以图表的形式呈现,我 ...
2024-10-28数据分析师在现代信息密集型的商业世界中扮演着至关重要的角色。他们通过专业的技能和敏锐的商业洞察力,帮助企业从大量数据中提 ...
2024-10-28