大数据与个人信息保护
数据为王的时代,对于用户隐私的保护必然会越来越受到重视。那么,个人隐私保护制度会对互联网的发展带来怎样的影响?如何才能在大数据应用的商业利益与公众的个人信息保护需求之间取得平衡?在互联网无时不在、无时不有的今天,我们的隐私在各种情况下被收集、被利用,甚至被滥用,有关个人信息保护的立法也是国家立法计划中的重要内容,我主要跟大家分享几个方面,首先什么是隐私,如果这一点达不成共识,讨论就没有意义了。第二,我们现在所谓隐私保护面临哪些问题?第三,面对这些问题,未来从法律上怎么解决这些问题?
隐私是一个法律概念
隐私简单地说,是一个人不想让别人知道的东西。但个人的生活、感情因人而异,大家对隐私的看法也不一样。很多朋友都讲,隐私体现的是一种个人的东西,这在我理解的话就是属于个人信息的范畴。很多人对什么是隐私有分歧,就同一个人来说也不确定自己哪些是隐私,或者有些时候是,有些时候不是,完全自己说了算。所以这样的社会里如果较起真来,或者在法律上要维权的话就混乱了。
隐私不是中国本土的概念,隐私是用美国隐私概念的瓶装入了欧洲隐私的酒拿到中国来的。欧美人并没有对隐私从不同的学科、不同的语境、不同的地域文化上做区分,在欧美问什么是隐私,分歧也很大,但可能会比中国好一些,因为这种隐私跟我们的文化水土不服。隐私是一个与地域文化传统关联十分密切的概念。
在欧洲,宗教信仰就是隐私,而在中国,谁会认为这是隐私呢?中国传统上并没有隐私的概念,有一个观念是阴私。但上世纪70年代末80年代初,从欧美翻译过来的隐私的概念传到中国后广泛传播,导致了现在中国的隐私泛滥、泛化,动不动就说侵犯隐私,但你问什么是隐私,他却无法给你准确的答案。
隐私应当做不同学科、不同语境、不同地域文化的理解。女性的三围、身高、体重是心理学或社会学上的隐私,一定不能将这些隐私,包括政治学、经济学意义上的隐私跟法律上的隐私混为一谈。法律上,隐私是通过隐私权来保护的,权利就是行为自由的边界。这个边界很清晰,其他人不能进入,否则就可以起诉他侵权。如果法律上的隐私内涵不确定、外延不明确,因人而异,就会出现混乱。
隐私与公共利益无关
隐私绝对是个人的东西,比如国家机关就没有隐私。法律上的隐私,是个人信息的一部分,但不是所有个人信息都是法律上的隐私,姓名、家庭住址、女性的三围绝对不是法律上所讲的隐私。中国的阴私概念是值得借鉴的,从1956年“民法草案”开始,到1982年的民法通则,这一段时间里中国的法律上就有阴私概念。阴私是指不好的事情,一般正常理性的人,这些事情、信息公布出去会让他名誉扫地,让他的社会尊严受到伤害。传统的阴私仅仅是指与性有关的一些东西,比如裸照、性生活、两性情感。这个价值取向值得我们认可,但缺点是内涵比较窄,仅限于与性有关的方面。
阴私的价值观我们要继承。在上世纪70年代、80年代之前,阴私内涵比较窄没有问题,但是发展到今天,价值取向扩大了。很多人认可隐私这个词,这就是中国传统阴私的概念,但是内容要扩展。所以法律上的隐私,不限于与性有关的,还包括不为人知的重大生理疾病缺陷,这些缺陷公布出去同样会让他受到歧视,或令他的名誉受到影响。
这里下一个定义,法律上的隐私是指与公共利益、社会利益没有直接关系,同时又与人的名誉和尊严有关的极少数个人信息,这是抽象出来的本质;包括但不限于裸照、性相关、情感经历、生理疾病等,这是范围和表象。很多学者批评中国民法通则没有规范隐私,不重视人权,但是最高法院的司法解释是把它作为名誉权来保护的,比如披露与性有关的东西,让人名誉扫地,就认为侵犯了名誉权。其实按我的理解,隐私权不独立,隐私与名誉是相联系的。这方面中国其实比欧美先进,中国有阴私概念,披露阴私即会使人名誉扫地。
与公共利益、社会利益的关系还要看具体情况。一般人的婚外情或者是两性的东西可能被认为是属于隐私,但是作为政治官员、作为公众人物,他们的某些个人信息可能与公共利益、社会利益有关系,所以这部分在一定范围内可以公开。一般人认为属于隐私的,他们要受到限制。但是无论如何,在披露这些政治人物或者公众人物隐私时也要考虑到他们作为一个人最起码的名誉和尊严,披露的方式要注意,比如将裸照放在网上是不可以接受的,不能因为是公众人物就不被保护。再比如犯罪记录,它有不同国家、不同文化的考量。有的以社会利益为本位的国家不把犯罪记录作为隐私,他们认为如果把犯罪记录作为隐私保护起来的话,会对周围人的安全带来隐患,虽然公开犯罪记录也可能会使被公开者的尊严受损。
难以操作的个人信息保护指令
我们现在说的个人信息、敏感信息的概念来自欧盟。欧盟与中国国情不同,拿过来没有可操作性。今天在讨论隐私遇到互联网时,一定要知道这个隐私是什么样的隐私,否则讨论就没有任何意义。欧美的隐私观,表面上看好像尊重了个人权利,好像很现代化,实际上不仅没有任何积极意义,还会带来很多消极的作用。现在所说的“隐私遇上互联网”的这个隐私,不是我讲的法律上的隐私,而是受到欧美隐私观影响的一种东西。
在个人信息中,姓名、家庭地址、电话号码都是在社会交往中正常产生的,我们反对的是骚扰电话、垃圾短信这样的滥用行为。现在买卖个人信息很常见,发送垃圾短信、骚扰电话,有人认为是侵犯隐私,这看起来非常诱人的想法实际上正是导致问题泛滥的根源。按照刑法修正案,情节严重的买卖个人信息是一种犯罪行为,但是起诉维权的成本特别高,侵权和犯罪的成本却特别低。现在的隐私观念听起来讲人权,但客观上不利于受害人维权。
我们现在的立法是学习欧盟的,全国人大常委会2012年通过一个规定,互联网公司在收集个人信息的时候应当征得当事人的同意,当事人有决定权是否让你收集;有知情权,你基于什么样的目的收集个人信息,收集以后存在什么地方;当事人也有查看的权利、删除的权利、修改的权利,比如信息记录不完整、有出入时可以进行修改;甚至还有被遗忘的权利———以前互联网上的信息,时过境迁不希望放在网上的时候有权请求删除,删除之后在互联网上就被遗忘了,所以是被遗忘的权利。
收集信息所涉及的同意、知情、查询、修改、删除权是欧盟1995年的个人信息保护指令中所规定的内容,去年修改时增加了被遗忘的权利,但是这个权利的落实需要技术上的一个先决条件,就是当事人必须知道自己的信息何时何地被何人收集在了什么地方,这样才能行使相关权利。欧盟的个人信息保护指令源于上世纪60年代末70年代初,那时只有银行、保险、电信公司和政府机构才有大型计算机,但现在,移动互联网的出现让信息的收集无时无处不在,每个人的工作单位、电话号码、家庭地址能说清楚何时何地被何人收集了吗?所以现在的立法和认识都远远过时了,没有办法操作。
去年欧洲讨论很激烈的是被遗忘的权利,最后勉强通过,我们马上将欧洲的东西引进过来。欧洲有没有大的互联网公司?一个都没有。欧盟像垂暮的老年,特别保守,极端推崇个人的权利、个人的自由,欧盟的隐私观就是极端个人主义自由观的体现。
互联网收集的信息多数不是隐私
当隐私遇到互联网,很多时候我们说的那个隐私其实并不是隐私。互联网收集信息无处不在无时不有,但收集的这些信息多数不属于隐私范畴:比如说在当当购书了,就会发现上网时会提示你买什么书;或者使用了搜索引擎,下次再使用时就会自动弹出相关的东西,很多人都错误地认为这是侵犯了隐私。排除政府的行为,对互联网企业来说,你要是认为它收集的信息侵犯了你的隐私,这十有八九是自作多情。互联网企业无需知道你是张三还是李四,它只需要有针对性地推广商品和服务。
在互联网背景下,要区分什么是我的个人信息,什么是可以找到我的信息。个人信息是由若干片断组合而成的,N个片断的组合才是我的个人信息。如果N -1个片断的话,不是完整的我,就不是个人信息了。所以行为偏好不是个人信息,个人信息是能够直接或间接识别出一个人的信息总和,单单行为偏好的数据不足以识别出一个完整的我。但是行为偏好数据可以让商家很快找到这个人所需要的服务,对双方都有好处。所以隐私遇到互联网,有一个观念要转变,很多人认为商家收集信息就是侵犯个人隐私,这是错误的,是对互联网的误解。一般来说互联网公司无需知道一个人的个人信息,也没有动机知道,知道对它没有任何好处,只有坏处。只有一种情况例外,就是比如公安机关依法定程序找互联网企业要信息。
现在的大数据时代还意味着,原来散落在互联网各个角落的信息,通过数据信息的收集、加工技术,海量数据将连在一起。这样,原来不能识别出一个人的N -1、N - 2、N -3个信息就可以还原为N个信息,就可以找到这个人,实行实名化。所以这里有一个原则,在大数据的背景下对数据的加工分析匹配过程一定要匿名化。匿名化对商家来说,就是处理的这些数据不会知道具体是谁的信息,只是数据而已。收集加工处理越精准,才越有利于用户和企业之间减少交易成本。当然还有一个原则,阴私是禁止收集、禁止加工的,但遵循匿名原则的话,这个问题就不存在了。
只要我们遵循以上的这些原则,隐私遇到互联网其实没有什么大问题,不像传说中那么恐怖。最重要的,一是要规范政府的行为,二是要规范企业的信息加工,使最后的匹配行为一定匿名化。如果这两点做到了,在互联网环境下,我们就不要老强调信息安全,害怕泄露隐私。现在我们在观念上本末倒置,强调信息的安全,事实上无法安全。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31本人基本情况: 学校及专业:厦门大学经济学院应用统计 实习经历:快手数据分析、字节数据分析、百度数据分析 Offer情况:北京 ...
2025-01-30