大数据时代更加注重个人隐私_数据分析师
近日,谷歌因侵犯数据隐私在法国被罚,理由是未整改其跟踪并储存用户信息的违法行为。此事要回溯到2012年3月,谷歌启用新的数据收集方案,修改了隐私政策,通过YouTube、Gmail等服务收集数据并整合在一起。虽然谷歌称此举可以为用户提供更加便捷、高效的服务,但法国国家信息自由委员会(CNIL)认为谷歌对用户信息的处理不够透明,用户既不知道这些数据会被怎样处理,也不知道谷歌处理其个人数据信息的目的,而且用户别无选择。
最终,谷歌被CNIL处罚15万欧元,虽然跟谷歌的收入相比简直微不足道,但此判罚将引发世界各地对个人隐私保护的连锁反应。据悉,谷歌新的隐私政策在西班牙、英国、德国、意大利以及荷兰都遭到了相似的指控。
上述案例是目前吵得沸沸扬扬的大数据与个人隐私之争的典型代表。未来随着大数据应用的进一步广泛,个人隐私保护将面临更为严峻的挑战。
福尔摩斯可以从微小的细节中发现案件的相关蛛丝马迹,勾勒出嫌疑人的形象。同样,大数据通过对海量数据的分析,也可以将一个人具象化。
互联网的个人隐私问题由来已久
自己的秘密不愿让他人知道,是自己的权利,这个权利就叫隐私权。在互联网时代,个人隐私问题主要是指对个人隐私权的侵犯。比如个人照片,当事人主动在网上分享与当事人不情愿却被他人放到网上分享是截然不同的两种情形,后者显然侵犯了个人隐私。人们的个人身份信息,以及人们在互联网上的各种行为,在没有任何提示的情况下被网站存储、利用,甚至泄露,这就是目前互联网在个人隐私方面涉及的主要问题。
互联网上个人隐私问题由来已久,因为个人隐私信息具有很高的利用价值。去年的央视315让人们了解到Cookie这一古老的收集个人上网行为的工具,在人们接触互联网的过程中,网民的性别、年龄、职业、兴趣等等都会成为有价值的数据,互联网广告可以通过这些数据实现精准的推送。在社交网络兴起之后,网民之间的社交关系同样极具价值:当你的某个朋友将要过生日时,生日礼物的广告已经铺天盖地提前占满所有屏幕。同样,LBS兴起之后,网民的地理位置信息同样可被利用,人们到达任意位置,附件商家的信息可以即时呈现。即使不用LBS,移动通信基站同样可以实现定位
大数据让互联网隐私问题更加突出
既然个人隐私问题是互联网Web2.0生来携带的胎毒,那为何还要与大数据应用起争执呢?我们知道,大数据分析是大数据应用的撒手锏,Gartner将大数据描述为具有更强的决策力、洞察发现力。大数据可以对海量的信息进行分析并发现其中的价值,这种能力让其成为了互联网应用中的夏洛克福尔摩斯。大数据应用中,前面所述的所有类型的个人信息都可以关联利用,使得这个人更加具象。所以说,大数据应用下互联网隐私问题显得更加突出。
不过,大数据与个人隐私之间的关系并非处处剑拔弩张。在讨论这个问题之前,可以先看这么几则案例:
送到机场的晚餐
当一位顾客开玩笑地通过推特向位于芝加哥的牛排连锁店Morton牛排店订餐,并要求送到纽约Newark机场(他将在一天工作之后抵达该处)时,Morton开始了自己的社交秀。首先,分析推特数据,发现该顾客是本店的常客,也是推特的常用者。根据客户以往的订单,推测出其所乘的航班,然后派出一位身着燕尾服的侍者为客户提供晚餐。
摸清赌客的脾气
现实中的赌客个个深藏不露,但在互联网上就没那么神了。Tipp24 AG针对欧洲博彩业构建的下注和预测平台,利用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的营销活动。这项举措减少了90%的预测模型构建时间。
定制化求婚
这不能算作一个案例。在百度有一个奇思妙想实验室,在足够规模的用户数据和技术积累下,输入一句简单的怎么向女友求婚,通过跨领域推荐引擎技术,便能找到一套为你量身打造的方案。甚至连道具、路线、天气,乃至如何讨得她家小狗欢心的方法都考虑得一应俱全。
大数据炒股
经典的大数据应用。华尔街有炒家利用电脑程序分析全球3.4亿微博账户的留言来判断民众情绪,再以1到50为其打分。同时根据打分的结果,来处理手中数以百万美元的股票。判断原则很简单:如果多数人表现兴奋,那就买入;如果大家的焦虑情绪上升,那就抛售。这一数据分析帮助该炒手今年第一季度获得了7%的收益率。
上述的四则案例中,前面三个均是针对个人的定制化服务,在利用大数据的过程中,必然会涉及大量的个人隐私信息,其中有哪些是用户授权的,哪些是未经授权的,这些分析系统未必能分得清楚,因此带来一系列的侵犯隐私的问题;对于第四种行为,对群体信息进行分析,笔者认为其实际上已经做到了脱敏,并不涉及隐私问题。
相比Cookie、社交、LBS的单一功能,大数据综合利用到更多的隐私信息,当然也带来更加定制化的服务。良好的用户体验恰恰又需要高度定制化的服务,因此如何平衡隐私与定制服务的关系成为难题。美国《连线》杂志创始人凯文凯利曾经说过说:如果需要个性化服务,就必须用透明度换取。最大化的个性化意味着最大化的透明化。如果不想透露任何信息,那就不能期待别人把自己当作有个性的个体。
对群体信息的分析实际上已经实现了脱敏
好坏之分:看AK47在谁的手里
每个网民、每个消费者都无法避免个人隐私被互联网记录和利用。虽然DNT(Do Not Track,禁止跟踪)技术可以阻止记录浏览行为,但通过对移动终端的定位,结合网关的上网行为分析依然能识别每一个人。大数据的特点已经讲过了,可以对所有的数据进行关联分析,从这个意义上说,大数据面前人人无所遁形。
大数据只是一个工具,好与坏要看人们怎么去用它。就像卡拉什尼科夫发明的AK47"
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31