大数据时代 你还有隐私吗_数据分析师
“我点击了自己的名字,页面上出现了一张熟悉的照片——是我穿着一件蓝色衬衫的照片,旁边配有我的基本履历资料……我点开了一个最近更新的链接,地点是波士顿的马萨诸塞大街……两秒钟后,我在视频中看到了自己推开了地铁站那厚重的大门……每次看到自己出现在视频中,我都会浑身不自在。但现在可好,我的一举一动已经被LifeLinear网的系统给记录了下来……”
以上是出自美国作家艾伯特-拉斯洛·巴拉巴西今年的新书《爆发》中的片段,其中出现的能够每时每刻记录人们行踪的“LifeLinear系统”只是作者杜撰出来,并非真实存在。但是作者同时认为,在科技发达的今天,借助大数据的平台,“LifeLinear系统”并非不能实现。这样的场景又让人毛骨悚然:如果真有这样一套系统面世,我们的隐私岂不是要暴露在光天化日之下?大数据堪称一把双刃剑。不论是企业还是个人,都会因大数据的爆发获益匪浅,但同时个人隐私也无处遁形。随之而来的问题是:这些数据应当属于谁?谁有权利利用这些数据进行分析?这种利用能否有个限度?
大数据改变世界
大数据概念相对“年轻”,但是对于很多人并不陌生。数据的爆发归功于社交网络、电子商务和物联网的快速发展。以前,人们只是将上网当做娱乐方式之一,现在,人们更多的是生活在网络平台上。这使得每18个月,数据量就会翻一番。海量数据的影响力是不可小觑的。麻省理工学院斯隆管理学院的经济学教授埃里克·布吕诺尔夫松(Erik Brynjolfsson)曾经指出,在商业、经济及其他领域中,决策行为将日益基于数据和分析而作出,而并非基于经验和直觉。“我们的决策能够开始变得更加科学化。”他这样说。
越来越多的企业希望借助数据存储、数据分析等为自身带来更多利益。最典型的一个案例就是,华尔街有炒家利用电脑程序分析当时全球3.4亿微博账户的留言来判断民众情绪,再以1到50为其打分,根据分数高低处理手中的股票。判断原则很简单:如果多数人表现兴奋,那就买入;如果大家的焦虑情绪上升,那就抛售。这一数据分析软件帮助该炒家在今年第一季度获得了7%的收益率。
当然,消费者也会享受到更方便和更具个性化的服务。网购狂人李雪(化名)每天早上打开邮件,首先映入眼帘的就是各大电子商务网站发出的订阅邮件和个性化推荐的邮件,着实方便了她在网上进行目标性极强的有选择的“扫荡式”购物。这是商家根据对用户的页面停留时间、浏览与购买商品的分类等数据的分析作出的推荐。
另外,还可以通过数据分析来为人们的提供健康保障。总部位于美国加州的医疗管理财团Kaiser Permanente,收集并分析所有的临床分析和成本数据,发现了美国默沙东公司的神经和肌肉、骨骼系统药“万络”能够引发心脏病的副作用,最终成功使其退出市场。《爆发》一书中提出,如果大数据被充分利用,在流行病的控制等方面也会发挥奇效。
谁来掌控属于你的大数据
每个人都期待获得个性化服务。但是,在大数据时代,想要获得个性化服务,就一定会在某种程度上牺牲自己的隐私。
当你在使用电子邮件、社交网络的时候,你大概也会知道你的信息正在被记录下来,你发表的言论或者分享的照片、视频等都决定着互联网运营商即将向你推荐什么样的资源和广告;当你拿着iPhone满世界跑的时候,苹果早已通过定位系统把你的全部信息收罗在自己的数据库里,利用这些信息来构建地图和交通信息等;当你在享受着视频监控带来的安全感的同时,别忘了你也是被监控的一分子,你的一举一动都会暴露在镜头下面;你用手机通话时,运营商不仅知道你打给谁,打了多久,还知道你是在哪里进行的通话。
以前,这些记录几乎不会对普通人造成影响,因为它的数量如此巨大,除非刻意寻找,人们不会注意其中的某些信息。但是,随着大数据技术的不断进步,这一状况正在发生改变。本文之前提到的悬而未决的问题随之而来,造成了很多尴尬的局面。例如,Facebook公司内部的科学家已经利用这些数据进行了大量研究并发表了超过30篇论文,但Facebook顾虑到隐私问题,并未公布原始数据,使得这些论文无法被业界承认并应用在广泛的社会学和心理学领域。同时,外界的研究者苦于没有数据,进行相关研究时远远没有Facebook得心应手。今年8月,Facebook公司表示正计划向社会学家开放有限的数据访问权限,这又会带来更多争议。此外,谷歌也和美国政府就数据利用问题产生了多次冲突。美国政府以各种理由不断要求谷歌提供用户数据并时常遭到谷歌拒绝。同时,美国政府也对街景等应用进行调查,限制谷歌收集更多数据以制衡谷歌。
微软研究院的高级研究员博伊德(Danah Boyd)曾经表示:“如今,我们社交网络化的社会绝对有制造恐慌的天分。在大数据时代,对隐私泄露的担忧就是强大的紧张和焦虑的源泉。人们普遍认为,最令人焦虑的在于你根本不知道什么时候自己的隐私就无意中被泄露出去。”她认为,这并不是我们希望建立的社会。
人们最担心的,是对这种数据的无限制利用。《爆发》一书中更指出,人的行为看似随机无序,但实际上是存在某种规律的。社交网络如此发达的今天,大数据把人的行为进行放大分析,从而能够相对准确地预测人的性格和行程。所以,不排除有这样一种可能:在忙完了一天的工作之后,你还没有决定要去哪儿,数据中心却早就先于你准确预测了接下来的目的地。
人们是否存在真正的隐私
当前,数据的数量时刻都在飞速增长。信息分享在全世界范围内越广泛,确保数据安全和保护人们隐私的任务就越难完成。现如今,人与人之间交流产生的流量远远大于文件传输产生的流量,但是,人与人之间的交流可以界定为隐私,属于比较敏感的范畴。由此看来,整个互联网都是隐私的,是不可公开的。但是,现有的互联网结构下,你的所有应用对于服务提供商,其实都是透明的。那么,人们既想要借助互联网的平台与别人交流,又想要自己的空间不被窥探,这是完全不可能的。
《爆发》一书中指出,为获得便利,人们未来会接受匿名的隐私泄露。但是,在过去的几年中,计算机专家一再表示,即使是匿名的数据也可以被重新确定,并且归属到具体的个人。例如,如果一笔超市购物记录中的零食全都和你的爱好相符、提供记录的超市正好位于你公司到家里的路上、购物时间刚好是你下班和到家之间的时间,这笔购物就很有可能与你相关,如果单子里刚好有你之前微博上表示感兴趣的商品,那就更有可能了。曾经,谷歌的一位工程师在解释“为什么不收集与人的名字相关的信息”的时候说道:“我们根本就不需要名字,名字对我们来说完全多余。谷歌记录网民搜索查询、位置和网上行为的大型数据库中就有大量信息,这足以让谷歌间接地了解一个人。” 这意味着人们隐私权的最后一道防线同样脆弱得不堪一击。
人们只能寄希望于在政府加大立法制度的同时,企业自身也设定相关规则实现自我管控。在美国北卡罗来纳州,曾经有人因为雇主看了他在Facebook上的信息而求职失败,求职者对雇主起诉并打赢官司。为此,北卡罗来纳州专门立法规定雇主不得对雇员进行网上监控。Facebook也专门设立了首席隐私官。不过,政府和企业本身就拥有最多的数据,它们会真正限制自己对数据的应用吗?这将是未来大数据时代头上的一把达摩克利斯之剑。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31