“数据引导你的行为”:大数据背后的权力与不公
国内有网友发现,同样的商品或服务,老客户看到的价格反而比新客户要贵出许多,在机票、酒店、电影、电商、出行等多个价格有波动的平台都存在类似情况。这在互联网行业被称作“大数据杀熟”。另外,李彦宏在中国高层发展论坛上就个人信息利用问题发表的观点——“我想中国人可以更加开放,对隐私问题没有那么敏感。如果他们愿意用隐私交换便捷性,很多情况下他们是愿意的,那我们就可以用数据做一些事情。”此言一出,李彦宏成为众矢之的。
国外,Facebook也遭遇了数据泄露丑闻。根据一名剑桥分析公司员工的爆料,该公司在用户不知情的情况下,秘密分析了大约5000万脸书用户的个人资料,以此制定个人化的政治宣传,预测并影响选民投票,帮助美国总统特朗普赢得2016年的大选。
Facebook很快遭到了市场的惩罚,股价蹭蹭往下掉,市值蒸发500多亿美元。这一丑闻愈演愈烈,国外发起了#delete Facebook(删除Facebook)运动,埃隆·马斯克站出来当起了表率,注销了自己两家公司SpaceX和Tesla在Facebook的官方主页,越来越多的网友参与其中。并且,因为影响选举,数据泄露还上升为政治事件,引起了英美等国政要的“强烈不安”。
很长一段时间以来,我们享受到了大数据时代带来的种种便利,而忽视个人信息被攫取和利用的巨大风险。我们本以为逃匿在网络空间是为了“隐身”,可在互联网企业眼里,我们其实是在“裸奔”。人们关于个人信息安全的保护意识,开始苏醒。
数据引导你的作为
此次涉及非法收集用户信息的数据公司“剑桥分析”由共和党大金主、对冲基金亿万富豪罗伯特·默瑟投资,美国总统特朗普前首席战略顾问班农担任董事,与特朗普有着千丝万缕关系。
在纽约的一次公开演讲中,剑桥分析的CEO 亚历山大·尼克斯曾分享过这个公司的运作“秘密”:他们会对成千上万名调查者进行心理分析,并将他们分为32种不同的人格,然后融入选民的Facebook足迹、消费足迹和投票记录等,最终分析并影响他们的投票行为。也就是说,根据数据对每一个用户画像的捕捉,它就可以比用户的朋友更了解他。
在剑桥分析网站的首页,一行大字醒目而跳脱,Data drives all that we do(数据引导你的作为);而剑桥分析政治服务部门的广告语是:“我们定位你的选民,打动他们让他们采取行动。”在官网上,剑桥分析列出了自己的光荣业绩:“为五大洲超过100场竞选提供支持;仅在美国,我们就为赢得总统选举、国会选举和各州选举发挥了关键作用。”
数据在引导你的作为——表面上看这有些危言耸听,但当你足够多的数据被收集合并归纳之后,数据的确可以做到。
数据是社交媒体的生命线。为了提供准确的定制化、个人化信息服务,让资讯的推送与用户的偏好吻合,都需要对用户进行画像。而画像的基础数据,就是个人的身份信息、浏览习惯等。一旦你在互联网上有任何行为,比如进入某个APP,购买某样东西,阅读某篇文章,其实都在被记录、被分析。你的一切信息都会成为别人的数据库,被用来给你画像。
过去,这一切被统称为大数据,一直以来,舆论对大数据时代多持一种乐观态度。的确,数据潜藏着丰富的价值,比如大数据分析是更好的决策工具,很大程度便利了我们的生活……但对于数据对个体行为的引导,则缺乏足够的重视和警觉。
国际网络安全专家施奈尔(Bruce Schneier)在《隐形帝国》一书里写道:“脸书(facebook)只是根据按赞的动作,就可以推测一个人的种族、个性、性向、政治意识形态、感情状态和药物使用情形……”
谷歌公司研究员François Chollet在泄露事件后发表了一系列推文,警告说Facebook的问题不仅仅是隐私泄露或缺乏信任,而是由AI驱动的Facebook很快就会成为“极权主义的圆形监狱”。他在抨击Facebook的文章中写道:“不透明的社交媒体算法正在越来越多地决定我们阅读哪些文章,我们与谁保持联系,我们阅读谁的观点,获得谁的反馈。经过多年的训练,算法对我们所消费信息的处理使得这些系统在我们的生活中掌握了相当大的权力,决定了我们成为什么样的人。”
凯文·凯利认为,技术狂热是我们的一种自然状态,我们喜爱我们的东西,并且由它们引导。互联网公司先是大量收集你的数据,巨细无遗地捕捉、收集进云端数据库,对你进行数据画像,再根据你的画像不断向你投递个性化的信息流和广告,你习惯了这种信息接收方式,成为被种种信息喂养的你——技术瓦解了“自我的真实”。久而久之,互联网公司推送的信息就能够影响你的决策,“数据引导你的作为”成为一种现实。
无处不在的信息泄露
剑桥分析是如何攫取个人信息的?
2013年,当时在剑桥大学工作的研究者科根做了个性格测试软件,除了受访者本人之外,该应用还能收集受访者Facebook好友的数据资料。一共有约32万名美国选民参与了此次测试,但加上每人的Facebook好友,科根一共收集到了超过5000万Facebook用户的数据。后来,这些收集时号称被用作学术研究的信息,被转手给了剑桥分析。
Facebook的核心问题在于,它轻易地将用户数据分享给第三方。科根此前被允许收集Facebook用户信息,但仅限于学术目的,但它顺走了其他4000多万用户的信息,未得到用户许可,且在未经允许下将个人数据卖给另外的第三方,这才是最令人愤怒之处。
但环球同此凉热,未经允许被窃取信息并被利用的现象,在国内也非常普遍。支付宝在“年度账单”的首页让不少用户默认勾选了“我同意《芝麻服务协议》”以套取用户数据,他们的信息将“被同意”分享给第三方。腾讯方面,不少人质疑微信偷看用户聊天记录。今日头条被质疑利用手机麦克风获取用户数据隐私。“手机百度”、“百度浏览器”两款手机APP涉嫌在消费者安装前,在未告知用户、未取得用户同意的情况下,获取“监听电话、定位、读取短彩信、读取联系人、修改系统设置”等各种权限……
不少评论者建议,互联网企业应当自觉与用户建立隐私保护的契约,以文字证据提供权益保障。然而认真阅读超长的隐私政策的人寥寥可数,即便认真读了,用户也未必能发现其中暗藏的玄机;即便发现了其中的玄机,用户也没有什么说“不”的底气和权力。目前很多情况下,各种APP对个人信息的获取和使用有不对等的霸权,个人如果不通过授权,很多最重要的功能就无法使用。
就比如很多人已经习惯了使用支付宝和微信,习惯了“无现金”的生活状态;很多人也习惯了将微博和微信作为获取信息和人际交流的工具;很多人习惯了在淘宝、京东网购……但这些APP得以使用的前提,无一例外是你在注册之后必须同意它们设定的种种条款,即便这些其中有不少不平等、不合理,可能造成个人信息被泄露和滥用的条目,一旦你点击“不同意”,就意味着你无法使用这些工具。基于社交需要和生活便利需要,你很难对这些APP说“不”,不得不“让渡”出个人信息——即便你明明知道它正处在风险之中。
总之,那些让人们感到便捷舒适的服务,多半都以公众出让隐私为前提的。
避免“数据极权”
中国互联网企业的发展走在世界前列,其中一个很大的原因就是,我们对个人信息的保护持比较开放态度或者说保护力度较弱,互联网企业获取个人信息的成本很低。这可能是弯道超车必须承担的风险成本。但有风险,更凸显对风险管控的重要性,而非放任风险的存在,并最终像Facebook这样,被指“操控大众心理”,直接威胁美国的民主根基。
应该看到,数据并非是数据那么简单,数据还是一种权力。英国哲学家杰里米·边沁提出的全景监狱设想,在福柯这里衍生出了一种全新的权力运作方式。福柯曾说:“完美的规训机构应能使一切都一目了然。中心点应该既是照亮一切的光源,又是一切需要被了解的事情的汇聚点,应该是一只洞察一切的眼睛,又是一个所有的目光都转向这里的中心……这里发号施令,记录各种活动,察觉和裁决一切过错。而做到这一切仅仅需要一种精密的几何学的直接帮助。”而今,我们在网络上的行为受到了互联网公司全天候的监视,“全景敞视”成为一种现实。任何人在互联网上的踪迹和信息,都被数据公司所观看,并且这种观看无时不刻在进行。一方面你的确具备了使用互联网的权利,但另一方面你也赋予互联网公司掌控你的信息的权力,你的隐私权、自主权等轻易被剥夺。
罗素在《权力论》中指出:“我相信,机械权力必然产生一种新思想,这使得控制政府比以往任何时代都更为重要。由于技术的发展,民主或许会变得更为困难,但它也会变得更为重要。那拥有巨大的机械指挥权的人,如果得不到控制,也许会觉得自己是神——不是基督徒的爱神,而是异教的雷神会火神。”也即,数据权力不仅造成个人信息被滥用成为常态,并且,数据权力还可能变成一种“数据极权”,通过监视数据,进而监视思想、控制思想,轻而易举地“形塑人们对政治角色的体认、挑战既有的政治认同、解构大众的政治心理”。
因此,解决问题的关键在于,应该将互联网公司的数据权力关在笼子里,避免数据被滥用。一方面要打破全景敞视,赋予用户知情权。不仅应让用户知晓,哪些数据被监测,哪些数据被利用,被利用在什么地方;还应让用户知晓具体的分析算法是什么,以及该算法如何具体使用其数据。并且,应赋予用户信息使用事先的同意权,以及事后的撤回权、删除权。
除此之外,还应迅速构建起对搜集个人信息的行为的限制与监管体系。应该从法律的高度上保护数据隐私,打破互联网公司与用户之间不对等的权力关系,对涉及数据的采集及其目的使用进行必要的限制,同样需要对数据的使用过程有清晰、明确的边界和能够被严格理解的基本要求。
我们已经进入了一个大数据时代,它具有不可逆转的趋势,并让我们的社会生活实现了里程碑式的跨越;但也应该看到,人们在享受大数据提供的种种便利的同时,某些失控的行为正在发生。我们对此应有足够的重视和警惕——毕竟一旦科技用以作恶,后果比什么都可怕。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31