在大数据的年代,避免被惦记
前段时间,我们花了个周末出去短途旅行。在车上,LD跟我说:哎呀,忘记通知送鲜奶的,明天我们不在家,不用送奶了。你说现在大数据这么厉害,为什么不能做到智能点呢?比如手机定位发现家里人都出去了,或者用水用电监控发现家里没有人,就自动通知送牛奶的、送纯净水的,这段时间不要送了?
我答:这想法倒是好,但是万一数据被滥用呢?你不在家的消息,送牛奶的知道了是不会来,但是小偷知道了,可能正要上门呢。
她接着问:这倒是个问题。但是,技术那么厉害,你们难道不能限制信息只让送牛奶、送水的人知道,不发给别人吗?
我想了想:这个,好像真做不到。数据本身是中性的,一般没办法限定那么细的用途。而且即便只发给送牛奶、送水的人,也没法保证他们不会对外传播呀……
这答案让她无奈了:如果“知道我不在家”的人让我信不过,信息又会四散传播,看来还是不要大数据的好。
这段对话让我印象深刻,是因为它代表了当今很多普通人对“大数据”的认识。普通人一般认为,大数据很神奇,很强大,很有用,可以给我们提供很多便利。没错,通过收集、存储、分析、挖掘大量数据,我们的确享受到很多便利。
但是出于职业习惯,我会想的更多。很多时候我们只看到,“方便”是目的,运用大数据手段收集、存储、分析、挖掘数据,则是达到目的的手段。然而一旦数据被拿走,就不知道会存在什么地方,能被谁看到,继而怎么分析,是否仅仅用于当初那个“方便”的目的。
前些年流行过一阵“车载智能”设备,装在你的汽车的OBD(车载诊断)接口上,然后就可以看到自己车的详细数据,比如节气门开度、喷油量等等,进而可以晒数据,也可以准确知道自己的驾驶习惯是否优秀。看起来很神奇对不对?科技含量确实足够高。
但是你或许不知道,详细收集这些数据的目的并不只是简单改进你的驾驶习惯,还有更深层次的目的。记录了你的驾驶习惯,以及你经常走的路线,就可以判断你出事故的几率。知道了出事故的几率,就能为你“量身定制”保险的保费。车主把数据交托出去,可能就是简单直接地想到“看到我的车的运转细节”,绝不会想到“我的保费因此上涨”吧。
不要以为这种情况只针对“有车一族”,同样的逻辑早已深入生活,不少“健康体检”也是这样的玩法。通过体检了解不同人的身体情况,保险公司拿到这些数据之后,评估出每个人买保险的风险高低,作出不同决策。你以为参加免费或者低价的体检,是自己占了便宜,其实真正占便宜的没准是保险公司。
中国有句老话:不怕贼偷,就怕贼惦记。我觉得,它也挺适合描述大数据时代的处境。“贼偷”,代表的是传统生活里和贼的一次相遇,尽管损失可能会惨重,但无非是一锤子买卖,损失有限。“贼惦记”,代表的是大数据时代下,基于个人的行为数据持续对个人反复分析,且美其名曰“挖掘潜在价值”。
“挖掘潜在价值”,这个说法听起来很美妙,其实掩盖了不少东西。
重要的问题是,价值是谁的,谁能享受到这种价值?窥见你的兴趣,推一些商品让你买,你最终买了,大概是给双方创造了价值。但是,如果你本来只是打个顺丰车,却让车主给你标上“肤白貌美”、“娇美柔弱”、“非此女不娶”的标签,当然还是在挖掘你的价值,但受益的到底是谁,恐怕就不是个简单问题了。
身为技术人员,我很清楚地知道,目前我们对“大数据”的收集能力,要远远大于对其应用正当性的管理能力。比如,如今许多“大数据公司”已经可以用非常低的成本拿到普通用户的大量数据,姓名、年龄、籍贯、户口所在地、收入情况、消费习惯、信贷状况……许多时候,数据收集方甚至没有明确这些数据有什么用,但是仍然抱着“数据不怕多,收集了再说”的念头下手。
然而,有这么多数据在手,如何保管、使用,却一直没有明确、合理的规范。如果某项数据被滥用了,要追查“滥用”的来龙去脉往往异常复杂,甚至证实“滥用”本身也很难。
当然,大多数情况下,数据在收集之前都会和用户签一份协议,尽管绝大多数用户根本懒得看也看不懂(或许根本就没想让你看懂)这份云山雾罩的协议到底说了什么。在绝大多数人的潜意识里,“我授权你用我的数据”并不等于你“我授权你在当前场景下、为我们约定的明确目的,利用我的数据”,他们并不知道,数据一旦被收集,就难以避免被非法复制,难以避免被用于其它目的。
这不是危言耸听。我们身边有许多人喜欢拍胸脯说“这就是我的隐私,拿去吧,我无所谓”。其实据我观察,他们并不是真的无所谓,而是根本没有认识到,隐私被拿去可以用来干什么。一旦告诉他们,“隐私”甚至包括他们每个月收入多少钱、花多少钱、去什么地方、钱是怎么花的、和谁一起消费……
如果你仍然觉得无所谓,那么玩法可以继续升级,拿到这些私密信息就可以冒充你的密友,去获取其他人信任、展开诈骗…… 按照我的经验,绝大多数一开始“无所谓”的人,其实都是不懂,一旦讲明白这些道理,都感到心惊肉跳。相反,越是懂技术的人,越不会对此无所谓。
那么,有什么好办法约束这种情况,避免“被(恶意)惦记”吗?至少在我看来答案很悲观:没有。这些数据往往都是现成躺在公司的数据仓库里,等待着业务从各种角度的反复爬梳、挖掘。目前这类问题大多处在法律模糊地带,唯一有可能约束它们的,暂时只有公司的价值观和职业道德。
不过,价值观、职业道德这玩意儿多少钱一斤?我真不知道。你大概记得,好几次出现类似的事故,BAT中某家的员工都是同一套说辞:别跟我们谈道德,我们只是家公司,赚取利润才是公司的首要目的,懂吗?
在这种嘴脸面前,你还能指望自己的数据因为有“职业道德”约束而不被滥用?反正我是不敢。我们唯一能做的,只有“不跟你打不必要的交道,也不给你不必要的数据”。
这也是我想说的,大数据的时代已经来临,大数据时代对隐私的侵犯和滥用又没有很好的解决方案,身为普通人,我们能做的就是避免被大数据惦记,不泄露那么多数据,不让泄露的数据被串联起来,精确定位到我们——总之,避免被大数据惦记。
怎么做才能避免被大数据惦记呢?
我觉得,最重要的是“不要单纯图省事,单纯怕麻烦”。无数“居心叵测”的数据收集,都是打着“为你方便”的幌子进行的。天知道挂着“方便”牌匾的门下面暗藏着几条地道,通向什么地方。你在这里方便了,在其它地方会不会方便,会不会有风险?这些问题既然未知,就别一心想图方便。
如果认可“不要单纯图省事,单纯怕麻烦”,下面有些具体的指引,大概能给你点帮助。
1.申请专门的手机号,用于银行等要害信息。如今手机号已经越来越重要了,方便了认证,也方便其他人知道了我们的联络信息,就能顺藤摸瓜找到网银账号等等。所以,申请一个专门的手机号,专门用于银行等要害信息很有必要。如今各大运营商都推了不少含有副卡的套餐,直接申请个副卡很方便。重要的是,这个手机号尽量避免暴露,避免被其他人知道。
2. 对这个专门的手机号,配备专门的手机,使用“有良心”的系统,比如iOS或者干净的Android。现在许多Android手机都提供了“智能短信”的服务,能把收到的银行短信做好格式化,换一种更美观的表现方式。这样做,用户体验当然是更好了,用户隐私也没了。黑产之所以知道许多人的私密信息,读到“您尾号xxxx的银行卡刚刚入账工资xxxx元”是个特别好的途径。
3.为不同账号设置不同的密码。在大数据的年代,要串联多个场合定位同一个人,难度其实并不大。考虑到许多时候我们的用户名都是手机号或者邮箱,而手机号和邮箱又不可能经常变化,“知道你在甲网站账号就可以破解你在乙网站账号”的难度就低了很多。比较好的办法是,为不同的账号提供不同的密码。当然,你不必死记硬背,有个窍门是按自定规矩来生成密码。密码有一部分是固定的,还有一部分是变量,变量可以根据网站来生成。比如京东的域名是JD,看看电话的拨号键盘,J和D对应的按键分别是5和3,所以你的密码中的变量就是5和3。其它网站的密码都可以照此类推。
4.善用浏览器的隐身模式。如今许多浏览器都提供了隐身模式,其实也就是“不带任何历史信息干净模式”,这样就避免了被定位,出现“你刚在甲网站搜了某商品,乙网站马上就给你推对应购物信息”的情况。我的习惯是,每天早上新开一个隐身窗口,当天大部分浏览都在这个窗口里进行,晚上关掉。这样真正做到了“tomorrow is another day”。
5. 如果你习惯没事玩手机,不妨安排点不一样的玩法,详细检查手机里每个应用申请的权限。许多应用默认会申请完全没有必要的权限——比如地图申请通讯录和发短信的权限。但是关掉这些权限,它也可以运行。所以没事玩手机时查查权限列表,确保关掉了不必要的权限,这是个好习惯。
6. 在遇到各种App或者活动申请权限的时候,停下来换个角度想一想。不要单纯从“为了达到眼前的目的,我需要提供哪些数据”的角度来看,还要想想“一旦我提供了这些数据,你还可以用作其它什么目的”。这种思维习惯建立了,许多不怀好意的运营伎俩就会看得非常清楚。
7. 把行为拆散到不同的App和不同的生态,打散成碎片。虽然互联网公司的大数据很厉害,但不同互联网公司之间的大数据通常不是互通的,我们很难想象,微信和支付宝之间互通数据。所以如果你习惯手机支付,不妨有意识地混用微信和支付宝,不要单纯依赖一家,有些时候,用用现金也是非常好的习惯。如果你喜欢看书,没事逛逛书店买几本书,既支持了实体书店,也避免了暴露自己全部的购书记录。
8.注意保护其他人尤其是未成年人的隐私。我经常看到很多人在朋友圈晒娃,不但有小朋友的面部照片,还有生日、得奖、体检等等详细信息。这样做或许提供了一时的欢乐,但是换位思考,大概没有人愿意长大之后,被长辈甚至不认识的朋友拿出照片来,细细历数自己小时候的成长细节。再进一步说,如果“别有用心”的人或系统平时把这些信息收集起来,可以做什么更是未知数。所以,即便要在朋友圈晒娃,也一定要注意适度。
我衷心祝愿大家在大数据时代能生活得安全、开心,不要被目的不明的大数据惦记着。
数据分析咨询请扫描二维码
数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21大数据技术专业主要学习计算机科学、数学、统计学和信息技术等领域的基础理论和技能,旨在培养具备大数据处理、分析和应用能力的 ...
2024-11-21《Python数据分析极简入门》 第2节 3 Pandas数据查看 这里我们创建一个DataFrame命名为df: importnumpyasnpi ...
2024-11-21越老越吃香的行业主要集中在需要长时间经验积累和专业知识的领域。这些行业通常知识更新换代较慢,因此随着年龄的增长,从业者能 ...
2024-11-20数据导入 使用pandas库的read_csv()函数读取CSV文件或使用read_excel()函数读取Excel文件。 支持处理不同格式数据,可指定分隔 ...
2024-11-20大数据与会计专业是一门结合了大数据分析技术和会计财务理论知识的新型复合型学科,旨在培养能够适应现代会计业务新特征的高层次 ...
2024-11-20要成为一名数据分析师,需要掌握一系列硬技能和软技能。以下是成为数据分析师所需的关键技能: 统计学基础 理解基本的统计概念 ...
2024-11-20是的,Python可以用于数据分析。Python在数据分析领域非常流行,因为它拥有丰富的库和工具,能够高效地处理从数据清洗到可视化的 ...
2024-11-20在这个数据驱动的时代,数据分析师的角色变得愈发不可或缺。他们承担着帮助企业从数据中提取有价值信息的责任,而这些信息可以大 ...
2024-11-20数据分析作为现代信息时代的支柱之一,已经成为各行业不可或缺的工具。无论是在商业、科研还是日常决策中,数据分析都扮演着至关 ...
2024-11-20数字化转型已成为当今商业世界的热点话题。它不仅代表着技术的提升,还涉及企业业务流程、组织结构和文化的深层次变革。理解数字 ...
2024-11-20在现代社会的快速变迁中,选择一个具有长期增长潜力的行业显得至关重要。了解未来发展前景好的行业不仅能帮助我们进行职业选择, ...
2024-11-20统计学专业的就业方向和前景非常广泛且充满机遇。随着大数据、人工智能等技术的快速发展,统计学的重要性进一步凸显,相关人才的 ...
2024-11-20