别轻易点赞 大数据痕迹会暴露你的隐私
没有人可以离开社交媒体(微信、微博、脸书等),朋友圈是维系外界最重要的通道之一,大多数人都是社交媒体的重度使用者。但是,有没有想过,我们在社交媒体上的一些无意识的行为(例如点赞、收藏、上传头像、状态更新、转帖等),其实很深层次的在暴露内心的一些秘密和隐私。
整理了一些社交媒体数据挖掘的结果,你会发现,大数据、行为痕迹和社交媒体的结合,展现了无限的机会和可能。例如,基于脸书的挖掘,可以探知你的智商、神经质、生活满意度、宗教信仰、单身与否、身材发福、产后郁郁、话题偏好和舆情监测等。
一、别轻易点赞——它会泄露你的性格秘密
最近看到一篇文章,很有意思。
美国科学院院报(PNAS)最近的一篇研究表明,在社交网站上别轻易点赞,因为点赞能够泄露你一些比较私密的性格特质。基于社交网站上(例如Facebook)的点赞,可以计算出你的性格特征(大五人格The Big Five),通过算法计算的结果比你的朋友、同学、亲人判断的更准。
研究过程。具体的做法就是,作者邀请脸书上8.6万志愿者参与一项性格测试,并且收集了他们的“点赞”数据(即对什么帖子或内容发生点赞行为)。并且邀请了被试的亲朋好友参与测试,给出有关该被试性格的评价。这样就有关于被试的三份性格数据,一份是自我的评价,一份是亲朋好友的评价,一份是基于点赞数据计算的结果。研究结果表明,算法得到的性格倾向指数比亲朋好的判断更为准确。
点赞和特质。点赞的时候,我们希望向脸书好友展示我们对特定内容(包括状态更新、照片、书籍、产品、音乐)的积极态度。但是,与此同时,“点赞”行为也暴露了你很多的私密信息、敏感特质、性格偏好和行为倾向等。例如宗教信仰、政治观点、性取向和酒量等。而且,通常一个点赞(例如点赞了某一篇分享)就能够产生较为精准的预测。一些结论举例如下。
具体的,大概只需要10个“赞”,计算机就能比同事更准确的判断你的性格。通过70个“赞”,电脑就能超过其朋友。140个“赞”便超过其家人(父母亲兄妹)。300个“赞”则能“击败”你的伴侣。
二、与社交媒体有关的其他一些好玩的案例和应用
(一)你还单身吗
状态更新和单身判断。发现颜高妹子的时候,小伙伴们冒出的第一个念头,她是不是单身哈。告诉你一个福音,脸书帮你解决这个问题了。
脸书通过上百万的状态更新的数据,基于更新内容进行文本分析,识别一些特征变量,从而判断和预测用户何时从单身状态变成恋爱中状态。进一步地,脸书联合企业将研究结论进行商业应用,即向个人页面首页投放相关的产品广告。例如,向恋爱中的用户提供产品(买一赠一、情侣折扣等),或者向失恋的用户提供产品(纸巾、Ben&Jerry的冰激凌等)。
(二)内容收藏和性格判断
朋友圈,你常常会收藏一些内容和文档。其实,通过你的收藏,也是可以判断你高度敏感的个人特征的。例如性取向、生活满意度、智力、情感稳定性、宗教信仰、过度饮酒习惯、年龄、性别、种族、政治观点等。
(三)社交媒体中的好友推荐
脸书上每个人都需要上传自己的头像。基于用户的头像,脸书可以做什么事情呢?人脸识别技术。
人脸识别是指,基于面部特征,分析五官的相对位置、尺寸、形状等,保存最为突出的特点,将图像数据转化为矩阵数据,以便面部识别。
对用户的头像进行人脸识别后,脸书会检索整个互联网,看看这些照片还在哪里出现过,看看是否出现在别人的合影中,猜测你可能会认识哪些人,从而向你推荐一些二度三度的朋友。
另外一方面,脸书也会将照片与公司网站、在线相亲网站进行匹配,或者从最新发表的博客或文章中寻找有关你的更多的信息。从而了解你的职业、兴趣、偏好和行为倾向等。
(四)这个陌生人是谁
谷歌眼镜和社交媒体。之前看过一个视频,描绘的就是一个小伙伴带上谷歌眼镜后,遇到一个陌生人,迅速通过谷歌眼镜找到很多有关这个陌生人的信息。想在想一想,这也是可以实现的。
谷歌眼镜需求和脸书的合作。谷歌自己开发了一套Nametag技术。基于该技术,当遇到陌生人时,谷歌眼镜通过拍照,把人脸上传,丢到脸书上进行人脸识别。从而匹配到该陌生人的职业、年龄、生日、动态、朋友圈、日志、状态和最近的兴趣等。
(五)谁是最适合的候选人
现在有些公司,借助社交媒体内容,进行潜在员工的筛选。招聘方通过个人资料,例如脸书,抓取脸书上的个人信息,基于信息和网络环境中个体表现出来的特质,判断和预测个体的智力水平和情绪稳定性。从而作为员工录用的一个参考的标准。
(六)好久不见,瘦了吗
头像变化分析。在脸书上,每个人的头像都不会一成不变的,间隔一段时间,大家就会采用新的头像或自拍照。你在进行头像更新时,脸书就在思考另外一件事,即他们通过人脸识别技术,判断前后头像是否存在差别,即你是否变胖了。
如果图像分析的结果表明,你确实发福了,恰好你的性别又是女性的话,脸书很可能就会联合一些减肥、健身、保健公司,向你的个人页面,精准的推送一些折扣券。
(七)产后抑郁症
越来越多的公司关心员工的福祉,关心员工的生活状态,并且及时的进行涉入和干预,以便你快乐工作和快乐生活。
一家公司就通过分析女性员工社交媒体上的发帖和话题(例如微博、脸书、Twitter)来判断她们是否存在陷入产后抑郁症的风险。通过抓取女性员工在生产前后几周在社交媒体上的话题和发言,摘取其所使用的动词。
分析结果表明,有抑郁症倾向的母亲常常会使用暗示“焦虑”和“不高兴”的话。发言中一般会包含一些贬义词,例如“失望”、“痛苦”、“讨厌”等,暗示着失望情绪的疯长。
(八)社交媒体和救灾路线图
2013年台风席卷菲律宾时,通过社交媒体脸书上PO的照片数据,人们绘制一幅救灾线路图。
发生灾难时,人们常常会将自己亲身经历的照片、文本、视频发布到社交媒体上。研究者们对人们上传的照片进行分析和挖掘。对于一张受灾照片,“损害程度如何?通过点击按钮确定,无、中度、严重”。对于Facebook或Twitter文本信息,判断文本的类型即“寻求帮助”、“基础设施损坏”、“人口流失”、“相关但属于其他”等分类。
然后通过确认数据来自菲律宾的哪个地方,通过照片或文本发送时携带的GPS传感信息来定位,从而绘制一个受灾地图。
通过这个救灾地图,就可以得知,谁需要什么、谁需要食物、尸体在哪里、哪里有流离失所的人、哪里受到的灾难较为严重、什么医院损伤最小。从而为救灾提供了最一手、最新鲜的信息。
(九)舆情和话题监测
很多公司目前都跟在踪和监测社交媒体上与品牌相关的词汇(产品、品牌、竞争者、品牌代言人、政策趋势等),并进行情感和话题分析,了解人们在网络上如何讨论公司及其产品。
社交媒体也是一个早期的预警系统。当消费者对产品或服务不太满意时,他们会在社交媒体上吐槽,企业迅速捕捉此类信息,并且进行产品服务改良,控制负面消息的扩散和传播。
三、数字痕迹和智能生活
“大数据”无处无在,“智能”非常性感。当“大数据”和“智能”勾兑和发酵,一切就变得无限可能。
通过社交媒体的这些案例,想要表达什么呢?大概几点。
第一,不管你有没有意识,你的很多行为都会留下数字痕迹。文本(微博)、视频(优酷土豆等)、音频(客服电话)、图片(朋友圈)、传感器数据(手环、手机内置的传感器)等。
第二,别否认,机器和算法有时候更懂你。
第三,算法是理性的,智能是性感的。并且,算法和智能是相伴而生的。
第四,延伸来说,基于数据挖掘,计算机是能够推断出你我的心理特质的。更进一步,如果计算机能根据个人性格特质做出匹配性的响应,那么它就真的成为具有情感和社交能力的智能产物了。
不知道大家是否看过电影《她Her》、《机械姬Ex Machina》(注:年度科幻电影排名前五),《她》里面基于人工智能虚拟的Dream Girl,绝对是你完美的伴侣。
第五,最后一点也是最为重要的一点,好歹我也辛辛苦苦梳理了这么多的资料,看完记得点赞哈。
数据分析咨询请扫描二维码
数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21大数据技术专业主要学习计算机科学、数学、统计学和信息技术等领域的基础理论和技能,旨在培养具备大数据处理、分析和应用能力的 ...
2024-11-21《Python数据分析极简入门》 第2节 3 Pandas数据查看 这里我们创建一个DataFrame命名为df: importnumpyasnpi ...
2024-11-21越老越吃香的行业主要集中在需要长时间经验积累和专业知识的领域。这些行业通常知识更新换代较慢,因此随着年龄的增长,从业者能 ...
2024-11-20数据导入 使用pandas库的read_csv()函数读取CSV文件或使用read_excel()函数读取Excel文件。 支持处理不同格式数据,可指定分隔 ...
2024-11-20大数据与会计专业是一门结合了大数据分析技术和会计财务理论知识的新型复合型学科,旨在培养能够适应现代会计业务新特征的高层次 ...
2024-11-20要成为一名数据分析师,需要掌握一系列硬技能和软技能。以下是成为数据分析师所需的关键技能: 统计学基础 理解基本的统计概念 ...
2024-11-20是的,Python可以用于数据分析。Python在数据分析领域非常流行,因为它拥有丰富的库和工具,能够高效地处理从数据清洗到可视化的 ...
2024-11-20在这个数据驱动的时代,数据分析师的角色变得愈发不可或缺。他们承担着帮助企业从数据中提取有价值信息的责任,而这些信息可以大 ...
2024-11-20数据分析作为现代信息时代的支柱之一,已经成为各行业不可或缺的工具。无论是在商业、科研还是日常决策中,数据分析都扮演着至关 ...
2024-11-20数字化转型已成为当今商业世界的热点话题。它不仅代表着技术的提升,还涉及企业业务流程、组织结构和文化的深层次变革。理解数字 ...
2024-11-20在现代社会的快速变迁中,选择一个具有长期增长潜力的行业显得至关重要。了解未来发展前景好的行业不仅能帮助我们进行职业选择, ...
2024-11-20统计学专业的就业方向和前景非常广泛且充满机遇。随着大数据、人工智能等技术的快速发展,统计学的重要性进一步凸显,相关人才的 ...
2024-11-20