透明化大数据时代 透视大数据的隐痛_数据分析师
导语:大数据将给零售业带来什么影响,又将如何影响企业业务?大数据会将企业置于危险境地吗?在大数据时代,数据科学家们不应该做的事情包括哪些?
除了简单的字节和比特之外,大数据如今创造出了数十亿美元的商业机会。一些企业组织,如零售商和制造商,通过对客户的邮政编码和购买记录等数据进行分析,从而发现了大数据为企业业务发展而带来的无限力量。
据麦肯锡研究所(McKinsey Global Institute)和麦肯锡咨询公司的研究部门估计,大数据将会给零售业带来60%的利润增长率。 而且,波士顿咨询公司最近发布的一项研究表明,客户的个人数据能够有效地促进企业的业务增长,同时企业又能创造出新的符合客户需求的产品。
但是,如果企业能够掌握好数据分析的度,那么大数据将会给公司带来有力的竞争优势;反之,过分地数据挖掘,可能会事与愿违,是企业陷于危险境地。随着企业不断深入地掌握数据挖掘的技巧,并对数据挖掘无休无止,那么很可能会导致他人的隐私受到侵犯,其危害性不亚于人们逾期未还贷款或者心脏病发作。
《大数据伦理学:平衡风险和创新》一书的作者Kord Davis说:“在实践中,数据分析、处理的价值就在于能够产生一些实际的、良好的效果,而不是对于过分地进行数据采集和挖掘。”
以诺德斯特姆公司(Nordstrom)为例,这家美国高档连锁百货商店曾利用Euclid科技公司提供的传感器,在顾客用智能手机连接商店Wi-Fi服务时,来获取顾客的购物信息。但是,这一行为引起了隐私保护者们的批评,如今诺德斯特姆公司已不再采用这种分析方式了。
时尚服装连锁店Urban Outfitters要求使用信用卡支付的顾客必须提供他们的邮编(实际上顾客根本不需要提供这一信息),然后Urban Outfitters利用这一信息获取顾客的通讯地址。而现在,Urban Outfitters被指侵犯了消费者权益保护法,正面临一起集体诉讼案。
Facebook一直都在极力维护自己神秘的隐私保护政策。最近,有报道称Facebook向美国国家安全局(NSA)提供用户的数据信息,Facebook也在积极回应此事件。尽管如此,Facebook仍然深陷用户数据隐私权争议的中心。
由于过分地数据挖掘,企业的行为引起了客户的不满,遭到客户的批评指责和法律诉讼。数据隐私管理解决方案供应商Truste于2013年9月发布一项调查显示,三分之一的互联网用户出于隐私考虑,已经停止使用某公司的网站,或者完全终止了与某公司的交易往来。
IT专家发现平衡好复杂的数据分析与客户权益之间的关系,对企业来说,获得的利益并不仅仅是能够避免企业的负面报道和销售额的下滑,还关系到企业的诚信问题。Davis预测说:“企业对于数据使用的透明度将成为他们在市场竞争中的一个优势。”人们也开始关心他们的数据信息能给企业带来什么样的变化,所以企业适时适度,并合理地向客户公开一些数据,反而能够得到客户的信任,使其在市场中处于更有利的地位。
然而,很多CIO和数据科学家们都在纠结一个问题,那就是怎样在尊重客户权利,并赢得他们信任的同时,企业又能够获得更多的价值。随着数据存储量的增长,以及数据管理技术的多样化,一些IT专家也在极力地采取一些创造性的方式,以防止数据滥用现象。
Retention Science就是一个典型的例子,该公司是位于美国加利福尼亚州的圣塔莫尼卡市的一家创业公司。Retention Science向其客户提供了预测分析算法和一些数据,如家庭收入、购物记录和信用等级,帮助他们来预测顾客的购买情况,并争取更多的市场份额。除了顾客提供的数据之外,Retention Science的分析数据也来源于第三方提供的合理数据。
为了尊重顾客隐私,又能达到既定目标,Retention Science制定了顾客数据使用法则,其中一条就是:Retention Science禁止其客户之间共享数据。比如Gap服装公司就是其客户之一,它向Retention Science提供的顾客数据绝不能与其他客户共享,即使是匿名的也不可以。
另外,尽管Retention Science掌握有万亿字节的秘密数据,但是为了保护顾客隐私,该公司仍然坚持让其数据科学家们签订保密协议,而这些数据科学家们大多是教授或者研究员。“这些人绝对不可以在别的地方或者在其发表的书籍和文章中,分享或使用这些数据。”Retention Science的CEOJerry Jao说。
除了要求员工对顾客数据信息负责之外,Retention Science规定在使用顾客数据时,一定要预先征得顾客的同意。Jao说:“如果那些顾客在最初提供他们的数据时,犹豫不决的话,我们就不会使用他们的数据信息。”
显然,内部规范对企业的发展是有帮助的,但是企业还可以做得更好,那就是能够让顾客亲自看到与他们相关的数据。BlueKai公司就有这样的策略,该公司是位于美国加利福尼亚州库比蒂诺的一家数据管理平台提供商,市场营销人员和出版商均利用其平台,管理并使用数据来制定目标市场战略。2008年,BlueKai建立了一个线上门户网站,在这个网站上顾客能够清楚地知道BlueKai,及其客户收集了多少条他们访问网站的cookie,这些cookie都是根据他们浏览的历史记录一条条积累下来的。
比如,一位女性要在网上购买一辆红色自行车,假如她访问了多家BlueKai客户的运动产品网站,那么在她的浏览器上就会有许多匿名的cookie。根据这些浏览记录,BlueKai的市场客户就可以在她的电脑上推出一些符合其要求的自行车广告。
近期,许多在网上购物的顾客总能看到与他们浏览记录相似的产品广告,他们才意识到这并不是巧合。但BlueKai Registry却使得这一过程变得更加透明,甚至允许访客们退出注册,或者可以通过改变他们的购物喜好来更新他们的匿名档案。
BlueKai的CEO Omar Tawakol指出其Registry的好处在于:如果顾客的数据成为一种交易对象的话,那么顾客自己就完全可以控制其数据。基于这个原因,BlueKai也鼓励其客户在他们自己的网站上公布他们所收集的顾客cookie记录,以减少顾客对数据隐私的担忧,同时提升企业工作的透明度。
Tawakol说:“我们这项工作的完美之处就在于我们不知道你是谁,我们也不想知道你是谁,我们更不想知道一切能够识别出顾客的方式。我们只是想让顾客知道,企业是可以获取他们的cookie的。”
BlueKai并不是唯一一个发放“后台通行证”的大数据管理公司,位于美国阿肯色州小岩城的营销技术公司Acxiom最近也宣布推出了AboutTheData.com网站, 人们可以免费在该网站上浏览该公司为他们收集的信息,内容详细到婚姻状况和驾驶车辆的类型。访客们只需简单键入关键的个人信息,如姓名、生日等,就可以发现他们的哪些数据被广告商利用并谋取利益。
Acxiom公司的解决方案有助于简化数据分析和管理,并推动企业的营销计划,对此BlueKai的Tawakol并没有感到惊讶。他认为,企业现在别无选择,只有改变顾客数据隐私的观念。他说:“几年前,消费者无法控制其在数据公司的个人数据信息,今非昔比,消费者应该对自己的数据有一定的控制力。”
Davis表示,企业越来越关注他们的数据应用实践,并进一步明确、改进实践的方法,这样做能使企业避免官司纠缠和一些负面宣传。而且,让消费者了解企业他们的数据使用情况的做法更像是企业的一种公关手段,而不仅仅是信息公开。Davis说:“我现在唯一不知道的是哪些企业在购买这些消费者的数据信息,以及他们将利用这些数据做什么。”
然而,有时候企业的透明度越大却并不意味着企业能够获得更多的理解。一些行业巨头,如Facebook和谷歌,它们有关隐私的保护协议却因词义难懂、行文冗长而遭到批评。其隐私保护协议足足有70多页,长度相当于一篇中篇小说,且文中多用一些模糊的术语,让人根本读不懂协议中到底在说些什么。其中的一些条文,甚至还引起了联邦贸易委员会(Federal Trade Commission)的调查。
品牌战略公司Siegel+Gale于2012年4月发布的一项调查显示,用户并不理解Facebook和谷歌是怎样查找、储存并共享他们的数据的。Siegel+Gale让受访者们阅读这两家公司的隐私保护协议,并分别给它们的隐私保护协议打分,80分就代表他们能够完全理解条例中的内容。然而,Facebook才得了39分,谷歌只得了36分,也就是说用户们不能完全理解它们的隐私保护协议。
“人们有时候根本不了解他们同意签署的隐私保护协议。”Davis说:“因为企业把这些协议制定地过于复杂,除此之外,阅读这些服务协议时也会花费人们很长时间,一年中,人们约有76天用于阅读各种服务协议上。”
尽管如此,隐私保护协议仍然在大数据应用中存在价值。全球信息技术和商务咨询服务提供商Infosys的客户经理Nans Sivaram表示,企业要做的不仅仅是规划出协议的条条框框,还要与一些有价值的客户进行沟通,帮助他们理解协议中的内容。
在最近Infosys发布的一项全球调查显示,39%的受访者认为数据挖掘侵犯了他们的隐私,72%的人认为他们收到的线上广告和邮件并不符合他们的兴趣和需要。但是,Sivaram说:“假如结果对他们有利的话,顾客倒是愿意提供他们的数据信息。”
调查结果显示了顾客的这种矛盾的心理:一方面,他们希望获得他们所期待的高性价比的产品和服务;另一方面,他们又不希望看到他们的个人数据信息用于商业用途。
“零售商如果想要抓住自己的顾客,那么就要在利用顾客数据时多加谨慎。”Sivaram说:“同时,要避免侵犯顾客隐私的事情发生,以免惹上不必要的麻烦、失去顾客的信任。”
那么,这些企业到底该怎样做呢?Sivaram认为,企业在收集数据时,应该给顾客一个更好的理由,让顾客心甘情愿地分享他们的数据。例如,可以告诉他们,他们的数据信息能够换来客户忠诚积分,并享受折扣。这样的话,企业在赢得客户信任并占据有利竞争地位的同时,也能为其客户提供更多更好的服务。
然而,要解决这一问题并不能仅仅依赖顾客主动分享他们的数据、解密令人困惑难解的隐私保护协议或者以信用等级换取商店优惠券来诱惑顾客。Michael Walker认为大数据专家在使用和分析数据时,应该遵守一定的行为准则,Michael Walker是位于美国丹佛的系统集成商和信息技术服务商——Rose Business Technologies的管理合伙人。他已经起草了一份12页的有关数据分析和使用的行为准则,用来规范数据科学家的行为,该行为准则囊括了数据科学家的角色和职责在内的所有内容。
“企业也开始明白了数据信息二次使用和个人数据滥用的危害。”Walker说:“一旦企业开始有这样的想法,那么他们会非常希望有一个行为准则来规范他们,以免造成不必要的麻烦。”
Michael Walker表示,数据科学家应该向医生或者律师一样,利用一些道德行为准则严格约束自己的行为。为此,他为这些数据管理和分析的人制定了一系列准则和规范,以规范这些数据科学家们的品行,保护顾客的隐私。
Walker认为数据科学家们不应该做的事情:
1. 在数据分析时,不采用科学的分析方法;
2. 以不合理且难以理解的方式,为客户做证明资料的质量评级;
3. 断言那些坏的、不明确的证明资料为典型的数据证明资料;
4. 错误地将不典型、不明确的证明资料应用于模拟现实中或做出误导;
5. 以不合理且难以理解的方式,为客户做数据的质量评级;
6. 断言那些坏的、不明确的数据为明确的数据;
7. 错误地将坏的、不明确的数据应用于模拟现实中或做出误导;
8. 没有选择一个正确的方式公开部分或全部数据科学分析结果;
9. 没有试图复制数据科学分析结果;
10. 没有公开那些不能被复制的数据科学分析结果;
11. 错误的将数据科学分析结果应用于模拟现实中或做出误导;
12. 没有公开失败的实验或那些被证明不成立的数据论证,而这可能会对客户不利;
13. 明智是错误的结果却仍然提供这样的结果。
如果数据科学家对数据和证明资料的质量存在质疑,那么他需要告知客户这一问题。如果数据科学家已经提供了数据分析的证明,后来才得知数据有误的话,那么他需要采取补救措施,包括告知客户。数据科学家应该公开或标注他认为有误的数据证明。
统计软件供应商Revolution Analytics于2013年8月发布调查显示,80%的受访者表示他们赞成在数据收集和使用中要有相关道德行为的约束。一半以上的数据科学家表示,道德行为准则在他们的研究工作中占据着重要地位。
“我的解决方法就是,要制定一些能够规范数据专家们的行为准则,而且这些专家们也愿意遵守这些准则,以保护客户的私人数据。”Walker说。有了数据分析行业的行为准则,那些数据分析家们都会从道德和法律的角度出发,拒绝有损客户隐私权利的数据分析和使用行为。
Walker并不是第一个构想这些行为准则的人。今年年初,运筹学和管理学研究协会(INFORMS)在发布其“CAP认证(Certified Analytics Professional)”时,就起草了数据分析和使用的行为准则。
但是,Davis说:“问题在于,你需要清楚地了解你利用这些数据要做些什么,并且明白这些是否与你自己公司的价值观相符。”然而,企业要实现什么样的价值,以及企业的数据实践活动是否体现了这些价值,这些都是与普通的商业活动完全不同的话题。
一些IT专家们认为,数据科学家要做的不仅仅是保护个人隐私。“他们还需要从数据中提炼出一些精华,总结出一些有意思的观点。” WatchDox 的首席产品官Ryan Kalember说。WatchDox位于美国加利福尼亚州帕洛阿托,是一家安全工具提供商。
不管隐私涉及到谁——顾客、企业高管还是数据科学家,有一点是确定的,那就是数据隐私已经成为一个热点话题。甚至是美国政府,也在调查那些收集和管理客户数据的企业,并要求他们为客户提供合适的方式让客户自己能够控制自己的个人数据。行业观察家们也很支持政府的这种做法。
美国国安局“棱镜门事件”的曝光,大大降低了公众对于政府的信任,并对政府保护个人隐私持怀疑态度。Tawakol表示,人们这种对于个人数据隐私观念的转变,很可能会促使美国政府启动数据收集改革方案的调查工作。
“相关市场机制的出现要比相关法律法规的出现快得多。”Tawakol说:“随着你数据被使用的次数越来越多,你会更加清楚地了解你能得到哪些情报。而那些坚持不公开数据使用情况的企业,最终会落后于市场的步伐。”
Walker分享了他对未来的憧憬,他说:“数据分析会带来更多好处,也能帮助企业为顾客量身定制他们喜欢的产品和服务,但这是基于企业充分尊重客户个人数据隐私的前提。”他补充道,如果客户发现企业暗中监视他们,或者采用不正当的手段窃取并使用他们的数据的话,企业最终将会失去他们的客户。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 2 Pandas数据类型 Pandas 有两种自己独有的基本数据结构。需要注意的是,它固然有着两种数据 ...
2024-11-01《Python数据分析极简入门》 第2节 1 Pandas简介 说好开始学Python,怎么到了Pandas? 前面说过,既然定义为极简入门,我们只抓 ...
2024-10-31在当今数据驱动的世界中,数据科学与工程专业的重要性愈发凸显。无论是推动技术进步,还是在商业决策中提供精准分析,这一专业都 ...
2024-10-30在当今信息爆炸的时代,数据已成为企业决策和战略制定的核心资源。爬虫工程师因此成为数据获取和挖掘的关键角色。本文将详细介绍 ...
2024-10-30在当今数据驱动的世界中,数据分析是揭示商业洞察和推动决策的核心力量。选择合适的数据分析工具对于数据专业人士而言至关重要。 ...
2024-10-30能源企业在全球经济和环境保护双重压力下,正面临前所未有的挑战与机遇。数字化转型作为应对这些挑战的关键手段,正在深刻变革传 ...
2024-10-30近年来,随着数据科学的逐步发展,Python语言的使用率也越来越高,不仅可以做数据处理,网页开发,更是数据科学、机器学习、深度 ...
2024-10-30大数据分析师证书 针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。 ...
2024-10-30《Python数据分析极简入门》 附:Anaconda安装教程 注:分Windows系统下安装和MacOS系统安装 1. Windows系统下安装 第一步清华大 ...
2024-10-29拥抱数据分析的世界 - 成为一名数据分析工程师是一个充满挑战和机遇的职业选择。要成功地进入这个领域,你需要掌握一系列关键技 ...
2024-10-28降本增效:管理战略的关键 企业管理中的降本增效不仅是一项重要的战略举措,更是激发竞争力、提高盈利能力的关键。这一理念在当 ...
2024-10-28企业数字化是指利用数字技术和信息化手段,对企业的各个方面进行改造和优化,以提升生产效率、服务质量和市场竞争力的过程。实现 ...
2024-10-28数据科学专业毕业后,毕业生可以选择从事多种不同的岗位和领域。数据科学是一个快速发展且广泛应用的领域,毕业生在企业、学术界 ...
2024-10-28学习数据科学与大数据技术是当今职业发展中至关重要的一环。从基础到高级,以下是一些建议的课程路径: 基础课程: Python编程 ...
2024-10-28在信息技术和数据科学领域,数据架构师扮演着至关重要的角色。他们负责设计和管理企业中复杂的数据基础设施,以支持数据驱动的决 ...
2024-10-28进入21世纪以来,随着信息技术的迅猛发展,大数据已经成为全球最具影响力的技术之一,并成为企业数字化转型的核心驱动力。大数据 ...
2024-10-28随着科技的迅猛发展,数字化转型已成为现代企业保持竞争力和推动增长的关键战略之一。数字化不仅仅是技术的应用,它代表着一种全 ...
2024-10-28银行业正处于一个前所未有的数字化转型时期。在数字经济的驱动下,金融科技如大数据、人工智能、生物识别、物联网和云计算等技术 ...
2024-10-28数据分析可视化是一门艺术与科学相结合的技术,其主要目标是将复杂的数据变得更易于理解和分析。通过将数据以图表的形式呈现,我 ...
2024-10-28数据分析师在现代信息密集型的商业世界中扮演着至关重要的角色。他们通过专业的技能和敏锐的商业洞察力,帮助企业从大量数据中提 ...
2024-10-28