大数据带给企业的风险_数据分析师
“大数据”。这是最新的IT流行语,而原因也不难理解。更快、更深入地解析更多信息的能力,使企业、政府、研究机构等能够以一种以前只能想象的方式去理解这个世界。
这些都是事实。不过呢……
还有一种情况同样也是事实:在争先恐后拥抱大数据的各种可能性之际,我们或许忽略了大数据带来的挑战,比如企业怎样解读信息,怎样管理数据带来的政治问题,以及怎样寻找必需的人才来理解新信息的洪流。
也就是说,大数据为数据分析的游戏增添了更大额的赌注。侵犯隐私的可能性增加,在快速变幻的市场中的财务敞口加大,把噪音当真知灼见的可能性增加,把大量金钱和时间用于界定不清晰的问题或机会的风险加大。
如果不明白、不化解这些挑战,我们就会面临这类风险:将本来有望强化组织的一切数据变成一种牵扯精力的东西,一种幻象,或者是一场伤筋动骨的权力争夺。
请允许我更具体地说说这些挑战。
找到有能力使用Hive、Pig、Cassandra、MongoDB或Hadoop等数据分析工具的人才只是整个洋葱的第一层。没有几家公司的内部专家能够从业务角度证明花钱聘请大数据专家的价值,更不用说对求职者的优劣展开评估。很多管理人员也缺乏基本的数学能力,所以如何找到能够掌握更复杂统计机制的决策者,也有可能是一种挑战。
让事情更加复杂的是,大数据工具还没有做好大范围推广的准备:它们仍在快速演化,大多数高校都没有教,供应商的支持不够理想,对用户灵活性的要求也高于更成熟的工具。考虑到这种情况,寻找合适人才的重要性只增不减。
洋葱的另一层:要让大数据发挥作用,程序员和分析师还要了解所涉行业的基本情况。比如说,一家制药企业的数据分析师注意到,近乎实时的销售终端数据显示1月份阿司匹林销量大增,于是他们说,流感愈演愈烈。但在调动销售资源开展大规模广告活动并增加产量之前,不妨把当前的销售型态与过去几年的情况做个比较。阿司匹林销量增加也可能是很多人在参加新年前夜的聚会之后出现了宿醉反应。如果分析师不了解业务以及应该问的问题,那么公司就有可能在花了很多钱之后一次次地走进死胡同。
最后一层是IT安全。如果说很多公司真的没有能力使用大数据工具,那么它们肯定也没有能力保障数据安全。收集到的信息越多,可能遭到泄露或窃取的信息也就越多。
人们常常认为掌握信息就会在组织内部掌握权力。显然,不管是谁来决定大数据时代该衡量哪些东西,这个决定者都会积累越来越大的权力。
另外,跨越组织边界的信息分享是大数据的属性之一,它可以颠覆传统的权力关系。
以一家在加拿大和美国各有一座工厂的公司为例。来自传感器的数据流显示加拿大工厂出产的发动机拥有97%的可靠性,美国工厂发动性的可靠性只有80%。突然之间,加拿大工厂管理人员在组织内部的地位可能就会升高,让美国工厂的管理人员感到惊慌。
公司的效益可能会得到改善,但高管必须做好管理内部政治的准备。
再举一个例子。大数据使人有机会衡量先前无法衡量的东西。如果一家大型零售企业现在可以更快速、更方便地衡量消费者对不同营销活动(不管是“超级碗”广告、杂志优惠券还是报纸广告)的反应,不同的利益相关者在组织内部的相对地位可能就会发生变化。他们也有可能对社交媒体团队产生憎恨,因为后者会用点击率数据来证明他们有能力或没有能力拉动销售收入。
原先要用几个月时间来规划、执行的流程现在可能只需几分钟就能评估完毕,将会进一步加剧上述颠覆过程。多年习惯了评估年度销售业绩的人常常很难应付每周甚至是每天的收入数据。按老一套办法管理的人可能会发现自己已经落伍于新的世界。
一旦知道信息即权力,有人可能就会投机取巧,损害公司的利益。
比如说,一家大公司开始以公司被推特(Twitter)提及的次数为指标来跟踪网站流量,跟踪结果在高管的推特活动一览表(dashboard)上持续更新。
一支销售团队的经理原先主要是通过贸易展会来获取线索并最终达成销售,然而当推特提及次数成为关键衡量指标之后,这位经理改变了部门的重点,宣称“我们要拿下dashboard”。到头来这个部门可能确实是拿下了dashboard,但这样一来,它强调的就不是曾经大获成功的展会,而是没有优质线索、无利可图的网站点击量和社交媒体流量。
普通数据库大约已经存在了35年的时间,所以人们有了很多经验,这些工具的理解和运用相对容易。相比之下,大数据还在萌芽阶段,所以组织、理解其深层意义的技术仍然处在起步阶段。
另外,理解如此大规模的信息也不是一件容易的事情。安全大师布鲁斯·施奇纳(Bruce Schneier)如此总结很多人的数学能力:“一个,两个,三个,很多个。”电子表格仍然是很多公司的主要定量分析工具,但它远远不足以用来实时衡量某个城市特定时刻道路上的汽车数量,或者是本周联邦政府在交通项目上的支出。
视觉化对于这类数据可以起到极大的帮助作用,但这个领域仍不成熟,其特殊语言也没有多少人懂得。
在如此大的规模层面上思考问题意味着什么?我们怎样才能学会针对主城道路上每一辆汽车、大型连锁零售店每一位顾客的智能手机、或配送车上每一个隔夜包裹所发出的信息提出问题?怎样才能让更多的商人学会按统计概率而非偶然事件思考?由于《点球成金》(Moneyball)这本书及同名电影的缘故,其中涉及的方法已经为球迷所熟知。但他们也将记得,这样的方法是怎样给一个组织带来了天翻地覆的变化,并被竞争对手模仿。
从某些意义上讲,它要求人们用一种全新的方式打量这个世界。
但优秀管理的原则也适用于大数据领域。在企业能够利用大数据获利之前,管理人员必须拒绝迷失在噪音当中,放任它掩盖客户、价值和执行这些基本力量。大数据的数量、速度和多样性可能会显得陌生,使人很容易在数字海啸面前晕头转向。
所以,坚守扎实分析的基本原则总是至关重要。还要记住,数字可能会告诉你一些以前根本都不知道要问的事情,但数字从来不会自己说话。文章来自:CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31本人基本情况: 学校及专业:厦门大学经济学院应用统计 实习经历:快手数据分析、字节数据分析、百度数据分析 Offer情况:北京 ...
2025-01-3001专家简介 徐杨老师,CDA数据科学研究院教研副总监,主要负责CDA认证项目以及机器学习/人工智能类课程的研发与授课,负责过中 ...
2025-01-29持证人简介 郭畅,CDA数据分析师二级持证人,安徽大学毕业,目前就职于徽商银行总行大数据部,两年工作经验,主要参与两项跨部 ...
2025-01-282025年刚开启,知乎上就出现了一个热帖: 2024年突然出现的经济下行,使各行各业都感觉到压力山大。有人说,大环境越来越不好了 ...
2025-01-27在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-01-26数据指标体系 “数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而 ...
2025-01-26在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-25俗话说的好“文不如表,表不如图”,图的信息传达效率很高,是数据汇报、数据展示的重要手段。好的数据展示不仅需要有图,还要选 ...
2025-01-24数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪70 ...
2025-01-24又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-23“用户旅程分析”概念 用户旅程图又叫做用户体验地图,它是用于描述用户在与产品或服务互动的过程中所经历的各个阶段、触点和情 ...
2025-01-22在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-22在数据分析领域,Excel作为一种普及率极高且功能强大的工具,无疑为无数专业人士提供了便捷的解决方案。尽管Excel自带了丰富的功 ...
2025-01-17在这个瞬息万变的时代,许多人都在寻找能让他们脱颖而出的职业。而数据分析师,作为大数据和人工智能时代的热门职业,自然吸引了 ...
2025-01-14Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09