七个必定使数据分析失败的方式
数据分析正迅速成为赢得业务战略的关键。但是如果没有正确的方法、技巧和策略,你的数据举措可能永远没有结果。
数据分析已经成为企业最重要的业务和技术的差异化要素之一,数据分析使企业能够深入了解其运营的方方面面,从而在竞争中获得优势。
调研公司Gartner今年早些时候预测,2017年将是数据和分析成为主流的一年,为已经为转型做好准备的组织内外创造价值。Gartner表示,数据分析的方法正在变得更加整体化,涵盖整个业务。
Gartner的研究报告显示,在主要趋势中,分析将推动现代业务运营,而不仅仅是反映其绩效。企业将创建端到端的架构,这些架构考虑到了组织核心乃至组织边缘的数据管理和分析;高管们将数据和分析作为业务战略的一部分,使数据和分析专业人员能够发挥新的作用并创造业务增长。
公司正在为分析工具投入大量资金。国际数据公司(International Data Corp.)在2017年3月的一份报告中预测,今年全球大数据和业务分析的收入将达到1508亿美元,比2016年增长12%,该公司预计增长会一直持续到2020年,届时收入将超过2100亿美元。
然而在数据分析被反复强调的请况下,很多组织还是陷入了损害或浪费分析的真正价值的陷阱。根据IT领导者和行业专家的说法,以下是七个必定使数据分析失败的方式。
1. 急于试水,却不知道自己在找什么
如果你不知道在数据中需要检查哪些具体的趋势或信号,你怎么能期望从中获得真正的价值呢?
德勤分析(Deloitte Analytics)的高级顾问、《逐鹿分析:新的制胜之道》一书的作者Tom Davenport说:“分析过程中最大的问题是你不知道自己在找什么数据。”
Davenport说:“数据挖掘让系统找出数据中的有趣之处的理念使很多公司误入歧途。即便使用机器学习,从数据关系的角度来了解你正在寻找的东西也是大有裨益的。”
天气网站Weather.com的质量保证经理Todd Eaton说:“Weather.com强调要找到‘知道如何查询数据并能完整而准确地讲述数据要传达的含义的人’。”
Eaton说:“合适的人员对使用数据回答问题充满激情,然后愿意不断质疑他们的发现,确保数据不仅适合叙事,而且能够解释我们所看到的事物并有助于预测未来发展的目标。重要的是,每个人都知道我们正在试图发现数据和我们的总体目标,并收集一致的测量结果和数据。”
启动分析工作时,缺乏重点肯定会导致失败。通用电气公司的首席数据官Christina Clark表示:“当数据团队把重点放在优先考虑的成果上时,他们将是最成功的。团队往往会失败,因为他们希望立即解决很多的业务需求,最终由于精力过分分散而没有产生有意义的影响来保持兴趣或维持资金来源。”
2. 建立(维护)自己的基础设施
建立和维护自己的大数据基础设施可能是一个巨大的诱惑。但这可能会危及你的分析工作的使命。
网络安全公司Vectra的首席技术官Oliver Tavakoli表示:“这往往浪费了数据科学家大量时间,而不是实际开发更好的分析。”
Tavakoli说:“我们知道我们需要大量的数据来进行分析。我们开始做大家都要求做的事情:我们买了一堆有大量磁盘容量的服务器,我们把它们放在托管设施里,我们用Apache Spark创建了自己的Hadoop集群,并让我们的数据科学家编写Scala代码与集群进行交互。”
有时由于硬件故障,集群会中断,更多的时候是由于软件故障。软件包会过时,有时几小时过去了,集群都处在不可用的状态。
Tavakoli说:“我们终于有了足够的资源并决定将这部分问题外包出去。自打Vectra与外部供应商合作之后,它就很少花时间在这些基本问题上,“我们几乎所有的时间都致力于将数据提供给系统并分析其中的数据”,他这样说道。
3. 成为数据分割者,而不是数据统一者
长期以来,企业一直在努力解决阻止各部门共享信息的“数据孤岛”问题,从而使整个机构受益。分析也遇到了同样的挑战。
客户生命周期管理营销公司Zeta Global的首席信息官Jeffry Nimeroff说,统一不同的数据就是一个很好的最佳实践。
Nimeroff表示:“每个数据孤岛都会在能产生价值相互连接之间形成一个障碍。例如,考虑一个丰富的用户配置文件连接或断开网站活动数据。可以互连的数据越多越好,因为在这些互连里才能找到预测能力。”
Nimeroff说,这并不意味着必须将所有数据从初始系统移动到一个整体。他说:“相反,我们使用其中一种现代集成技术来提供统一的数据视图,而这一切都在当前的系统中。”
4. 回避良好的数据卫生
如果你正在分析的数据不准确、不是最新的、且没有条理,那么分析的价值可能会急剧下降。
Nimeroff说:“错进错出(garbage in, garbage out)是原始业务数据的容量和范围扩大的问题,最好的数据分析团队要质量渗透,因此,建立流程并利用技术来执行质量标准是一个必胜的组合。”
Nimeroff说,在流程方面,确保流程的可重复性以及对结果的可审计性是非常重要的。在技术方面,他说,部署包括分析、元数据管理、清理、采购等数据质量工具有助于确保获得更好的高质量数据。
Tavakoli说:组织需要使用工具来“清除碎片”——不完整和破坏的数据——并且从不同的来源获取数据,以使其兼容且易于理解,并尽可能简化分析。尽可能使数据一目了然,以便团队的所有成员都了解各种数据的意义。”
技术服务公司Incedo的首席执行官TP Miglani说,高质量的数据“是产生有用洞察的关键动力”。他说:“你需要建立数据仓库和数据湖泊,把结构化和非结构化的数据汇集在一起。成功的组织会确保他们会用清理、计算缺失值,并准确地标记数据来提高数据的质量。”
良好的数据卫生也意味着保持数据尽可能是最新的。Nimeroff说,数据需要新鲜度,“数据宇宙”要不断膨胀,企业才能从分析中获得价值。
Nimeroff说:“数据新鲜度要求了解当前数据采集过程的时效性。显然,一个系统越实时,新鲜度就越高。也可以通过使用第三方服务来支持新鲜度,以加强你现有的技术和流程。”
5. 放弃分析计划的高管赞助
与其它类型的重大IT项目一样,没有数据分析项目的高级管理人员的领导能力可能对成功不利。
Miglani说:“分析团队的目标是通过将数据与公司的战术和战略决策相结合来产生洞察。一个失败的例子就是如果一个数据科学团队做了大量的数据分析,开发出了准确的预测模型,但是结果并没有被实施,因为它需要组织和文化的变革。”
Clark说,建立数据管理基础需要多年持续不断的努力。他说:“数据和分析团队要促进的一些工作不会有立竿见影的效果,这可能与业务合作伙伴的预期不一致。这需要强有力的领导层支持,以及努力教育业务合作伙伴,以实现更加趋于数据驱动的未来。”
6. 忽略中层和下层管理者
数据科学家在真空中进行的分析和其他那些没有从最亲近分析需求的业务经理得到可靠输入的专家不太可能成功。
服务管理软件供应商Astea International的首席运营官David Giannetto表示:“如果没有中低层管理人员的积极参与,分析团队提供的信息往往不能真正地帮助管理层团队更好地完成工作。”
Giannetto说:“信息将是定向的,信息会指出更大的流程缺陷或可以改进的地方,但是管理层早晚要着手处理——当他们有时间的时候。而大多数管理者从来都没有多余的时间。只有当团队由真正懂业务的人组成,以及业务实际上每天都需要访问信息时,传递的信息才足以对业务产生积极影响。”
Giannetto说,如果分析能够告诉用户真正的问题在哪里——哪里可能会出现问题——他们有足够的时间来阻止问题,他们每天都使用这些信息,那么这一举措将会取得成功。
7. 缺乏支持良好数据分析的文化和技能
这对于组织来说是一个普遍的问题,很大程度上是因为数据科学这样的技术很难获取。但是,如果数据素养不是公司文化的核心,分析失败的可能性更大。
Miglani说:“对于不熟悉分析的人来说,数据科学被认为是解决问题的一种神奇的方式。预测和自学的概念很难让人掌握。要说服你的商业伙伴在不透明的算法上作出决策是很难的。你需要先教育他们。“
而且组织机构在继续努力寻找具有分析技能的数据科学家和其他专业人员。Miglani说:“培养这种能力的最好方法之一是培养这种才能,而不是在组织外物色超级明星。很多项目失败或者推迟,就是因为公司无法按时聘请或大量流失分析人员。”
数据分析咨询请扫描二维码
数据分析工具推荐 数据分析工具的选择至关重要。不同工具适用于不同的需求和场景。以下是一些推荐的数据分析工具,根据您的需求 ...
2024-11-27选择适合您需求的数据分析工具 数据分析作为商业决策过程中的关键环节,工具的选择至关重要。不同的工具适用于不同的场景和需求 ...
2024-11-27数据架构文档的编写涉及多个方面,包括内容结构、编写原则和具体要求。遵循规范可以帮助团队更好地理解和管理数据架构,支持项目 ...
2024-11-27挑战与解决方案概述 在数字化时代,数据开放共享对于推动创新和发展至关重要。然而,这一进程面临诸多挑战。保护用户隐私、确保 ...
2024-11-27促进科学研究和创新 数据开放共享为研究人员提供更广泛的资源和合作机会,加速科学知识的发展。通过访问他人的数据集,验证研究 ...
2024-11-27数据组织与存储策略 数据模型是数据仓库和商业智能系统的核心,通过合理的数据组织和存储策略,确保高效、低成本、高质量地利用 ...
2024-11-27持续关注数据系统运行状态 - 数据设计与开发完成后,维护与优化工作成为至关重要的环节。这个过程需要持续且细致的关注,以确保 ...
2024-11-27数据服务未来的趋势 智能化和自动化: 随着人工智能和机器学习技术的飞速发展,数据服务领域正逐渐朝着更智能化和自动化的方向 ...
2024-11-27未来最有前景的行业主要集中在以下几个领域: 人工智能与机器学习:人工智能被认为是未来最具潜力的行业之一,其应用范围广泛 ...
2024-11-27根据多条证据,目前多个行业展现出良好的发展前景。以下是一些被认为具有最好发展前景的行业: 人工智能与机器学习:人工智能 ...
2024-11-27学习数据分析后,可以在多种类型的单位找到工作机会。这些单位包括但不限于: 政府机关:数据分析师在政府机构中扮演重要角色 ...
2024-11-27必备的职业技能 统计学基础 - 理解概率、假设检验、回归分析等统计概念。 - 运用统计方法对数据进行分析和解读。 编程能力 - 掌 ...
2024-11-27基础课程 - 统计学基础: 统计学是数据分析的基石,包括概率、假设检验、回归分析等基本知识。这有助于分析师更好地理解数据背后 ...
2024-11-27数据分析领域涉及众多工具软件,涵盖了从数据处理、分析到可视化的各个方面。在选择适合自己需求的工具时,需要考虑数据规模、分 ...
2024-11-27在数据分析领域,选择合适的工具至关重要。不同的软件适用于不同的需求和技能水平。以下是几款值得考虑的数据分析软件: - Table ...
2024-11-27数据分析中常用的Excel与Python函数公式涵盖了广泛的应用场景。掌握这些基础和高级技巧对于成为一名优秀的数据分析师至关重要。 ...
2024-11-27Python是一种高级编程语言,由荷兰程序员Guido van Rossum于1989年圣诞节期间开始开发,并于1991年首次发布。Python的设计哲学强 ...
2024-11-27课程内容 数学基础: 高等数学、线性代数、概率论与数理统计、微积分等为算法设计和数据分析打下基础。 编程与算法: 掌握 ...
2024-11-27爬虫工程师是互联网时代中至关重要的职业之一,他们的工作内容主要涉及编写和维护网络爬虫程序,进行数据采集与清洗,设计系统架 ...
2024-11-27技能需求 数据管理与建模 - 掌握SQL、HiveQL、Spark SQL等数据库语言,进行复杂数据查询和分析。 - 使用数据建模工具如ER/Studio ...
2024-11-27