作者 | Daniel Faggella编译 | CDA数据分析师
自2012年以来,很容易看到风险投资,会议和与业务相关的“机器学习”查询的广泛普及-但大多数技术主管通常很难确定他们的业务可能将机器学习(ML)实际应用于业务问题的位置。
随着每周创建新的AI流行语,似乎很难掌握哪些应用程序是可行的,哪些是炒作,夸张或骗局。
在本文中,我们将分解ML通常处理的业务问题的类别,并且还将提供可行的建议,以正确的方法和观点开始ML计划(即使这是您执行的第一个此类项目)在您的公司)。
最重要的是,我们将参考真实的业务用例,以及来自我们的AI研究人员和执行人员网络的“如何用ML解决业务问题”的引用和观点。到本文结尾,您将对ML是否可以很好地解决您当前的任何业务挑战有一个好主意。
*注意:在本文的底部,我以简单语言列出了ML术语的基本词汇表。如果您发现本文中您所不理解的短语或术语,请参阅下面的词汇表,或者,如果您希望我们对本文中的概念更加清楚,请 [与我们联系]
如果有可能构建一套规则或“如果-则情景”来完全解决您的问题,那么可能根本就不需要ML。此外,如果没有成功的先例可将机器学习应用于您要解决的特定问题,那么这可能不是进入ML世界的最佳途径。
出于说明目的,列出一些成熟的机器学习业务用例将很有帮助,以便您(读者)可以提出自己的应用程序构想:
在经验丰富的数据科学专业人员中,“清洁数据胜于大数据”是一个常见的说法。如果您拥有数年前的大量业务数据,则今天可能没有任何意义,尤其是在基本业务流程逐年急剧变化的领域(例如移动电子商务)中。如果您有大量的非结构化数据和脱节数据,那么您可能需要进行太多的“清理”工作,然后才能开始从收集的信息中学习。
UBER机器学习负责人Danny Lange曾经建议刚开始机器学习的公司应从对历史数据应用监督的机器学习开始。查找已经干净且相对较新的数据,并使用带有标签的培训数据开始寻找见解。
请注意,在瞬息万变的领域,肯定需要更新的数据。例如,如果您为宠物用品运行上门送货服务,而您的应用,价格,产品和服务范围在过去六个月中发生了显着变化,那么您需要的最新数据要比蒙大拿州出售房主保险的公司。如果数据与您当前业务的相关趋势和细微差别无关,则不太可能收集预测价值。
虽然无监督学习(请参阅下面的术语表)允许在不使用标签的情况下实现广泛的数据意义的应用,但通常不建议公司在无监督学习中首次应用“跳入”机器学习。ML用例的低调成果很可能是从其历史标记数据中产生的。以下是一些可能有助于读者获得新想法的示例:
ML可能被认为是一种“技能”,就像人们可以将其应用于人类一样。一种技能,可以根据经验进行动态调整,适应和发展。由于这个原因,机器学习解决方案通常会在一定百分比的时间内是不正确的,尤其是当它是由新的或变化的刺激告知时。如果您的任务绝对不允许出现任何错误,则ML可能是该工作的错误工具。
不允许出现错误的应用程序示例可能是旨在读取发票或账单金额然后支付该发票或账单的应用程序。一个字母或一个数字的差异可能意味着多付了您账单原始金额的10倍(如果十进制被解释为在错误的位置),或汇款给了错误的公司(如果发票公司名称未正确注册) 。
在上述情况下,某种程度的ML可能有助于“存储”不同类型的账单或发票,但是输入付款金额并发送付款的最终决定可能需要负责任的人员。
作为一个有趣的警告,位于旧金山的一家名为Roger.ai的初创公司旨在利用自然语言处理和机器视觉来实现账单和支付账单,尽管它在汇款之前将人们拉入了循环。
为了获得关于“为机器学习选择业务问题”问题的更多观点,我们决定与以前的AI播客访谈对象的网络联系,为我们的业务读者提供更多指导:
Ben Waber博士-麻省理工学院博士-Humanyze(人工智能技术的人分析公司)首席执行官:
“ 任何具有硬数据,可变性和大量示例的业务问题。”
Danko Nikolic博士-奥克拉荷马大学博士学位-计算机科学公司的数据科学和BD&A:
“ 1。公司可以节省很多钱。
2.预测需要许多变量,它们之间复杂的非线性关系,在某些情况下是高度随机的。因此,通常只有算法才能了解这些关系。光是人类就很难。”
Charles Martin博士-芝加哥大学博士-计算咨询公司首席执行官:
“ 最好的问题是存在一个庞大的历史数据集,这些数据集既包含丰富的功能,又包含可以用于构建的直接反馈以及可以轻松实施和测试的算法,这将降低运营成本, /或立即增加收入。“
Ronen Meiri博士-特拉维夫大学博士-DMWay首席技术官兼创始人
:“大多数企业的问题可以采用两种机器学习方法妥善解决 1 日:‘什么可能会发生’ 和 2 次:“什么是...未来的预期值?”。
第一个是分类类型问题,其中包括对在许多其他用例中可能流失,违约,购买,出售的人进行分类。
第二个问题是期望值问题,该问题可以通过回归解决,并且可以针对各种用例(如定价优化和预测生命周期价值)提供准确的预测。”
彼得·沃斯(Peter Voss)-AGI创新公司首席执行官:
(首先,彼得引用乔治·梅森大学教授罗宾·汉森博士的话:“优秀的CS专家说:大多数认为自己想要高级AI / ML的公司实际上只需要对清理后的数据进行线性回归。”)
“我认为大多数企业都没有理由在ML / DL上进行投资(当然,ML意味着很多事情)。 每个人都在谈论的最前沿内容需要大量数据和专业知识,并且是静态的,即,当数据或类别更改时,需要对其进行重新培训。”
线性回归是最古老,最简单且广泛使用的机器学习模型之一。一些研究人员认为,至少在最初,许多中间预测问题可能只需要基本方法即可。图片由MathWorks提供。
彼得的评论是恰当的,不应掉以轻心。当ML因其流行和流行而被人们抢走时,它不可能产生显着的结果。找到最适合您的底线需求的工具;ML可能不是满足业务或增长目标所需的解决方案。
这使我们进入了本指南的第二个主要部分:
在与查尔斯·马丁(Charles Martin)博士(湾区AI顾问)的场外对话中,他提到许多公司热情地阅读了有关ML的内容,并决定“找到某种使用它的方法。”这导致团队没有真正的动力。或追求(或承诺的资源)以驱动实际结果。选择一个非常重要的业务问题,并且似乎很有可能得到解决
UBER的Danny Lange从一开始就提到,有一个思维过程很可能会产生富有成果的机器学习用例思想:“如果我们只知道____。”
问问自己,您想知道哪些关键业务信息,但当前无法访问?也许是在了解最有可能产生最高客户生命周期价值的潜在客户来源,或者最能表明预期客户流失的用户行为。
想想要“馈送”您的算法的信息并不像假定的那么容易。机器学习算法虽然擅长识别相关性,但他们无法理解围绕数据的事实,这些事实可能使数据变得相关或不相关。以下是“上下文”如何阻碍开发有效的ML解决方案的一些示例:
构建ML解决方案需要在选择算法,选择数据,清理数据以及在实际环境中进行测试时进行仔细的思考和测试。对于独特而复杂的业务用例,没有“开箱即用”的机器学习解决方案。即使对于极为常见的用例(推荐引擎,预测客户流失),每个应用程序也会有很大差异,并且需要迭代和调整。如果一家公司没有进行长时间的修补就投入了ML项目,那么它可能永远不会取得有用的结果。
我们再次联系了我们的Emerj受访者和共识受访者网络,以获取有关在企业中实施机器学习的意见和技巧。以下是引号的集合:
Ben Waber博士-麻省理工学院博士-Humanyze(人工智能技术的人分析公司)首席执行官:
“ 您不能使用ML真空解决业务问题。确保您得到业务部门负责人的支持,以根据分析做出具体更改。”
Danko Nikolic博士-奥克拉荷马大学博士学位-计算机科学公司的数据科学和BD&A:
“ 企业在使用ML时常犯的最常见错误是,他们认为ML解决方案是一站式过程:他们将数据发送给数据科学家,而数据科学家则将模型返回。与此相反,找到好的ML解决方案是一个反复的过程,涉及研究,试验和错误,试验,与业务专家交谈等。
ML永远不可能成为商品。ML的成功在很大程度上取决于做到这一点的人的知识,技能和奉献精神。”
Charles Martin博士-芝加哥大学博士-计算咨询公司首席执行官:
“在您掌握要做什么之前,请避免建立大规模的基础架构。您可以轻松地花费6个月到一年的时间来设置Hadoop和Spark,而不会看到任何投资回报。
如果您5%的数据正确且有用,您将很幸运。您需要设计一个实验,以识别低垂的果实并找出所需的数据。您可以在高内存的AWS节点上构建算法。
将算法放入实时环境中,并尽早对其进行测试。不要构建尝试完整的生产系统。记住,ML是关于数学的,而不是编码!您想测试一下。运行足够的示例来消除问题,但不要太小,以至于统计数据毫无意义。”
Ferris Jumah-以前曾在LinkedIn担任ML-湾区ML顾问:
“尽快获取数据驱动。机器学习不是免费提供的。您需要围绕数据建立直觉,如何衡量业务并了解客户,不仅将度量值链接,还将洞察力链接到决策制定。记录所有内容,构建存储和处理系统,确保它们可访问,对产品进行深入分析和尽可能多的实验,并在尽可能多的产品中内置智能。
在这一点上,消费者期望个性化和“智能”功能。建立它们,向他们学习,并确保您拥有适当的反馈机制。最后,雇用和投资对您的问题和业务充满热情的数据人员。”
共识(在上面引用的数量有限,以及与具有业务头脑的数据科学家进行的其他数十次对话中)是,机器学习不像营销自动化软件那样仅仅是“工具”。任何拥有良好管理者并获得社区大学学士学位的人都可以选择“持续联系”,甚至可以选择(甚至可以稍作修改并致电支持热线)Marketo或Hubspot并提高公司价值。
应用机器学习的迭代,多方面过程没有简单的捷径。图像信誉Microsoft的CortanaIntelligence。
机器学习还没有出现在一个整洁的盒子中,而价值却是由刻苦的思考,实验设计以及(在某些情况下)刻苦的数学创造的。在Google和YouTube上花费一些时间,您可以了解如何为您的企业设置DropBox。通过机器学习预测整个客户群的流失率吗?不一样的游戏。
准备从ML中获得业务价值意味着要有受过训练的人才,专家指导和(通常)巨大的“数据清理”时期-而且,正如马丁博士在上面恰当地指出的那样,这没有保证一定会赢。如果Google,Amazon和Facebook能够让他们的实习生建立ML系统,他们真的会花费数百万美元从学者中挖走世界顶级AI人才来为他们工作吗?
虽然机器学习不是一个简单的设置,但也不是任何有远见的企业都可以离开桌面太长时间。“摇滚明星”技术公司通过机器学习获得的效率是巨大的,而湾区的初创企业不仅因为“机器学习”是一个流行词而获得了资金,还因为它们中的许多公司业务强大而有力案件。
感兴趣的读者可能会从我们最近对26位机器学习/人工智能研究人员达成的共识中受益,我们在其中提出了以下问题:“机器学习应首先应用于商业领域吗?” 该信息图表特色充分体现了本文中强调的许多观点。
高管们面临的最终问题仍然是:我们什么时候才能拥有(a)认真投资于机器学习所需的资源,以及(b)合法的用例,该用例始于试图找到真正的商业价值,而不是从“试图找到一种方法”这是一个无法为您完成的思考过程,但是我们希望本文能够帮助您了解您的观点并为您提供将来借鉴的资源。
除非另有说明,否则定义均来自维基百科。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“用户旅程分析”概念 用户旅程图又叫做用户体验地图,它是用于描述用户在与产品或服务互动的过程中所经历的各个阶段、触点和情 ...
2025-01-22在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-22在数据分析领域,Excel作为一种普及率极高且功能强大的工具,无疑为无数专业人士提供了便捷的解决方案。尽管Excel自带了丰富的功 ...
2025-01-17在这个瞬息万变的时代,许多人都在寻找能让他们脱颖而出的职业。而数据分析师,作为大数据和人工智能时代的热门职业,自然吸引了 ...
2025-01-14Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09在如今这个信息爆炸的时代,数据已然成为企业的生命线。无论是科技公司还是传统行业,数据分析正在深刻地影响着商业决策以及未来 ...
2025-01-08“数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而言,数据指标体 ...
2025-01-07在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-06在现代企业中,数据分析师扮演着至关重要的角色。每天都有大量数据涌入,从社交媒体到交易平台,数据以空前的速度和规模生成。面 ...
2025-01-06在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02在当今的数字化时代,数据分析师扮演着一个至关重要的角色。他们如同现代企业的“解密专家”,通过解析数据为企业提供决策支持。 ...
2025-01-02数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪 ...
2024-12-31数据分析,听起来好像是技术大咖的专属技能,但其实是一项人人都能学会的职场硬核能力!今天,我们来聊聊数据分析的核心流程,拆 ...
2024-12-31