CDA数据分析研究院出品,转载需授权
从广义上讲,人工智能涉及机器做一些只有人才能做到的事情。也就是说,计算机科学家不同意几年前的某些计算能力是否可以构成人工智能。如今,许多这些功能可能仅仅只被称为软件。
人工智能的现代复兴是由一种非常特殊的计算方式的进步推动的:也就是机器学习。我们经常在Emerj上交替使用人工智能和机器学习,但许多计算机科学家喜欢将两者分开。关于人工智能的究竟是由什么构成的,在该领域存在(并且可能永远存在)辩论。一些计算机科学家不考虑人工智能的计算能力,除非它们涉及机器学习。
这些科学家可能会继续改变他们的人工智能参数,直到实现人工一般智能(AGI)。AGI的发展(计算机执行人类所能执行的任何智力任务的能力)是许多计算机科学研究人员的目标,但实现它可能需要很多年,并且它值得在其他的时间用专门的一篇文章来形容。
研究人员似乎同意的一点是机器学习在某种程度上属于人工智能的范畴,而人工智能本身属于计算机科学学科。深度学习是后续文章的主题,并且深度学习是机器学习的一个子集。这一概念由NVIDIA提出,解释如下:
Yoshua Bengio,过去二十年来最杰出的深度学习研究者之一,为我们提供了他自己对机器学习的定义:
机器学习研究是人工智能研究的一部分,旨在通过数据,观察和与世界的互动为计算机提供知识。获得的知识允许计算机正确地推广到新设置。
尽管机器学习在今天的人工智能思想的主导地位,但人工智能曾经以一种截然不同的方式被研究。
专家系统和人工智能的早期方法
在21世纪末和2010年初的机器学习取得进步之前,人工智能的兴趣围绕着一个完全独立的计算能力。在60年代和70年代,专家系统主导了人工智能的开发。开发人员试图通过将其概念化为一系列if-then语句来模仿人类思想和决策。实质上,专家系统是一个由if-then场景构建的大型网络,通过该场景过滤查询以实现一些预编程的最终结果。专家系统背后的if-then语句被硬编码到软件中。因此,AI每次都会以相同的方式响应某些输入。
如果所得到的软件在工业中具有任何实际用途,那么这些if-then场景需要适当地通知领域专家。例如,为了建立一个专家系统来了解当出现某种传染病时应该做些什么,开发人员需要以某种方式将软件的if-then场景建立在传染病专家在传染病时可能做的事情的基础上 。
例如,开发人员可以采访40位不同的传染病医疗专家,并向他们询问有关症状和治疗的一系列问题,并将他们的反应硬编码到专家系统中。这需要软件开发人员进行大量的深谋远虑和规划。他们需要与领域专家合作,列出某人可能询问某个特定主题的所有可能问题,然后找出这些问题的所有可能的答案。如果他们没不能解释一个问题或答案,那么专家系统将无法提供用户问题的准确答案。
另一个例子可能涉及客户支持票。专家系统可以建立在以下if-then场景上:“如果电子邮件的正文中包含”退款“字样,则将票证路由到退款票据桶。”这当然看起来是一个合理的规则,它确实可能会将大部分退款票据路由到相应的桶中。该规则不考虑客户谈论与退款相关的概念或使用退款相关短语而不使用“退款”一词的支持票。
客户可能会说,“如果你不给我回电话,我就会打电话给我的银行。”一个有业务背景的人力支持代理可能知道这样的门票通常涉及到客户不知道他们账户的费用是他们注册的年度订阅服务。代理商可能也知道,在几乎所有情况下,客户都希望退还该费用。基于专家系统的软件永远无法将这些票据退还到退款桶中。
专家系统的局限性
从理论上讲,具有业务“客户支持票证背景”的人员可以在构建专家系统之前将有关此场景的信息传递给构建专家系统的开发人员。if-then规则可能类似于“如果电子邮件的正文包含'bank'一词,则将票证路由到退款票据桶。”
但是,如果该企业最近才开始销售其订购服务,那么其基于专家系统的客户支持软件将无法适应进入系统的各种票证,并对其订阅服务进行模糊引用,例如上面的示例。在业务联系开发人员以使用另一个if-then规则更新软件之前,这些票证不会被路由到退款桶中。
围绕这一限制进行工作明显是不切实际的,这也是专家系统(以及通常的人工智能)在一段被称为“人工智能寒冬”的时期内衰退的最大原因。
随着互联网的出现,从在线购物到保险理赔的大量数据都变得数字化。数据现在已成为常态,即使是最小的公司也将数据存储在数字格式中。
机器学习是一种让计算机以与专家系统完全不同的方式模仿人类思想和决策的方式。如果一个人有能力存储,访问和理解他们可以做出决策的大脑中的数十亿个数据点,他们可能会做出与我们现在做出决策的方式截然不同的决策; 在任何情况下,在绝大多数情况下,对更多信息和背景做出的决定优于在较少信息和较少背景下进行的决策。
简而言之,机器学习模型可以对数十亿个数据点做出决策。它们理解这些数据,并将其转化为可能性,为它们的产出提供动力。这与专家系统非常不同,专家系统每个if-then规则只有一个输出,每个“if”只有一个“then”。更重要的是,机器学习模型是为了适应新的意外的输入而构建的。专家系统不知道如何处理不属于退款票规则的退票,但随着时间的推移,机器学习模型可以开始将“我正在给我的银行打电话”路由到退款桶中,作为回应人的反馈。
机器学习的适应性
如果人员在其路由正确或不正确时向模型指示,那么它可以使用该反馈来通知其基于其票证路由的可能性。虽然我们建议不要将人工智能拟人化,但它本身会问自己“这张票应该被送到退款桶的可能性是多少?”每当提供支持票时。如果确定可能性很高,则票证将被路由到退款桶。如果确定可能性较低,则可以对模型进行编程以标记票据以供人工审查。
这种适应性是机器学习和专家系统之间的关键差异,这就是为什么一些计算机科学家不再考虑专家系统和人工智能的其他计算能力的原因。它也是斯坦福定义机器学习的基础:“让计算机在没有明确编程的情况下采取行动的科学。”
这种适应性的一个例子是Netflix的推荐引擎。当平台上的新用户第一次从俄克拉荷马州的某个位置登录时,推荐引擎除了用户的IP位置之外几乎没有任何关于该用户的数据。但是,Netflix确实有几百万个数据点来自于俄克拉荷马州的其他用户。推荐引擎可以使用该数据来基于过去与类似用户的交互来做出关于该新用户可能想要看到什么内容的一般假设。
当用户继续与Netflix交互时,他们选择观看的数据,当他们暂停这些节目或完全停止观看时,以及显示他们连续观看的数据通知机器学习模型推荐给用户可能喜欢的节目。该模型响应用户的交互并适应他们的偏好。用户的数据还为其他用户提供了推荐,这些用户具有第一个用户相似的偏好和相似的人口统计学特征。
机器学习的核心是在大量数据上进行训练机器,使机器能够识别数据中的模式,从而确定使用特定输出而获得成功的可能性。
机器学习的局限性
机器学习有其局限性,事实上,当涉及到一个核心概念时,它比专家系统更糟糕:那就是可解释性。
我们可以遵循一系列if-then规则来弄清楚专家系统是如何产生特定输出的。如果结果证明他们的答案”then“是不正确的,那么就允许开发人员修复这些规则。专家系统是高度透明的,这在某些领域甚至是必要的,这是有帮助的。
如果患者询问他们的医生为什么他们诊断患有疾病,医生如果根据专家系统的输出做出诊断,那么医生可以回答这个问题。从理论上讲,他们可以通过专家系统的if-then规则读取导致其输出的信息,以及患者的诊断结果。
机器学习模型不是这种情况,它比if-then树复杂得多。机器学习模型背后的神经网络可能如下所示:
如果医生根据机器学习模型的输出进行诊断,他们将无法向患者解释清楚。机器学习模型基于在数据集中自行构建的模式进行输出。人类在没有任何上下文的情况下为机器学习算法提供数据,并且该算法提供了一些基于人类目前无法识别的模式来确定结果。
机器学习模型可以基于任意数量的数据点为患者进行诊断。这可能是因为患者的CT扫描异常。也可能是因为他们的人口统计学特征,他们的名字,以及他们的保险索赔历史,比其他人更容易被诊断出患有特定疾病。医生既无法确认也无法否认。
这个问题也就是所谓的人工智能的“黑匣子”。机器学习模型可以通过以人类无法达到的规模查找数据模式来进行预测和推荐,但没有人能够解释模型如何或为何做出这些预测和建议。没有透明度,这是某些行业的一个主要问题,正如我们在报告中讨论的那样,在B2B和B2C中应用人工智能 - 有什么区别?对于计算机科学研究人员而言,黑匣子是一个令人担忧的问题,被称为“人工智能教父”的杰弗里·辛顿甚至建议“把它扔掉,然后再重新开始”。
商业领袖的经验
绝大多数商业领袖可能会考虑的人工智能解决方案,我们在Emerj所涵盖的确实是机器学习解决方案。商业领袖可以在谈话中使用人工智能,并希望他们的数据科学家能够理解他们所指的是机器学习。从历史的角度来看,专家系统通常被认为是人工智能,但是在80年代末期之前开发的计算能力通常不是人们在谈论人工智能时所指的。
有可能在未来十年或二十年内,机器学习本身将面临类似的命运,被归纳为计算机科学史的范畴,作为一种计算能力,它在当时发挥了应有的作用,但最终让位于某种更复杂,或许更具解释性的东西。再或者,机器学习可能不会被抛弃,而是变得无处不在,以至于它不再被称为人工智能。
商业领袖可以将专家系统和机器学习视为人工智能频谱的两端。现在,开发人员在开始构建人工智能解决方案时,通常不会构建专家系统; 他们建立机器学习模型。是实现人工智能相同目标的两种截然不同的方法:让计算机完成传统上为人类保留的智力任务。机器学习和专家系统是人工智能的子集,它是整个计算机科学的一个子集。
数据分析咨询请扫描二维码
在准备数据分析师面试时,掌握高频考题及其解答是应对面试的关键。为了帮助大家轻松上岸,以下是10个高频考题及其详细解析,外加 ...
2024-12-20互联网数据分析师是一个热门且综合性的职业,他们通过数据挖掘和分析,为企业的业务决策和运营优化提供强有力的支持。尤其在如今 ...
2024-12-20在现代商业环境中,数据分析师是不可或缺的角色。他们的工作不仅仅是对数据进行深入分析,更是协助企业从复杂的数据信息中提炼出 ...
2024-12-20随着大数据时代的到来,数据驱动的决策方式开始受到越来越多企业的青睐。近年来,数据分析在人力资源管理中正在扮演着至关重要的 ...
2024-12-20在数据分析的世界里,表面上的技术操作只是“入门票”,而真正的高手则需要打破一些“看不见的墙”。这些“隐形天花板”限制了数 ...
2024-12-19在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17数据分析,是一项通过科学方法处理数据以获取洞察并支持决策的艺术。无论是在商业环境中提升业绩,还是在科研领域推动创新,数据 ...
2024-12-17在数据分析领域,图表是我们表达数据故事的重要工具。它们不仅让数据变得更加直观,也帮助我们更好地理解数据中的趋势和模式。相 ...
2024-12-16在当今社会,我们身处着一个飞速发展、变化迅猛的时代。不同行业在科技进步、市场需求和政策支持的推动下蓬勃发展,呈现出令人瞩 ...
2024-12-16在现代商业世界中,数据分析师扮演着至关重要的角色。他们通过解析海量数据,为企业战略决策提供有力支持。要有效完成这项任务, ...
2024-12-16在当今数据爆炸的时代,数据分析师是组织中不可或缺的导航者。他们通过从大量数据中提取可操作的洞察力,帮助企业在竞争激烈的市 ...
2024-12-16