CDA数据分析研究院出品,转载需授权
从广义上讲,人工智能涉及机器做一些只有人才能做到的事情。也就是说,计算机科学家不同意几年前的某些计算能力是否可以构成人工智能。如今,许多这些功能可能仅仅只被称为软件。
人工智能的现代复兴是由一种非常特殊的计算方式的进步推动的:也就是机器学习。我们经常在Emerj上交替使用人工智能和机器学习,但许多计算机科学家喜欢将两者分开。关于人工智能的究竟是由什么构成的,在该领域存在(并且可能永远存在)辩论。一些计算机科学家不考虑人工智能的计算能力,除非它们涉及机器学习。
这些科学家可能会继续改变他们的人工智能参数,直到实现人工一般智能(AGI)。AGI的发展(计算机执行人类所能执行的任何智力任务的能力)是许多计算机科学研究人员的目标,但实现它可能需要很多年,并且它值得在其他的时间用专门的一篇文章来形容。
研究人员似乎同意的一点是机器学习在某种程度上属于人工智能的范畴,而人工智能本身属于计算机科学学科。深度学习是后续文章的主题,并且深度学习是机器学习的一个子集。这一概念由NVIDIA提出,解释如下:
Yoshua Bengio,过去二十年来最杰出的深度学习研究者之一,为我们提供了他自己对机器学习的定义:
机器学习研究是人工智能研究的一部分,旨在通过数据,观察和与世界的互动为计算机提供知识。获得的知识允许计算机正确地推广到新设置。
尽管机器学习在今天的人工智能思想的主导地位,但人工智能曾经以一种截然不同的方式被研究。
专家系统和人工智能的早期方法
在21世纪末和2010年初的机器学习取得进步之前,人工智能的兴趣围绕着一个完全独立的计算能力。在60年代和70年代,专家系统主导了人工智能的开发。开发人员试图通过将其概念化为一系列if-then语句来模仿人类思想和决策。实质上,专家系统是一个由if-then场景构建的大型网络,通过该场景过滤查询以实现一些预编程的最终结果。专家系统背后的if-then语句被硬编码到软件中。因此,AI每次都会以相同的方式响应某些输入。
如果所得到的软件在工业中具有任何实际用途,那么这些if-then场景需要适当地通知领域专家。例如,为了建立一个专家系统来了解当出现某种传染病时应该做些什么,开发人员需要以某种方式将软件的if-then场景建立在传染病专家在传染病时可能做的事情的基础上 。
例如,开发人员可以采访40位不同的传染病医疗专家,并向他们询问有关症状和治疗的一系列问题,并将他们的反应硬编码到专家系统中。这需要软件开发人员进行大量的深谋远虑和规划。他们需要与领域专家合作,列出某人可能询问某个特定主题的所有可能问题,然后找出这些问题的所有可能的答案。如果他们没不能解释一个问题或答案,那么专家系统将无法提供用户问题的准确答案。
另一个例子可能涉及客户支持票。专家系统可以建立在以下if-then场景上:“如果电子邮件的正文中包含”退款“字样,则将票证路由到退款票据桶。”这当然看起来是一个合理的规则,它确实可能会将大部分退款票据路由到相应的桶中。该规则不考虑客户谈论与退款相关的概念或使用退款相关短语而不使用“退款”一词的支持票。
客户可能会说,“如果你不给我回电话,我就会打电话给我的银行。”一个有业务背景的人力支持代理可能知道这样的门票通常涉及到客户不知道他们账户的费用是他们注册的年度订阅服务。代理商可能也知道,在几乎所有情况下,客户都希望退还该费用。基于专家系统的软件永远无法将这些票据退还到退款桶中。
专家系统的局限性
从理论上讲,具有业务“客户支持票证背景”的人员可以在构建专家系统之前将有关此场景的信息传递给构建专家系统的开发人员。if-then规则可能类似于“如果电子邮件的正文包含'bank'一词,则将票证路由到退款票据桶。”
但是,如果该企业最近才开始销售其订购服务,那么其基于专家系统的客户支持软件将无法适应进入系统的各种票证,并对其订阅服务进行模糊引用,例如上面的示例。在业务联系开发人员以使用另一个if-then规则更新软件之前,这些票证不会被路由到退款桶中。
围绕这一限制进行工作明显是不切实际的,这也是专家系统(以及通常的人工智能)在一段被称为“人工智能寒冬”的时期内衰退的最大原因。
随着互联网的出现,从在线购物到保险理赔的大量数据都变得数字化。数据现在已成为常态,即使是最小的公司也将数据存储在数字格式中。
机器学习是一种让计算机以与专家系统完全不同的方式模仿人类思想和决策的方式。如果一个人有能力存储,访问和理解他们可以做出决策的大脑中的数十亿个数据点,他们可能会做出与我们现在做出决策的方式截然不同的决策; 在任何情况下,在绝大多数情况下,对更多信息和背景做出的决定优于在较少信息和较少背景下进行的决策。
简而言之,机器学习模型可以对数十亿个数据点做出决策。它们理解这些数据,并将其转化为可能性,为它们的产出提供动力。这与专家系统非常不同,专家系统每个if-then规则只有一个输出,每个“if”只有一个“then”。更重要的是,机器学习模型是为了适应新的意外的输入而构建的。专家系统不知道如何处理不属于退款票规则的退票,但随着时间的推移,机器学习模型可以开始将“我正在给我的银行打电话”路由到退款桶中,作为回应人的反馈。
机器学习的适应性
如果人员在其路由正确或不正确时向模型指示,那么它可以使用该反馈来通知其基于其票证路由的可能性。虽然我们建议不要将人工智能拟人化,但它本身会问自己“这张票应该被送到退款桶的可能性是多少?”每当提供支持票时。如果确定可能性很高,则票证将被路由到退款桶。如果确定可能性较低,则可以对模型进行编程以标记票据以供人工审查。
这种适应性是机器学习和专家系统之间的关键差异,这就是为什么一些计算机科学家不再考虑专家系统和人工智能的其他计算能力的原因。它也是斯坦福定义机器学习的基础:“让计算机在没有明确编程的情况下采取行动的科学。”
这种适应性的一个例子是Netflix的推荐引擎。当平台上的新用户第一次从俄克拉荷马州的某个位置登录时,推荐引擎除了用户的IP位置之外几乎没有任何关于该用户的数据。但是,Netflix确实有几百万个数据点来自于俄克拉荷马州的其他用户。推荐引擎可以使用该数据来基于过去与类似用户的交互来做出关于该新用户可能想要看到什么内容的一般假设。
当用户继续与Netflix交互时,他们选择观看的数据,当他们暂停这些节目或完全停止观看时,以及显示他们连续观看的数据通知机器学习模型推荐给用户可能喜欢的节目。该模型响应用户的交互并适应他们的偏好。用户的数据还为其他用户提供了推荐,这些用户具有第一个用户相似的偏好和相似的人口统计学特征。
机器学习的核心是在大量数据上进行训练机器,使机器能够识别数据中的模式,从而确定使用特定输出而获得成功的可能性。
机器学习的局限性
机器学习有其局限性,事实上,当涉及到一个核心概念时,它比专家系统更糟糕:那就是可解释性。
我们可以遵循一系列if-then规则来弄清楚专家系统是如何产生特定输出的。如果结果证明他们的答案”then“是不正确的,那么就允许开发人员修复这些规则。专家系统是高度透明的,这在某些领域甚至是必要的,这是有帮助的。
如果患者询问他们的医生为什么他们诊断患有疾病,医生如果根据专家系统的输出做出诊断,那么医生可以回答这个问题。从理论上讲,他们可以通过专家系统的if-then规则读取导致其输出的信息,以及患者的诊断结果。
机器学习模型不是这种情况,它比if-then树复杂得多。机器学习模型背后的神经网络可能如下所示:
如果医生根据机器学习模型的输出进行诊断,他们将无法向患者解释清楚。机器学习模型基于在数据集中自行构建的模式进行输出。人类在没有任何上下文的情况下为机器学习算法提供数据,并且该算法提供了一些基于人类目前无法识别的模式来确定结果。
机器学习模型可以基于任意数量的数据点为患者进行诊断。这可能是因为患者的CT扫描异常。也可能是因为他们的人口统计学特征,他们的名字,以及他们的保险索赔历史,比其他人更容易被诊断出患有特定疾病。医生既无法确认也无法否认。
这个问题也就是所谓的人工智能的“黑匣子”。机器学习模型可以通过以人类无法达到的规模查找数据模式来进行预测和推荐,但没有人能够解释模型如何或为何做出这些预测和建议。没有透明度,这是某些行业的一个主要问题,正如我们在报告中讨论的那样,在B2B和B2C中应用人工智能 - 有什么区别?对于计算机科学研究人员而言,黑匣子是一个令人担忧的问题,被称为“人工智能教父”的杰弗里·辛顿甚至建议“把它扔掉,然后再重新开始”。
商业领袖的经验
绝大多数商业领袖可能会考虑的人工智能解决方案,我们在Emerj所涵盖的确实是机器学习解决方案。商业领袖可以在谈话中使用人工智能,并希望他们的数据科学家能够理解他们所指的是机器学习。从历史的角度来看,专家系统通常被认为是人工智能,但是在80年代末期之前开发的计算能力通常不是人们在谈论人工智能时所指的。
有可能在未来十年或二十年内,机器学习本身将面临类似的命运,被归纳为计算机科学史的范畴,作为一种计算能力,它在当时发挥了应有的作用,但最终让位于某种更复杂,或许更具解释性的东西。再或者,机器学习可能不会被抛弃,而是变得无处不在,以至于它不再被称为人工智能。
商业领袖可以将专家系统和机器学习视为人工智能频谱的两端。现在,开发人员在开始构建人工智能解决方案时,通常不会构建专家系统; 他们建立机器学习模型。是实现人工智能相同目标的两种截然不同的方法:让计算机完成传统上为人类保留的智力任务。机器学习和专家系统是人工智能的子集,它是整个计算机科学的一个子集。
数据分析咨询请扫描二维码
在当今以数据为导向的商业环境中,数据分析师的角色变得越来越重要。无论是揭示消费者行为的趋势,还是优化企业运营的效率,数据 ...
2024-11-17金融数学是一门充满挑战和机遇的专业,它将数学、统计学和金融学的知识有机结合,旨在培养能够运用数学和统计方法解决复杂金融市 ...
2024-11-16在信息时代的浪潮中,大数据已成为推动创新的重要力量。无论是在商业、医疗、金融,还是在日常生活中,大数据扮演的角色都愈发举 ...
2024-11-16随着大数据技术的迅猛发展,数据已经成为现代商业、科技乃至生活各个方面的重要资产。大数据专业的毕业生在这一变革背景下,拥有 ...
2024-11-15随着大数据技术的迅猛发展,数据已经成为现代商业、科技乃至生活各个方面的重要资产。大数据专业的毕业生在这一变革背景下,拥有 ...
2024-11-15在快速演变的数字时代,数据分析已成为多个行业的核心驱动力。无论你是刚刚踏入数据分析领域,还是寻求进一步发展的专业人士,理 ...
2024-11-15Python作为一种通用编程语言,以其简单易学、功能强大等特点,成为众多领域的核心技术驱动者。无论是初学者还是有经验的编程人员 ...
2024-11-15在当今数据驱动的世界中,数据分析已成为许多行业的基础。无论是商业决策,产品开发,还是市场策略优化,数据分析都扮演着至关重 ...
2024-11-15数据分析作为现代商业和研究领域不可或缺的一部分,吸引了越来越多的初学者。然而,自学数据分析的过程中,初学者常常会遇到许多 ...
2024-11-15在当今的数据驱动世界中,机器学习方法在数据挖掘与分析中扮演着核心角色。这些方法通过从数据中学习模式和规律来构建模型,实现 ...
2024-11-15随着数据在各个行业的重要性日益增加,数据分析师在商业和技术领域的角色变得至关重要。其核心职责之一便是通过数据可视化,将复 ...
2024-11-15数据分析师的职责不仅仅局限于解析数据和得出结论,更在于将这些复杂的信息转换为清晰、易懂且具有影响力的沟通。良好的沟通能力 ...
2024-11-15数字化转型是企业提升竞争力和实现可持续发展的关键路径。面对快速变化的市场环境,以及技术的飞速发展,企业在数字化转型过程中 ...
2024-11-15CDA数据分析师认证:CDA认证分为三个等级:Level Ⅰ、Level Ⅱ和Level Ⅲ,每个等级的报考条件如下: Le ...
2024-11-14自学数据分析可能是一条充满挑战却又令人兴奋的道路。随着数据在现代社会中的重要性日益增长,掌握数据分析技能不仅能提升你的就 ...
2024-11-14数据分析相关职业选择 数据分析领域正在蓬勃发展,为各种专业背景的人才提供了丰富的职业机会。从初学者到有经验的专家,每个人 ...
2024-11-14数据挖掘与分析在金融行业的使用 在当今快速发展的金融行业中,数据挖掘与分析的应用愈发重要,成为驱动行业变革和提升竞争力的 ...
2024-11-14学习数据挖掘需要掌握哪些技能 数据挖掘是一个不断发展的领域,它结合了统计学、计算机科学和领域专业知识,旨在从数据中提取有 ...
2024-11-14统计学作为一门基于数据的学科,其广泛的应用领域和多样的职业选择,使得毕业生拥有丰厚的就业前景。无论是在政府还是企业,统计 ...
2024-11-14在当今高速发展的技术环境下,企业正在面临前所未有的机遇和挑战。数字化转型已成为企业保持竞争力和应对市场变化的必由之路。要 ...
2024-11-13