CDA数据分析研究院出品,转载需授权
从广义上讲,人工智能涉及机器做一些只有人才能做到的事情。也就是说,计算机科学家不同意几年前的某些计算能力是否可以构成人工智能。如今,许多这些功能可能仅仅只被称为软件。
人工智能的现代复兴是由一种非常特殊的计算方式的进步推动的:也就是机器学习。我们经常在Emerj上交替使用人工智能和机器学习,但许多计算机科学家喜欢将两者分开。关于人工智能的究竟是由什么构成的,在该领域存在(并且可能永远存在)辩论。一些计算机科学家不考虑人工智能的计算能力,除非它们涉及机器学习。
这些科学家可能会继续改变他们的人工智能参数,直到实现人工一般智能(AGI)。AGI的发展(计算机执行人类所能执行的任何智力任务的能力)是许多计算机科学研究人员的目标,但实现它可能需要很多年,并且它值得在其他的时间用专门的一篇文章来形容。
研究人员似乎同意的一点是机器学习在某种程度上属于人工智能的范畴,而人工智能本身属于计算机科学学科。深度学习是后续文章的主题,并且深度学习是机器学习的一个子集。这一概念由NVIDIA提出,解释如下:
Yoshua Bengio,过去二十年来最杰出的深度学习研究者之一,为我们提供了他自己对机器学习的定义:
机器学习研究是人工智能研究的一部分,旨在通过数据,观察和与世界的互动为计算机提供知识。获得的知识允许计算机正确地推广到新设置。
尽管机器学习在今天的人工智能思想的主导地位,但人工智能曾经以一种截然不同的方式被研究。
专家系统和人工智能的早期方法
在21世纪末和2010年初的机器学习取得进步之前,人工智能的兴趣围绕着一个完全独立的计算能力。在60年代和70年代,专家系统主导了人工智能的开发。开发人员试图通过将其概念化为一系列if-then语句来模仿人类思想和决策。实质上,专家系统是一个由if-then场景构建的大型网络,通过该场景过滤查询以实现一些预编程的最终结果。专家系统背后的if-then语句被硬编码到软件中。因此,AI每次都会以相同的方式响应某些输入。
如果所得到的软件在工业中具有任何实际用途,那么这些if-then场景需要适当地通知领域专家。例如,为了建立一个专家系统来了解当出现某种传染病时应该做些什么,开发人员需要以某种方式将软件的if-then场景建立在传染病专家在传染病时可能做的事情的基础上 。
例如,开发人员可以采访40位不同的传染病医疗专家,并向他们询问有关症状和治疗的一系列问题,并将他们的反应硬编码到专家系统中。这需要软件开发人员进行大量的深谋远虑和规划。他们需要与领域专家合作,列出某人可能询问某个特定主题的所有可能问题,然后找出这些问题的所有可能的答案。如果他们没不能解释一个问题或答案,那么专家系统将无法提供用户问题的准确答案。
另一个例子可能涉及客户支持票。专家系统可以建立在以下if-then场景上:“如果电子邮件的正文中包含”退款“字样,则将票证路由到退款票据桶。”这当然看起来是一个合理的规则,它确实可能会将大部分退款票据路由到相应的桶中。该规则不考虑客户谈论与退款相关的概念或使用退款相关短语而不使用“退款”一词的支持票。
客户可能会说,“如果你不给我回电话,我就会打电话给我的银行。”一个有业务背景的人力支持代理可能知道这样的门票通常涉及到客户不知道他们账户的费用是他们注册的年度订阅服务。代理商可能也知道,在几乎所有情况下,客户都希望退还该费用。基于专家系统的软件永远无法将这些票据退还到退款桶中。
专家系统的局限性
从理论上讲,具有业务“客户支持票证背景”的人员可以在构建专家系统之前将有关此场景的信息传递给构建专家系统的开发人员。if-then规则可能类似于“如果电子邮件的正文包含'bank'一词,则将票证路由到退款票据桶。”
但是,如果该企业最近才开始销售其订购服务,那么其基于专家系统的客户支持软件将无法适应进入系统的各种票证,并对其订阅服务进行模糊引用,例如上面的示例。在业务联系开发人员以使用另一个if-then规则更新软件之前,这些票证不会被路由到退款桶中。
围绕这一限制进行工作明显是不切实际的,这也是专家系统(以及通常的人工智能)在一段被称为“人工智能寒冬”的时期内衰退的最大原因。
随着互联网的出现,从在线购物到保险理赔的大量数据都变得数字化。数据现在已成为常态,即使是最小的公司也将数据存储在数字格式中。
机器学习是一种让计算机以与专家系统完全不同的方式模仿人类思想和决策的方式。如果一个人有能力存储,访问和理解他们可以做出决策的大脑中的数十亿个数据点,他们可能会做出与我们现在做出决策的方式截然不同的决策; 在任何情况下,在绝大多数情况下,对更多信息和背景做出的决定优于在较少信息和较少背景下进行的决策。
简而言之,机器学习模型可以对数十亿个数据点做出决策。它们理解这些数据,并将其转化为可能性,为它们的产出提供动力。这与专家系统非常不同,专家系统每个if-then规则只有一个输出,每个“if”只有一个“then”。更重要的是,机器学习模型是为了适应新的意外的输入而构建的。专家系统不知道如何处理不属于退款票规则的退票,但随着时间的推移,机器学习模型可以开始将“我正在给我的银行打电话”路由到退款桶中,作为回应人的反馈。
机器学习的适应性
如果人员在其路由正确或不正确时向模型指示,那么它可以使用该反馈来通知其基于其票证路由的可能性。虽然我们建议不要将人工智能拟人化,但它本身会问自己“这张票应该被送到退款桶的可能性是多少?”每当提供支持票时。如果确定可能性很高,则票证将被路由到退款桶。如果确定可能性较低,则可以对模型进行编程以标记票据以供人工审查。
这种适应性是机器学习和专家系统之间的关键差异,这就是为什么一些计算机科学家不再考虑专家系统和人工智能的其他计算能力的原因。它也是斯坦福定义机器学习的基础:“让计算机在没有明确编程的情况下采取行动的科学。”
这种适应性的一个例子是Netflix的推荐引擎。当平台上的新用户第一次从俄克拉荷马州的某个位置登录时,推荐引擎除了用户的IP位置之外几乎没有任何关于该用户的数据。但是,Netflix确实有几百万个数据点来自于俄克拉荷马州的其他用户。推荐引擎可以使用该数据来基于过去与类似用户的交互来做出关于该新用户可能想要看到什么内容的一般假设。
当用户继续与Netflix交互时,他们选择观看的数据,当他们暂停这些节目或完全停止观看时,以及显示他们连续观看的数据通知机器学习模型推荐给用户可能喜欢的节目。该模型响应用户的交互并适应他们的偏好。用户的数据还为其他用户提供了推荐,这些用户具有第一个用户相似的偏好和相似的人口统计学特征。
机器学习的核心是在大量数据上进行训练机器,使机器能够识别数据中的模式,从而确定使用特定输出而获得成功的可能性。
机器学习的局限性
机器学习有其局限性,事实上,当涉及到一个核心概念时,它比专家系统更糟糕:那就是可解释性。
我们可以遵循一系列if-then规则来弄清楚专家系统是如何产生特定输出的。如果结果证明他们的答案”then“是不正确的,那么就允许开发人员修复这些规则。专家系统是高度透明的,这在某些领域甚至是必要的,这是有帮助的。
如果患者询问他们的医生为什么他们诊断患有疾病,医生如果根据专家系统的输出做出诊断,那么医生可以回答这个问题。从理论上讲,他们可以通过专家系统的if-then规则读取导致其输出的信息,以及患者的诊断结果。
机器学习模型不是这种情况,它比if-then树复杂得多。机器学习模型背后的神经网络可能如下所示:
这是华威大学的典型的drop-net神经网络
如果医生根据机器学习模型的输出进行诊断,他们将无法向患者解释清楚。机器学习模型基于在数据集中自行构建的模式进行输出。人类在没有任何上下文的情况下为机器学习算法提供数据,并且该算法提供了一些基于人类目前无法识别的模式来确定结果。
机器学习模型可以基于任意数量的数据点为患者进行诊断。这可能是因为患者的CT扫描异常。也可能是因为他们的人口统计学特征,他们的名字,以及他们的保险索赔历史,比其他人更容易被诊断出患有特定疾病。医生既无法确认也无法否认。
这个问题也就是所谓的人工智能的“黑匣子”。机器学习模型可以通过以人类无法达到的规模查找数据模式来进行预测和推荐,但没有人能够解释模型如何或为何做出这些预测和建议。没有透明度,这是某些行业的一个主要问题,正如我们在报告中讨论的那样,在B2B和B2C中应用人工智能 - 有什么区别?对于计算机科学研究人员而言,黑匣子是一个令人担忧的问题,被称为“人工智能教父”的杰弗里·辛顿甚至建议“把它扔掉,然后再重新开始”。
商业领袖的经验
绝大多数商业领袖可能会考虑的人工智能解决方案,我们在Emerj所涵盖的确实是机器学习解决方案。商业领袖可以在谈话中使用人工智能,并希望他们的数据科学家能够理解他们所指的是机器学习。从历史的角度来看,专家系统通常被认为是人工智能,但是在80年代末期之前开发的计算能力通常不是人们在谈论人工智能时所指的。
有可能在未来十年或二十年内,机器学习本身将面临类似的命运,被归纳为计算机科学史的范畴,作为一种计算能力,它在当时发挥了应有的作用,但最终让位于某种更复杂,或许更具解释性的东西。再或者,机器学习可能不会被抛弃,而是变得无处不在,以至于它不再被称为人工智能。
商业领袖可以将专家系统和机器学习视为人工智能频谱的两端。现在,开发人员在开始构建人工智能解决方案时,通常不会构建专家系统; 他们建立机器学习模型。是实现人工智能相同目标的两种截然不同的方法:让计算机完成传统上为人类保留的智力任务。机器学习和专家系统是人工智能的子集,它是整个计算机科学的一个子集。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-12