
从朴素贝叶斯分类器到贝叶斯网络
一、贝叶斯公式(一些必备的数学基础)
贝叶斯(Thomas Bayes)是生活在十八世纪的一名英国牧师和数学家。因为历史久远,加之他没有太多的著述留存,今天的人们对贝叶斯的研究所知甚少。唯一知道的是,他提出了概率论中的贝叶斯公式。但从他曾经当选英国皇家科学学会会员(类似于院士)来看,他的研究工作在当时的英国学术界已然受到了普遍的认可。
事实上,在很长一段时间里,人们都没有注意到贝叶斯公式所潜藏的巨大价值。直到二十世纪人工智能、机器学习等崭新学术领域的出现,人们才从一堆早已蒙灰的数学公式中发现了贝叶斯公式的巨大威力。为了方便后续内容的介绍,这里我们先来简单复习一下概率论中的一些基本知识。
事件A在另外一个事件B已经发生条件下的发生概率,称为条件概率,记为P(A|B)。
两个事件共同发生的概率称为联合概率。A与B的联合概率表示为 P(AB) 或者P(A,B)。
进而有,P(AB) = P(B)P(A|B)=P(A)=P(B|A)。这也就导出了最简单形式的贝叶斯公式,即
P(A|B)=P(B|A)*P(A)/P(B)
以及条件概率的链式法则
P(A1,A2,...,An) = P(An|A1,A2,...,An-1)P(An-1|A1,A2,...,An-2)...P(A2|A1)P(A1)
概率论中还有一个全概率公式
由此可进一步导出完整的贝叶斯公式
二、朴素贝叶斯分类器(Naïve Baysian classifier)
分类是机器学习和数据挖掘中最基础的一种工作。假设现在我们一组训练元组(Training tuples),或称训练样例,以及与之相对应的分类标签(Class labels)。每个元组都被表示成n维属性向量X=(x1, x2, ..., xn)的形式,而且一共有K个类,标签分别为C1, C2, ..., Ck。分类的目的是当给定一个元组X时,模型可以预测其应当归属于哪个类别。
朴素贝叶斯分类器的原理非常简单,就是基于贝叶斯公式进行推理,所以才叫做“朴素”。对于每一个类别Ci, 利用贝叶斯公式来估计在给定训练元组X时的条件概率p(Ci|X),即
P(Ci|X) = P(X|Ci)P(Ci)/P(X)
当且仅当概率P(Ci|X)在所有的P(Ck|X)中取值最大时,就认为X属于Ci。更进一步,因为P(X)对于所有的类别来说都是恒定的,所以其实只需要P(Ci|X) = P(X|Ci)P(Ci)最大化即可。
应用朴素贝叶斯分类器时必须满足条件:所有的属性都是条件独立的。也就是说,在给定条件的情况下,属性之间是没有依赖关系的。即
为了演示贝叶斯分类器,来看下面这个例子。我们通过是否头疼、咽痛、咳嗽以及体温高低来预测一个人是普通感冒还是流感。
上面是我们提供的训练数据。现在有一个病人到诊所看病,他的症状是:severeheadache, no soreness, normaltemperature and with cough。请问他患的是普通感冒还是流感?分析易知,这里的分类标签有Flu 和Cold两种。于是最终要计算的是下面哪个概率更高。
P( Flu| Headache = severe, Sore = no,Temperature = normal, Cough = yes)
≅P(Flu)*P(Headache= severe|Flu)*P(Sore= no|Flu)*P(Temperature= normal |Flu)*P(Cough = yes|Flu)
P( Cold| Headache = severe, Sore = no,Temperature = normal, Cough = yes)
≅P(Cold)*P(Headache= severe|Cold)*P(Sore= no|Cold)*P(Temperature= normal |Cold)*P(Cough = yes |Cold)
为了计算上面这个结果,我们需要通过已知数据(训练数据)让机器自己“学习”(建立)一个“模型”。由已知模型很容以得出下表中的结
以及
e= small value = 10^-7(one can use e to be less than 1/n where n is the number of training instances)
P( Flu| Headache = severe, Sore = no,Temperature = normal, Cough = yes)
= P(Flu)*P(Headache = severe|Flu)*P(Sore= no|Flu)*P(Temperature = normal |Flu)*P(Cough = yes|Flu)
= 3/5 × 2/3 × e × 2/3 × 3/3 = 0.26e
P( Cold| Headache = severe, Sore = no,Temperature = normal, Cough = yes)
~ P(Cold)*P(Headache =severe|Cold)*P(Sore = no|Cold)*P(Temperature = normal |Cold)*P(Cough = yes|Cold)
= 2/5 × e × ½ × 1 × ½ = 0.1e
显然P(Flu) > P(Cold),所以我们的诊断(预测,分类)结果是 Flu。
最后讨论一下朴素贝叶斯分类器的特点(来自网上资料总结,我就不翻译了):
我们将把贝叶斯网络留待下一篇文章中介绍(未完,待续...)。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
全球第一!上交AI智能体炼成Kaggle特级大师登顶OpenAI MLE-bench 编辑:KingHZ 好困 【新智元导读】刚刚,由上海交通大学人 ...
2025-07-02探索最优回归方程:数据背后的精准预测密码 在数据分析和统计学的广阔领域中,回归分析是揭示变量之间关系的重要工具,而回 ...
2025-07-02CDA 证书:银行招聘中的 “黄金通行证” 在金融科技飞速发展的当下,银行正加速向数字化、智能化转型,海量数据成为 ...
2025-07-02CDA 数据分析师报考条件全解析:开启数据洞察之旅 在当今数字化浪潮席卷全球的时代,数据已成为企业乃至整个社会发展的核心驱 ...
2025-07-01深入解析 SQL 中 CASE 语句条件的执行顺序 在 SQL 编程领域,CASE语句是实现条件逻辑判断、数据转换与分类的重要工 ...
2025-07-01SPSS 中计算三个变量交集的详细指南 在数据分析领域,挖掘变量之间的潜在关系是获取有价值信息的关键步骤。当我们需要探究 ...
2025-07-01CDA 数据分析师:就业前景广阔的新兴职业 在当今数字化时代,数据已成为企业和组织决策的重要依据。数据分析师作为负责收集 ...
2025-06-30探秘卷积层:为何一个卷积层需要两个卷积核 在深度学习的世界里,卷积神经网络(CNN)凭借其强大的特征提取能力 ...
2025-06-30探索 CDA 数据分析师在线课程:开启数据洞察之旅 在数字化浪潮席卷全球的当下,数据已成为企业决策、创新与发展的核心驱 ...
2025-06-303D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32% 编辑:LRST 【新智元导读】中科院自动化所提出BridgeVLA模型,通过将 ...
2025-06-30LSTM 为何会产生误差?深入剖析其背后的原因 在深度学习领域,LSTM(Long Short-Term Memory)网络凭借其独特的记忆单元设 ...
2025-06-27LLM进入拖拽时代!只靠Prompt几秒定制大模型,效率飙升12000倍 【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新 ...
2025-06-27探秘 z-score:数据分析中的标准化利器 在数据的海洋中,面对形态各异、尺度不同的数据,如何找到一个通用的标准来衡量数据 ...
2025-06-26Excel 中为不同柱形设置独立背景(按数据分区)的方法详解 在数据分析与可视化呈现过程中,Excel 柱形图是展示数据的常用工 ...
2025-06-26CDA 数据分析师会被 AI 取代吗? 在当今数字化时代,数据的重要性日益凸显,数据分析师成为了众多企业不可或缺的角色 ...
2025-06-26CDA 数据分析师证书考取全攻略 在数字化浪潮汹涌的当下,数据已成为企业乃至整个社会发展的核心驱动力。数据分析师作 ...
2025-06-25人工智能在数据分析的应用场景 在数字化浪潮席卷全球的当下,数据以前所未有的速度增长,传统的数据分析方法逐渐难以满足海 ...
2025-06-25评估模型预测为正时的准确性 在机器学习与数据科学领域,模型预测的准确性是衡量其性能优劣的核心指标。尤其是当模型预测结 ...
2025-06-25CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-06-24金融行业的大数据变革:五大应用案例深度解析 在数字化浪潮中,金融行业正经历着深刻的变革,大数据技术的广泛应用 ...
2025-06-24