朴素贝叶斯_CDA答疑社区

热线电话：13121318867

登录

809669515

2018-10-31 阅读量: 1474

朴素贝叶斯

朴素贝叶斯方法是一组监督学习算法，基于贝叶斯定理应用给定类变量值的每对特征之间的条件独立性的“天真”假设。在给定类变量y和从属特征向量x1到xn，贝叶斯定理表明了以下关系：

使用条件独立假设

对于所有i，这种关系被简化为

由于P(x1,…,xn)在输入时是常数，我们可以使用以下分类规则：

我们可以使用最大后验（MAP）估计来估计 P(y)和P(xi∣y) ; 前者是训练集中y类的相对频率。

不同的朴素贝叶斯分类器主要不同于它们对P(xi∣y)分布的假设。

尽管它们显然过于简化了假设，但朴素的贝叶斯分类器在许多实际情况中都运行良好，着名的是文档分类和垃圾邮件过滤。他们需要少量的训练数据来估计必要的参数。（由于理论上的原因，为什么朴素贝叶斯运行良好，以及它的数据类型，请参阅下面的参考资料。）

与更复杂的方法相比，朴素贝叶斯学习者和分类器可以非常快。类条件特征分布的解耦意味着每个分布可以独立地估计为一维分布。这反过来有助于缓解维度诅咒带来的问题。

另一方面，虽然朴素贝叶斯被称为一个不错的分类器，但它被认为是一个不好的估计器，所以输出的概率 predict_proba不要太认真。

0.0000

0

5

关注作者

收藏

评论(0)

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子