热线电话:13121318867

登录
2018-10-31 阅读量: 1371
朴素贝叶斯

朴素贝叶斯方法是一组监督学习算法,基于贝叶斯定理应用给定类变量值的每对特征之间的条件独立性的“天真”假设。在给定类变量y和从属特征向量x1xn,贝叶斯定理表明了以下关系:

使用条件独立假设

对于所有i,这种关系被简化为

由于P(x1,…,xn)在输入时是常数,我们可以使用以下分类规则:

我们可以使用最大后验(MAP)估计来估计 P(y)和P(xi∣y) ; 前者是 训练集中y类的相对频率。

不同的朴素贝叶斯分类器主要不同于它们对P(xi∣y)分布的假设。

尽管它们显然过于简化了假设,但朴素的贝叶斯分类器在许多实际情况中都运行良好,着名的是文档分类和垃圾邮件过滤。他们需要少量的训练数据来估计必要的参数。(由于理论上的原因,为什么朴素贝叶斯运行良好,以及它的数据类型,请参阅下面的参考资料。)

与更复杂的方法相比,朴素贝叶斯学习者和分类器可以非常快。类条件特征分布的解耦意味着每个分布可以独立地估计为一维分布。这反过来有助于缓解维度诅咒带来的问题。

另一方面,虽然朴素贝叶斯被称为一个不错的分类器,但它被认为是一个不好的估计器,所以输出的概率 predict_proba不要太认真。

0.0000
5
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子