如何简单通俗的理解交叉熵损失函数？-CDA数据分析师官网

如何简单通俗的理解交叉熵损失函数？

2020-07-24

前面小编给大家简单介绍过损失函数，今天给大家继续分享交叉熵损失函数，直接来看干货吧。

一、交叉熵损失函数概念

交叉熵损失函数CrossEntropy Loss，是分类问题中经常使用的一种损失函数。公式为：

接下来了解一下交叉熵：交叉熵Cross Entropy，是Shannon信息论中一个重要概念，主要用于度量两个概率分布间的差异性信息。在信息论中，交叉熵是表示两个概率分布p,q，其中p表示真实分布，q表示非真实分布，在相同的一组事件中，其中，用非真实分布q来表示某个事件发生所需要的平均比特数。

交叉熵的计算方式如下：

交叉熵可在机器学习中作为损失函数，p代表真实标记的分布，q则代表训练后的模型的预测标记分布，交叉熵损失函数可以衡量p与q的相似性。交叉熵作为损失函数还有一个好处是：使用sigmoid函数在梯度下降时，可以避免均方误差损失函数学习速率下降的问题，这是因为学习速率是能够被输出的误差所控制的。

二、交叉熵损失函原理

一般我们学习交叉熵损失函数是在二元分类情况下，就比如逻辑回归「Logistic Regression」、神经网络「Neural Network」等，其真实样本的标签为 [0.1]，分别表示负类和正类。模型的最后通常会经过一个 Sigmoid 函数，输出一个概率值，这个概率值反映了预测为正类的可能性：概率越大，可能性越大。

其中s是模型上一层的输出，sigmoid函数有这样的特点：s = 0 时，g(s) = 0.5; s >> 0 时，g ≈ 1.s << 0 时，g ≈ 0.显然，g(s) 将前一级的线性输出映射到[0. 1]之间的数值概率上，这里g(s)就是交叉熵公式中的模型预测输出。

预测输出也就是， Sigmoid 函数的输出，表示当前样本标签为 1 的概率：

y^=P(y=1|x)

那么，当前样本标签为 0 的概率就可以表示为：

1−y^=P(y=0|x)

从极大似然性的角度考虑，将上面两种情况进行整合：

也就是：

当真实样本标签 y = 0 时，上面式子第一项就为 1.概率等式转化为：

P(y=0|x)=1−y^

当真实样本标签 y = 1 时，上面式子第二项就为 1.概率等式转化为：

P(y=1|x)=y^

这两种情况下的概率表达式跟原来的完全相同，只是将两种情况进行了整合。

接下来我们重点看一下整合之后的概率表达式，概率 P(y|x) 越大越好。因为 log 运算并不会影响函数本身的单调性，所以将log 函数引入P(y|x)。于是就有：

log P(y|x)=log(y^y⋅(1−y^)1−y)=ylog y^+(1−y)log(1−y^)

log P(y|x) 越大越好，反过来说也就是，只需要 log P(y|x) 的负值 -log P(y|x) 越小就可以了。引入损失函数，而且使得 Loss = -log P(y|x)即可。那么就能得到损失函数为：

如果是计算N个样本的总损失函数的情况，则只需要将N个Loss叠加起来

三、交叉熵损失函数的优缺点分析

1.使用逻辑函数得到概率，并结合交叉熵当损失函数时，当模型效果差的时，学习速度较快，模型效果好时，学习速度会变慢。

2.采用了类间竞争机制，比较擅长于学习类间的信息，但是只关心对于正确标签预测概率的准确性，而忽略了其他非正确标签的差异，从而导致学习到的特征比较散。

以上就是小编今天跟大家分享的关于交叉熵损失函数概念和原理的相关介绍，希望对于大家有所帮助。

相信读完上文，你对算法已经有了全面认识。若想进一步探索机器学习的前沿知识，强烈推荐机器学习之半监督学习课程。

学习入口：https://edu.cda.cn/goods/show/3826?targetId=6730&preview=0
涵盖核心算法，结合多领域实战案例，还会持续更新，无论是新手入门还是高手进阶都很合适。赶紧点击链接开启学习吧！

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

损失函数机器学习概率分布特征逻辑回归神经网络监督学习半监督

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇机器学习中有监督学习和无监督学习的区别表现在什么方面？

下一篇一文带你快速了解机器学习中的多元线性回归到底是什么？

如何简单通俗的理解交叉熵损失函数？

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】互联网运营必看：私域用户质量数据分析 ...

【CDA持证人案例分享】用 Excel 精准监控电商及推广 ...

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...

CDA数据分析师就业班3月29日开班，仅剩1个名额 ...

【案例】网飞Netflix流量漏斗分析案例 ...