神经网络的关键是什么-CDA数据分析师官网

神经网络的关键是什么

2018-07-25

神经网络的关键是什么

相对于传统的线性和非线性方法，为什么神经网络会如此强大？

当你有一个线性模型，每一个功能要么对你有帮助，要么对你有伤害，这种假设是线性模型中固有的。因此线性模型要么功能异常强大，用类1表示；要么则毫无用处，用类2表示。所有的解决方案，要么导致该功能获得巨大的价值；要么价值变得微不足道。你永远不会有这么一个状态说，在这个区间，该功能就是代表类1；但是在另一个区间，它代表类2。

线性和非线性方法局限性很大。也就是说，如果你分析图片，举个例子，寻找狗狗的照片，它很可能会进入到一个特定的子集里面，比如只显示有一只狗的照片，或是显示某一像素和其他类型的图片。在线性模式里面，你无法确定复杂的关系集。相比于线性模型，非线性模型可能会显得更强大一些，但是这种模式同样难以训练。我们会再一次进入到所谓最优化理论的问题之中，这也是我们在很长一段时间里认为神经网络还不是足够好的原因之一，因为他们会“过拟合”，通俗的说，就是太过强大。我们无法做预测，也无法确保最优化方案。或许，这可能就是为什么神经网络从当下暂时消失的原因吧。

在神经网络理论中，机器学习有很多分支和方法，你能总结一些关键方法吗？

到目前为止，最成功的方法是监督学习方法，它使用了一个比较老的算法，称为反向传播，构建了一个拥有许多不同输出的神经网络。

让我们看下一个神经网络构建，这个网络已经非常流行了，叫做卷积神经网络。这个理念是机器学习研究人员构建了一个多层架构的模型，每一层都可以用不同的方法处理之前一层的连接。

在第一层，你有一个窗口，上面会给图像分配权值，它也变成了该层的输入。由于权值“卷积”，该层也被称为卷积层，它会自我重叠。接着后面会有若干个不同类型的层，每层都有不同的属性，绝大多数都是非线性的。

最后一层会有1万个潜在神经元输入，那些激活的神经输出，每一个都对应了一个特殊的标签，可以用来识别图像。第一类可能是一只猫，第二类可能是一辆车，以此推到所有一万个类，这样一张“图像网”就出来了。如果第一个神经元（一只猫）与1万个神经元中绝大多数都匹配，那么这张图像就能被识别出来，是一张猫的图像。

这种监督学习方法的缺点是，在训练的时候，你必须要在图像上应用标签，这是一辆车，这是一个动物园等。

没错，那么无监督学习方法呢？

无监督学习方法还不是那么受欢迎，它涉及到“自编码器”。这种神经网络不会用来分类图像，但是可以压缩图像。同我刚才提及的方法来读取图像，识别一个权值，并在一个卷积层内用像素填满。其他若干层也这样，包括相比于其它层小的多的中间层。这样做的话，相关的神经元会变得很少，基本上，你读取图像时会进入到一个瓶颈，之后从另一边走出来，并尝试重新构建该图像。

在无监督学习训练下，不需要打标签，因为你所做的就是把图像放入到神经网络的两端，然后训练网络适应图像，特别是训练中间层。一旦你这么做了，那么就拥有了一个知道如何压缩图像的神经网络。无监督学习方法可以给你提供能应用在其他分类器的功能，因此如果你有哪怕一点点标签训练数据，没问题，它一样可以为你提供大量图像。你可以把这些图像看做是无标签训练数据，并使用这些图像构建一个“自编辑器”，然后从这个自编辑器中导出一些功能，这些功能适合使用一些训练数据，以此找到对特殊模型敏感的自动编码神经网络中的神经元。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

神经网络无监督学习无监督机器学习过拟合

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇量化模型的八种基础

下一篇简介Python设计模式中的代理模式与模板方法模式编程

神经网络的关键是什么

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【干货】“数据又崩了”？其实是你还不会做归因分析 ...

【CDA干货】解锁企业数据价值的3大关键 ——从政策 ...

【CDA案例】基于 EAST和 FineBI 实现 AARRR 信用卡 ...

【CDA干货】互联网运营必看：私域用户质量数据分析 ...

【CDA持证人案例分享】用 Excel 精准监控电商及推广 ...

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...