机器学习中有监督学习和无监督学习的区别表现在什么方面？-CDA数据分析师官网

机器学习中有监督学习和无监督学习的区别表现在什么方面？

2020-07-23

机器学习主要分为：有监督学习，无监督学习，以及半监督学习等。小编今天给大家分享的主要是有监督学习和无监督学习的比较，希望对于大家机器学习有所帮助。

一、首先来了解一下有监督学习和无监督学习的概念

1、有监督学习(supervised learning)是指从给定的训练数据集中学习出一个函数(模型参数)，当新的数据到来时，可以根据这个函数预测结果。有监督学习的训练集要求包括输入输出，也可以说是特征和目标。训练集中的目标是由人标注的。

以此可以总结出有监督学习的特点：

(1)有标签的就是有监督学习。

(2) 已经标记好的数据(labelled data)，用来做训练来预测新数据的类型(class)，或者是值。预测已有类型叫做分类(classification)，预测一个值叫做回归(regression)。

(3) 常见的有监督学习算法：回归分析和统计分类。

常见的有监督学习算法：回归分析和统计分类。最典型的算法是KNN和SVM。

2、无监督学习(或者非监督学习，unsupervised learning)输入数据没有被标记，也没有确定的结果。样本数据类别未知，需要根据样本间的相似性对样本集进行分类(聚类，clustering)试图使类内差距最小化，类间差距最大化。无监督学习是另一种研究的比较多的学习方法，它与监督学习的不同之处，在于我们事先没有任何训练样本，而需要直接对数据进行建模。

无监督学习的方法分为两大类：

(1) 一类为基于概率密度函数估计的直接方法：指设法找到各类别在特征空间的分布参数，再进行分类。

(2) 另一类是称为基于样本间相似性度量的简洁聚类方法：其原理是设法定出不同类别的核心或初始内核，然后依据样本与核心之间的相似性度量将样本聚集成不同的类别。

利用聚类结果，可以提取数据集中隐藏信息，对未来数据进行分类和预测。应用于数据挖掘，模式识别，图像处理等。

PCA和很多deep learning算法都属于无监督学习。

二、有监督学习和无监督学习的区别

1.有监督学习方法必须要有训练集与测试样本。在训练集中找规律，而对测试样本使用这种规律。而无监督学习没有训练集，只有一组数据，在该组数据集内寻找规律。

2.有监督学习的方法就是识别事物，识别的结果表现在给待识别数据加上了标签。因此训练样本集必须由带标签的样本组成。而无监督学习方法只有要分析的数据集的本身，预先没有什么标签。如果发现数据集呈现某种聚集性，则可按自然的聚集性分类，但不予以某种预先分类标签对上号为目的。

3.无监督学习方法在寻找数据集中的规律性，这种规律性并不一定要达到划分数据集的目的，也就是说不一定要“分类”。在这一点上无监督学习比有监督学习方法的用途要广。

4.用无监督学习方法分析数据集的主分量与用K-L变换计算数据集的主分量又有区别。后者从方法上讲不是学习方法。因此用K-L变换找主分量不属于无监督学习方法，即方法上不是。而通过学习逐渐找到规律性这体现了学习方法这一点。在人工神经元网络中寻找主分量的方法属于无监督学习方法。

三、如何选择有监督学习和无监督学习

最简单的方法就是从定义入手，

有训练样本则考虑采用监督学习方法;

无训练样本，则一定不能用监督学习方法。

需要注意的是，实际应用中，即使在没有训练样本的情况下，我们也能够从待分类的数据中，对一些样本进行人工标注，并将它们作为训练样本，这样一来，就能够把条件进行改善，使用有监督学习方法来做。在不同的场景，正负样本的分布如果会存在偏移，这种情况下，有监督学习的效果可能没有无监督学习的效果好。

以上就是小编今天跟大家分享的关于有监督学习和无监督学习的区别。在机器学习中，有监督学习和无监督学习是最常用的两种学习方法了，大家一定要清楚两者之间的区别，以及两者的适用场景。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

无监督无监督学习有监督学习有监督机器学习特征 KNN SVM

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇机器学习中Apriori是什么？如何实现？

下一篇如何简单通俗的理解交叉熵损失函数？

机器学习中有监督学习和无监督学习的区别表现在什么方面？

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】互联网运营必看：私域用户质量数据分析 ...

【CDA持证人案例分享】用 Excel 精准监控电商及推广 ...

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...

CDA数据分析师就业班3月29日开班，仅剩1个名额 ...

【案例】网飞Netflix流量漏斗分析案例 ...