机器学习中的基础知识（三）-CDA数据分析师官网

机器学习中的基础知识（三）

2019-02-19

通过前两篇文章我们给大家介绍了机器学习的相关概念，我们不难看出，机器学习的知识是十分零碎的，这是因为机器学习涉及到的知识有很多，在这篇文章中我们继续为大家介绍机器学习的知识，希望这篇文章能够给大家带来帮助。

（1）分类阈值应用于模型的预测分数以分离正类别和负类别的一种标量值标准。当需要将 logistic 回归的结果映射到二元分类模型中时就需要使用分类阈值。

（2）凸函数就是一种形状大致呈字母 U 形或碗形的函数。然而，在退化情形中，凸函数的形状就像一条线。凸函数是很常用的损失函数。因为当一个函数有最小值的时候，梯度下降的各种变化都能保证找到接近函数最小值的点。类似的，随机梯度下降的各种变化有很大的概率找到接近函数最小值的点。两个凸函数相加后仍然是凸函数。深度模型通常是非凸的。

（3）早期停止法就是一种正则化方法，在训练损失完成下降之前停止模型训练过程。当验证数据集的损失开始上升的时候，即泛化表现变差的时候，就该使用早期停止法了。

（4）交叉熵就是多类别分类问题中对 Log 损失函数的推广。交叉熵量化两个概率分布之间的区别。

（5）密集特征就是大多数取值为非零的一种特征，通常用取浮点值的张量表示。和稀疏特征相反。

（6）派生特征是合成特征的同义词。

（7）离散特征就是只有有限个可能取值的一种特征。和连续特征（continuous feature）对照。

（8）dropout 正则化就是训练神经网络时一种有用的正则化方法。dropout 正则化的过程是在单次梯度计算中删去一层网络中随机选取的固定数量的单元。删去的单元越多，正则化越强。

（9）动态模型是以连续更新的方式在线训练的模型。即数据连续不断的输入模型。

（10）数据集就是样本的集合。

（11）决策边界在一个二元分类或多类别分类问题中模型学习的类别之间的分离器。

（12）深度模型是一种包含多个隐藏层的神经网络。深度模型依赖于其可训练的非线性性质。和宽度模型对照。

在这篇文章中我们给大家介绍了很多有关机器学习的概念，通过这些概念我们不难发现人工智能和机器学习都是很多学科交叉而成，尤其是离不开数学，所以我们一定要重视数学的学习。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

特征机器学习神经网络损失函数人工智能

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇机器学习中的基础知识（二）

下一篇机器学习中的基础知识（四）

机器学习中的基础知识（三）

CDA考试动态

CDA报考指南

热门栏目

最新资讯

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...

CDA数据分析师就业班3月29日开班，仅剩1个名额 ...

【案例】网飞Netflix流量漏斗分析案例 ...

tensorflow_datasets 如何load本地的数据集？ ...

《CDA二级教材》试读版上线CDA网校，助你轻松拿下二 ...

【干货】3步带你画出用户DNA，精准营销更进一步 ...

什么是随机森林，它的优缺点是什么？：面试标准答案 ...

【干货】电商营收暴跌40%，如何排查？ ...

【干货】如何通过精细化运营提升 DAU 指标？ ...