简单介绍机器学习建模过程-CDA数据分析师官网

简单介绍机器学习建模过程

2019-05-20

在机器学习中，我们会遇到很多算法，而这些算法都是能够帮助机器学习解决很多问题，可以说，机器学习是整个人工智能的核心。当然，机器学习的算法特征之一就是模型，那么大家是否知道机器学习建模的过程是什么呢？下面我们就给大家介绍一下这个内容。

建模的过程离不开模型的求解，我们假设输入特征变量记为X，输出变量记为Y，他们对应的具体取值分别记为x和y，输入变量X可以是标量也可以是向量。本系列课程中除非特殊声明，否则特征向量都是列向量，因此输入实例x的列向量可以表示为：x=(x(1),x(1),...,x(i),...,x(n))T。

那么这个式子是什么意思呢？其中x(i)表示x的第i个特征值，因此x是一个具有n个特征值的特征向量。注意，我们将会使用另一种表示方法xi表示第i个输入实例。那么第i个输入实例的第k个特征值就表示为x(k)i。因此，对于具有N个训练实例的有监督学习的训练数据集就可以表示为:T={(x1,y1),(x2,y2),...,(xN,yN)}。当我们有了以上的数据表示，那么对于一个机器学习算法来说，基本上的提出过程可以总结为四个步骤。

第一就是根据特征向量的数据分布提出一个合适的模型函数 y=f(x;θ) 来估计参数分布。第二个步骤就是提出一个合适的损失函数 L(x,y) 计算对于训练数据集上的所有训练样本估计的误差损失大小：L(x,y)=1NN∑i=1L(yi,f(xi))。第三个步骤就是用合适的优化算法使得损失函数带有参数的 L(x,y) 的值最小化，即：minf∈F1NN∑i=1L(yi,f(xi))。第四个步骤就是求解最优化上述函数值得到 L(yi,f(xi)) 的最小值，从而得到原函数 y=f(x;θ) 的参数值θ的解：θ=(θ(1),θ(2),...,θ(K))。

在上述的式子中，参数个数K与模型函数 f(x;θ)相关，与特征向量维数以及数据集个数无关。这样新的类标未知的样本x就可以直接输入到函数f(x)中就可以得到新的预测类标值y。

我们为什么要重视建模过程呢？其实机器学习算法要素有四点，分别是特征、模型、策略和算法。所以我们一定要对模型给予足够重视。在这篇文章中我们给大家介绍了关于机器学习建模过程的相关知识，通过对这些知识的介绍，相信大家已经知道了机器学习建模的过程，希望这篇文章能够帮助大家更好地理解机器学习。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

特征机器学习特征向量损失函数有监督有监督学习人工智能

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇每个数据科学人都应该知道的7种回归技术

下一篇数据分析师应该懂得的技巧

简单介绍机器学习建模过程

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】解锁企业数据价值的3大关键 ——从政策 ...

【CDA案例】基于 EAST和 FineBI 实现 AARRR 信用卡 ...

【CDA干货】互联网运营必看：私域用户质量数据分析 ...

【CDA持证人案例分享】用 Excel 精准监控电商及推广 ...

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...