数据挖掘中的经典算法-CDA数据分析师官网

数据挖掘中的经典算法

2019-04-12

大家都知道，数据挖掘中有很多的算法，不同的算法有着不同的优势，它们在数据挖掘领域都产生了极为深远的影响。那么大家知道不知知道数据挖掘中的经典算法都有哪些呢？在这篇文章中我们就给大家介绍数据挖掘中三个经典的算法，希望这篇文章能够更好的帮助大家。

1.K-Means算法

K-means algorithm算法是一个聚类算法，把n的对象根据他们的属性分为k个分割，k大于n。它与处理混合正态分布的最大期望算法很相似，因为他们都试图找到数据中自然聚类的中心。它假设对象属性来自于空间向量，并且目标是使各个群组内部的均方误差总和最小。这种算法在数据挖掘中是十分常见的算法。

2.支持向量机

而Support vector machines就是支持向量机，简称SV机（论文中一般简称SVM）。它是一种监督式学习的方法，这种方法广泛的应用于统计分类以及回归分析中。支持向量机将向量映射到一个更高维的空间里，在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大，分类器的总误差越小。这些优点也就成就了这种算法。

3.C4.5算法

然后我们给大家说一下C4.5算法，C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法. C4.5算法继承了ID3算法的优点，并对ID3算法进行了改进，这种改进具体体现在四个方面，第一就是在树构造过程中进行剪枝，第二就是能够完成对连续属性的离散化处理，第三就是用信息增益率来选择属性，克服了用信息增益选择属性时偏向选择取值多的属性的不足，第四就是能够对不完整数据进行处理。那么这种算法的优点是什么呢？优点就是产生的分类规则易于理解，准确率较高。其缺点是：在构造树的过程中，需要对数据集进行多次的顺序扫描和排序，因而导致算法的低效。

相信大家看了这篇文章以后对The k-means algorithm算法、Support vector machines、C4.5算法有了比较是深刻的了解，其实这三种算法那都是十分重要的算法，能够帮助数据挖掘解决更多的问题。大家在学习数据挖掘的时候一定要注意好这些问题。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

数据挖掘 D3 支持向量机 SVM 正态分布决策树机器学习

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇大数据发展面临的挑战是什么？

下一篇数据挖掘中数据的格式

数据挖掘中的经典算法

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【干货】“数据又崩了”？其实是你还不会做归因分析 ...

【CDA干货】解锁企业数据价值的3大关键 ——从政策 ...

【CDA案例】基于 EAST和 FineBI 实现 AARRR 信用卡 ...

【CDA干货】互联网运营必看：私域用户质量数据分析 ...

【CDA持证人案例分享】用 Excel 精准监控电商及推广 ...

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...