如何快速简单的理解决策树的概念？-CDA数据分析师官网

热线电话：13121318867

首页大数据时代如何快速简单的理解决策树的概念？

如何快速简单的理解决策树的概念？

2020-07-09

决策树(Decision Tree)是机器学习中一种常见的算法，它的思想非常朴素，就像我们平时利用选择做决策的过程。决策树是一种基本的分类与回归方法，当被用于分类时叫做分类树，被用于回归时叫做回归树。

一、决策树结构：

顾名思义，决策树在逻辑上表现为树的形式，包含有节点和向边。

一般情况下，一棵决策树包含一个根结点、若干个内部结点和若干个叶结点。

根节点：包含样本全集，从根结点到每个叶结点的路径对应了一个判定测试序列。

内部节点：表示一个特征和属性。每个内部节点都是一个判断条件，并且包含数据集中，满足从根节点到该节点所有条件的数据的集合。根据内部结点的属性测试结果，内部节点对应的数据的集合别分到两个或多个子节点中。

叶节点：表示一个类，对应于决策结果。叶节点为最终的类别，如果该数据被包含在该叶节点，则属于该类别。

如下图中，其中圆和方框分别表示内部结点和叶结点。

简而言之，决策树是一个利用树的模型进行决策的预测模型，表现出的是对象属性与对象值之间的一种映射关系，简单明了，非常容易理解。

我们决策树学习的目的是为了产生一棵泛化能力强，也就是能够高效、有效处理未见示例的决策树。

二、决策树的优缺点：

1.决策树的最大优点是，对背景知识要求不高，计算复杂度也不是很高，可以自学习。

2.属于有监督学习

3.对中间缺失值不敏感

4. 解释性强，甚至超过线性回归

5.相比传统的回归和分类方法，决策树是更接近人的决策模式

6. 能够用图形来表示，即使不是专业人士也可以轻松理解

7.可以在不创建哑变量的情况下，直接处理定性的预测变量，

8.决策树的预测准确性相比一般比回归和分类方法比较弱，但能够通过用集成学习方法组合大量决策树，这样可以显著提升树的预测效果

三、决策树的生成

决策树的生成是一个自顶向下的递归过程，其基本思想是以信息熵为度量构造一颗熵值下降最快的树，到叶子节点处的熵值为零。

在决策树算法中有三种情形导致递归返回：

1)当前节点包含的样本属于同一类，不需要划分;

2)当前属性集为空，无法进行划分。这种情况下，需要将当前结点标记成叶节点，并将其类别设定为所含样本最多的类别;利用当前结点的后验分布;(就是：有样本无属性进行划分)

3)当前结点包含的样本集合为空，不能进项划分。此时，要将当前结点标记为叶节点，将其类别设定为其父结点所含样本最多的类别;利用父结点的先验分布(就是：无样本有属性)

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

决策树有监督有监督学习线性回归集成学习特征泛化能力机器学习

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇XGBoost算法的这3类参数，你知道吗？

下一篇决策树剪枝，常用这2种方法

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

如何快速简单的理解决策树的概念？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

从表格到洞察：数据分析师视角下的表格结构数据特征 ...

【CDA干货】最大最小距离法在Kmeans聚类中的应用困 ...

【CDA干货】随机森林特征重要性分析：原理、方法与 ...

【CDA干货】用户运营核心指标：拆解、应用与优化， ...

【CDA干货】数据模型、本体模型与业务模型：区别厘 ...

表格结构数据进阶：从类型识别到功能实战 ...

【CDA干货】模型质量测试对比：方法、维度与实操指 ...

【CDA干货】Python Requests库全方位对比解析：用法 ...

数据分析第一步：你真的读懂“表格结构数据”了吗？ ...

【CDA干货】回归方程筛选主要因子：方法、计算流程 ...

【CDA干货】学习曲线：验证机器学习模型过拟合的核 ...

流程为脉，专业为核：CDA数据分析师赋能商业数据分 ...

案例分享会 | 医疗行业数据分析实践（2026.04.09） ...

【CDA干货】Tableau两列数据求同比：实操方法、场景 ...

【CDA干货】集成学习赋能模型不确定性分析：原理、 ...

可视化传声，专业赋能：CDA数据分析师玩转统计制图 ...

【CDA干货】文本挖掘技术赋能跨文化传播研究：理论 ...

【CDA干货】Python ECharts折线图：为每个数据点设 ...

范式为纲，专业为器：CDA数据分析师玩转数据分析基 ...

【CDA干货】LSTM预测结果波动：成因解析、影响评估 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载