如何快速简单的理解决策树的概念？-CDA数据分析师官网

热线电话：13121318867

首页大数据时代如何快速简单的理解决策树的概念？

如何快速简单的理解决策树的概念？

2020-07-09

决策树(Decision Tree)是机器学习中一种常见的算法，它的思想非常朴素，就像我们平时利用选择做决策的过程。决策树是一种基本的分类与回归方法，当被用于分类时叫做分类树，被用于回归时叫做回归树。

一、决策树结构：

顾名思义，决策树在逻辑上表现为树的形式，包含有节点和向边。

一般情况下，一棵决策树包含一个根结点、若干个内部结点和若干个叶结点。

根节点：包含样本全集，从根结点到每个叶结点的路径对应了一个判定测试序列。

内部节点：表示一个特征和属性。每个内部节点都是一个判断条件，并且包含数据集中，满足从根节点到该节点所有条件的数据的集合。根据内部结点的属性测试结果，内部节点对应的数据的集合别分到两个或多个子节点中。

叶节点：表示一个类，对应于决策结果。叶节点为最终的类别，如果该数据被包含在该叶节点，则属于该类别。

如下图中，其中圆和方框分别表示内部结点和叶结点。

简而言之，决策树是一个利用树的模型进行决策的预测模型，表现出的是对象属性与对象值之间的一种映射关系，简单明了，非常容易理解。

我们决策树学习的目的是为了产生一棵泛化能力强，也就是能够高效、有效处理未见示例的决策树。

二、决策树的优缺点：

1.决策树的最大优点是，对背景知识要求不高，计算复杂度也不是很高，可以自学习。

2.属于有监督学习

3.对中间缺失值不敏感

4. 解释性强，甚至超过线性回归

5.相比传统的回归和分类方法，决策树是更接近人的决策模式

6. 能够用图形来表示，即使不是专业人士也可以轻松理解

7.可以在不创建哑变量的情况下，直接处理定性的预测变量，

8.决策树的预测准确性相比一般比回归和分类方法比较弱，但能够通过用集成学习方法组合大量决策树，这样可以显著提升树的预测效果

三、决策树的生成

决策树的生成是一个自顶向下的递归过程，其基本思想是以信息熵为度量构造一颗熵值下降最快的树，到叶子节点处的熵值为零。

在决策树算法中有三种情形导致递归返回：

1)当前节点包含的样本属于同一类，不需要划分;

2)当前属性集为空，无法进行划分。这种情况下，需要将当前结点标记成叶节点，并将其类别设定为所含样本最多的类别;利用当前结点的后验分布;(就是：有样本无属性进行划分)

3)当前结点包含的样本集合为空，不能进项划分。此时，要将当前结点标记为叶节点，将其类别设定为其父结点所含样本最多的类别;利用父结点的先验分布(就是：无样本有属性)

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

决策树特征泛化能力有监督有监督学习线性回归集成学习机器学习

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇XGBoost算法的这3类参数，你知道吗？

下一篇决策树剪枝，常用这2种方法

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

如何快速简单的理解决策树的概念？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据分析全流程常见问题：成因、危害与 ...

【CDA干货】维度表与事实表：数据仓库的核心双子星 ...

CDA数据分析师：数据读取实操指南，打通数据价值转 ...

【CDA干货】用户行为分析中泛化性指标：计算方法、 ...

【CDA干货】以数为鉴，读懂用户：三大行业用户行为 ...

CDA数据分析师：量化策略分析框架，解锁数据驱动决 ...

【CDA干货】随机森林模型训练全解析：从参数调优到 ...

【CDA干货】随机森林算法重要性分析：原理、实操与 ...

CDA数据分析师：数据思维赋能企业管理，激活决策新 ...

【CDA干货】数据分析赋能价值创造：国内外知名经典 ...

【CDA干货】Python爬取163网易财经上市公司财务报表 ...

CDA数据分析师：数字化时代，数据思维的核心步骤与 ...

【CDA干货】线性回归拟合性判断实战指南：从指标解 ...

【CDA干货】安装SQL Server后提示“服务名无效”： ...

CDA数据分析师实操指南：指标体系搭建的方法与完整 ...

【CDA干货】销售额预测实战：基于时间序列与回归分 ...

【CDA干货】金融数据分析：为什么异常值处理是必做 ...

CDA数据分析师必备：指标与指标体系管理基础指南 ...

【CDA干货】数据呈现与数据分析：核心区别+实操边界 ...

【CDA干货】Pandas读取dat文件：提取第一行数据并转 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载