R语言分类算法之随机森林-CDA数据分析师官网

R语言分类算法之随机森林

2017-05-29

1.原理分析:
随机森林是通过自助法(boot-strap)重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练集样本集合,然后根据自助样本集生成k个决策树组成的随机森林,新数据的分类结果按照决策树投票多少形成的分数而定.
通俗的理解为由许多棵决策树组成的森林,而每个样本需要经过每棵树进行预测,然后根据所有决策树的预测结果最后来确定整个随机森林的预测结果.随机森林中的每一颗决策树都为二叉树,其生成遵循自顶向下的递归分裂原则,即从根节点开始依次对训练集进行划分.在二叉树中,根节点包含全部训练数据,按照节点不纯度最小原则,分裂为左节点和右节点,他们分别包含训数据的一个子集,按照同样的规则,节点继续分裂,直到满足分支停止规则,停止生长.
1.首先我们用N来表示原始训练集样本的个数,用M来表示变量的数目.
2.其次我们需要确定一个定值m,该值被用来决定当在一个节点上做决定时,会使用到多少个变量.m

fit_rf=randomForest(Species~.,data=data_train,mtry=4,importance=TRUE,ntree=1000)
fit_rf[1:length(fit_rf)]

2)作图

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想查询CDA考试成绩，点击>>> “CDA成绩” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想获取CDA考试时间/费用/条件/大纲/通过率，点击 >>>“CDA考试官网” 了解CDA考试详情；

随机森林决策树 R语言

数据分析咨询请扫描二维码

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

R语言分类算法之随机森林

CDA考试动态

CDA报考指南

热门栏目

最新资讯

没学历没经验，如何入职大厂？5年字节数据分析经验 ...

【热议话题】一个人为何会陷入社会底层 ...

数据分析师应该会哪些编程语言

学好数据分析需要掌握哪些技能

数据分析需要做什么步骤

制作简洁而美观的数据分析图表

当前发展最快的行业及趋势

数据分析师需要掌握哪些专业技能

大数据分析常用的技术和方法

数据分析师的工作流程

数据分析的主要方法和技巧

数据分析的行业需求与就业前景

数据分析专业值得选择吗

适合数据分析专业学生的实习岗位

数据分析工作薪资水平如何

数据分析专业的就业岗位

数据分析师的工作流程都是怎样的

数据分析师必学的统计学知识

数据分析师的工作目标与职责

数据分析师的核心能力是什么