首页 > 行业图谱 >

- R语言使用boosting方法对数据分类与交叉验证
2018-01-19
-
R语言使用boosting方法对数据分类与交叉验证
数据分类说明
与bagging方法类似,boosting算法也是先获得简单的分类器,然后通过调整错分样本的权重逐步改进分类器,使得后续分类器能够学习前一轮分类器,adab ...

- R语言使用随机森林方法对数据分类
2018-01-19
-
R语言使用随机森林方法对数据分类
说明
随机森林是另一类可用的集成学习方法,该算法在训练过程中将产生多棵决策树,每棵决策树会根据输入数据集产生相应的预测输出,算法采用投票机制选择类别众数做为预测 ...

- R语言利用ROCR评测模型的预测能力
2018-01-19
-
R语言利用ROCR评测模型的预测能力
说明
受试者工作特征曲线(ROC),这是一种常用的二元分类系统性能展示图形,在曲线上分别标注了不同切点的真正率与假正率。我们通常会基于ROC曲线计算处于曲线下方的面积AU ...

- R语言基于模型的聚类方法处理
2018-01-18
-
R语言基于模型的聚类方法处理
说明
与使用启发式方法而非依赖某个形式化模型的层次聚类和K均值聚类不同,基于模型的聚类算法假设存在多种数据模型,并使用EM算法来判断可能性最大的数据模型作为对数据处理进 ...

- R语言使用密度聚类笔法处理数据
2018-01-18
-
R语言使用密度聚类笔法处理数据
说明
除了使用距离作为聚类指标,还可以使用密度指标来对数据进行聚类处理,将分布稠密的样本与分布稀疏的样本分离开。DBSCAN是最著名的密度聚类算法。
操作
将使用mlb ...

- R语言获取优化的k均值聚类
2018-01-17
-
R语言获取优化的k均值聚类
k均值算法效率快也易于实现,但在算法开始要求提前规定好簇K的数目,因此我们可以使用距离的平方和确定那个K值能够得到最好的k均值聚类效果。
操作
执行以下操作为K均值算法找到最合 ...

- R语言使用逻辑回归分类算法
2018-01-15
-
R语言使用逻辑回归分类算法
逻辑回归属于概率统计的分类算法模型的算法,是根据一个或者多个特征进行类别标号预测。在R语言中可以通过调用logit函数执行逻辑回归分类算法并预测输出概率。通过调用glm函数将fami ...

- R语言线性回归诊断
2018-01-15
-
R语言线性回归诊断
回归诊断主要内容
(1).误差项是否满足独立性,等方差性与正态
(2).选择线性模型是否合适
(3).是否存在异常样本
(4).回归分析是否对某个样本的依赖过重,也就是模型是否具有稳定性
(5).自变量 ...

- R语言调用rlm函数生成稳建回归模型
2018-01-15
-
R语言调用rlm函数生成稳建回归模型
数据中的孤立点会对回归直线的正确性带来一定的影响,除了去掉孤立点,我们也可以用稳建回归来处理包括孤立点的数据集。
数据准备
准备好包含孤立点,并且孤立点会影响回归模 ...

- R语言中qplot()的用法
2018-01-15
-
R语言中qplot()的用法
a, b, c, d, e, f, g, h = range(8)
ggplot2()函数
ggplot2是一个强大的作图工具,它可以让你不受现有图形类型的限制,创造出任何有助于解决你所遇到问题的图形。
qplot()
qplot()属于gg ...

- R语言回归分析之影响分析
2018-01-14
-
R语言回归分析之影响分析
说明
影响分析就是探查对估计有异常影响的数据,如果一个样本不遵从某个模型,但是其余数据遵从这个模型,称为这个样本点为强影响点,也称为高杠杆点,影响分析的一个重要功能就是 ...

- R语言与回归分析几个假设的检验
2018-01-14
-
R语言与回归分析几个假设的检验
一、从线性回归的假设说起
对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫条 ...

- R语言与显著性检验学习笔记
2018-01-14
-
R语言与显著性检验学习笔记
一、何为显著性检验
显著性检验的思想十分的简单,就是认为小概率事件不可能发生。虽然概率论中我们一直强调小概率事件必然发生,但显著性检验还是相信了小概率事件在我做的这一 ...

- R语言 画图时常用命令
2018-01-09
-
R语言 画图时常用命令
生成图片 存储图片 存储图片格式 存储位置的方式 画图的常用命令
第一种png格式
png(file=\"myplot.png\", bg=\"transparent\")
画图程序
dev.off()
第二 ...

- 利用R语言如何去除字符串中成对的括号
2018-01-08
-
利用R语言如何去除字符串中成对的括号
近日,遇到一个问题,编写程序,删除任意字符串中包含的所有成对的括号及括号里面的字符,如字符“AB(CD)EFG(I)JK”处理成“ABEFJK”我们来利用R语言中的正则化表达式实现 ...

- R语言:文本(字符串)处理与正则表达式
2018-01-07
-
R语言:文本(字符串)处理与正则表达式
处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍 ...

- R语言 字符串的处理(解析+案例)
2018-01-06
-
R语言 字符串的处理(解析+案例)
数据分析师的日常工作就是数据预处理,数据预处理最经常遇到的问题就是字符串的处理,这部分很难,我以前看过一些R的书和一些技术博客,现在依旧发现有些细节做不好,下面我就 ...

- R语言中字符串的拼接操作
2018-01-06
-
R语言中字符串的拼接操作
在R语言中 paste 是一个很有用的字符串处理函数,可以连接不同类型的变量及常量。
函数paste的一般使用格式为:
paste(..., sep = \" \", collapse = NULL)
其中…表示一个或多个R可以 ...

- R语言xgboost自定义目标函数
2018-01-06
-
R语言xgboost自定义目标函数
要自定义xgboost的目标函数,有两种方式
自定义目标函数(objective)
自定义评价函数(feval)。
如果是自定义目标函数你需要求解该目标函数的 ...
- R语言实现数据操作
2017-12-17
-
R语言实现数据操作
1.选择与查看数据
#选定数据
>data(iris)
#查看数据,按列展开,观测数据类型
>str(iris)
\'data.frame\': 150 obs. of 5 variables:
$ Sepal.Length: num&nb ...