首页 > 行业图谱 >

- R语言:数据处理包dplyr的函数
2017-07-07
-
R语言:数据处理包dplyr的函数
dplyr专注处理dataframe对象, 并提供更稳健的与其它数据库对象间的接口。
一、5个关键的数据处理函数:
select() 返回列的子集
filter() 返回行的子 ...

- R语言—日常随笔
2017-07-07
-
R语言—日常随笔
1.字符处理函数:paste()
需求:将字符向量中的字符串,用逗号隔开,合并为一句话。
> ##字符向量
> ls_1
[1] \"天津\" \"上海\" \"安徽\" \"福建\" \"四川\" \"重庆\" \"陕西\" \"青海\" \" ...

- R语言分类算法之线性判别分析(Linear Discriminant Analysis)
2017-07-02
-
R语言分类算法之线性判别分析(Linear Discriminant Analysis)
1.线性判别原理解析
基本思想是”投影”,即高纬度空间的点向低纬度空间投影,从而简化问题的处理.在原坐标系下,空间中的点可能很难被分开, ...

- R语言实现分层抽样(Stratified Sampling)以iris数据集为例
2017-07-02
-
R语言实现分层抽样(Stratified Sampling)以iris数据集为例
1.观察数据集
head(iris)
选取数据集中前6个数据,我们可以看出iris数据集一共有5个字段。
dim(iris)
iris数据集一 ...

- R语言进行中文分词和聚类
2017-07-02
-
R语言进行中文分词和聚类
由于时间较紧,且人手不够,不能采用分类方法,主要是没有时间人工分类一部分生成训练集……所以只能用聚类方法,聚类最简单的方法无外乎:K-means与层次聚类。
尝试过使用K-means ...

- 回归预测及R语言实现Part2回归R语言实现
2017-07-02
-
回归预测及R语言实现Part2回归R语言实现
下面是回归分析的各种变体的简单介绍,解释变量和相应变量就是指自变量和因变量。
常用普通最小二乘(OLS)回归法来拟合实现简单线性、多项式和多元线性等回归模 ...

- R语言决策树
2017-07-01
-
决策树是曲线图,表示在树的形式的选择和它们的结果。图中的节点表示一个事件或选择,以及图形的边表示所述决策规则或条件。它主要使用是在机器学习和数据挖掘应用程序中使用R语言。
使用决策树的一个例子 - 预测 ...

- R语言随机森林
2017-07-01
-
R语言随机森林
在随机森林做法是由大量的决策树来创建的。每个观察被送入每一个决定树。对于每个观测的最常见的结果被用作最终的输出。一个新的观察被送入所有树,并采取多数表决每个分类模型。
错误估算出 ...

- R语言生存分析
2017-07-01
-
R语言生存分析
生存分析涉及预测当特定事件将要发生的时间。它也被称为故障时间分析,或死亡时间的分析。例如,预测天的人患有癌症将生存的数量和预测时间时机械系统是要失败。
在R中包名为 survival 是用来 ...

- R语言卡方检验
2017-07-01
-
R语言卡方检验
卡方检验是一种统计方法,以确定两个分类变量之间有一个显著的相关性。 这两项变量应该是从同一个群体,它们应该是分类如 - Yes/No,
Male/Female, Red/Green
等。例如,我们可以建立与人 ...

- R语言泊松回归
2017-06-24
-
R语言泊松回归
泊松回归涉及回归模型,其中,应变量是计数且不是为分数的形式。例如出生或足球比赛系胜场数的列的计数。响应变量的值遵循泊松分布。
对于泊松回归一般的数学公式是:
log(y) = a + b1x1 + b2 ...

- R语言二项分布
2017-06-24
-
R语言二项分布
二项式分布模型涉及寻找具有在一系列实验中只有两种可能的结果的事件的成功的概率。对于一个硬币的例子折腾总是给出一个正面或反面。发现正是3个正面,在反复掷硬币10次的概率是二项分布估计的期 ...

- R语言逻辑回归
2017-06-24
-
R语言逻辑回归
逻辑回归是回归模型,其中响应变量(因变量)具有明确的值,如:True/False或0/1。 它实际测量二元响应作为响应变量,是基于与预测变量有关它的数学方程的值的概率。
逻辑回归一般的数学公 ...

- R语言多元回归
2017-06-20
-
R语言多元回归
多元回归是线性回归成多于两个变量之间关系的延伸。在简单的线性关系,我们有一个预测值和一个响应变量,但在多元回归我们有一个以上的预测值变量和一个响应变量。
对于多元回归的一般数 ...

- R语言均值,中位数和模式
2017-06-20
-
R语言均值,中位数和模式
在R统计分析是通过用许多内置函数来执行的。 大多数这些函数是R基本包的一部分。这些函数需要R向量作为输入参数并给出结果。
我们正在讨论本章中的函数是平均数,中位数和模式。
...

- R语言散点图
2017-06-20
-
R语言散点图
散点图显示绘制坐标平面多点。每个点代表两个变量的值。一个变量被选择在水平轴和另一个在垂直轴。
使用 plot()函数来创建简单的散点图。
语法
R中创造散点图的基本语法是:
plot(x, y ...

- R语言箱线图
2017-06-20
-
R语言箱线图
箱线图是分布在一个数据集中的数据的量度。它把组分为三个四分位值的数据。此图表示的最小值,最大值,中值,第一个四分位数和第三个四分位数中的数据集。在通过拉伸箱图比较每个跨数据集数据的分 ...

- R语言条形图(柱状图)
2017-06-19
-
R语言条形图(柱状图)
条形图代表在与条成比例的变量的值的长度矩形条数据。R使用函数barplot()来创建柱状图。R能够绘制柱状图垂直和水平条。在柱状图中每个条都可以显示不同的颜色。
语法
创建一个条形图 ...

- R语言饼图图表
2017-06-19
-
R语言饼图图表
R语言编写有许多库用来创建图表和图形。饼图是表示不同颜色的值的圆片。切片标记和对应于各切片的数量也被表示在图表中。
R语言中的饼图使用 pie()函数,接受正数作为一个向量输入来创建。附 ...

- R语言数据库(MySQL)
2017-06-19
-
R语言数据库(MySQL)
数据是关系数据库系统中存储的统一化格式。 因此,实施我们需要非常先进和复杂的SQL查询统计计算。但是R能够轻松地连接到诸如MySql,
Oracle, Sql
server等多种关系数据库并且可以从它们的 ...