首页 > 行业图谱 >
- R语言与回归分析几个假设的检验
- 2017-07-22
-
R语言与回归分析几个假设的检验
一、从线性回归的假设说起
对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫 ...
- R语言与函数估计学习笔记(样条方法)
- 2017-07-20
-
R语言与函数估计学习笔记(样条方法)
样条估计
如果函数在不同地方有不同的非线性度,或者有多个极值点,那么用多项式特别是低阶多项式来完成拟合是非常不合适的。一种解决办法是我们之前提到的近邻多项式 ...
- R语言因子分析
- 2017-07-18
-
R语言因子分析
因子模型: X=μ + A*F* + ε
其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。
I.参数估计
为了建立因子模型,需要要 ...
- R语言:异常值检验、离群点分析、异常值处理
- 2017-07-17
-
R语言:异常值检验、离群点分析、异常值处理
笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值)
异常值处理方 ...
- SPSS分析技术:简单对应分析
- 2017-07-12
-
SPSS分析技术:简单对应分析
分类型数据(包括定类数据和定序数据)在数据分析中扮演着重要的角色,例如,分类型数据能够帮助我们对每个数据记录进行分门别类,但是由于分类型数据的特点,很多基于均值、方差和 ...
- R语言之数据管理
- 2017-07-08
-
R语言之数据管理
数据挖掘最重要的一环就是如何管理你的数据,因为原始数据一般都不能直接用来进行分析,需要对原始数据进行增加衍生变量、数据分箱、数据标准化处理;对因子型变量进行哑变量处理;数据抽样和 ...
- python绘图:matplotlib和pandas的应用
- 2017-07-01
-
python绘图:matplotlib和pandas的应用
在进行数据分析时,绘图是必不可少的模式探索方式。用Python进行数据分析时,matplotlib和pandas是最常用到的两个库。
1、matplotlib库的应用
准备工作如下:打开i ...
- SPSS统计分析案例:一元线性回归
- 2017-06-22
-
SPSS统计分析案例:一元线性回归
一元线性回归,顾名思义,仅有一个自变量的回归模型,研究的是一个因素对结果的影响,可以用于预测,也经常被称之为简单线性回归分析。它的模型表达式为:
Y=a+bX+e
回归 ...
- SPSS统计分析案例:对应分析
- 2017-06-22
-
SPSS统计分析案例:对应分析
两个分类变量间的关系,无法直接使用常见的皮尔逊相关系数来表述,多采用频数统计、交叉表卡方检验等过程进行处理,当分类变量的取值较多时,列联表频数的形式就变得更为复杂,很难 ...
- SPSS教程:做多重线性回归,方差不齐怎么办
- 2017-06-20
-
SPSS教程:做多重线性回归,方差不齐怎么办
一、残差方差齐性判断
1. 残差方差齐性
回顾一下前面介绍过的残差方差齐性,即残差ei的大小不随预测值水平的变化而变化。我们在进行残差分析时,可以通过绘制标 ...
- 小屏幕的大数据可视化探索
- 2017-05-27
-
小屏幕的大数据可视化探索
数据并不枯燥,每个基础图表都有其特点,掌握这些特质、作出适用于不同行业不同业务的图表,帮助人们读懂数据并作出决策,就是数据可视化的价值所在。
web和手机两者的屏幕大小差 ...
- Excel数据分析:抽样设计
- 2017-05-16
-
Excel数据分析:抽样设计
一、随机数发生器
1. 随机数发生器主要功能
“随机数发生器”分析工具可用几个分布之一产生的独立随机数来填充某个区域。可以通过概率分布来表示总体中的主体特征。例如,可以使 ...
- 为什么你的数据分析那么好,图表做得那么烂
- 2017-05-09
-
为什么你的数据分析那么好,图表做得那么烂
所有优秀的数据可视化依赖优异的设计,并非仅仅选择正确的图表模板那么简单。全在于以一种更加有助于理解和引导的方式去表达信息,尽可能减轻用户获取信息的成本。当 ...
- SPSS基本统计图表的制作
- 2017-04-30
-
SPSS基本统计图表的制作
基本统计图表的制作 1 P-P图和Q-Q图
P-P图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P ...
- 数据挖掘过程体会
- 2017-04-14
-
数据挖掘过程体会
Step1.
就是商业问题的理解了,那么如何更好的理解“老大”提出的商业问题困惑呢?我觉得思维导图倒是个不错的选择,当然自己要想更好的理解“老大”的意思还需要进一步的沟通,商业问题的 ...
- 使用Python分析纽约出租车搭乘数据
- 2017-03-27
-
使用Python分析纽约出租车搭乘数据
在纽约,出租车分为两类:黄色和绿色。黄色出租(Yellow TAXI)车可以在纽约五大区(布朗克斯区、布鲁克林区、曼哈顿、皇后区、斯塔滕岛)内任何地点搭载乘客。绿色出租车(Gree ...
- R语言解读一元线性回归模型
- 2017-02-26
-
R语言解读一元线性回归模型
R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长 ...
- R语言的三种聚类方法
- 2017-02-24
-
R语言的三种聚类方法
一、层次聚类
1)距离和相似系数
r语言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数据框。method表示计算哪种距离 ...
- R语言对回归模型进行回归诊断
- 2017-02-15
-
R语言对回归模型进行回归诊断
在R语言中,对数据进行回归建模是一件很简单的事情,一个lm()函数就可以对数据进行建模了,但是建模了之后大部分人很可能忽略了一件事情就是,对回归模型进行诊断,判断这个模型到 ...
- SPSS—描述性统计分析—探索性分析
- 2017-01-14
-
SPSS—描述性统计分析—探索性分析
菜单
除了可以计算基本的统计量之外,也可以给出一些简单的检验结果和图形,有助于用户进一步的分析数据。使得用户能够从大量的分析结果之中挖掘到所需要的统计信息。
...