首页 > 行业图谱 >
- R语言中的多元方差分析
- 2018-02-28
-
R语言中的多元方差分析
1、当因变量(结果变量)不止一个时,可用多元方差分析(MANOVA)对它们同时进行分析。
library(MASS)
attach(UScereal)
y <- cbind(calories, fat, sugars)
aggregate(y, by = list( ...
- 建立数据感性认识
- 2018-02-27
-
建立数据感性认识
变量类型和数据分布
变量类型
连续变量
离散变量(名义变量-有序,分类变量-无序)
数据分布
分布就是概率,研究变量无外乎就是看变量的值以及其取值的概率。此事数据由一大堆数 ...
- R描述性统计分析
- 2018-02-27
-
R描述性统计分析
概念
数据摘要,有损地提取数据特征的过程,包含基本统计,分布/累计统计,数据特征(相关性,周期性等),数据挖掘
数据有很多变量和观测值,可以用一些简单表格,图形和少数汇总数字 ...
- Python统计学一数据的概括性度量
- 2018-02-26
-
Python统计学一数据的概括性度量
一、数据的概括性度量
1、统计学概括:
统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和 ...
- 使用Python进行描述性统计
- 2018-02-26
-
使用Python进行描述性统计
1 描述性统计是什么?
描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,我们可借助描述性统计来描绘或总结数据的基本情况,一来可以梳 ...
- 用python-pandas作图矩阵
- 2018-02-24
-
用python-pandas作图矩阵
我们在采用机器学习算法对数据进行分析时,首先要对数据进行了解,而了解数据最快速的方式就是可视化。但是作者可视化采用的方法对很多data都通用,且采用的是各种图形的图矩阵,如直 ...
- Pearson相关系数公式的四种形式及Python代码实现
- 2018-02-24
-
Pearson相关系数公式的四种形式及Python代码实现
两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商。
第一种形式(也就是定义的形式):
第二种形式:
第三种形式:
...
- SPSS详细教程:配对样本的非参数检验『Wilcoxon符号秩检验』
- 2018-02-14
-
SPSS详细教程:配对样本的非参数检验『Wilcoxon符号秩检验』
一、问题与数据
某研究者研发出一种新型的运动饮料,该饮料在传统运动饮料的基础上增加了蛋白质混合物。研究者拟分析该新型运动饮料是否可以提升 ...
- SPSS统计分析案例:Wilcoxon符号秩检验
- 2018-02-13
-
SPSS统计分析案例:Wilcoxon符号秩检验
最近我发现,大家对T检验的使用频率很高,但是有一个共同的应该引起注意的问题,几乎没有人去讨论原始数据的正态分布情况,只要是两样本差异检验,就直接使用T检验出结果 ...
- 一名合格的数据分析师该怎样解释“买不起房”这件事
- 2018-01-29
-
一名合格的数据分析师该怎样解释“买不起房”这件事
北京很大,大到容得下两千多万人的吃喝拉撒睡。北京很小,小到装不下一个外地人的北漂梦。
我是一名北漂,来北京7年了,7年时间里不断地租房搬家,心里 ...
- SPSS中三种相关系数
- 2018-01-24
-
SPSS中三种相关系数
在SPSS软件相关分析中,pearson(皮尔逊),kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同
两个连续变量间呈线性相关时,使用Pearson积差相 ...
- 利用R语言如何判别和分类
- 2018-01-21
-
利用R语言如何判别和分类
判别分析(discriminant analysis)是一种分类技术。它通过一个已知类别的“训练样本”来建立判别准则,并通过预测变量来为未知类别的数据进行分类。
...
- R之组间差异的非参数检验
- 2018-01-18
-
R之组间差异的非参数检验
# t 检验
# 在研究中最常见的行为就是对两个组进行比较。接受某种新药治疗的患者是否较使用某种现
# 有药物的患者表现出了更大程度的改善?某种制造工艺是否较另外一种工艺制造出的不 ...
- R语言与回归分析几个假设的检验
- 2018-01-14
-
R语言与回归分析几个假设的检验
一、从线性回归的假设说起
对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫条 ...
- 主成分分析、因子分析、聚类的概览与比较
- 2018-01-12
-
主成分分析、因子分析、聚类的概览与比较
主成分分析:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),用综合指标来解释多变量的方差——协方差结构,即每个主 ...
- 主成分分析和因子分析十大不同点
- 2018-01-11
-
主成分分析和因子分析十大不同点
主成分分析和因子分析无论从算法上还是应用上都有着比较相似之处,本文结合以往资料以及自己的理解总结了以下十大不同之处,适合初学者学习之用。
1.原理不同
主成分 ...
- Python数据分析常用函数笔记
- 2018-01-10
-
Python数据分析常用函数笔记
1、生成随机数列表
import numpy as np
array = np.random.permutation(20)
结果:
array([12, 18, 16, 8, 10, 17, 1, 2, 9, 7, 3, 6, 15, 13, 11, 5, 4, 0, 14, 19])
2、合并两个p ...
- SPSS—描述性统计分析—频数分析
- 2018-01-09
-
SPSS—描述性统计分析—频数分析
描述性统计量
分类
集中趋势分析——中心趋势的数值度量
反映一组数据向某一位置聚集的趋势,主要的统计量有均数(mean)、中位数(median)、众数(mode)、总 ...
- 数据科学的基本内容
- 2018-01-08
-
数据科学的基本内容
什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...
- 朴素贝叶斯模型:文本分类+垃圾邮件分类
- 2017-12-10
-
朴素贝叶斯模型:文本分类+垃圾邮件分类
学习了那么多机器学习模型,一切都是为了实践,动手自己写写这些模型的实现对自己很有帮助的,坚持,共勉。本文主要致力于总结贝叶斯实战中程序代码的实现(python)及朴 ...