首页 > 行业图谱 >

- Python数据分析常用函数笔记
2018-01-10
-
Python数据分析常用函数笔记
1、生成随机数列表
import numpy as np
array = np.random.permutation(20)
结果:
array([12, 18, 16, 8, 10, 17, 1, 2, 9, 7, 3, 6, 15, 13, 11, 5, 4, 0, 14, 19])
2、合并两个p ...

- SPSS—描述性统计分析—频数分析
2018-01-09
-
SPSS—描述性统计分析—频数分析
描述性统计量
分类
集中趋势分析——中心趋势的数值度量
反映一组数据向某一位置聚集的趋势,主要的统计量有均数(mean)、中位数(median)、众数(mode)、总 ...

- 数据科学的基本内容
2018-01-08
-
数据科学的基本内容
什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...
- 朴素贝叶斯模型:文本分类+垃圾邮件分类
2017-12-10
-
朴素贝叶斯模型:文本分类+垃圾邮件分类
学习了那么多机器学习模型,一切都是为了实践,动手自己写写这些模型的实现对自己很有帮助的,坚持,共勉。本文主要致力于总结贝叶斯实战中程序代码的实现(python)及朴 ...

- 数据缺失值的4种处理方法
2017-12-06
-
数据缺失值的4种处理方法
一、缺失值产生的原因
缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储器 ...

- 我们进行了1亿次婚恋配对实验,然后……
2017-12-05
-
我们进行了1亿次婚恋配对实验,然后……
“要求别太高,差不多就行了。”
“找个有钱人嫁了吧!”
“感情不能将就,一定要找合适的。”
……
这些说法有没有道理呢?按照这些“标准”,是不是有更 ...

- 数据挖掘中针对缺失值的处理
2017-12-01
-
数据挖掘中针对缺失值的处理
一、缺失值产生的原因
缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储 ...

- 数据分析中缺失值的处理方法
2017-11-23
-
数据分析中缺失值的处理方法
1、缺失值的分类
按照数据缺失机制可分为:
(1) 完全随机缺失(missing completely at random, MCAR)
所缺失的数据发生的概率既与已观察到的数据无关,也 ...

- SPSS混合模型:线性混合模型
2017-11-08
-
SPSS混合模型:线性混合模型
一、线性混合模型(分析-混合模型-线性)
1、概念:“线性混合模型”过程扩展了一般线性模型,因此允许数据表现出相关的和不恒定的变异性。因此,线性混合模型提供了不仅能够就 ...

- SPSS最优尺度:分类主成分分析
2017-11-05
-
SPSS最优尺度:分类主成分分析
一、分类主成分分析(分析-降维-最优尺度)
1、概念:此过程在减少数据维数的同时量化分类变量。分类主成份分析也表示为缩写词CATPCA(代表categorical principal com ...

- R语言中的方差分析
2017-11-01
-
R语言中的方差分析
方差分析:当包含的因子是解释变量时,我们关注的重点通常会从预测转向组别差异的分析,这种分析法称作方差分析(ANOVA)。
install.packages(c(\'multcomp\', \'gplots\', \'car\', \'HH ...

- 单因素下的方差分析
2017-10-31
-
单因素下的方差分析
在方差分析中,有三个基本的假设:
(1) 正态假设。对于因素的每个水平,其观测值都是来自正态总体的随机样本;
(2) 方差齐次假设。各个总体的方差相同;
(3) 独立假设。 ...

- SPSS—均 值 检 验 (Compare Means)—配对样本T检验
2017-10-30
-
SPSS—均 值 检 验 (Compare Means)—配对样本T检验
用来检验来自两配对总体的均值是否在统计上有显著差异
配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资 ...

- SPSS—描述性统计分析—比率分析
2017-10-30
-
SPSS—描述性统计分析—探索性分析
菜单
除了可以计算基本的统计量之外,也可以给出一些简单的检验结果和图形,有助于用户进一步的分析数据。使得用户能够从大量的分析结果之中挖掘到所需要的统计信息。
...

- SPSS干货分享:区分T检验与F检验
2017-10-28
-
SPSS干货分享:区分T检验与F检验
1. T 检验和 F 检验的由来
一般而言,为了确定从样本 (sample) 统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。
通过把所得 ...

- 假设检验中的P值 与显著性水平的联系
2017-10-27
-
假设检验中的P值 与显著性水平的联系
假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另 ...

- 置信区间、显著性检验和统计学意义
2017-10-27
-
置信区间、显著性检验和统计学意义
置信区间
估计参数真值所在的范围通常以区间的形式给出,同时还给出此区间包含参数真值的可信程度,这种形式的估计称为区间估计,这样的区间称为置信区间。
对于任意参 ...

- 方差分析--T检验和F检验的异同
2017-10-26
-
方差分析--T检验和F检验的异同
最近在图书馆借了本《R和ASReml-R统计分析教程》,林元震和陈晓阳主编的关于R的书籍,当时看上这本书的原因在于里面以统计学知识为主,作为R语言实战的良好补充,虽然R语言实战是 ...

- SPSS—描述性统计分析—探索性分析
2017-10-24
-
SPSS—描述性统计分析—探索性分析
菜单
除了可以计算基本的统计量之外,也可以给出一些简单的检验结果和图形,有助于用户进一步的分析数据。使得用户能够从大量的分析结果之中挖掘到所需要的统计信息。
...

- 利用SPSS箱线图与Z分数法判别异常值的比较
2017-10-24
-
利用SPSS箱线图与Z分数法判别异常值的比较
箱线图前提不要求正态分布,而Z分数法前提要求正态分布。
箱线图(Boxplot)也称箱须图(Box-whisker
Plot),是利用数据中的五个统计量:最小值、第一四分位 ...