cda

数字化人才认证

首页 > 行业图谱 >

数据分析中的缺失值处理
2017-12-01
数据分析中的缺失值处理 没有高质量的数据,就没有高质量的数据挖掘结果,数据值缺失是数据分析中经常遇到的问题之一。当缺失比例很小时,可直接对缺失记录进行舍弃或进行手工处理。但在实际数据中,往往 ...

SPSS之两独立样本非参数检验(U检验)

SPSS之两独立样本非参数检验(U检验)
2017-11-22
SPSS之两独立样本非参数检验(U检验) 一、概述 Mann-Whitney U 检验是用得最广泛的两独立样本秩和检验方法。简单的说,该检验是与独立样本 t 检验相对应的方法,当正态分布、方差齐性等不能达到 t 检验的要 ...
SPSS回归分析:有序回归
2017-11-21
SPSS回归分析:有序回归 一、概念(分析-回归-有序) 使用序数回归可以在一组预测变量(可以是因子或协变量)上对多歧分序数响应的依赖性进行建模。序数回归的设计基于McCullagh (1980, 1998)的方 ...
SPSS回归分析:自动线性模型
2017-11-19
SPSS回归分析:自动线性模型 一、自动线性模型(分析-回归-自动线性建模) 1、 目标(分析-回归-自动线性建模-构建选项) 2、基本(分析-回归-自动线性建模-构建选项) 自动准备 ...
SPSS分类分析:最近邻元素分析
2017-11-15
SPSS分类分析:最近邻元素分析 一、最近邻元素分析(分析-分类-最近邻元素) 1、概念:根据个案间的相似性来对个案进行分类。类似个案相互靠近,而不同个案相互远离。因此,通过两个个案之间的距离 ...
SPSS广义线性模型:广义估计方程
2017-11-08
SPSS广义线性模型:广义估计方程 一、广义估计方程: 1、概念:广义估计方程过程对广义线性模型进行了扩展,以允许分析重复的测量或其他相关观察数据,例如聚类数据。 2、示例。公共卫生官员 ...
SPSS时间序列:频谱分析
2017-11-01
SPSS时间序列:频谱分析 一、频谱分析(分析-预测-频谱分析)    “频谱图”过程用于标识时间序列中的周期行为。它不需要分析一个时间点与下一个时间点之间的变异,只要按不同频率 ...

数据科学的基本内容

数据科学的基本内容
2017-10-31
数据科学的基本内容 什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...

SPSS—均 值 检 验 (Compare Means)—单一样本T检验

SPSS—均 值 检 验 (Compare Means)—单一样本T检验
2017-10-30
SPSS—均 值 检 验 (Compare Means)—单一样本T检验 检验某个变量的总体均值和指定值是否存在显著性差异,统计的前提是样本的总体服从正态分布。此检验对偏离正态性也是相当稳健的。 置信区间 正态 ...
T检验、F检验和统计学意义(P值或sig值)
2017-10-27
T检验、F检验和统计学意义(P值或sig值) 1.T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所 ...

大数据世界里的谎言与事实

大数据世界里的谎言与事实
2017-10-08
大数据世界里的谎言与事实 这位先生,您好,您听过大数据么? 不不不,不是锯大树的那个锯...是很大的数据,特别大,是今年最流行的,人人都在谈的先进技术——您只要用了我们的大数据分析方案,保证您的企业 ...

数据分析:人类正在变成七秒鱼还是三秒男

数据分析:人类正在变成七秒鱼还是三秒男
2017-09-12
数据分析:人类正在变成七秒鱼还是三秒男 如果存在上帝或者三体人的话,他们会不会也怀着类似的视角看现在的人类?他们会不会觉得人类也是七秒鱼或者快进快出的三秒男? 让我产生这个想法的是最近接连不断的热 ...

一个优雅地探索相关性的新可视化方法

一个优雅地探索相关性的新可视化方法
2017-08-27
一个优雅地探索相关性的新可视化方法 一个古老的诅咒一直萦绕着数据分析:我们用来改进模型的变量越多,那么我们需要的数据就会出现指数级的增长。不过,我们通过关注重要的变量就可以避免欠拟合以及降低收集 ...
用Python从零实现贝叶斯分类器的机器学习的教程
2017-07-31
用Python从零实现贝叶斯分类器的机器学习的教程 这篇文章主要介绍了用Python从零实现贝叶斯分类器的教程,朴素贝叶斯算法属于机器学习中的基础内容、实用而高效,本文详细展示了用Python语言实现的步骤,需要的 ...

机器学习中的各种相似性、距离度量

机器学习中的各种相似性、距离度量
2017-07-25
机器学习中的各种相似性、距离度量 本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。 1. 闵可夫斯基距离 基本认识 该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...

样本统计量与总体的关系,抽样分布的概念性质

样本统计量与总体的关系,抽样分布的概念性质
2017-07-23
样本统计量与总体的关系,抽样分布的概念性质 本文对抽样分布的概念、无偏差和最小偏差等性质,以及中心极限定理和样本比例的抽样分布进行总结。 1  抽样分布基本概念 参数(parameter):参数 ...

图形和数值的数据集描述方法

图形和数值的数据集描述方法
2017-07-23
图形和数值的数据集描述方法 图形方法对数据集的描述 1. 条形图(bar graph)   条形图一般横向表示类别(class),纵向表示该类别所对应的类别频率(class frequency)。 2. 饼状图(pie graph) &nb ...

R语言与点估计学习笔记(矩估计与MLE)

R语言与点估计学习笔记(矩估计与MLE)
2017-07-22
R语言与点估计学习笔记(矩估计与MLE) 众所周知,R语言是个不错的统计软件。今天分享一下利用R语言做点估计的内容。主要有:矩估计、极大似然估计、EM算法、最小二乘估计、刀切法(Jackknife)、自助法(Boots ...

R语言与回归分析几个假设的检验

R语言与回归分析几个假设的检验
2017-07-22
R语言与回归分析几个假设的检验 一、从线性回归的假设说起 对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫 ...
R语言多元分析系列
2017-07-21
R语言多元分析系列 R语言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...

OK