cda

数字化人才认证

首页 > 行业图谱 >

数据分析方法:非正态数据转化成正态数据

数据分析方法:非正态数据转化成正态数据
2017-04-10
数据分析方法:非正态数据转化成正态数据 大部分的数据分析都希望原始数据是满足正态分布的定距变量。然而,显示是残酷的,在各种研究中,常常需要面对非正态分布的定距数据。为了解决数据的正态性问题,数学家 ...

简单易学的机器学习算法—Gibbs采样

简单易学的机器学习算法—Gibbs采样
2017-03-27
简单易学的机器学习算法—Gibbs采样 一、Gibbs采样概述 前面介绍的Metropolis-Hastings采样为从指定分布中进行采样提供了一个统一的框架,但是采样的效率依赖于指定的分布的选择,若是选择的不好,会使得接受率 ...

学习SAS的正确姿势是怎样的?

学习SAS的正确姿势是怎样的?
2022-01-20
SAS作为世界知名大数据分析产品,只要是大机构, 不论是、制药、金融、保险、市场部门、NGO还是政府部门,SAS的覆盖率,都是完全不可被替代的。甚至部分IT公司在统计软件上,也选择的是SAS。同时SAS系统具有使用灵 ...

机器学习中概率论知识复习

机器学习中概率论知识复习
2017-03-16
机器学习中概率论知识复习 1 基本概念 概率论在机器学习中扮演着一个核心角色,因为机器学习算法的设计通常依赖于对数据的概率假设。 1.1 概率空间 说到概率,通常是指一个具有不确定性的event发生的 ...

离群值的判断与处理_数据分析

离群值的判断与处理_数据分析
2017-03-13
离群值的判断与处理 我们在数据分析的时候,经常会碰到某些数据远远大于或小于其他数据,这些明显偏离的数据就是离群值,也叫奇异值、极端值。 离群值产生的原因大致有两点: 1.总体固有变异的极端表现,这 ...

SPSS详细操作:单因素方差分析

SPSS详细操作:单因素方差分析
2017-03-08
SPSS详细操作:单因素方差分析 一、问题与数据 为调查A、B、C三种治疗措施对患者谷丙转氨酶(ALT)的影响,某科室将45名患者随机分为三组,每组15人,分别采取A、B、C三种治疗措施。治疗后ALT水平(U/L)如下 ...

均值比较单样本t检验的spss和sas实现

均值比较单样本t检验的spss和sas实现
2017-03-04
均值比较单样本t检验的spss和sas实现 单样本t检验,首先检验其总体分布是否服从正态分布,对于符合相应条件的数据运用相应的检验。 仅举一例:调查一生产车间的刹车装置,直径为322millimeters为合格,生产车 ...

SPSS--描述性统计分析--探索性分析

SPSS--描述性统计分析--探索性分析
2017-03-03
SPSS--描述性统计分析--探索性分析 菜单 除了可以计算基本的统计量之外,也可以给出一些简单的检验结果和图形,有助于用户进一步的分析数据。使得用户能够从大量的分析结果之中挖掘到所需要的统计信息。 ...

SPSS分析技术:描述统计;了解手中的数据,从这里开始

SPSS分析技术:描述统计;了解手中的数据,从这里开始
2017-03-02
SPSS分析技术:描述统计;了解手中的数据,从这里开始 无论是总体数据还是样本数据,描述统计都是了解它们的第一步,因为了解数据是进行进一步数据分析的基础。在统计基础文章中介绍过,描述数据可以从三个维度 ...

SPSS分析技术:Pearson相关、Spearman相关及Kendall相关

SPSS分析技术:Pearson相关、Spearman相关及Kendall相关
2017-02-28
SPSS分析技术:Pearson相关、Spearman相关及Kendall相关 通过文章(点击蓝字即可回顾阅读):数据分析技术:数据关联性分析综述,我们知道数据的关联性分析可以分为两个大类:相关性分析和回归分析。根据数据种 ...

SPSS分析技术:低测度数据的相关性分析

SPSS分析技术:低测度数据的相关性分析
2017-02-28
SPSS分析技术:低测度数据的相关性分析 如果遇到低测度数据,需要判断它与低测度数据或高测度数据之间的相关性,需要根据数据类型以及数据组合之间的关系来决定分析方法,如下图所示: 今天,我们介绍低 ...

SPSS应用之非参数检验

SPSS应用之非参数检验
2017-02-28
SPSS应用之非参数检验 统计学的假设检验可以分为参数检验和非参数检验,参数检验是根据一些假设条件推算而来,当这些假设条件无法满足的时候,参数检验的效能会大打折扣,甚至出现错误的结果,而非参数检验通常 ...

R语言相关分布函数、统计函数的使用

R语言相关分布函数、统计函数的使用
2017-02-25
R语言相关分布函数、统计函数的使用 R语言相关分布函数、统计函数的使用 分布函数家族: *func() r : 随机分布函数 d : 概率密度函数 p : 累积分布函数 q : 分位数函数 func()表示具体的名称 ...

使用R进行统计分析--概率计算

使用R进行统计分析--概率计算
2017-02-24
使用R进行统计分析--概率计算 R语言中提供了很多概率函数,可以方便的计算事件发生的概率。如二项分布概率函数和泊松分布概率函数。本篇文章介绍如果使用R语言中的这些函数求解事件发生的概率。 概率函 ...

数据批处理--R语言里最重要的一个函数家族:*pply

数据批处理--R语言里最重要的一个函数家族:*pply
2017-02-22
数据批处理--R语言里最重要的一个函数家族:*pply 之前我们讲过循环,简单讲解了向量计算,它可以代替循环进行比较搞笑的批量计算,试想计算数据框中的总收入加上10,我们没必要进行循环计算这一列的每一个元素 ...

简单的认识R语言和逻辑斯蒂回归

简单的认识R语言和逻辑斯蒂回归
2017-02-19
简单的认识R语言和逻辑斯蒂回归 在生活中并不是所有的问题都要预测一个连续型的数值,比如药剂量,某人薪水,或者客户价值;逻辑斯蒂回归回归它主要用于只有两个结果的分类问题,它定义结果的变量只有两类的值 ...

用R语言进行数据探索

用R语言进行数据探索
2017-02-18
用R语言进行数据探索 这一次我们来说一下数据的探索性分析,R语言图标100X76 1) 主要分析工具 主要的图形表示方法有 1条图(barplot):用于分类数据。 2.直方图(hist)、点图(dotchart)、茎叶图(stem) ...

R语言学习笔记二

R语言学习笔记二
2017-02-17
R语言学习笔记二 今天主要学习了两个统计学的基本概念:峰度和偏度,并且用R语言语言来描述。 > vars<-c(\"mpg\",\"hp\",\"wt\") > head(mtcars[vars])         &n ...

简单的认识R语言和逻辑斯蒂回归

简单的认识R语言和逻辑斯蒂回归
2017-02-15
简单的认识R语言和逻辑斯蒂回归 在生活中并不是所有的问题都要预测一个连续型的数值,比如药剂量,某人薪水,或者客户价值;逻辑斯蒂回归回归它主要用于只有两个结果的分类问题,它定义结果的变量只有两类的值 ...

R语言解读多元线性回归模型

R语言解读多元线性回归模型
2017-01-31
R语言解读多元线性回归模型 在许多生活和工作的实际问题中,影响因变量的因素可能不止一个,比如对于知识水平越高的人,收入水平也越高,这样的一个结论。这其中可能包括了因为更好的家庭条件,所以有了更好的 ...

OK