cda

数字化人才认证

首页 > 行业图谱 >

12 2/2
R语言简单操作,数值与向量
2018-03-15
R语言简单操作,数值与向量 1 向量与赋值 R对命名了的数据结构进行操作。最简单的数据结构是数字向量;如, > x <- c(10.4, 5.6, 3.1, 6.4, 21.7)    c()是创建函数,赋值运算符是\'<-\',与函数a ...

Python使用三种方法实现PCA算法

Python使用三种方法实现PCA算法
2018-01-23
Python使用三种方法实现PCA算法 主成分分析,即Principal Component Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域。它的主要作用是对高维数据进行降维。PCA把原先的n个特征用数 ...

数据挖掘十大经典算法之K最近邻算法

数据挖掘十大经典算法之K最近邻算法
2018-01-02
数据挖掘十大经典算法之K最近邻算法 k-最近邻算法是基于实例的学习方法中最基本的,先介绍基于实例学习的相关概念。     基于实例的学习     1.已知一系列的训练样例,很多学习 ...

如何实现降维处理(R语言)

如何实现降维处理(R语言)
2017-12-07
如何实现降维处理(R语言) 现实世界中数据一般都是复杂和高维的,比如描述一个人,有姓名、年龄、性别、受教育程度、收入、地址、电话等等几十种属性,如此多的属性对于数据分析是一个严重的挑战,除了极大增加 ...
SPSS广义线性模型:广义估计方程
2017-11-08
SPSS广义线性模型:广义估计方程 一、广义估计方程: 1、概念:广义估计方程过程对广义线性模型进行了扩展,以允许分析重复的测量或其他相关观察数据,例如聚类数据。 2、示例。公共卫生官员 ...

数据科学的基本内容

数据科学的基本内容
2017-10-31
数据科学的基本内容 什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...

机器学习中的各种相似性、距离度量

机器学习中的各种相似性、距离度量
2017-07-25
机器学习中的各种相似性、距离度量 本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。 1. 闵可夫斯基距离 基本认识 该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...

R语言与回归分析几个假设的检验

R语言与回归分析几个假设的检验
2017-07-22
R语言与回归分析几个假设的检验 一、从线性回归的假设说起 对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫 ...
R语言多元分析系列
2017-07-21
R语言多元分析系列 R语言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...

广义线性模型中的Gauss Seidel 迭代算法实现

广义线性模型中的Gauss Seidel 迭代算法实现
2017-06-28
广义线性模型中的Gauss Seidel 迭代算法实现 数值模拟的算法迭代公式推导 R代码实现 根据以上公式,代入迭代步骤,即可实现算法。 ##------数据模拟-------- library(MASS) ##mvrnorm() ##定义一个 ...

利用SPSS进行主成分分析

利用SPSS进行主成分分析
2017-05-02
利用SPSS进行主成分分析 【例子】 以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。 图1 原始数据(未经标准化) 第二步:打开“因子分析”对话框。 沿着主菜 ...

SPSS中两种重复测量资料分析过程的比较

SPSS中两种重复测量资料分析过程的比较
2017-03-13
SPSS中两种重复测量资料分析过程的比较 在SPSS中,有两个过程可以对重复测量资料进行分析:一种是一般线性模型的重复度量;一种是混合线性模型,对于同样的数据资料,使用两种过程分析出的内容不大一样,注意 ...

SPSS缺失值:缺失值分析

SPSS缺失值:缺失值分析
2017-11-02
SPSS缺失值:缺失值分析 一、缺失值: 具有缺失值的个案会引发严重的问题,因为典型的建模过程会简单地从分析中丢弃这些个案。如果存在少量缺失值(大约低于个案总数的5%),且这些值可以被认为随 ...

变量选择之SCAD算法

变量选择之SCAD算法
2017-06-27
变量选择之SCAD算法 本文提出了一种用于同时达到选择变量和预测模型系数的目的的方法——SCAD。这种方法的罚函数是对称且非凹的,并且可处理奇异阵以产生稀疏解。此外,本文提出了一种算法用于优化对应的带惩 ...

面板数据异方差的处理_xtscc法+面板数据回归

面板数据异方差的处理_xtscc法+面板数据回归
2016-12-16
面板数据异方差的处理_xtscc法+面板数据回归 一、前言 计算和互联网技术的广泛运用极大地提高了数据的可获得性,使大量的数据得以收集、保存和整理。与此同时,计量经济学在整个经济学体系中的地位日益提升 ...

信息熵与方差-联系与区别

信息熵与方差-联系与区别
2016-04-05
    熵的概念很早就在物理学中出现,热力学中的熵用于衡量物质状态的混乱程度。霍金在《时间简历》中也对熵有着有趣的表述:一个常有人打扫清洁的屋子,熵值低,一个不打扫的屋子,熵值就高,自然界 ...

SPSS多因素方差分析(一般线性模型):多变量

SPSS多因素方差分析(一般线性模型):多变量
2020-12-08
一、概念(分析-一般线性模型-多变量)         “GLM 多变量”过程通过一个或多个因子变量或协变量为多个因变量提供回归分析和方差分析。因子变量将总体划分成组。通过使用此一般线性模型过程 ...

SPSS多因素方差分析(一般线性模型):重复测量

SPSS多因素方差分析(一般线性模型):重复测量
2014-11-01
SPSS多因素方差分析(一般线性模型):重复测量 一、GLM重复测量(分析-一般线性模型-重复度量) 1、概念:“GLM 重复测量”过程在对每个主体或个案多次执行相同的测量时提供方差分析。如果指定了主体间 ...

CDA LEVEL Ⅰ 业务分析师_模拟题

CDA LEVEL Ⅰ 业务分析师_模拟题
2024-09-12
《CDA数据分析认证考试模拟题库》 推荐学习书籍 《CDA一级教材》适合CDA一级考生备考,也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校,累计已有10万+在读~ 免费加入阅读:https://edu ...
12 2/2

OK