cda

数字化人才认证

首页 > 行业图谱 >

12 2/2

Python使用三种方法实现PCA算法

Python使用三种方法实现PCA算法
2018-01-23
Python使用三种方法实现PCA算法 主成分分析,即Principal Component Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域。它的主要作用是对高维数据进行降维。PCA把原先的n个特征用数 ...

数据挖掘十大经典算法之K最近邻算法

数据挖掘十大经典算法之K最近邻算法
2018-01-02
数据挖掘十大经典算法之K最近邻算法 k-最近邻算法是基于实例的学习方法中最基本的,先介绍基于实例学习的相关概念。     基于实例的学习     1.已知一系列的训练样例,很多学习 ...

如何实现降维处理(R语言)

如何实现降维处理(R语言)
2017-12-07
如何实现降维处理(R语言) 现实世界中数据一般都是复杂和高维的,比如描述一个人,有姓名、年龄、性别、受教育程度、收入、地址、电话等等几十种属性,如此多的属性对于数据分析是一个严重的挑战,除了极大增加 ...
SPSS广义线性模型:广义估计方程
2017-11-08
SPSS广义线性模型:广义估计方程 一、广义估计方程: 1、概念:广义估计方程过程对广义线性模型进行了扩展,以允许分析重复的测量或其他相关观察数据,例如聚类数据。 2、示例。公共卫生官员 ...

数据科学的基本内容

数据科学的基本内容
2017-10-31
数据科学的基本内容 什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...

机器学习中的各种相似性、距离度量

机器学习中的各种相似性、距离度量
2017-07-25
机器学习中的各种相似性、距离度量 本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。 1. 闵可夫斯基距离 基本认识 该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...

R语言与回归分析几个假设的检验

R语言与回归分析几个假设的检验
2017-07-22
R语言与回归分析几个假设的检验 一、从线性回归的假设说起 对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫 ...
R语言多元分析系列
2017-07-21
R语言多元分析系列 R语言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...

广义线性模型中的Gauss Seidel 迭代算法实现

广义线性模型中的Gauss Seidel 迭代算法实现
2017-06-28
广义线性模型中的Gauss Seidel 迭代算法实现 数值模拟的算法迭代公式推导 R代码实现 根据以上公式,代入迭代步骤,即可实现算法。 ##------数据模拟-------- library(MASS) ##mvrnorm() ##定义一个 ...

利用SPSS进行主成分分析

利用SPSS进行主成分分析
2017-05-02
利用SPSS进行主成分分析 【例子】 以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。 图1 原始数据(未经标准化) 第二步:打开“因子分析”对话框。 沿着主菜 ...

SPSS中两种重复测量资料分析过程的比较

SPSS中两种重复测量资料分析过程的比较
2017-03-13
SPSS中两种重复测量资料分析过程的比较 在SPSS中,有两个过程可以对重复测量资料进行分析:一种是一般线性模型的重复度量;一种是混合线性模型,对于同样的数据资料,使用两种过程分析出的内容不大一样,注意 ...

CDA LEVEL Ⅰ 业务分析师_模拟题

CDA LEVEL Ⅰ 业务分析师_模拟题
2024-09-12
《CDA数据分析认证考试模拟题库》 CDA LEVEL Ⅰ 业务分析师_模拟题: 一、单选 1.北京市统计局发布2014年度全市职工平均工资为77560元,月平均工资为6463元.众多网友直呼“被平均”,你认为 ...
12 2/2

OK