cda

数字化人才认证

首页 > 行业图谱 >

为什么R语言是学习数据分析的第一选择?

为什么R语言是学习数据分析的第一选择?
2017-08-07
刚开始学习数据科学的人都会面对同一个问题: 不知道该先学习哪种编程语言。 我给你的建议就是:先学习R语言 一、专注于一种语言 在说明为什么你应该学习R语言之前,我想 ...

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱
2017-07-24
机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱 本文主要解释一些关于机器学习模型评价的主要概念,与评价中可能会遇到的一些陷阱。如训练集-验证集二划分校验(Hold-out validation) ...

数据挖掘的基本概念:数据库、数据仓库、机器学习,统计学

数据挖掘的基本概念:数据库、数据仓库、机器学习,统计学
2017-07-23
数据挖掘的基本概念:数据库、数据仓库、机器学习,统计学 “数据挖掘“(Data Mining)又被称为“数据中的知识发现”(KDD),顾名思义,也就是通过数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估 ...

R语言与机器学习中的回归方法学习笔记

R语言与机器学习中的回归方法学习笔记
2017-07-21
R语言与机器学习中的回归方法学习笔记  机器学习中的一些方法如决策树,随机森林,SVM,神经网络由于对数据没有分布的假定等普通线性回归模型的一些约束,预测效果也比较不错,交叉验证结果也能被接受。下 ...

R语言与简单的回归分析

R语言与简单的回归分析
2017-07-19
R语言与简单的回归分析 回归模型是计量里最基础也最常见的模型之一。究其原因,我想是因为在实际问题中我们并不知道总体分布如何,而且只有一组数据,那么试着对数据作回归分析将会是一个不错的选择。 一、 ...

R语言主成分分析

R语言主成分分析
2017-07-18
R语言主成分分析 解决自变量之间的多重共线性和减少变量个数 根据主成分分析的原理,它一方面可以将k个不独立的指标变量通过线性变换变成k个相互独立的新变量,这是解决多重共线性问题的一个重要方法;另一 ...

SPSS和Mplus如何做非线性中介调节效应分析?如倒U形曲线

SPSS和Mplus如何做非线性中介调节效应分析?如倒U形曲线
2017-07-13
SPSS和Mplus如何做非线性中介调节效应分析?如倒U形曲线 传统的线性回归模型用的比较多,但有时候变量之间的关系更符合非线性关系,此时使用非线性模型其拟合度会更好,模型预测效果更佳。在非线性关系中,如果 ...

好课推荐丨CDA建模分析师-R语言

好课推荐丨CDA建模分析师-R语言
2017-07-13
“虽然是本科毕业,但是在看数据挖掘方面的算法理论时经常感觉一些公式的推导过程如天书一般,例如看svm的数学证明,EM算法,凸优化… 感觉知识跳跃比较大, 是我微积分学的不好还是中间有什么好的教材补充一下,数据 ...

SPSS大战多元回归分析

SPSS大战多元回归分析
2017-07-12
SPSS大战多元回归分析 使用多元回归进行数据分析,分析软件供选择的比较多,主要有Eviews、Spss、Stata、Sas、Gretel等。多元回归分析应用于各个领域,主要有经济、医学、农学等。今天小编为大家分享一篇SPSS大 ...

机器学习中的特征—特征选择的方法以及注意点

机器学习中的特征—特征选择的方法以及注意点
2017-07-04
机器学习中的特征—特征选择的方法以及注意点 关于机器学习中的特征我有话要说 在这次校园招聘的过程中,我学到了很多的东西,也纠正了我之前的算法至上的思想,尤其是面试百度的过程中,让我渐渐意识到 ...

回归预测及R语言实现Part2回归R语言实现

回归预测及R语言实现Part2回归R语言实现
2017-07-02
回归预测及R语言实现Part2回归R语言实现 下面是回归分析的各种变体的简单介绍,解释变量和相应变量就是指自变量和因变量。 常用普通最小二乘(OLS)回归法来拟合实现简单线性、多项式和多元线性等回归模 ...

SPSS进行逐步回归分析

SPSS进行逐步回归分析
2017-06-30
SPSS进行逐步回归分析 在自变量很多时,其中有的因素可能对应变量的影响不是很大,而且x之间可能不完全相互独立的,可能有种种互作关系。在这种情况下可用逐步回归分析,进行x因子的筛选,这样建立的多元回归模 ...

SAS信用评分之番外篇异常值的识别

SAS信用评分之番外篇异常值的识别
2017-06-26
SAS信用评分之番外篇异常值的识别 今天想分享给大家的是我早期建模的时候一个识别异常值的办法,也许你在“信用风险评分卡研究”看过,但是代码只能识别一个变量,我将这个代码作了改良,但是我在这里必须声明 ...

R语言多元回归

R语言多元回归
2017-06-20
R语言多元回归 多元回归是线性回归成多于两个变量之间关系的延伸。在简单的线性关系,我们有一个预测值和一个响应变量,但在多元回归我们有一个以上的预测值变量和一个响应变量。 对于多元回归的一般数 ...

R语言中的回归诊断-car包

R语言中的回归诊断-car包
2017-06-09
R语言中的回归诊断-car包 如何判断我们的线性回归模型是正确的? 1、回归诊断的基本方法 opar<-par(no.readOnly=TRUE) fit <- lm(weight ~ height, data = women) par(mfrow = c(2, 2)) plot(fit) par(op ...

数据科学家与数据工程师

数据科学家与数据工程师
2017-06-06
数据科学家与数据工程师 数据科学家和数据工程师的主要区别,可以用ETL和DAD的区别来解释。 ETL(提取/变换/载入)是数据工程师,还有数据架构师或数据库管理员(DBA)的职责。 DAD(发现/获取/提炼)是数据科 ...

 2017年最流行的15个数据科学Python库

2017年最流行的15个数据科学Python库
2017-06-02
Python 近几年在数据科学行业获得了人们的极大青睐,各种资源也层出不穷。数据科学解决方案公司 ActiveWizards 近日根据他们自己的应用开发经验,总结了数据科学家和工程师将在 2017 年最常使用的 Python 库。 核心 ...

SAS中的协方差分析

SAS中的协方差分析
2017-05-29
SAS中的协方差分析 所谓的协方差分析,就是在方差分析的基础上加上协变量这一额外因素,而方差分析则只考虑组变量这一因素。协变量可以有一个,也可以有多个。 在这篇文章中,我只讲述单变量的协方差分析。 ...

SPSS分析技术:分段拟合;电业局如何通过简单的回归模型来预测居民用电量

SPSS分析技术:分段拟合;电业局如何通过简单的回归模型来预测居民用电量
2017-05-28
SPSS分析技术:分段拟合;电业局如何通过简单的回归模型来预测居民用电量 今天给大家介绍利用分段回归模型拟合的办法来处理一些特殊的变量关系。某些变量之间的关系非常有趣,不是恒久的线性或非线性关系,可能 ...

SPSS分析技术:最小一乘法;制造企业如何合理安排生产计划

SPSS分析技术:最小一乘法;制造企业如何合理安排生产计划
2017-05-28
SPSS分析技术:最小一乘法;制造企业如何合理安排生产计划 最小二乘法的原理是以预测值和实测值之差(残差)的平方和达到最小作为判断模型优劣的评判标准,应用十分广泛。没有放之四海而皆准的真理,最小二乘法同 ...

OK