cda

数字化人才认证

首页 > 行业图谱 >

数据挖掘总结之主成分分析与因子分析
2018-01-12
数据挖掘总结之主成分分析与因子分析 主成分分析与因子分析 1)概念: 主成分分析概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。主成分分析(PCA)是一种数据降维技巧,它能 ...

浅谈数据分析和数据建模

浅谈数据分析和数据建模
2017-12-15
浅谈数据分析和数据建模 大数据应用有几个方面,一个是效率提升,帮助企业提升数据处理效率,降低数据存储成本。另外一个是对业务作出指导,例如精准营销,反欺诈,风险管理以及业务提升。过去企业都是通过线下 ...

数据分析中非常实用的自编函数和代码模块整理

数据分析中非常实用的自编函数和代码模块整理
2017-12-04
数据分析中非常实用的自编函数和代码模块整理 搞了接近四个周的模型开发工作,今天整理代码文件,评分卡模型基本告一段落了。那么在模型开发或者是我们日常的数据分析工作中,根据我们具体的业务需求,经常会重 ...

缺失数据处理-插值法

缺失数据处理-插值法
2017-12-04
缺失数据处理-插值法 在数据挖掘中,原始海量的数据中存在着大量不完整、不一致、有异常、偏离点的数据。这些问题数据轻则影响数据挖掘执行效率,重则影响执行结果。因此数据预处理工作必不可少,而其中常见工 ...

在人工智能和大数据产品的开发中,有哪些需要特别注意

在人工智能和大数据产品的开发中,有哪些需要特别注意
2017-11-24
在人工智能和大数据产品的开发中,有哪些需要特别注意 人工智能是近年来科技发展的重要方向,大数据的采集、挖掘、应用的技术越来越受到瞩目。在人工智能和大数据产品的开发过程中,有哪些特别需要注意的要点? ...
SPSS回归分析:自动线性模型
2017-11-19
SPSS回归分析:自动线性模型 一、自动线性模型(分析-回归-自动线性建模) 1、 目标(分析-回归-自动线性建模-构建选项) 2、基本(分析-回归-自动线性建模-构建选项) 自动准备 ...
SPSS分类分析:最近邻元素分析
2017-11-15
SPSS分类分析:最近邻元素分析 一、最近邻元素分析(分析-分类-最近邻元素) 1、概念:根据个案间的相似性来对个案进行分类。类似个案相互靠近,而不同个案相互远离。因此,通过两个个案之间的距离 ...
SPSS数据准备:数据验证
2017-11-02
SPSS数据准备:数据验证 一、数据准备:    随着计算系统能力的提高,对信息的需要成比例增长,导致收集的数据越来越多—出现更多的个案、更多的变量以及更多的数据输入错误。这些 ...
【北京新光在线教育咨询有限公司】招聘数据分析师
2017-08-26
【北京新光在线教育咨询有限公司】招聘数据分析师 北京新光在线教育咨询有限公司(Bright Education Online)是一家专业测评服务公司。公司拥有独具优势的核心技术和巨大的发展潜力,深受资本市场特别是国内顶尖大学 ...

学会数据分析背后的挖掘思维,分析就完成了一半

学会数据分析背后的挖掘思维,分析就完成了一半
2017-08-09
学会数据分析背后的挖掘思维,分析就完成了一半 在数据分析中,模型是非常有用和有效的工具和数据分析应用的场景,在建立模型的过程中,数据挖掘很多时候能够起到非常显著的作用。伴随着计算机科学的发展,模型也越 ...

R语言的常用函数速查

R语言的常用函数速查
2017-07-21
R语言的常用函数速查 基本 一、数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量character;字符型向量 list:列表 data.frame:数据框c:连接为向量或列表 length:求长度 subset:求子集 ...

R语言:异常值检验、离群点分析、异常值处理

R语言:异常值检验、离群点分析、异常值处理
2017-07-17
R语言:异常值检验、离群点分析、异常值处理 笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值) 异常值处理方 ...
R语言时间序列数据应用xts
2017-07-07
R语言时间序列数据应用xts zoo是时间序列的基础库,是面向通用的设计。 xts 是对时间序列库(zoo) 的一种扩展实现。xts 类型继承了zoo 类型,丰富了时间序列数据处理的函数。 一、xts对象的结构和定义 1、 ...

R语言做数据探索

R语言做数据探索
2017-06-09
R语言做数据探索 1 数据导入 数据常用格式.csv/.txt/.xls/.json/.xml。 R语言提供相应的函数和库实现对这些数据格式的导入。 现已导入.csv格式和以tab分隔的.txt格式为例 # 读.csv格式 data1<-read.c ...

SPSS统计基础---频率的使用

SPSS统计基础---频率的使用
2017-05-22
SPSS统计基础---频率的使用 频率过程提供有助于描述多种类型的变量的统计量和图形显示。频率过程是查看数据理想的开始位置。对于频率报告和条形图,可以用升序或降序排列不同的值,也可以按其频率对类别进行排 ...

说说什么是数据挖掘

说说什么是数据挖掘
2017-05-13
说说什么是数据挖掘 数据挖掘就是指从数据中获取知识。 好吧,这样的定义方式比较抽象,但这也是业界认可度最高的一种解释了。对于如何开发一个大数据环境下完整的数据挖掘项目,业界至今仍没有统一的规范 ...

好课推荐丨CDA建模分析师-R语言

好课推荐丨CDA建模分析师-R语言
2017-05-05
数据科学家被认为是21世纪最性感也是最具发展前景的职业,目前有75%左右的数据科学家使用R语言,有35%左右的数据科学家将R语言作为首选统计分析工具。今天,我们来了解一下R语言的前世今生。 一、R的 ...

SPSS基本统计图表的制作

SPSS基本统计图表的制作
2017-04-30
SPSS基本统计图表的制作 基本统计图表的制作 1 P-P图和Q-Q图 P-P图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P ...
R语言:函数使用技巧(循环、if族/for、switch、repeat、ifelse、stopifnot)
2017-04-29
R语言:函数使用技巧(循环、if族/for、switch、repeat、ifelse、stopifnot) 1、循环 [plain] view plain copy print?在CODE上查看代码片派生到我的代码片     ##循环for      ...
R语言:list用法、批量读取、写出数据时的用法
2017-04-25
R语言:list用法、批量读取、写出数据时的用法 列表是一种特别的对象集合,它的元素也由序号(下标)区分,但是各元素的类型可 以是任意对象,不同元素不必是同一类型。元素本身允许是其它复杂数据类型,比如, ...

OK