cda

数字化人才认证

首页 > 行业图谱 >

 2017年最流行的15个数据科学Python库

2017年最流行的15个数据科学Python库
2017-06-02
Python 近几年在数据科学行业获得了人们的极大青睐,各种资源也层出不穷。数据科学解决方案公司 ActiveWizards 近日根据他们自己的应用开发经验,总结了数据科学家和工程师将在 2017 年最常使用的 Python 库。 核心 ...

SPSS分析技术:多重线性回归模型;极端值与多重共线性的识别与处理

SPSS分析技术:多重线性回归模型;极端值与多重共线性的识别与处理
2017-05-28
SPSS分析技术:多重线性回归模型;极端值与多重共线性的识别与处理 如果拟合质量不好,可能存在的问题主要有以下两个方面: 极端值(强点)的影响。我们都知道,在线性回归分析中,自变量回归系数的确定主 ...

SPSS分析技术:分段拟合;电业局如何通过简单的回归模型来预测居民用电量

SPSS分析技术:分段拟合;电业局如何通过简单的回归模型来预测居民用电量
2017-05-28
SPSS分析技术:分段拟合;电业局如何通过简单的回归模型来预测居民用电量 今天给大家介绍利用分段回归模型拟合的办法来处理一些特殊的变量关系。某些变量之间的关系非常有趣,不是恒久的线性或非线性关系,可能 ...

SPSS分析技术:最小一乘法;制造企业如何合理安排生产计划

SPSS分析技术:最小一乘法;制造企业如何合理安排生产计划
2017-05-28
SPSS分析技术:最小一乘法;制造企业如何合理安排生产计划 最小二乘法的原理是以预测值和实测值之差(残差)的平方和达到最小作为判断模型优劣的评判标准,应用十分广泛。没有放之四海而皆准的真理,最小二乘法同 ...

浅析数据分析在销售管理过程中对企业发展的价值

浅析数据分析在销售管理过程中对企业发展的价值
2017-05-25
浅析数据分析在销售管理过程中对企业发展的价值 “数据(data)”已经成为21世纪商业的代名词。聚拢大量数据的浪潮正变得愈加猛烈。公司无论所属行业和规模大小,都竭力想要实现以数据为基础驱动公司内部和外部 ...

SPSS详细操作:正态转换的多种方法

SPSS详细操作:正态转换的多种方法
2017-05-23
SPSS详细操作:正态转换的多种方法 一、正偏态分布资料 1、轻度正偏态分布 偏度值>0,偏度值为其标准误差的2-3倍,即Z-score=2~3,此时认为资料分布呈现轻度的正偏态分布,可以考虑对变量x取根号开平方的 ...

大数据如何在制造企业中落地

大数据如何在制造企业中落地
2017-05-23
大数据如何在制造企业中落地 每个企业都有自己的规划和自己企业在运营环节的管理最佳实践,毕竟,这么多年的信息化建设,对企业的产品制造的方方面面都有了很大的提升。大数据对促进供应链中的生产环节产生了前 ...

关于如何解释机器学习的一些方法

关于如何解释机器学习的一些方法
2017-05-20
关于如何解释机器学习的一些方法 到现在你可能听说过种种奇闻轶事,比如机器学习算法通过利用大数据能够预测某位慈善家是否会捐款给基金会啦,预测一个在新生儿重症病房的婴儿是否会罹患败血症啦,或者预测一位 ...

用Python处理数据集中的缺失值

用Python处理数据集中的缺失值
2017-05-18
用Python处理数据集中的缺失值 现实生活中的数据经常存在缺失值。产生缺失值的原因有很多,如观察资料未被记录、数据损坏等。由于很多机器学习算法不支持存在缺失值的数据集,正确处理缺失值就显得比较重要了。 ...

SPSS分析技术:多重线性回归模型;极端值与多重共线性的识别与处理

SPSS分析技术:多重线性回归模型;极端值与多重共线性的识别与处理
2017-05-10
SPSS分析技术:多重线性回归模型;极端值与多重共线性的识别与处理 如果拟合质量不好,可能存在的问题主要有以下两个方面: 极端值(强点)的影响。我们都知道,在线性回归分析中,自变量回归系数的确定主要 ...

利用Python练习数据挖掘

利用Python练习数据挖掘
2017-05-03
利用Python练习数据挖掘 覆盖使用Python进行数据挖掘查找和描述数据结构模式的实践工具。 第一节 介绍 数据挖掘是一个隐式提取以前未知的潜在有用的数据信息提取方式。它使用广泛,并且是众多应用的技术基础。 ...

SPSS常用统计图

SPSS常用统计图
2017-05-02
SPSS常用统计图 SPSS统计图形的绘制 ? 一、概述 ? 二、统计图的分类 ? 三、常用统计图 ? 四、小结 一、概述 ? 统计描述: ? 包括统计指标和统计图、表 ? 统计图的特征: ? (1)形象化: ? 变抽象的文字为形象 ...

R语言:异常值检验、离群点分析、异常值处理

R语言:异常值检验、离群点分析、异常值处理
2017-04-29
R语言:异常值检验、离群点分析、异常值处理 笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值) 异常值处理 ...

R语言中如何使用最小二乘法

R语言中如何使用最小二乘法
2017-04-28
R语言中如何使用最小二乘法  这里只是介绍下R语言中如何使用最小二乘法解决一次函数的线性回归问题。         代码如下: > x<-c(6.19,2.51,7.29,7.01,5.7,2.66,3.98, ...

R与Excel之数据分析

R与Excel之数据分析
2017-04-22
R与Excel之数据分析 Excel 是一款很好用的数据分析工具,但是你分析数据时只有 Excel 这一款工具的话,则会大大影响工作效率。相比之下,R 工具更好用,而且提供的工具集模块更完整。 我从事数据分析工作已 ...

R语言中plyr包

R语言中plyr包
2017-04-20
R语言中plyr包 apply族函数是R语言中很有特色的一类函数,包括了apply、sapply、lapply、tapply、aggregate等等。这一类函数本质上是将数据进行分割、计算和整合。它们在数据分析的各个阶段都有很好的用处。例 ...

解锁数据分析的正确姿势:描述统计

解锁数据分析的正确姿势:描述统计
2017-04-07
当获得一份数据集时,你会怎么做? 立马撩起袖管进行分析么?这不是一个好建议。无数的经验告诉我们,如果分析师不先行了解数据集的质量,后续的推断分析是事倍功半的。 正确的处理方法是先 ...

留一交叉验证及SAS代码

留一交叉验证及SAS代码
2017-04-01
留一交叉验证及SAS代码 在数据量很少,用什么模型?我们总结过当数据量很少时如何选择模型和方法,以使得数据能够最大限度的得到利用。 其中有一个方法就是做交叉验证。 我有备选的模型G(x1, x2, x3), G ...

K-means算法原理与R语言实例

K-means算法原理与R语言实例
2017-03-17
K-means算法原理与R语言实例 聚类是将相似对象归到同一个簇中的方法,这有点像全自动分类。簇内的对象越相似,聚类的效果越好。支持向量机、神经网络所讨论的分类问题都是有监督的学习方式,现在我们所介绍的聚 ...

机器学习入门:K-近邻算法

机器学习入门:K-近邻算法
2017-03-11
机器学习入门:K-近邻算法 先来一个简单的例子,我们如何来区分动作类电影与爱情类电影呢?动作片中存在很多的打斗镜头,爱情片中可能更多的是亲吻镜头,所以我们姑且通过这两种镜头的数量来预测这部电影的主题 ...

OK