cda

数字化人才认证

首页 > 行业图谱 >

本人用到了spss重要功能总结

本人用到了spss重要功能总结
2018-03-19
本人用到了spss重要功能总结 一、SPSS篇 (1)用spss剔除异常值 异常值:一组观测值中与平均值的偏差超过两倍标准差的测定值。 一、analyze >> descriptive statistics >>des ...

为什么你学完了68个Python函数,却依旧做不好数据分析?

为什么你学完了68个Python函数,却依旧做不好数据分析?
2018-03-08
为什么你学完了68个Python函数,却依旧做不好数据分析? 数据分析老鸟都知道,相比于自己作出好的数据分析报告,“教别人如何入门数据分析”这事情简单多了。 什么for循环呀,def函数呀,print输出呀,自变 ...

常用的机器学习&数据挖掘知识点

常用的机器学习&数据挖掘知识点
2018-03-07
常用的机器学习&数据挖掘知识点 Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最 ...

数据挖掘之KNN分类

数据挖掘之KNN分类
2018-03-05
数据挖掘之KNN分类 分类算法有很多,贝叶斯、决策树、支持向量积、KNN等,神经网络也可以用于分类。这篇文章主要介绍一下KNN分类算法。 1、介绍 KNN是k nearest neighbor 的简称,即k最邻近,就是找k个 ...

大数据入门,你需要懂这四个常识

大数据入门,你需要懂这四个常识
2018-03-02
大数据入门,你需要懂这四个常识 一、大数据分析的五个基本方面 1、可视化分析 大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可 ...

数据挖掘中的分类技术

数据挖掘中的分类技术
2018-02-27
数据挖掘中的分类技术 KNN(K最近邻算法) 算法核心:如果一个样本在特征空间中K个最相似的样本中的大多数属于一个类别,则该样本也属于这个类别,并具有这个类别的特征 在确定分类时只依靠最邻近的一个 ...

数据挖掘模型中的IV和WOE详解

数据挖掘模型中的IV和WOE详解
2018-02-25
数据挖掘模型中的IV和WOE详解 1.IV的用途 IV的全称是Information Value,中文意思是信息价值,或者信息量。 我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我 ...

机器学习新手必看十大算法

机器学习新手必看十大算法
2018-02-23
机器学习新手必看十大算法 本文介绍了机器学习新手需要了解的 10 大算法,包括线性回归、Logistic 回归、朴素贝叶斯、K 近邻算法等。 在机器学习中,有一种叫做「没有免费的午餐」的定理。简而言之,它指出 ...

大数据时代 | 数据分析方法及理论详解

大数据时代 | 数据分析方法及理论详解
2018-02-23
大数据时代 | 数据分析方法及理论详解 1 数据分析前,我们需要思考 像一场战役的总指挥影响着整个战役的胜败一样,数据分析师的思想对于整体分析思路,甚至分析结果都有着关键性的作用。 2 分析问题和解 ...

逻辑斯谛回归&最大熵模型

逻辑斯谛回归&最大熵模型
2018-02-21
逻辑斯谛回归&最大熵模型 逻辑斯谛回归和最大熵模型,从原理上看二者并不十分相关,不知是不是因为篇幅都相对较小,所以将这两部分内容放到一起。本文还是从原理、应用场景以及优缺点来做简要介绍。 ...

数据分析架构及方法

数据分析架构及方法
2018-02-18
数据分析架构及方法 一、以往的数据分析在今天的各类型企业中,数据分析岗位已经基本得到普及和认可,这个岗位的核心任务往往是支撑运营和营销,将企业内部的数据,客户的数据进行分析和总结,形成以往工作情况 ...

浅析预测分析注定失败的思考方式

浅析预测分析注定失败的思考方式
2018-02-12
浅析预测分析注定失败的思考方式 虽说预测分析是一项很得人心的技术,每个人都希望能通过使用预测分析方法和预测分析工具,从而可提前看到未知的结果,来避免失败,但如果没有做好准备,信手拈来的使用预测分析 ...

数据挖掘概念综述

数据挖掘概念综述
2018-01-29
数据挖掘概念综述 数据挖掘又称从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持。KDD一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。随后在1991年、1993年和199 ...

DT时代,如何成为十字复合型数据分析师

DT时代,如何成为十字复合型数据分析师
2018-01-25
DT时代,如何成为十字复合型数据分析师 当前社会正从IT到DT智能时代,传统行业嫁接互联网,产生的是加法效应;大数据创新驱动,产生的是乘法效应,价值呈指数递增。DT时代拼的是人才和创新价值的能力,拼的是你 ...

利用R语言如何判别和分类

利用R语言如何判别和分类
2018-01-21
利用R语言如何判别和分类 判别分析(discriminant analysis)是一种分类技术。它通过一个已知类别的“训练样本”来建立判别准则,并通过预测变量来为未知类别的数据进行分类。       ...

R语言使用boosting方法对数据分类与交叉验证

R语言使用boosting方法对数据分类与交叉验证
2018-01-19
R语言使用boosting方法对数据分类与交叉验证 数据分类说明 与bagging方法类似,boosting算法也是先获得简单的分类器,然后通过调整错分样本的权重逐步改进分类器,使得后续分类器能够学习前一轮分类器,adab ...

R语言使用随机森林方法对数据分类

R语言使用随机森林方法对数据分类
2018-01-19
R语言使用随机森林方法对数据分类 说明 随机森林是另一类可用的集成学习方法,该算法在训练过程中将产生多棵决策树,每棵决策树会根据输入数据集产生相应的预测输出,算法采用投票机制选择类别众数做为预测 ...

R语言使用逻辑回归分类算法

R语言使用逻辑回归分类算法
2018-01-15
R语言使用逻辑回归分类算法 逻辑回归属于概率统计的分类算法模型的算法,是根据一个或者多个特征进行类别标号预测。在R语言中可以通过调用logit函数执行逻辑回归分类算法并预测输出概率。通过调用glm函数将fami ...

如何为分类问题选择合适的机器学习算法

如何为分类问题选择合适的机器学习算法
2018-01-12
如何为分类问题选择合适的机器学习算法 若要达到一定的准确率,需要尝试各种各样的分类器,并通过交叉验证选择最好的一个。但是,如果你只是为你的问题寻找一个“足够好”的算法或者一个起点,以下准则有利于 ...

数据科学家需要掌握的10个基本统计技术

数据科学家需要掌握的10个基本统计技术
2018-01-08
数据科学家需要掌握的10个基本统计技术 无论您在数据的科学性问题上持哪种看法,都无法忽视数据的持续重要性,也不能轻视分析、组织和情境化数据的能力。 根据大量的就业数据和员工反馈信息统计,在“25个最 ...

OK