cda

数字化人才认证

首页 > 行业图谱 >

大数据世界里的谎言与事实

大数据世界里的谎言与事实
2017-10-08
大数据世界里的谎言与事实 这位先生,您好,您听过大数据么? 不不不,不是锯大树的那个锯...是很大的数据,特别大,是今年最流行的,人人都在谈的先进技术——您只要用了我们的大数据分析方案,保证您的企业 ...

数据分析:人类正在变成七秒鱼还是三秒男

数据分析:人类正在变成七秒鱼还是三秒男
2017-09-12
数据分析:人类正在变成七秒鱼还是三秒男 如果存在上帝或者三体人的话,他们会不会也怀着类似的视角看现在的人类?他们会不会觉得人类也是七秒鱼或者快进快出的三秒男? 让我产生这个想法的是最近接连不断的热 ...

一个优雅地探索相关性的新可视化方法

一个优雅地探索相关性的新可视化方法
2017-08-27
一个优雅地探索相关性的新可视化方法 一个古老的诅咒一直萦绕着数据分析:我们用来改进模型的变量越多,那么我们需要的数据就会出现指数级的增长。不过,我们通过关注重要的变量就可以避免欠拟合以及降低收集 ...
用Python从零实现贝叶斯分类器的机器学习的教程
2017-07-31
用Python从零实现贝叶斯分类器的机器学习的教程 这篇文章主要介绍了用Python从零实现贝叶斯分类器的教程,朴素贝叶斯算法属于机器学习中的基础内容、实用而高效,本文详细展示了用Python语言实现的步骤,需要的 ...

机器学习中的各种相似性、距离度量

机器学习中的各种相似性、距离度量
2017-07-25
机器学习中的各种相似性、距离度量 本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。 1. 闵可夫斯基距离 基本认识 该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...

样本统计量与总体的关系,抽样分布的概念性质

样本统计量与总体的关系,抽样分布的概念性质
2017-07-23
样本统计量与总体的关系,抽样分布的概念性质 本文对抽样分布的概念、无偏差和最小偏差等性质,以及中心极限定理和样本比例的抽样分布进行总结。 1  抽样分布基本概念 参数(parameter):参数 ...

图形和数值的数据集描述方法

图形和数值的数据集描述方法
2017-07-23
图形和数值的数据集描述方法 图形方法对数据集的描述 1. 条形图(bar graph)   条形图一般横向表示类别(class),纵向表示该类别所对应的类别频率(class frequency)。 2. 饼状图(pie graph) &nb ...

R语言与点估计学习笔记(矩估计与MLE)

R语言与点估计学习笔记(矩估计与MLE)
2017-07-22
R语言与点估计学习笔记(矩估计与MLE) 众所周知,R语言是个不错的统计软件。今天分享一下利用R语言做点估计的内容。主要有:矩估计、极大似然估计、EM算法、最小二乘估计、刀切法(Jackknife)、自助法(Boots ...

R语言与回归分析几个假设的检验

R语言与回归分析几个假设的检验
2017-07-22
R语言与回归分析几个假设的检验 一、从线性回归的假设说起 对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫 ...
R语言多元分析系列
2017-07-21
R语言多元分析系列 R语言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...
R语言与点估计学习笔记(刀切法与最小二乘估计)
2017-07-20
R语言与点估计学习笔记(刀切法与最小二乘估计) 一、       刀切法(jackknife)         刀切法的提出,是基于点估计准则无偏性。刀切 ...
R语言逻辑回归、ROC曲线和十折交叉验证
2017-07-19
R语言逻辑回归、ROC曲线和十折交叉验证 自己整理编写的逻辑回归模板,作为学习笔记记录分享。数据集用的是14个自变量Xi,一个因变量Y的australian数据集。 1. 测试集和训练集3、7分组 [html] view plain copy ...

一篇文章解决你所有关于数据分析的问题

一篇文章解决你所有关于数据分析的问题
2017-07-19
一篇文章解决你所有关于数据分析的问题  1. 数据分析多层模型介绍 这个金字塔图像是数据分析的多层模型,从下往上一共有六层:   底下第一层称为Data Sources 元数据层。 比如说在生产线上 ...
R语言判别分析
2017-07-19
R语言判别分析 本文中分三个方法介绍判别分析,Bayes判别,距离判别,Fisher判别。前两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差的一种)相等或不等的情况,由var.equal=的逻辑参 ...
R语言因子分析
2017-07-18
R语言因子分析 因子模型: X=μ + A*F* + ε 其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。 I.参数估计 为了建立因子模型,需要要 ...

SPSS分析技术:简单对应分析

SPSS分析技术:简单对应分析
2017-07-12
SPSS分析技术:简单对应分析 分类型数据(包括定类数据和定序数据)在数据分析中扮演着重要的角色,例如,分类型数据能够帮助我们对每个数据记录进行分门别类,但是由于分类型数据的特点,很多基于均值、方差和 ...

SPSS分析技术:二元logistic回归

SPSS分析技术:二元logistic回归
2017-07-11
SPSS分析技术:二元logistic回归 今天我们介绍另外一种应用范围更加广泛的回归分析方法:二元logistic回归。 应用背景 数据分析技术在实际应用过程中,大量的研究都需要对只有“是”和“否”两种选择的结 ...
spss的常见问题
2017-07-05
spss的常见问题 A:SPSS中标准化数据,可以”Analysis”-”Descriptive Analysis”中的”Descriptive...”分析,”save standarded values as variables”即可。标准化变量自动添加到变量里 Q:如何在SPS ...

SPSS统计基础-距离相关

SPSS统计基础-距离相关
2017-06-29
SPSS统计基础-距离相关 该过程计算测量变量对或个案对之间相似性或不相似性(距离)的各种统计量。随后,这些相似性或距离测量可与其他过程(例如因子分析、聚类分析或多维尺度)一起使用,以帮助分析复杂的数 ...

广义线性模型中的Gauss Seidel 迭代算法实现

广义线性模型中的Gauss Seidel 迭代算法实现
2017-06-28
广义线性模型中的Gauss Seidel 迭代算法实现 数值模拟的算法迭代公式推导 R代码实现 根据以上公式,代入迭代步骤,即可实现算法。 ##------数据模拟-------- library(MASS) ##mvrnorm() ##定义一个 ...

OK