cda

数字化人才认证

首页 > 行业图谱 >

信息熵与方差-联系与区别

信息熵与方差-联系与区别
2016-04-05
    熵的概念很早就在物理学中出现,热力学中的熵用于衡量物质状态的混乱程度。霍金在《时间简历》中也对熵有着有趣的表述:一个常有人打扫清洁的屋子,熵值低,一个不打扫的屋子,熵值就高,自然界 ...

大数据面试可能遇到的问题

大数据面试可能遇到的问题
2016-04-04
大数据面试可能遇到的问题 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的? 3、什么是:提升值、关键绩效指标、强壮 ...
解密 : 从互联网巨头数据挖掘类招聘笔试题目看我们还差多少知识
2016-04-02
1 从阿里数据分析师笔试看职业要求 以下试题是来自阿里巴巴招募实习生的一次笔试题,从笔试题的几个要求我们一起来看看数据分析的职业要求。 一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常值( ...

数据分析与统计推断:线性回归

数据分析与统计推断:线性回归
2016-03-31
数据分析与统计推断:线性回归 相关性(correlation) 相关性描述了两个变量之间线性关联的强度,表示符号为R。 属性: 相关系数的幅度(绝对值)测量两个数字变量之间线性关联的强度 相关系数 ...

如何让你的分析报告更具洞察力?实现从数据到观点的五点分享!

如何让你的分析报告更具洞察力?实现从数据到观点的五点分享!
2016-03-31
如何让你的分析报告更具洞察力?实现从数据到观点的五点分享! 大数据比任何时候都谈论的多,因此公司的管理层比以往任何时间都希望通过数据分析得到他们感兴趣的东西,因此都会为此组建一支网站分析团队去发现 ...

用SPSS做判别分析的流程介绍

用SPSS做判别分析的流程介绍
2016-03-22
用SPSS做判别分析的流程介绍 如何用SPSS做判别分析呢?下面我们就说说用SPSS的整个操作流程。 1.Discriminant Analysis判别分析主对话框     如图 1-1 所示   ...

统计中分类算法总结

统计中分类算法总结
2016-03-19
统计中分类算法总结 对于很多做统计的人员来说,对统计中的算法知道的不是很全面,下面就对统计中分类算法做个总结。 数据转换 主要有两种: l   归一化处理 主要通过把数据归一到一 ...
数据挖掘十大算法总结--核心思想,算法优缺点,应用领域,数据挖掘优缺点
2016-03-19
数据挖掘十大算法总结--核心思想,算法优缺点,应用领域,数据挖掘优缺点 本文所涉算法均只概述核心思想,具体实现细节参看“数据挖掘算法学习”分类下其他文章,不定期更新中。转载请注明出处,谢谢。 参考 ...

如何利用 Excel 进行高级数据分析?

如何利用 Excel 进行高级数据分析?
2016-03-16
高级的数据分析会涉及回归分析、方差分析和T检验等方法,不要看这些内容貌似跟日常工作毫无关系,其实往高处走,MBA的课程也是包含这些内容的,所以早学晚学都得学,干脆就提前了解吧,请查看以下内容。 ...

统计名词和数据挖掘术语大盘点

统计名词和数据挖掘术语大盘点
2016-03-12
统计名词和数据挖掘术语大盘点 一、数据挖掘术语 【算法】指的是用于实现某一数据挖掘技术-如分类树、辨识分析等等的特定程序。 【属性】也被称为“特性”、“变量”、或者从数据库的观点,是一个“域” ...

大数据时代,如何成为数据科学人才?

大数据时代,如何成为数据科学人才?
2016-03-11
大数据时代,如何成为数据科学人才? 什么是数据科学? 数据科学有很多很多定义,最基本的定义就是computer science,还有数学、统计、目标、知识,这是最基本的,再说多了就过分了。一般对于年轻人来说,现在 ...

统计学中为什么要对变量取对数?

统计学中为什么要对变量取对数?
2016-03-08
统计学中为什么要对变量取对数? 对数据做一些变换的目的是它能够让它符合我们所做的假设,使我们能够在已有理论上对其分析。 对数变换(log transformation)是特殊的一种数据变换方式,它可以将一类我们理论上 ...

数据挖掘实战训练

数据挖掘实战训练
2016-03-08
数据挖掘实战训练 问题:如果研究的变量为连续变量,且多种因素对它有影响,本研究共分为四组,并且组间AGE、BMI、BP等差异均具有统计学意义,应该如何校正AGE、BMI、BP等? 这里: Y是连续性变量,我们 ...
如何让你的分析报告更具洞察力 ?实现从数据到观点的5点分享
2016-03-07
目前500强的公司每天可产生超过1GB供网站分析的原始的数据,而对于一些传媒公司来说,数据量往往要大数倍。 大数据比任何时候都谈论的多,因此公司的管理层比以往任何时间都希望通过数据分析得到他们感兴趣的东西, ...

用R语言进行数据分析:常用函数参考

用R语言进行数据分析:常用函数参考
2016-02-24
用R语言进行数据分析:常用函数参考 对于很多数据分析师来说,R语言都不陌生,应为在做数据分析时,常会用到它,下面是我总结用R语言进行数据分析:常用函数参考。希望对你们有所帮助。 基本 一、数据管 ...

 数据挖掘领域的10大经典算法分享

数据挖掘领域的10大经典算法分享
2016-02-12
 数据挖掘领域的10大经典算法分享 在和数据挖掘方面的朋友聊天时,会讨论一些关于挖掘领域方面知识,对于10大经典算法还有过一次激烈的讨论,应为当时是刚接触数据挖掘,不是很懂。国际权威的学术组织the ...

SAS 常用过程之 PROC UNIVARIATE

SAS 常用过程之 PROC UNIVARIATE
2016-02-03
SAS 常用过程之 PROC UNIVARIATE PROC UNIVARIATE 含七道指令它们的格式如下(每道指令结束后才用逗号分开): PROC UNIVARIATE 选项串; VAR 变量名称串; BY 变量名称串; FREQ 变量名称; WEIGH ...

如何用SPSS做数据正态化转换?

如何用SPSS做数据正态化转换?
2016-01-31
数据分析师在用spss做数据不完全符合正态分布,接下来的问题是,很多学科都在讲大样本不用太考虑正态分布问题,但事实上由此造成的误差确实存在,有时还会比较大。那么数据分析师如何用SPSS做数据正态化转换呢? ...

利用统计学知识为android应用的启动时间做数据分析

利用统计学知识为android应用的启动时间做数据分析
2016-01-31
利用统计学知识为android应用的启动时间做数据分析 一.数据说明 启动时间用同一台设备,同一个包进行启动时间的测试,其中三组样本数据(每组100份对比数据)如下: 设备pr ...

数据分析方法汇总(1)

数据分析方法汇总(1)
2016-01-18
数据分析方法汇总(1) 很长时间没有写过关于数据分析师的文章了,做数据分析师也好多年了,近期好多数据小白们在问,数据分析师的数据分析方法都有哪些,下面是对数据分析方法的总结。 一、描述统计 描述 ...

OK