热线电话:13121318867

登录
2020-06-22 阅读量: 3220
数据挖掘需了解的数据基础

来自老师,怒码


一、统计学部分

1.统计学的解决问题的思路(数据分析的四个环节、数据分析师的四大任务:收集/抓取/获取、处理/清洗、分析、解释数据)

 

2.统计学几个基本概念:

数据类型

总体和样本

参数和统计量

变量

 

3.“描述统计”分析方法:

分析角度(总体规模、对比关系、集中趋势、离散程度、偏态、峰态)

重要指标的计算(算数平均数、总体方差、总体标准差、样本方差、样本标准差、离散系数)

 

4.数据分析中常见的分布:(概率统计部分

两点分布

二项分布

正态分布、标准正态分布(概念、通过分布函数φ(x)查表计算概率、查表计算分位点Zα

t分布(概念、查表计算分位点tα

χ2分布(概念、查表计算分位点χ2α

F分布(概念、查表计算分位点Fα

 

5.估计:

总体均值的估计(单总体、双总体)

总体比例的估计(单总体、双总体)

总体方差的估计(单总体、双总体)

评价估计量的标准

两类估计方法:点估计(矩估计、最大似然估计)、区间估计

 

6.假设检验:

假设检验的原理、两类错误

假设检验的思想

假设检验的步骤

总体均值的假设检验(单总体、双总体)

总体比例的假设检验(单总体、双总体)

总体方差的假设检验(单总体、双总体)

P值法

 

7.列联分析

原理

步骤

作用

8.方差分析

原理

步骤

作用

类型

 

9.相关分析

散点图

相关系数

 

10.回归分析

模型设定

模型估计

模型检验

模型应用

 

二、高等数学(微积分)

1.导数

概念、几何意义

运算

 

三、高等数学(线性代数)

1.行列式

对角线法则(二阶、三阶)

总公式法(n阶)

性质计算法

降维法(展开法则)

 

2.矩阵

概念、特殊矩阵

运算

加、减

乘:数乘、矩阵相乘(满足前一个矩阵的行数=后一个矩阵的列数)

除:逆

转置

行列式

分块矩阵

初等变换:交换两行或两列、非零数k乘以某一行或某一列、某一行(列)乘以k加到另一行(列)

矩阵的秩:行秩=列秩,矩阵A的秩最大取mn中的最小值。

 

 

3.向量

概念

线性相关与线性无关

向量组的秩

内积

长度

正交性

特征值与特征向量


40.8026
4
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子