数据分析师教程《统计学极简入门》第3节数据分布-CDA数据分析师官网

热线电话：13121318867

首页数据分析教程数据分析师教程《统计学极简入门》第3节数据分布

数据分析师教程《统计学极简入门》第3节数据分布

2024-10-09

3. 数据分布

t分布、F分布和卡方分布是统计学中常用的三种概率分布，它们分别用于样本均值的推断、方差的比较和数据的拟合优度检验。

总之这3个分布很有用，首次接触你可能理解不了，但没关系你知道很重要就行了，接着往下看，我们在介绍三大分布之前，先看一下正态分布和标准正态分布：

正态分布（Normal Distribution）

正态分布也被称为高斯分布，是统计学中最常见的概率分布之一。

正态分布具有钟形曲线的特征，均值和标准差是其两个重要的参数。

import numpy as np
import seaborn as sns

mean = 3  # 均值
std = 4  # 标准差
size = 1000  # 生成1000个随机数

data = np.random.normal(mean, std, size=size)
sns.histplot(data, kde=True)

标准正态分布（Standard Normal Distribution）

标准正态分布是一种特殊的正态分布，其均值为0，标准差为1。在统计学中，标准正态分布经常用于标准化数据或进行假设检验。

import numpy as np
import seaborn as sns

size = 1000  # 生成1000个随机数

data = np.random.standard_normal(size=size)
sns.histplot(data, kde=True)

t分布（t Distribution）

t分布是一种概率分布，用于小样本情况下对总体均值的推断。当样本容量较小或总体方差未知时，使用T分布进行推断更准确。T分布的形状类似于正态分布，但尾部较宽。T分布的自由度（degrees of freedom）决定了其形状。

import numpy as np
import seaborn as sns

df = 10  # 自由度
size = 1000  # 生成1000个随机数

data = np.random.standard_t(df, size=size)
sns.histplot(data, kde=True)

F分布（F Distribution）

F分布是一种概率分布，用于比较两个样本方差的差异。F分布常用于方差分析和回归分析中。F分布的形状取决于两个自由度参数，分子自由度和分母自由度。

import numpy as np
import seaborn as sns

dfn = 5  # 分子自由度
dfd = 10  # 分母自由度
size = 1000  # 生成1000个随机数

data = np.random.f(dfn, dfd, size=size)
sns.histplot(data, kde=True)

卡方分布（Chi-Square Distribution）

卡方分布是一种概率分布，用于检验观察值与理论值之间的拟合优度。卡方分布常用于拟合优度检验、独立性检验中。卡方分布的自由度参数决定了其形状。

import numpy as np
import seaborn as sns

df = 5  # 自由度
size = 1000  # 生成1000个随机数

data = np.random.chisquare(df, size)
sns.histplot(data, kde=True)

番外篇：三大分布互相推导

注：本节作为延伸阅读，初学者简单了解即可

十九世纪中叶至二十世纪初，有三位统计学届杰出代表： 皮尔逊( Pearson) 、戈塞特( Gosset) 、费希尔( Fisher) 表，他们是统计学三大分布的始创者。

皮尔逊(Pearson) 在创立拟合优度理论的过程中发现了分布;
戈塞特( Gosset) 发现分布的过程正是 小样本理论 创立的过程;
费希尔( Fisher) 在创立 方差分析 理论的过程中发现了分布。

这便是著名的三大抽样分布包括: 分布、分布和分布

分布是由个相互独立的标准正态分布 的平方和确定的分布，记作 ~ ，即

分布的分子是一个，分母是自由度为的分布与自由度的比值再开方确定的分布，记作 ~ ，即

分布是由两个分布与其自由度比值的比值确定的分布，记作 ~ ，即

三大分布的推导

三大分布的推导例题

下期预告：《Python统计学极简入门》第4节区间估计

这里分享一个你一定用得到的小程序——CDA数据分析师考试小程序。它是专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分，通过该小程序，考生可以享受更便捷的服务。扫码加入CDA小程序，与圈内考生一同学习、交流、进步！

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

正态分布 seaborn 概率分布 numpy F分布方差卡方分布 T分布

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇数据分析师教程《统计学极简入门》第2节描述性统计

下一篇数据分析师教程《统计学极简入门》第4节区间估计

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

数据分析师教程《统计学极简入门》第3节数据分布

3. 数据分布

正态分布（Normal Distribution）

标准正态分布（Standard Normal Distribution）

t分布（t Distribution）

F分布（F Distribution）

卡方分布（Chi-Square Distribution）

番外篇：三大分布互相推导

三大分布的推导例题

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：赵森淼谈药企数据分析从业体验与转 ...

【CDA干货】卡方检验与T检验结果的标准化解读方法及 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

【CDA干货】MySQL查询不包含指定列的实现方法、实操 ...

【CDA干货】Python中content属性的核心特性、实操应 ...

从零基础到数据科学家：CDA三本官方教材全解读 ...

【CDA干货】资金财务领域本体模型与业务领域模型的 ...

【CDA干货】数字经济下企业数据战略的落地实践与案 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：刘伟谈金融行业数据分析实践与转岗 ...

【CDA干货】SQL LEFT JOIN查询耗时过长的成因分析与 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】产品生命周期理论及经典案例应用分析 ...

【CDA干货】数据透视表数据批量对应匹配其他工作表 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

何种调研问卷数据适用卡方检验及实操应用分析 ...

CDA持证人专访：刘伟谈金融行业数据分析实践与转岗 ...

从“整体波动”到“因子归因”：CDA数据分析师视角 ...

【CDA干货】逻辑回归中因子与协变量的核心区别、模 ...

【CDA干货】依托大数据分析优化企业营销策略的路径 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

数据分析师教程《统计学极简入门》第3节 数据分布

3. 数据分布

正态分布（Normal Distribution）

标准正态分布（Standard Normal Distribution）

t分布（t Distribution）

F分布（F Distribution）

卡方分布（Chi-Square Distribution）

番外篇：三大分布互相推导

三大分布的推导例题

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：赵森淼谈药企数据分析从业体验与转 ...

【CDA干货】卡方检验与T检验结果的标准化解读方法及 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

【CDA干货】MySQL查询不包含指定列的实现方法、实操 ...

【CDA干货】Python中content属性的核心特性、实操应 ...

从零基础到数据科学家：CDA三本官方教材全解读 ...

【CDA干货】资金财务领域本体模型与业务领域模型的 ...

【CDA干货】数字经济下企业数据战略的落地实践与案 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：刘伟谈金融行业数据分析实践与转岗 ...

【CDA干货】SQL LEFT JOIN查询耗时过长的成因分析与 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】产品生命周期理论及经典案例应用分析 ...

【CDA干货】数据透视表数据批量对应匹配其他工作表 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

何种调研问卷数据适用卡方检验及实操应用分析 ...

CDA持证人专访：刘伟谈金融行业数据分析实践与转岗 ...

从“整体波动”到“因子归因”：CDA数据分析师视角 ...

【CDA干货】逻辑回归中因子与协变量的核心区别、模 ...

【CDA干货】依托大数据分析优化企业营销策略的路径 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

数据分析师教程《统计学极简入门》第3节数据分布