cda

数字化人才认证

首页 > 行业图谱 >

数据分析师教程《统计学极简入门》第7节 相关性分析

数据分析师教程《统计学极简入门》第7节 相关性分析
2024-10-09
7. 相关性分析 前面的假设检验、方差分析基本上都是围绕差异性分析,不论是单个总体还是两个总体及以上,总之都是属于研究“区别”,从本节开始,我们关注“联系”,变量之间的关系分为 函数关系和相关关系。 本节这 ...

数据分析师教程《统计学极简入门》第6节 方差分析

数据分析师教程《统计学极简入门》第6节 方差分析
2024-10-09
6. 方差分析 单因素多水平方差分析 例6.1 不同装配方式对生产的过滤系统数量的差异性检验 某城市过滤水系统生产公司,有A、B、C3种方式进行过滤水系统的装配,该公司为了研究三种装配方式生产的过滤系统数量是否有差 ...

数据分析师教程《统计学极简入门》第5节 假设检验

数据分析师教程《统计学极简入门》第5节 假设检验
2024-10-09
5. 假设检验 久经考场的你肯定对于很多概念类题目里问到的 “区别和联系” 不陌生,与之类似,在统计领域要研究的是数据之间的区别和联系 ,也就是差异性分析和相关性分析。本节我们重点关注数据的差异性分析。 我们 ...

数据分析师教程《统计学极简入门》第4节 区间估计

数据分析师教程《统计学极简入门》第4节 区间估计
2024-10-09
4. 区间估计 还以为你被上节课的内容唬住了~终于等到你,还好没放弃! 本节我们将说明两个问题:总体均值 的区间估计和总体比例 的区间估计。 区间估计经常用于质量控制领域来检测生产过程是否正常运行或者在“控 ...

数据分析师教程《统计学极简入门》第3节 数据分布

数据分析师教程《统计学极简入门》第3节 数据分布
2024-10-09
3. 数据分布 t分布、F分布和卡方分布是统计学中常用的三种概率分布,它们分别用于样本均值的推断、方差的比较和数据的拟合优度检验。 总之这3个分布很有用,首次接触你可能理解不了,但没关系你知道很重要就行了,接 ...

数据分析师教程《统计学极简入门》第2节 描述性统计

数据分析师教程《统计学极简入门》第2节 描述性统计
2024-10-09
2. 描述性统计 上一篇介绍了数据的分类、统计学是什么、以及统计学知识的大分类,本篇我们重点学习描述性统计学。 我们描述一组数据的时候,通常分三个方面描述:集中趋势、离散趋势、分布形状。通俗来说,集中趋势 ...
利用Python进行数据分析
2024-09-20
数据分析是现代商业和科学研究中不可或缺的一部分。Python凭借其强大的库和易用性,成为数据分析领域的首选编程语言。本文将深入探讨如何使用Python进行数据清洗和预处理,介绍适合数据分析的主要库,并详述统计分析 ...
如何使用Python进行数据清洗?
2023-12-04
在现代数据驱动的世界中,数据清洗是一个至关重要的步骤。通过清理、转换和整理原始数据,我们可以确保数据的质量和一致性,从而提高后续分析和建模的准确性。Python作为一种功能强大且易于使用的编程语言,在数据 ...
如何中心化数据以进行分析?
2023-06-28
中心化是一种常见的数据处理技术,它可以帮助我们更好地理解和分析数据。本文将介绍什么是中心化,为什么要进行中心化以及如何进行中心化。 什么是中心化? 中心化是指通过减去平均值将数据移到中心位置,使得数据 ...
如何对数据汇总计算和分组?
2023-06-20
数据汇总计算和分组是数据分析中非常重要的一环。它们可以帮助我们对数据进行更深入的理解,并从中提取有用的信息。在这篇文章中,我将介绍如何对数据进行汇总计算和分组,以及它们的应用场景。 数据汇总计算 数据 ...
数据清洗常用工具与技巧?
2023-06-17
数据清洗是数据预处理的一个重要步骤,它涉及到对数据进行检查、修正和转换,以确保数据质量和可靠性。在实际应用中,数据常常存在缺失、重复、异常等问题,因此需要使用各种工具和技巧对数据进行清洗。 一、数据清 ...
数据分析师必备条件是什么
2023-05-30
作为数据分析领域的权威专家,我们需要探讨数据分析师必备的条件。在当前迅速发展的数字时代,数据已经成为了企业决策过程中不可或缺的资源。因此,数据分析师的角色变得越来越重要。下面将介绍三个必备的条件,以 ...
请教下pandas如何根据两列的判断条件生成新的列?
2023-05-30
Pandas是Python中最流行的数据分析工具之一,它提供了高效、灵活和易于使用的数据结构和操作函数。其中一个重要的功能就是可以根据多个列的判断条件生成新的列,本文将介绍如何在pandas中实现这种操作。 什么是条件 ...
anaconda里的spyder为什么打不开?
2023-05-30
Anaconda是一种广泛使用的Python发行版,其中包含了许多流行的Python工具和库。Spyder是Anaconda中的一款Python IDE(集成开发环境),它提供了一个交互式的编程环境,可以方便地进行代码编辑、调试和运行。然而,有 ...
win10已经安装了python3,在不卸载的情况下如何顺利安装、使用anaconda?
2023-05-22
安装和使用Anaconda与Python 3的同时是完全可能的,因为Anaconda包含了自己的Python发行版以及众多常用数据科学工具和库。这篇文章将向你展示如何在不卸载现有Python 3的情况下顺利安装和使用Anaconda。 步骤一:下 ...
pandas中如何求某个特定值在数据框中出现的次数?
2023-05-09
在 Pandas 中,可以使用 value_counts() 方法来计算数据框中某个特定值出现的次数。这个方法可以应用于 Series 对象和 DataFrame 对象。 对于 Series 对象,value_counts() 方法返回一个 Series,其中包含每个唯一值 ...
python: pandas如何向下填充NaN的数值?
2023-05-05
Pandas 是一个非常强大的 Python 库,它提供了许多用于数据处理和操作的函数和工具。在数据分析中,经常会遇到缺失值的问题,而 Pandas 提供了一些方法来处理 NaN 值,比如向下填充 NaN。 本文将介绍 Pandas 中向下 ...
pandas中dropna函数的作用是什么?
2023-05-04
pandas是一个开源的Python库,用于数据分析和处理。它提供了许多内置函数和工具,以帮助处理各种数据操作和任务。其中之一就是dropna()函数,该函数可以删除存在缺失值的行或列。 dropna()函数是pandas中用于处理缺 ...

怎么利用pandas实现区间频率分布的展现?

怎么利用pandas实现区间频率分布的展现?
2023-05-04
Pandas是Python中用于数据分析和处理的常用工具,它提供了一系列方便易用的数据结构和函数。在数据分析中,我们经常需要对数据进行频率分布的计算和展示,而Pandas提供了很多方便的函数可以实现这一功能。本文将介绍 ...
pandas如何提取每天固定时间段的数据?
2023-04-24
在数据分析和处理中,pandas是一个强大的工具。它可以轻松地在Python中进行数据处理,以及进行多种常见的数据操作,如索引、切片、聚合和过滤等。在这篇文章中,我们将学习如何使用pandas提取每天固定时间段的数据。 ...

OK