cda

数字化人才认证

首页 > 行业图谱 >

CDA LEVEL 1 考试,知识点汇总《一元线性回归》

CDA LEVEL 1 考试,知识点汇总《一元线性回归》
2024-08-13
散点图的绘制与解读、相关系数的概念与特征 1.正线性相关 例如通常情况下,某地区的犯罪率越高,则该地区的房价越低,但由于供需环境等其他不确定因素,数据点基本落在直 线周围,我们称之为负线 ...

CDA LEVEL 1 考试,知识点汇总《数据预处理方法》

CDA LEVEL 1 考试,知识点汇总《数据预处理方法》
2024-08-13
数据预处理的基本步骤 第一步:数据集成 第二步:数据探索 在进行了基本的了解后,我们还需要把集合中的数据通过一定形式的变换,转换成适合分析和建模的形式。主要的数 ...

CDA LEVEL 1 考试,知识点汇总《回归分析》

CDA LEVEL 1 考试,知识点汇总《回归分析》
2021-02-24
1.线性回归的出现 多元线性回归的出现是非常自然的,由于在一元线性回归中,因变量只能依赖一个自变量来解释,换一句话说,就是我们 只能在一维空间中来解释世界,这是十分糟糕的,毕竟事物之间的关联是非常 ...

CDA LEVEL 1 考试,知识点汇总《因子分析》

CDA LEVEL 1 考试,知识点汇总《因子分析》
2024-08-13
一、基本概念 1.什么是因子分析? 主成分分析时一般情况下不能对主成分所代表含义进行业务上的解读,因为主成分方向上一般不会恰好某些变量权重大, 而另外一些变量权重都小,这也表现在主成分权重的形成的 ...

CDA LEVEL I 数据分析认证考试模拟题库(十二)

CDA LEVEL I 数据分析认证考试模拟题库(十二)
2024-10-05
不过,在出题前,要公布下上一期51-55题的答案,大家一起来看! 52、D 54、B 你答对了吗? 56.一家电商抽取了36个消费者年龄作为随机样本,得到样本均值为40,样本标准差为6。该电商客户年龄90%的置信 ...

pandas数据可视化原来也这么厉害

pandas数据可视化原来也这么厉害
2020-11-26
作者:小伍哥  来源:AI入门学习(公众号) 在python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易。 seaborn:是建 ...

这些不常见的统计图你都懂吗?

这些不常见的统计图你都懂吗?
2020-11-30
作者:有福有德 来源:计量与统计 SAS软件系统计出身,相应的围绕这个主题的图形输出功能与统计本身一样很全,我们可以借助原始数据绘制自己需要的图形,也可以在统计的基础上,将常用的统计量保持下来,绘 ...

R语言绘图 | 折线图画法,如何画出你满意的图?

R语言绘图 | 折线图画法,如何画出你满意的图?
2020-10-27
作者:丁点helper 来源:丁点帮你 上篇文章中,我们用世界银行的例子给大家介绍了R语言散点图怎么画,那折线图呢? 绘制折线图 如果将散点图上的点从左往右连接起来,就会得到一个折线图。今天我 ...

用python分析《世界幸福指数报告》后我们发现…

用python分析《世界幸福指数报告》后我们发现…
2020-09-21
CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】 今天教大家用python分析《世界幸福指数报告》。《世界幸福指数报告》是对全球幸福状况的一次具有里程碑意义的 ...

回归系列(五)| 线性回归分析做完后,还应考虑什么?

回归系列(五)| 线性回归分析做完后,还应考虑什么?
2020-09-09
作者:丁点helper  来源:丁点帮你 上一篇文章介绍了一般线性回归的典型操作,并且留了一个思考题。感谢小伙伴的参与,大家很厉害,没有被迷惑到,线性回归获得的系数代表的是相关关系,而非因果关 ...

回归系列(二)| 最小二乘法真有那么复杂吗?

回归系列(二)| 最小二乘法真有那么复杂吗?
2020-08-31
作者:丁点helper 来源: 丁点帮你 上一篇文章给大家留了一个思考题,问在假设检验时下面哪种写法是正确的: 大家都答对了吗?正确答案是“A”。 样本与总体回归系数的区分 这一点内容看似 ...

如何提高你的数据分析能力

如何提高你的数据分析能力
2018-07-31
如何提高你的数据分析能力 第一步:数据准备(80%时间) 获取数据(爬虫,数据仓库) 验证数据 数据清理(缺失值、孤立点、垃圾信息、规范化、重复记录、特殊值、合并数据集) 使用python进行文件读取c ...

主成分分析与因子分析及SPSS实现

主成分分析与因子分析及SPSS实现
2018-05-25
主成分分析与因子分析及SPSS实现 一、主成分分析 (1)问题提出 在问题研究中,为了不遗漏和准确起见,往往会面面俱到,取得大量的指标来进行分析。比如为了研究某种疾病的影响因素,我们可能会收集患者 ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2018-05-16
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用 ...

R与Excel之数据分析

R与Excel之数据分析
2018-05-05
R与Excel之数据分析 Excel 是一款很好用的数据分析工具,但是你分析数据时只有 Excel 这一款工具的话,则会大大影响工作效率。相比之下,R 工具更好用,而且提供的工具集模块更完整。 我从事数据分析工作已 ...

利用Python代码实现数据可视化的5种方法详解

利用Python代码实现数据可视化的5种方法详解
2018-04-20
利用Python代码实现数据可视化的5种方法详解 数据科学家并不逊色于艺术家。他们用数据可视化的方式绘画,试图展现数据内隐藏的模式或表达对数据的见解。更有趣的是,一旦接触到任何可视化的内容、数据时,人类 ...

机器学习解决问题的步骤

机器学习解决问题的步骤
2018-03-20
机器学习解决问题的步骤 针对任何一个打算由机器学习算法来解决的问题,都有一种『套路』存在,只要按照这个模板『按部就班』就能够得到一个结果。就跟一个产品的生产流水线是一个道理。但是得到结果的好坏跟你 ...

(R语言)图形过程

(R语言)图形过程
2018-03-06
(R语言)图形过程 在Windows下用window()命令可以打开图形窗口。 12.1 高级绘图命令     高级绘图函数,由函数参数提供数据生成一幅完整的图形。其中适当的坐标轴 ...

大数据处理之道(预处理方法)

大数据处理之道(预处理方法)
2018-02-28
大数据处理之道(预处理方法) 一:为什么要预处理数据? (1)现实世界的数据是肮脏的(不完整,含噪声,不一致) (2)没有高质量的数据,就没有高质量的挖掘结果(高质量的决策必须依赖于高 ...

Python语言描述机器学习之Logistic回归算法

Python语言描述机器学习之Logistic回归算法
2018-01-23
Python语言描述机器学习之Logistic回归算法 本文介绍机器学习中的Logistic回归算法,我们使用这个算法来给数据进行分类。Logistic回归算法同样是需要通过样本空间学习的监督学习算法,并且适用于数值型和标称型 ...

OK