cda

数字化人才认证

首页 > 行业图谱 >

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...

大学读的文科/商科专业,如何转型数据分析师?

大学读的文科/商科专业,如何转型数据分析师?
2021-12-08
互联网和移动互联网时代,程序员成了公认的高薪工作,是众多企业的抢手人才。但凡大学专业沾边计算机的理科生,都有机会去竞逐一下互联网大厂的高薪岗位。 其实文科生已经意识到自己的竞争对手 ...

如何利用 pandas 根据数据类型进行筛选?

如何利用 pandas 根据数据类型进行筛选?
2021-09-24
来源:早起Python 作者:刘早起 前两天,有一位读者在知识星球提出了一个关于 pandas 数据清洗的问题。 他的数据大致如下 现在希望分别做如下清洗 “A列中非字符行B列中非日 ...

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为
2021-09-08
淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。 分析目标与思路 何判断高价值用户, ...

在R中用箱形图做组间比较

在R中用箱形图做组间比较
2021-09-07
来源:丁点帮你 作者:丁点helper 之前的文章讲了如何用R绘制箱形图,以此来帮助我们了解数据的整体分布情况、是否存在异常值。除此之外,箱形图还可以进行数据的组间比较。 分组变量的数据清理 多重 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)
2021-08-11
不过,在出题前,要公布上一期Level Ⅲ 中51-55题的答案,大家一起来看! 52、C 54、B A、数据正规化 C、数据一般化 57、数据准备方法是在评估模型性能之前对整个数据集进行处理,这会导致数据泄 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
2021-08-05
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 42、A 44、B A.会将数据缩放到0-1范围之内 C.作用是将不同量纲数据的量纲进行统一 47.常见的缺失值填充方法有填充默认值 ...

运用Python爬取并分析全国5w+新楼盘近况

运用Python爬取并分析全国5w+新楼盘近况
2021-07-14
作者:云朵君 通过爬取全国城市在售预售新盘,下面以获取单个城市为例,介绍爬取数据部门主要代码。完整代码见文末获取方式。 1、定义函数 2、获取数据的主函数 def get_data(c_city, c ...

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码
2021-07-07
作者:云朵君 本文主要介绍回归模型图lmplot、线性回归图regplot,这两个函数的核心功能很相似,都会绘制数据散点图,并且拟合关于变量x,y之间的回归曲线,同时显示回归的95%置信区间。 所有图形将使 ...

CDA LEVEL II 数据分析认证考试模拟题库(四十六)

CDA LEVEL II 数据分析认证考试模拟题库(四十六)
2021-07-01
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看! 87、B 89、D A.均值加减标准差法 C.聚类法 92、在对数据进行可视化展示的时候合适的图表决定了可视化的效果。下面关于直 ...

CDA LEVEL II 数据分析认证考试模拟题库(十九)

CDA LEVEL II 数据分析认证考试模拟题库(十九)
2024-08-14
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看! 87、C 89、A 你答对了吗? 91.数据清洗包括处理缺失值、异常值、重复值等脏数据,处理每种脏数据的方法也是多种多样。以下哪些 ...

CDA LEVEL II 数据分析认证考试模拟题库(十八)

CDA LEVEL II 数据分析认证考试模拟题库(十八)
2021-05-19
查看更多题目 81、C 83、D 85、A A.ETL过程中的主要环节是数据抽取、数据转换和加工、数据流转 C.常用ETL工具包括datastage,Informatica等 87.下面关于第三范式关系必须符合的条件,说法错误的 ...

CDA LEVEL II 数据分析认证考试模拟题库(七)

CDA LEVEL II 数据分析认证考试模拟题库(七)
2021-04-30
不过,在出题前,要公布上一期LEVEL II中26-30题的答案,大家一起来看! 27、C 29、A 你答对了吗? 31.以下不适合对线性回归模型进行评估的指标是: B.F1 score D.判定系数 A.最小二乘法只适 ...

CDA LEVEL II 数据分析认证考试模拟题库(五)

CDA LEVEL II 数据分析认证考试模拟题库(五)
2021-04-28
不过,在出题前,要公布上一期LEVEL II中6-10题的答案,大家一起来看! 17、A 19、D 你答对了吗? 21.在系统聚类方法中,哪种系统聚类是直接利用了组内的离差平方和? B.重心法 D.类平均法 A ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2024-10-04
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 二、模型构建流程 既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...

CDA LEVEL 1 考试,知识点汇总《描述性统计分析》

CDA LEVEL 1 考试,知识点汇总《描述性统计分析》
2024-08-13
一、数据计量尺度 数据的计量尺度和具体的统计方法息息相关,大致分为3类,分别是名义测量、次序测量和连续变量测量。这三类测量 分别对应三种变量类型,即分类变量,顺序变量和数值变量。连续变量测量可以进一 ...

CDA LEVEL 1 考试,知识点汇总《一元线性回归》

CDA LEVEL 1 考试,知识点汇总《一元线性回归》
2024-08-13
散点图的绘制与解读、相关系数的概念与特征 1.正线性相关 例如通常情况下,某地区的犯罪率越高,则该地区的房价越低,但由于供需环境等其他不确定因素,数据点基本落在直 线周围,我们称之为负线 ...

CDA LEVEL 1 考试,知识点汇总《数据预处理方法》

CDA LEVEL 1 考试,知识点汇总《数据预处理方法》
2024-08-13
数据预处理的基本步骤 第一步:数据集成 第二步:数据探索 在进行了基本的了解后,我们还需要把集合中的数据通过一定形式的变换,转换成适合分析和建模的形式。主要的数 ...

CDA LEVEL 1 考试,知识点汇总《分类分析》

CDA LEVEL 1 考试,知识点汇总《分类分析》
2024-08-13
列联表和卡方检验 分类变量之间的相关性一般可以采用列联表分析或卡方检验的方法来进行验证。 列联表是两个分类变量的分类水平之间形成的交叉频数表,通过计算行百分比或列百分比,对实际频率和期望频率进行对 比 ...

CDA LEVEL 1 考试,知识点汇总《回归分析》

CDA LEVEL 1 考试,知识点汇总《回归分析》
2021-02-24
1.线性回归的出现 多元线性回归的出现是非常自然的,由于在一元线性回归中,因变量只能依赖一个自变量来解释,换一句话说,就是我们 只能在一维空间中来解释世界,这是十分糟糕的,毕竟事物之间的关联是非常 ...

OK