cda

数字化人才认证

首页 > 行业图谱 >

如何利用 pandas 根据数据类型进行筛选?

如何利用 pandas 根据数据类型进行筛选?
2021-09-24
来源:早起Python 作者:刘早起 前两天,有一位读者在知识星球提出了一个关于 pandas 数据清洗的问题。 他的数据大致如下 现在希望分别做如下清洗 “A列中非字符行B列中非日 ...

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为
2021-09-08
淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。 分析目标与思路 何判断高价值用户, ...

在R中用箱形图做组间比较

在R中用箱形图做组间比较
2021-09-07
来源:丁点帮你 作者:丁点helper 之前的文章讲了如何用R绘制箱形图,以此来帮助我们了解数据的整体分布情况、是否存在异常值。除此之外,箱形图还可以进行数据的组间比较。 分组变量的数据清理 多重 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)
2021-08-11
不过,在出题前,要公布上一期Level Ⅲ 中51-55题的答案,大家一起来看! 52、C 54、B A、数据正规化 C、数据一般化 57、数据准备方法是在评估模型性能之前对整个数据集进行处理,这会导致数据泄 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
2021-08-05
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 42、A 44、B A.会将数据缩放到0-1范围之内 C.作用是将不同量纲数据的量纲进行统一 47.常见的缺失值填充方法有填充默认值 ...

运用Python爬取并分析全国5w+新楼盘近况

运用Python爬取并分析全国5w+新楼盘近况
2021-07-14
作者:云朵君 通过爬取全国城市在售预售新盘,下面以获取单个城市为例,介绍爬取数据部门主要代码。完整代码见文末获取方式。 1、定义函数 2、获取数据的主函数 def get_data(c_city, c ...

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码
2021-07-07
作者:云朵君 本文主要介绍回归模型图lmplot、线性回归图regplot,这两个函数的核心功能很相似,都会绘制数据散点图,并且拟合关于变量x,y之间的回归曲线,同时显示回归的95%置信区间。 所有图形将使 ...

CDA LEVEL II 数据分析认证考试模拟题库(四十六)

CDA LEVEL II 数据分析认证考试模拟题库(四十六)
2021-07-01
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看! 87、B 89、D A.均值加减标准差法 C.聚类法 92、在对数据进行可视化展示的时候合适的图表决定了可视化的效果。下面关于直 ...

CDA LEVEL II 数据分析认证考试模拟题库(十九)

CDA LEVEL II 数据分析认证考试模拟题库(十九)
2024-08-14
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看! 87、C 89、A 你答对了吗? 91.数据清洗包括处理缺失值、异常值、重复值等脏数据,处理每种脏数据的方法也是多种多样。以下哪些 ...

CDA LEVEL II 数据分析认证考试模拟题库(十八)

CDA LEVEL II 数据分析认证考试模拟题库(十八)
2021-05-19
不过,在出题前,要公布上一期LEVEL II中81-85题的答案,大家一起来看! 82、C 84、A 你答对了吗? 86.企业数据仓库里面的数据一般是由业务数据经过ETL技术处理后来的,以下关于ETL的说法错误的是 ...

CDA LEVEL II 数据分析认证考试模拟题库(七)

CDA LEVEL II 数据分析认证考试模拟题库(七)
2021-04-30
不过,在出题前,要公布上一期LEVEL II中26-30题的答案,大家一起来看! 27、C 29、A 你答对了吗? 31.以下不适合对线性回归模型进行评估的指标是: B.F1 score D.判定系数 A.最小二乘法只适 ...

CDA LEVEL II 数据分析认证考试模拟题库(五)

CDA LEVEL II 数据分析认证考试模拟题库(五)
2021-04-28
不过,在出题前,要公布上一期LEVEL II中6-10题的答案,大家一起来看! 17、A 19、D 你答对了吗? 21.在系统聚类方法中,哪种系统聚类是直接利用了组内的离差平方和? B.重心法 D.类平均法 A ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2024-08-13
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 二、模型构建流程 既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...

CDA LEVEL 1 考试,知识点汇总《描述性统计分析》

CDA LEVEL 1 考试,知识点汇总《描述性统计分析》
2024-08-13
一、数据计量尺度 数据的计量尺度和具体的统计方法息息相关,大致分为3类,分别是名义测量、次序测量和连续变量测量。这三类测量 分别对应三种变量类型,即分类变量,顺序变量和数值变量。连续变量测量可以进一 ...

CDA LEVEL 1 考试,知识点汇总《一元线性回归》

CDA LEVEL 1 考试,知识点汇总《一元线性回归》
2024-08-13
散点图的绘制与解读、相关系数的概念与特征 1.正线性相关 例如通常情况下,某地区的犯罪率越高,则该地区的房价越低,但由于供需环境等其他不确定因素,数据点基本落在直 线周围,我们称之为负线 ...

CDA LEVEL 1 考试,知识点汇总《数据预处理方法》

CDA LEVEL 1 考试,知识点汇总《数据预处理方法》
2024-08-13
数据预处理的基本步骤 第一步:数据集成 第二步:数据探索 在进行了基本的了解后,我们还需要把集合中的数据通过一定形式的变换,转换成适合分析和建模的形式。主要的数 ...

CDA LEVEL 1 考试,知识点汇总《分类分析》

CDA LEVEL 1 考试,知识点汇总《分类分析》
2024-08-13
列联表和卡方检验 分类变量之间的相关性一般可以采用列联表分析或卡方检验的方法来进行验证。 列联表是两个分类变量的分类水平之间形成的交叉频数表,通过计算行百分比或列百分比,对实际频率和期望频率进行对 比 ...

CDA LEVEL 1 考试,知识点汇总《回归分析》

CDA LEVEL 1 考试,知识点汇总《回归分析》
2021-02-24
一、基本概念 1.线性回归的出现 当被解释变量和解释变量都为连续型,且存在线性关系时,可以采用线性回归对被解释变量进行预测。 多元线性回归的出现是非常自然的,由于在一元线性回归中,因变量只能依赖 ...

CDA LEVEL 1 考试,知识点汇总《聚类分析》

CDA LEVEL 1 考试,知识点汇总《聚类分析》
2024-08-13
层次聚类法通常分为自底向上和自顶向下。两种方法的运算原理其实是相同的。只不过实际计算是方向相反。 自底向上,又叫做合并法。这种方法是先将每个样本分别作为一个独立的类,然后通过距离计算,将距离相近的两 ...

用Python制作处理小工具,多种操作,一键完成,非常实用

用Python制作处理小工具,多种操作,一键完成,非常实用
2021-02-07
作者:GUI工作组 本文将结合GUI工具PySimpleGUI,来讲解如何制作一款属于自己的数据预处理小工具,让这个过程也能够自动化!最终效果如下 本文将分为三部分讲解: 主要涉及将涉及以下模块: 一、G ...

OK