首页 > 行业图谱 >
- 一文搞懂Pandas数据排序
- 2021-08-13
-
来源:AI入门学习
作者:小伍哥
数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。
Series排序
Series.sort_index ...
- CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)
- 2021-08-11
-
不过,在出题前,要公布上一期Level Ⅲ 中51-55题的答案,大家一起来看!
52、C
54、B
A、数据正规化
C、数据一般化
57、数据准备方法是在评估模型性能之前对整个数据集进行处理,这会导致数据泄 ...
- CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
- 2021-08-05
-
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看!
42、A
44、B
A.会将数据缩放到0-1范围之内
C.作用是将不同量纲数据的量纲进行统一
47.常见的缺失值填充方法有填充默认值 ...
- Pandas中的宝藏函数-map
- 2021-07-28
-
来源:AI入门学习
作者:小伍哥
pandas中的map类似于Python内建的map()方法,pandas中的map()方法将函数、字典索引或是一些需要接受单个输入值的特别的对象与对应的单个列的每一个元素建立联系并串行得到结 ...
- 集成算法,随机森林回归模型
- 2021-07-20
-
来源:数据STUDIO
作者:云朵君
所有的参数,属性与接口,全部和随机森林分类器一致。仅有的不同就是回归树与分类树的不同,不纯度的指标, 参数Criterion不一致。
RandomForestRegressor(n_estimators='wa ...
- 运用Python爬取并分析全国5w+新楼盘近况
- 2021-07-14
-
作者:云朵君
通过爬取全国城市在售预售新盘,下面以获取单个城市为例,介绍爬取数据部门主要代码。完整代码见文末获取方式。
1、定义函数
2、获取数据的主函数
def get_data(c_city, c ...
- CDA LEVEL II 数据分析认证考试模拟题库(四十六)
- 2021-07-01
-
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看!
87、B
89、D
A.均值加减标准差法
C.聚类法
92、在对数据进行可视化展示的时候合适的图表决定了可视化的效果。下面关于直 ...
- CDA LEVEL II 数据分析认证考试模拟题库(二十二)
- 2024-08-14
-
查看更多题目
101、CD
103、ACD
105、AD
A.对电影网站中相似的电影进行聚类, 从而帮助划分电影
C.人脸识别
107.以下几个场景可以使用逻辑回归算法?
B.疾病类型预测
108.某连续型变量数据 ...
- CDA LEVEL II 数据分析认证考试模拟题库(十九)
- 2024-08-14
-
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看!
87、C
89、A
你答对了吗?
91.数据清洗包括处理缺失值、异常值、重复值等脏数据,处理每种脏数据的方法也是多种多样。以下哪些 ...
- CDA LEVEL 1 考试,知识点《机器学习基本概念》
- 2024-10-04
-
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959)
二、模型构建流程
既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...
- CDA LEVEL 1 考试,知识点汇总《数据分析概述》
- 2024-08-13
-
1.数据分析和数据挖掘的概念
数据挖掘(Data Mining) : 是一个跨学科的计算机科学分支,它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发 现模式的计算过程。
数据分析的目 ...
- CDA LEVEL 1 考试,知识点汇总《数据预处理方法》
- 2024-08-13
-
数据预处理的基本步骤
第一步:数据集成
第二步:数据探索
在进行了基本的了解后,我们还需要把集合中的数据通过一定形式的变换,转换成适合分析和建模的形式。主要的数 ...
- CDA LEVEL I 数据分析认证考试模拟题库(一)
- 2024-08-13
-
查看更多题目
A.变大
C.不变
2.在研究数据中,有一个变量“饮料类型”有4 个水平“果汁”、“碳酸饮料”、
“能量饮料”和“其他”,由于该变量的少量数据缺失,那么缺失值用哪种填充
方式会比较好?
B. ...
- 用Python制作处理小工具,多种操作,一键完成,非常实用
- 2021-02-07
-
作者:GUI工作组
本文将结合GUI工具PySimpleGUI,来讲解如何制作一款属于自己的数据预处理小工具,让这个过程也能够自动化!最终效果如下
本文将分为三部分讲解:
主要涉及将涉及以下模块:
一、G ...
- 如何将杂乱的数据整理好(一)数据完整性判断
- 2021-02-05
-
来源:丁点帮你
作者:丁点helper
在前面的文章中,我们跟大家一起学习了R中的数据导入、基本的操作方法、描述性统计等内容。
这其中的很多操作都是针对格式和内容都完好的数据而言的。但在实际工作 ...
- 警钟敲响!全自动口罩机亮相,又一生产线将消失……
- 2020-12-28
-
近日,全自动口罩机亮相某博览会上,吸引了众多客商的目光,该机器占地不到10平方米,现场演示每分钟可生产160片口罩。
这对于普通老百姓而言是一件喜事,但是对于口罩流水线的工人,却犹如晴天霹雳,这种机器 ...
- pandas向量化字符串操作方法!
- 2020-11-20
-
作者:小伍哥
来源:AI入门学习
python内置一系列强大的字符串处理方法,但这些方法只能处理单个字符串,处理一个序列的字符串时,需要用到循环。那么,有没有办法,不用循环就能同时处理多个字符 ...
- 时序数据处理难题攻略(上)
- 2020-11-10
-
作者:计量与统计
来源:公众号计量与统计
时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般采用曲线拟合和参数估计方法(如非线性最小二乘法 ...
- 把数据输入R语言后,如何进行简单的操作(二)
- 2020-09-11
-
先回忆一下之前用到的例子。
将其输入R语言中:
age <- c(25, 34, 59, 60, 20) #患者年龄
type <- c(1, 2, 2, 2, 1) ...
- python进阶,详解collections工具库!
- 2020-09-04
-
作者:梁唐
来源:早起Python
大家好,今天为大家介绍python当中一个很好用也是很基础的工具库,叫做collections。collection在英文当中有容器的意思,所以顾名思义,这是一个容器的集合。这个库当中的 ...