首页 > 行业图谱 >

- 运用Python爬取并分析全国5w+新楼盘近况
2021-07-14
-
作者:云朵君
通过爬取全国城市在售预售新盘,下面以获取单个城市为例,介绍爬取数据部门主要代码。完整代码见文末获取方式。
1、定义函数
2、获取数据的主函数
def get_data(c_city, c ...

- CDA LEVEL II 数据分析认证考试模拟题库(四十六)
2021-07-01
-
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看!
87、B
89、D
A.均值加减标准差法
C.聚类法
92、在对数据进行可视化展示的时候合适的图表决定了可视化的效果。下面关于直 ...

- CDA LEVEL II 数据分析认证考试模拟题库(二十二)
2024-08-14
-
查看更多题目
101、CD
103、ACD
105、AD
A.对电影网站中相似的电影进行聚类, 从而帮助划分电影
C.人脸识别
107.以下几个场景可以使用逻辑回归算法?
B.疾病类型预测
108.某连续型变量数据 ...

- CDA LEVEL II 数据分析认证考试模拟题库(十九)
2024-08-14
-
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看!
87、C
89、A
你答对了吗?
91.数据清洗包括处理缺失值、异常值、重复值等脏数据,处理每种脏数据的方法也是多种多样。以下哪些 ...

- CDA LEVEL 1 考试,知识点《机器学习基本概念》
2024-10-04
-
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959)
二、模型构建流程
既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...

- CDA LEVEL 1 考试,知识点汇总《数据分析概述》
2024-08-13
-
1.数据分析和数据挖掘的概念
数据挖掘(Data Mining) : 是一个跨学科的计算机科学分支,它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发 现模式的计算过程。
数据分析的目 ...

- CDA LEVEL 1 考试,知识点汇总《数据预处理方法》
2024-08-13
-
数据预处理的基本步骤
第一步:数据集成
第二步:数据探索
在进行了基本的了解后,我们还需要把集合中的数据通过一定形式的变换,转换成适合分析和建模的形式。主要的数 ...

- CDA LEVEL I 数据分析认证考试模拟题库(一)
2024-08-13
-
查看更多题目
A.变大
C.不变
2.在研究数据中,有一个变量“饮料类型”有4 个水平“果汁”、“碳酸饮料”、
“能量饮料”和“其他”,由于该变量的少量数据缺失,那么缺失值用哪种填充
方式会比较好?
B. ...

- 用Python制作处理小工具,多种操作,一键完成,非常实用
2021-02-07
-
作者:GUI工作组
本文将结合GUI工具PySimpleGUI,来讲解如何制作一款属于自己的数据预处理小工具,让这个过程也能够自动化!最终效果如下
本文将分为三部分讲解:
主要涉及将涉及以下模块:
一、G ...

- 如何将杂乱的数据整理好(一)数据完整性判断
2021-02-05
-
来源:丁点帮你
作者:丁点helper
在前面的文章中,我们跟大家一起学习了R中的数据导入、基本的操作方法、描述性统计等内容。
这其中的很多操作都是针对格式和内容都完好的数据而言的。但在实际工作 ...

- 警钟敲响!全自动口罩机亮相,又一生产线将消失……
2020-12-28
-
近日,全自动口罩机亮相某博览会上,吸引了众多客商的目光,该机器占地不到10平方米,现场演示每分钟可生产160片口罩。
这对于普通老百姓而言是一件喜事,但是对于口罩流水线的工人,却犹如晴天霹雳,这种机器 ...

- pandas向量化字符串操作方法!
2020-11-20
-
作者:小伍哥
来源:AI入门学习
python内置一系列强大的字符串处理方法,但这些方法只能处理单个字符串,处理一个序列的字符串时,需要用到循环。那么,有没有办法,不用循环就能同时处理多个字符 ...

- 时序数据处理难题攻略(上)
2020-11-10
-
作者:计量与统计
来源:公众号计量与统计
时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般采用曲线拟合和参数估计方法(如非线性最小二乘法 ...

- 把数据输入R语言后,如何进行简单的操作(二)
2020-09-11
-
先回忆一下之前用到的例子。
将其输入R语言中:
age <- c(25, 34, 59, 60, 20) #患者年龄
type <- c(1, 2, 2, 2, 1) ...

- python进阶,详解collections工具库!
2020-09-04
-
作者:梁唐
来源:早起Python
大家好,今天为大家介绍python当中一个很好用也是很基础的工具库,叫做collections。collection在英文当中有容器的意思,所以顾名思义,这是一个容器的集合。这个库当中的 ...
- 如何用Python进行大数据挖掘和分析?快速入门路径图
2018-08-30
-
如何用Python进行大数据挖掘和分析?快速入门路径图
大数据无处不在。在时下这个年代,不管你喜欢与否,在运营一个成功的商业的过程中都有可能会遇到它。
什么是 大数据 ?
大数据就像它看起来那样——有 ...

- 如何提高你的数据分析能力
2018-07-31
-
如何提高你的数据分析能力
第一步:数据准备(80%时间)
获取数据(爬虫,数据仓库)
验证数据
数据清理(缺失值、孤立点、垃圾信息、规范化、重复记录、特殊值、合并数据集)
使用python进行文件读取c ...
- 人工智能和大数据的开发过程中需要注意这12点
2018-07-21
-
人工智能和大数据的开发过程中需要注意这12点
人工智能是近年来科技发展的重要方向,在大数据时代,对数据采集、挖掘、应用的技术越来越受到瞩目。在人工智能和大数据的开发过程中,有哪些特别需要注意的要点?
...
- 决策树与随机森林的R语言实现
2018-06-14
-
决策树与随机森林的R语言实现
1.用party包构建决策树
以iris数据集为例。
用ctree()建立决策树,用predict()对新数据进行预测。
训练集与测试集划分:
[ruby] view plain copy
> str(iris) ...

- 大数据时代下数据挖掘技术的应用
2018-06-05
-
大数据时代下数据挖掘技术的应用
随着社会信息化的迅速发展,无论是数据的变化速率,还是数据的新增种类都在不断更新,数据研究变得越来越复杂,这意味着“大数据时代”到来。2011年,互联网数据中心(internet ...