cda

数字化人才认证

首页 > 行业图谱 >

做数据分析已经会Excel了,还要学Python吗?(CDA成长导师)

做数据分析已经会Excel了,还要学Python吗?(CDA成长导师)
2021-12-14
CDA数据分析师 出品 今天我给大家做一些关于我个人的分享,希望对大家的成长能够有所帮助。 我叫张俊红,目前在一家互联网公司从事数据分析相关的工作。在工作之余,我个人会写一些公众号文章,还会写数 ...

手中无y,心中有y——聚类算法的正确建模方式

手中无y,心中有y——聚类算法的正确建模方式
2021-12-10
CDA数据分析师 出品 作者:CDA教研组 编辑:JYD 聚类算法是属于无监督的机器学习方法;机器学习里把算法分为有监督和无监督的算法,所谓有监督,即我想研究的数据集有目标数据,白话点就是建模里大家 ...

如何避免无效的数据分析结果,这六种错误不可忽视

如何避免无效的数据分析结果,这六种错误不可忽视
2021-12-08
导读:在数据清洗过程中,主要处理的是缺失值、异常值和重复值。所谓清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的。 作者:宋天龙 本文转自:大数据DT( ...

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位
2021-11-30
来源:关于数据分析与可视化 数据抓取的流程与步骤 数据清洗的流程与步骤 可视化的结果与分析 我们用Python当中的requests模块来发送与接收请求,然后用BeautifulSoup模块也解析返回 ...

4000字归纳总结 Pandas+Sklearn 带你做数据预处理

4000字归纳总结 Pandas+Sklearn 带你做数据预处理
2021-11-24
作者:俊欣 来源:关于数据分析与可视化 今天我们就来讲讲数据预处理过程当中的一些要点与难点。我们大致会提到数据预处理中的 加载数据 处理缺失值如何处理 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...

CDA Level I 数据分析认证考试模拟题库(五)

CDA Level I 数据分析认证考试模拟题库(五)
2021-10-21
不过,在出题前,要公布上一期Level I 中16-20题的答案,大家一起来看! 17、D 19、C 21、卡方检验是用途非常广的一种假设检验方法,卡方检验中,将任意两行互换,卡方值( ) B.变小 D.不确定 ...

大学读的文科/商科专业,如何转型数据分析师?

大学读的文科/商科专业,如何转型数据分析师?
2021-12-08
互联网和移动互联网时代,程序员成了公认的高薪工作,是众多企业的抢手人才。但凡大学专业沾边计算机的理科生,都有机会去竞逐一下互联网大厂的高薪岗位。 其实文科生已经意识到自己的竞争对手 ...

手把手教你用 pandas 分析可视化东京奥运会数据

手把手教你用 pandas 分析可视化东京奥运会数据
2021-09-26
作者:刘早起 数据读取 注意到上面的 df1 列名并没有完整,所以可以使用 rename 函数修改指定列的名称 df1.rename(columns={'Unnamed: 2':'金牌数', 'Unnamed: 3':' ...

如何利用 pandas 根据数据类型进行筛选?

如何利用 pandas 根据数据类型进行筛选?
2021-09-24
来源:早起Python 作者:刘早起 前两天,有一位读者在知识星球提出了一个关于 pandas 数据清洗的问题。 他的数据大致如下 现在希望分别做如下清洗 “A列中非字符行B列中非日 ...

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为
2021-09-08
淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。 分析目标与思路 何判断高价值用户, ...
一文搞懂Pandas数据排序
2021-08-13
来源:AI入门学习 作者:小伍哥 数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。 Series排序 Series.sort_index ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)
2021-08-11
不过,在出题前,要公布上一期Level Ⅲ 中51-55题的答案,大家一起来看! 52、C 54、B A、数据正规化 C、数据一般化 57、数据准备方法是在评估模型性能之前对整个数据集进行处理,这会导致数据泄 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
2021-08-05
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 42、A 44、B A.会将数据缩放到0-1范围之内 C.作用是将不同量纲数据的量纲进行统一 47.常见的缺失值填充方法有填充默认值 ...

Pandas中的宝藏函数-map

Pandas中的宝藏函数-map
2021-07-28
来源:AI入门学习 作者:小伍哥 pandas中的map类似于Python内建的map()方法,pandas中的map()方法将函数、字典索引或是一些需要接受单个输入值的特别的对象与对应的单个列的每一个元素建立联系并串行得到结 ...

集成算法,随机森林回归模型

集成算法,随机森林回归模型
2021-07-20
来源:数据STUDIO 作者:云朵君 所有的参数,属性与接口,全部和随机森林分类器一致。仅有的不同就是回归树与分类树的不同,不纯度的指标, 参数Criterion不一致。 RandomForestRegressor(n_estimators='wa ...

运用Python爬取并分析全国5w+新楼盘近况

运用Python爬取并分析全国5w+新楼盘近况
2021-07-14
作者:云朵君 通过爬取全国城市在售预售新盘,下面以获取单个城市为例,介绍爬取数据部门主要代码。完整代码见文末获取方式。 1、定义函数 2、获取数据的主函数 def get_data(c_city, c ...

CDA LEVEL II 数据分析认证考试模拟题库(四十六)

CDA LEVEL II 数据分析认证考试模拟题库(四十六)
2021-07-01
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看! 87、B 89、D A.均值加减标准差法 C.聚类法 92、在对数据进行可视化展示的时候合适的图表决定了可视化的效果。下面关于直 ...

CDA LEVEL II 数据分析认证考试模拟题库(二十二)

CDA LEVEL II 数据分析认证考试模拟题库(二十二)
2024-08-14
查看更多题目 101、CD 103、ACD 105、AD A.对电影网站中相似的电影进行聚类, 从而帮助划分电影 C.人脸识别 107.以下几个场景可以使用逻辑回归算法? B.疾病类型预测 108.某连续型变量数据 ...

OK