cda

数字化人才认证

首页 > 行业图谱 >

用R整理数据

用R整理数据
2022-03-29
作者:丁点helper 来源:丁点帮你 上篇文章介绍了如何在数据中增加或者删除变量,但是实际操作中,我们需要从大的数据库中选取一些变量来分析,那么如何从数据中选取多个变量呢? ...

风控策略的自动化生成-利用决策树分分钟生成上千条策略

风控策略的自动化生成-利用决策树分分钟生成上千条策略
2022-02-21
作者:小伍哥 来源:小伍哥聊风控 本文重点:风控策略挖掘、策略推荐,策略发现,风控策略自动化,决策树 下面开始正文: 风控策略同学在挖掘有效的风控规则的时候,经常需要基于业务经验,将那几 ...

关于数据分析师的学习路线,这是我见过最全面的

关于数据分析师的学习路线,这是我见过最全面的
2022-01-24
CDA数据分析师 出品 编辑:JYD 对于很多初入数据分析领域的小白来说,往往都会陷入迷茫。数据分析的坑很大,一旦走上这条路,就要明确基本方向,不然只会越走越偏,最后耗费力气,毫无收获。 比如你 ...

数据质量类岗位每天需要做什么?通过一个案例了解下

数据质量类岗位每天需要做什么?通过一个案例了解下
2022-01-21
CDA数据分析师 出品 编辑:JYD 大家好,我是曹鑫老师,今天要给大家分享的是数据质量类岗位。 下面我们截取一小段数据演示一个实际案例,帮您更好的了解这类岗位。 例如:某车企在全国各地有不同 ...

巨细!一文告诉你数据分析不得不知的秘密(CDA干货分享)

巨细!一文告诉你数据分析不得不知的秘密(CDA干货分享)
2022-01-18
来源:Python 技术 数据分析的目的是什么? 今天的文章主要讲解数据分析与可视化的相关步骤以及每个步骤需要用到的 Python 库,给正在从事数据分析或者学习数据分析的同学提供工作或者学习思路。 什么是 ...

3000字详解Pandas数据查询,建议收藏(CDA干货分享)

3000字详解Pandas数据查询,建议收藏(CDA干货分享)
2021-12-28
来源:关于数据分析与可视化 导入数据集和模块 根据文本内容来筛选 output 0 False 1 True 2 True 3 True 4 True Name: type, dtype: bool output 当然我们也可以和.loc方法来相结合 ...

干货 | 数据分析实战案例——用户行为预测

干货 | 数据分析实战案例——用户行为预测
2021-12-22
CDA数据分析师 出品 作者:CDA教研组 编辑:Mika 案例介绍 背景:以某大型电商平台的用户行为数据为数据集,使用大数据处理技术分析海量数据下的用户行为特征,并通过建立逻辑回归模型、随机森林 ...

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏
2021-12-20
来源:关于数据分析与可视化 01、导入库和读取数据 我们先来大致地看一下数据集中各个特征值的情况,通过info()这个方法 df.info() 02、去除掉缺失值和重复值 要是数据集中存在大量的缺失值, ...

做数据分析已经会Excel了,还要学Python吗?(CDA成长导师)

做数据分析已经会Excel了,还要学Python吗?(CDA成长导师)
2021-12-14
CDA数据分析师 出品 今天我给大家做一些关于我个人的分享,希望对大家的成长能够有所帮助。 我叫张俊红,目前在一家互联网公司从事数据分析相关的工作。在工作之余,我个人会写一些公众号文章,还会写数 ...

手中无y,心中有y——聚类算法的正确建模方式

手中无y,心中有y——聚类算法的正确建模方式
2021-12-10
CDA数据分析师 出品 作者:CDA教研组 编辑:JYD 聚类算法是属于无监督的机器学习方法;机器学习里把算法分为有监督和无监督的算法,所谓有监督,即我想研究的数据集有目标数据,白话点就是建模里大家 ...

如何避免无效的数据分析结果,这六种错误不可忽视

如何避免无效的数据分析结果,这六种错误不可忽视
2021-12-08
导读:在数据清洗过程中,主要处理的是缺失值、异常值和重复值。所谓清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的。 作者:宋天龙 本文转自:大数据DT( ...

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位
2021-11-30
来源:关于数据分析与可视化 数据抓取的流程与步骤 数据清洗的流程与步骤 可视化的结果与分析 我们用Python当中的requests模块来发送与接收请求,然后用BeautifulSoup模块也解析返回 ...

4000字归纳总结 Pandas+Sklearn 带你做数据预处理

4000字归纳总结 Pandas+Sklearn 带你做数据预处理
2021-11-24
作者:俊欣 来源:关于数据分析与可视化 今天我们就来讲讲数据预处理过程当中的一些要点与难点。我们大致会提到数据预处理中的 加载数据 处理缺失值如何处理 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...

CDA Level I 数据分析认证考试模拟题库(五)

CDA Level I 数据分析认证考试模拟题库(五)
2021-10-21
不过,在出题前,要公布上一期Level I 中16-20题的答案,大家一起来看! 17、D 19、C 21、卡方检验是用途非常广的一种假设检验方法,卡方检验中,将任意两行互换,卡方值( ) B.变小 D.不确定 ...

大学读的文科/商科专业,如何转型数据分析师?

大学读的文科/商科专业,如何转型数据分析师?
2021-12-08
互联网和移动互联网时代,程序员成了公认的高薪工作,是众多企业的抢手人才。但凡大学专业沾边计算机的理科生,都有机会去竞逐一下互联网大厂的高薪岗位。 其实文科生已经意识到自己的竞争对手 ...

手把手教你用 pandas 分析可视化东京奥运会数据

手把手教你用 pandas 分析可视化东京奥运会数据
2021-09-26
作者:刘早起 数据读取 注意到上面的 df1 列名并没有完整,所以可以使用 rename 函数修改指定列的名称 df1.rename(columns={'Unnamed: 2':'金牌数', 'Unnamed: 3':' ...

如何利用 pandas 根据数据类型进行筛选?

如何利用 pandas 根据数据类型进行筛选?
2021-09-24
来源:早起Python 作者:刘早起 前两天,有一位读者在知识星球提出了一个关于 pandas 数据清洗的问题。 他的数据大致如下 现在希望分别做如下清洗 “A列中非字符行B列中非日 ...

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为
2021-09-08
淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。 分析目标与思路 何判断高价值用户, ...

OK