cda

数字化人才认证

首页 > 行业图谱 >

高效构建基于Python的商品评论文本挖掘网页APP

高效构建基于Python的商品评论文本挖掘网页APP
2022-06-28
CDA数据分析师 出品 作者:CDALevel Ⅰ持证人 岗位:数据分析师 行业:大数据 背景 电子商务行业在近几年发展得极为迅猛,很多在传统行业就业但是薪资不理想的都在网电子商务行业去转。这种趋 ...

一行Pandas代码制作数据分析透视表,太牛了

一行Pandas代码制作数据分析透视表,太牛了
2022-06-07
作者:俊欣 来源:关于数据分析与可视化 相信大家都用在Excel当中使用过数据透视表(一种可以对数据动态排布并且分类汇总的表格格式),也体验过它的强大功能,在Pandas模块当中被称作是pivot_table,今天小编 ...

分享30个超级好用的Pandas实战技巧

分享30个超级好用的Pandas实战技巧
2022-06-01

当机器学习遇到数据量不够时,这几个Python技巧为你化解难题

当机器学习遇到数据量不够时,这几个Python技巧为你化解难题
2022-06-01
作者:俊欣 有时候我们在进行模型的训练与优化的时候,是需要基于现有的数据集来操作的,要是数据量比较充足的情况下倒是还好说,但是要是遇到数据量不够的情况,该怎么办呢?今天小编就给大家来介绍几个方法 ...

当机器学习遇到数据量不够时,这几个Python技巧为你化解难题

当机器学习遇到数据量不够时,这几个Python技巧为你化解难题
2022-06-01
作者:俊欣 有时候我们在进行模型的训练与优化的时候,是需要基于现有的数据集来操作的,要是数据量比较充足的情况下倒是还好说,但是要是遇到数据量不够的情况,该怎么办呢?今天小编就给大家来介绍几个方法 ...

用R整理数据

用R整理数据
2022-03-29
作者:丁点helper 来源:丁点帮你 上篇文章介绍了如何在数据中增加或者删除变量,但是实际操作中,我们需要从大的数据库中选取一些变量来分析,那么如何从数据中选取多个变量呢? ...

风控策略的自动化生成-利用决策树分分钟生成上千条策略

风控策略的自动化生成-利用决策树分分钟生成上千条策略
2022-02-21
作者:小伍哥 来源:小伍哥聊风控 本文重点:风控策略挖掘、策略推荐,策略发现,风控策略自动化,决策树 下面开始正文: 风控策略同学在挖掘有效的风控规则的时候,经常需要基于业务经验,将那几 ...

关于数据分析师的学习路线,这是我见过最全面的

关于数据分析师的学习路线,这是我见过最全面的
2022-01-24
CDA数据分析师 出品 编辑:JYD 对于很多初入数据分析领域的小白来说,往往都会陷入迷茫。数据分析的坑很大,一旦走上这条路,就要明确基本方向,不然只会越走越偏,最后耗费力气,毫无收获。 比如你 ...

数据质量类岗位每天需要做什么?通过一个案例了解下

数据质量类岗位每天需要做什么?通过一个案例了解下
2022-01-21
CDA数据分析师 出品 编辑:JYD 大家好,我是曹鑫老师,今天要给大家分享的是数据质量类岗位。 下面我们截取一小段数据演示一个实际案例,帮您更好的了解这类岗位。 例如:某车企在全国各地有不同 ...

巨细!一文告诉你数据分析不得不知的秘密(CDA干货分享)

巨细!一文告诉你数据分析不得不知的秘密(CDA干货分享)
2022-01-18
来源:Python 技术 数据分析的目的是什么? 今天的文章主要讲解数据分析与可视化的相关步骤以及每个步骤需要用到的 Python 库,给正在从事数据分析或者学习数据分析的同学提供工作或者学习思路。 什么是 ...

3000字详解Pandas数据查询,建议收藏(CDA干货分享)

3000字详解Pandas数据查询,建议收藏(CDA干货分享)
2021-12-28
来源:关于数据分析与可视化 导入数据集和模块 根据文本内容来筛选 output 0 False 1 True 2 True 3 True 4 True Name: type, dtype: bool output 当然我们也可以和.loc方法来相结合 ...

干货 | 数据分析实战案例——用户行为预测

干货 | 数据分析实战案例——用户行为预测
2021-12-22
CDA数据分析师 出品 作者:CDA教研组 编辑:Mika 案例介绍 背景:以某大型电商平台的用户行为数据为数据集,使用大数据处理技术分析海量数据下的用户行为特征,并通过建立逻辑回归模型、随机森林 ...

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏
2021-12-20
来源:关于数据分析与可视化 01、导入库和读取数据 我们先来大致地看一下数据集中各个特征值的情况,通过info()这个方法 df.info() 02、去除掉缺失值和重复值 要是数据集中存在大量的缺失值, ...

做数据分析已经会Excel了,还要学Python吗?(CDA成长导师)

做数据分析已经会Excel了,还要学Python吗?(CDA成长导师)
2021-12-14
CDA数据分析师 出品 今天我给大家做一些关于我个人的分享,希望对大家的成长能够有所帮助。 我叫张俊红,目前在一家互联网公司从事数据分析相关的工作。在工作之余,我个人会写一些公众号文章,还会写数 ...

手中无y,心中有y——聚类算法的正确建模方式

手中无y,心中有y——聚类算法的正确建模方式
2021-12-10
CDA数据分析师 出品 作者:CDA教研组 编辑:JYD 聚类算法是属于无监督的机器学习方法;机器学习里把算法分为有监督和无监督的算法,所谓有监督,即我想研究的数据集有目标数据,白话点就是建模里大家 ...

如何避免无效的数据分析结果,这六种错误不可忽视

如何避免无效的数据分析结果,这六种错误不可忽视
2021-12-08
导读:在数据清洗过程中,主要处理的是缺失值、异常值和重复值。所谓清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的。 作者:宋天龙 本文转自:大数据DT( ...

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位
2021-11-30
来源:关于数据分析与可视化 数据抓取的流程与步骤 数据清洗的流程与步骤 可视化的结果与分析 我们用Python当中的requests模块来发送与接收请求,然后用BeautifulSoup模块也解析返回 ...

4000字归纳总结 Pandas+Sklearn 带你做数据预处理

4000字归纳总结 Pandas+Sklearn 带你做数据预处理
2021-11-24
作者:俊欣 来源:关于数据分析与可视化 今天我们就来讲讲数据预处理过程当中的一些要点与难点。我们大致会提到数据预处理中的 加载数据 处理缺失值如何处理 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...

OK