cda

数字化人才认证

首页 > 行业图谱 >

数据清洗常用工具与技巧?
2023-06-17
数据清洗是数据预处理的一个重要步骤,它涉及到对数据进行检查、修正和转换,以确保数据质量和可靠性。在实际应用中,数据常常存在缺失、重复、异常等问题,因此需要使用各种工具和技巧对数据进行清洗。 一、数据清 ...
用SQL 做数据清洗与用Python做数据清洗的利弊分别是什么?哪种方法处理更简单?
2023-05-12
数据清洗是数据分析中最重要、最繁琐和最具挑战性的任务之一。在实践中,数据清洗涉及多个步骤,包括缺失值填充、去重、异常值处理、数据转换等等。SQL 和 Python 都是常用的数据清洗工具,下面将从利弊以及处理简易 ...

干货分享 | 推荐一个更高效的 数据清洗 方法,建议收藏

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏
2021-12-20
来源:关于数据分析与可视化 01、导入库和读取数据 我们先来大致地看一下数据集中各个特征值的情况,通过info()这个方法 df.info() 02、去除掉缺失值和重复值 要是数据集中存在大量的缺失值, ...

关于R语言字符型 数据清洗 问题

关于R语言字符型数据清洗问题
2018-06-21
关于R语言字符型数据清洗问题 最近做一个预测关于投资者是否再次投资的项目,需要针对客户导出的数据进行清洗后建模分析,我目前选择的模型是xgboost,貌似数据必须全是numeric。 数据结构如下: 在 ...

以 数据清洗 为例,聊聊人工智能的配套服务产业

数据清洗为例,聊聊人工智能的配套服务产业
2017-09-28
以数据清洗为例,聊聊人工智能的配套服务产业 从商业模式来说,人工智能的相关企业有三种:第一种是提供人工智能技术的公司,比如机器视觉、NLP等等;第二种是将人工智能与具体行业应用结合的公司,比如fintech ...
SAS信用评分九步曲之第一步数据清洗
2017-04-02
SAS信用评分九步曲之第一步数据清洗 累积了一段时间的建模经验了,这次想把我在建模中用的代码分批分享出来,可能写的东西不是你能用到的,毕竟我们接触到的数据都不一样。但是譬如文本清洗之类的,看我之前的 ...

用R语言做简单的 数据清洗

用R语言做简单的数据清洗
2017-02-22
用R语言做简单的数据清洗 昨天和学长聊到下周要做的数据清洗工作,心想应该很好上手吧,结果今早爬起来一问度娘,立马就被灌了整锅的毒鸡汤…某论坛上的网友甚至告诉小编,数据清洗占了他某项工作中的八成分量 ...
利用SAS进行数据清洗技术—缺失值查询
2016-06-10
利用SAS进行数据清洗技术—缺失值查询 数据清洗技术是统计分析之前必做的一步,而且也是非常麻烦的一步,有时甚至花费的时间比统计分析都长。所以没有一定的技巧,这将是个非常烦人的工作。本篇文章介绍如何利 ...
数据清洗全经验分享
2016-05-27
数据清洗全经验分享 平时习惯了在某些特定的数据集合上做实验,简单的tokenization、预处理等步骤就足够了。但是在数据越来越大的年代,数据清洗越来越重要,也越来越复杂。 前言 科研工作者、工程师、业务分 ...

python 数据清洗 之噪声值的判断和处理

python数据清洗之噪声值的判断和处理
2020-07-31
提到噪声,你会想到什么?刺耳的,高分贝的声音?总之就是不好的,不想接受的声音。小编今天跟大家分享的就是python数据清洗中的噪声数据,对于这些噪声数据我们应该怎样检测和处理呢?下面跟小编一起来看吧。 一 ...

 数据清洗 之python实现缺失值处理

数据清洗之python实现缺失值处理
2020-07-24
在实际的数据清洗过程中,我们经常会遇到数据内容丢失的情况,这些丢失的数据内容就是缺失值。缺失值的产生的原因多种多样,主要分为机械原因和人为原因。 机械原因,也就是由于例如,数据存储失败,存储器损坏 ...

python 数据清洗 中,是如何识别和处理异常值的?

python数据清洗中,是如何识别和处理异常值的?
2020-07-17
异常值处理是python数据清洗中重要的步骤,虽然异常值出现频率比较低,但是如果置之不理的话,还是会对实际项目的分析造成偏差,所以今天小编就跟大家分享python数据清洗中应该如何识别和处理异常值,希望对大家有 ...
python数据清洗中常用的重复值处理方法是什么?
2020-07-07
重复值处理是python数据清洗过程中的重要步骤,小编今天给大家整理了重复值检测及重复值处理的方法,希望对大家有所帮助。 python重复值处理的常用方法是删除,用duplicates(subset,keep,inplace)方法对进行重 ...
python数据清洗时,经常用到的工具有哪几种?
2020-07-06
数据清洗是整个数据分析过程的第一步,也是整个数据分析项目中最耗费时间的一步,下面小编整理了几种常用的python数据清洗工具,希望对大家有所帮助。 目前在python中, numpy和pandas是最主流的数据清洗工具,N ...

python 数据清洗 :销售业绩分箱工具,pd.cut() Vs pd.qcut()

python数据清洗:销售业绩分箱工具,pd.cut() Vs pd.qcut()
2020-06-01
python数据清洗功能非常强大,相信很多进行数据处理工作的小伙伴都遇到过这种需求,比如已经有了各个销售员的销售业绩,现在需要给各个销售业绩进行一个分档,诸如未完成任务,完成任务,超额完成任务等。要完 ...

python 数据清洗 之数学基础(函数干货大全)

python数据清洗之数学基础(函数干货大全)
2020-05-25
python数据清洗时,会涉及到数学基础知识,今天我们就来给大家介绍这些函数! 基本初等函数 初等函数是由基本初等函数经过有限次的四则运算和复合运算所得到的函数。基本初等函数和初等函数在其定义区间内均 ...

数据清理利器:SQL 数据清洗 !

数据清理利器:SQL数据清洗
2020-05-12
俗话说的好,工欲善其事,必先利其器。很多从事数据统计分析工作的朋友应该会深有感触,苦于自己80%的时间在做数据清洗,而仅仅只有20%的时间在优化模型、分析统计结果等,今天我们就来介绍下SQL数据清洗。 因此, ...

4种python 数据清洗 中lambda表达式配合使用的函数!

4种python数据清洗中lambda表达式配合使用的函数!
2020-05-09
python清理数据领域的知识。 lambda 表达式是一个匿名函数,lambda表达式基于数学中的λ演算得名,直接对应于其中的lambda抽象,是一个匿名函数,即没有函数名的函数。 lambda表达式可以接受任意数量的参数 ...

Python 数据清洗 (三):异常值识别与处理

Python数据清洗(三):异常值识别与处理
2019-12-20
作者 | 刘顺祥 来源 | 数据分析1480 在《Python数据清洗(一):类型转换和冗余数据删除》和《Python数据清洗(二):缺失值识别与处理》文中已经讲解了有关数据中重复观测和缺失值的识别与处 ...

8 段用于 数据清洗  Python 代码

8 段用于数据清洗 Python 代码
2019-11-27
作者|Kin Lim Lee 编译|量子位 最近,大数据工程师Kin Lim Lee在Medium上发表了一篇文章,介绍了8个用于数据清洗的Python代码。 数据清洗,是进行数据分析和使用数据训练模型的必经之 ...

OK