cda

数字化人才认证

首页 > 行业图谱 >

哪些机器学习算法常用于数据分析?
2023-08-16
机器学习算法在数据分析领域发挥着重要的作用,帮助人们从海量的数据中提取有用的信息和洞察。下面是一些常用于数据分析的机器学习算法。 线性回归 (Linear Regression):线性回归是一种用于建立变量之间线性关系 ...
数据挖掘中最常用的算法有哪些?
2023-08-08
在数据挖掘领域,有许多常用的算法可用于发现隐藏在大量数据背后的有价值信息。这些算法能够帮助我们从数据集中提取模式、关联、趋势和规律,以支持决策制定、预测分析和问题解决。本文将介绍数据挖掘中最常用的几种 ...
如何在数据分析中处理缺失值?
2023-07-11
在进行数据分析时,经常会遇到缺失值的情况。缺失值可能由于多种原因产生,例如数据采集过程中的错误、用户不完整的输入或者系统故障等。然而,缺失值对于数据分析是一个挑战,因为它们可能导致结果的偏差和不准确性 ...
如何有效地检测和处理异常值?
2023-07-11
在数据分析和机器学习领域,异常值是指与其他观测值明显不同的数据点。异常值可能由于测量误差、数据录入错误或真实的极端情况而产生。然而,异常值可能会对数据分析和模型建立产生负面影响,因此需要采取适当的方法 ...
数据清洗中如何处理缺失值?
2023-06-29
缺失值是指数据集中某些变量或观测值缺少相关信息,这种情况在现实生活中很常见。在进行数据清洗时,如何处理缺失值是一个非常重要的问题。 处理缺失值的方法可以被分为三类:删除缺失值、填补缺失值和使用模型预测 ...
如何处理缺失数据和异常值?
2023-06-20
缺失数据和异常值是数据处理过程中经常遇到的问题,在数据分析和建模中,这些问题可能会导致结果不准确或者偏差较大。因此,有效地处理缺失数据和异常值是至关重要的。 一、处理缺失数据 缺失数据是指在某个变量中存 ...
在 Pandas DataFrame 中如何归一化某列?
2023-04-10
Pandas是一种用于数据分析和处理的常用Python库。在Pandas DataFrame中,归一化某列可以将该列的值从原始比例缩放到0到1之间的标准比例,使其更容易与其他列进行比较和分析。本文将介绍如何对Pandas DataFrame中的某 ...
如何通过sklearn实现多标签分类?
2023-03-31
多标签分类是指一个数据点可能属于多个类别。例如,在图像分类中,一张图片可以同时包含多种物体,如猫、鱼、玩具等。在这篇文章中,我们将介绍如何使用scikit-learn(简称sklearn)来实现多标签分类。 首先,我们需 ...

资深数据分析师来聊一聊数据挖掘

资深数据分析师来聊一聊数据挖掘
2022-10-19
一、数据挖掘的层次 一直想整理下对数据挖掘不同层次的理解,这也是这两年多的时间里面,和很多金融领域、互联网做数据相关工作的小伙伴,聊天交流的一些整理和归纳。大概可以分为四类。 (一)纯粹的数据 ...

从审核专员成功转型数据分析师

从审核专员成功转型数据分析师
2022-04-22
我从17年毕业后,一直在字节跳动西安做审核。做了两年多的审核工作,我对这个工作失去了热情。字节的视频审核和文字审核并非完全使用机器,采取的是双重审核,先机器审核筛选后再做人工审核的方法。工作的时候,我们需 ...

风控难题之无监督风险感知:脑力、想象力、第六感、黑洞

风控难题之无监督风险感知:脑力、想象力、第六感、黑洞
2022-04-06
作者:小伍哥 来源:小伍哥聊风控 大家好,我是小伍哥。 有效的风险感知或者无监督风险识别,其实非常的难,很多同学甚至无法下手,做了的可能也没有效果,如果找到合适的方法了,其实是非常有意思, ...

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例
2022-02-23
随着大数据的时代的来临,各个行业都受到了数据分析不同程度的影响和作用。尤其是在电信行业,数据分析已经逐渐成为电信运营商的战略优势之一。 大家好,我是一名CDA持证人,今天想跟大家分享一下,我如何 ...

如何避免无效的数据分析结果,这六种错误不可忽视

如何避免无效的数据分析结果,这六种错误不可忽视
2021-12-08
导读:在数据清洗过程中,主要处理的是缺失值、异常值和重复值。所谓清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的。 作者:宋天龙 本文转自:大数据DT( ...

十年芳华,逐梦前行 | 记录我的数据科学家成长之路

十年芳华,逐梦前行 | 记录我的数据科学家成长之路
2021-12-13
作者:Roll 本文为「心中有数」CDA征文作品 小学时, 老师经常问:“你长大以后想当什么?” 我说,我想当一名科学家。 工作后, 领导经常问:“你的职业规划是什么?” ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)
2021-08-11
不过,在出题前,要公布上一期Level Ⅲ 中51-55题的答案,大家一起来看! 52、C 54、B A、数据正规化 C、数据一般化 57、数据准备方法是在评估模型性能之前对整个数据集进行处理,这会导致数据泄 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第四期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第四期)
2024-10-05
不过,在出题前,要公布上一期Level Ⅲ 中11-15题的答案,大家一起来看! 12、A 14、D A.二者都可以处理分类问题 C.二者都是参数模型 17.如何以类神经网络仿真逻辑回归(Logistic Regression) ...

一个企业级数据挖掘实战项目,教育数据挖掘

一个企业级数据挖掘实战项目,教育数据挖掘
2021-07-06
来源:数据STUDIO 作者:云朵君 导读:大家好,我是云朵君!自从分享了一篇能够写在简历里的企业级数据挖掘实战项目,深受读者朋友们青睐,许多读者私信云朵君,希望多一些类似的数据挖掘实际案例。这就来了 ...

CDA LEVEL II 数据分析认证考试模拟题库(四)

CDA LEVEL II 数据分析认证考试模拟题库(四)
2021-04-27
查看更多题目 11、C 13、C 15、C A.随机波动 C.循环波动 17.可以用于趋势成分和季节成分序列的预测是哪种模型? B.Holt模型 D.以上都不是 A.取对数 C.差分 19.影响时间序列的因 ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2024-10-04
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 二、模型构建流程 既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...

38万条数据,用python分析保险产品交叉销售相关因素!

38万条数据,用python分析保险产品交叉销售相关因素!
2020-11-16
CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】今天的内容是一期python实战训练,我们来手把手教你用Python分析保险产品交叉销售和哪些因素有关。 01、实战背 ...

OK