cda

数字化人才认证

首页 > 行业图谱 >

如何对数据进行特征工程?
2023-06-15
特征工程是机器学习中至关重要的一步,它是将原始数据转换为机器学习算法可以使用的特征向量的过程。在本文中,我们将探讨如何对数据进行特征工程。 数据清洗 在进行特征工程之前,首先需要对原始数据进行清洗。这 ...
数据挖掘的流程是什么?
2023-06-15
数据挖掘(Data Mining)是指从大量数据中发现潜在的有价值的信息和模式的过程。它利用统计学、机器学习、人工智能等技术手段,将数据转化为有意义的知识,以支持决策、预测和发现新的关联等应用。 数据挖掘的流程一 ...
如何处理大规模数据集?
2023-06-15
随着现代技术的不断发展,处理大规模数据集已经成为了许多行业和领域的必要工作。从互联网公司、金融机构、医疗保健到政府机构,都需要处理大量数据,以帮助他们做出更明智的决策。在本文中,我们将探讨如何处理大规 ...
如何解读spss的分析结果?其中,因子分析和主成分分析的差别在哪里?
2023-05-12
SPSS是一款被广泛使用的统计分析软件,用于数据处理和分析。在进行数据分析时,正确地解读分析结果非常重要,因为它可以帮助我们确定我们所研究问题的答案并做出正确的决策。本文将探讨如何解读SPSS的分析结果,并介 ...
BP神经网络是否优于logistic回归?
2023-04-19
BP神经网络和logistic回归是两种常见的机器学习算法,它们都被广泛应用于分类问题。虽然这两种算法都有其独特的优点和适用范围,但在许多情况下,BP神经网络比logistic回归更为优越。 首先,BP神经网络可以处理非线 ...
TensorFlow和spark的ml以及python的scikit-learn 三者的区别是什么?
2023-04-07
TensorFlow, Spark的ML和Python的Scikit-learn是三种不同的机器学习工具,它们各自有其独特的特点和优势。以下是它们之间的主要区别。 TensorFlow TensorFlow是由Google开发的一个基于图形计算的深度学习框架。它 ...
catboost原理介绍,与lightgbm和xgboost比较优劣?
2023-04-03
CatBoost是一种基于梯度提升树的机器学习算法,它在处理分类和回归问题时都具有优秀的性能。CatBoost最初由Yandex团队开发,在2017年推出,并迅速受到了广泛关注和应用。 CatBoost与LightGBM和XGBoost都属于GBDT(Gr ...
用了更多特征,为什么xgboost效果反而变差了?
2023-04-03
XGBoost是一种流行的算法,常用于解决回归问题和分类问题。它通过集成多个决策树来提高模型的精度和泛化能力。尽管有时候添加更多的特征可能会改善模型的性能,但有时候它可能会导致模型的性能反而变差。在本文中, ...
CRF和LSTM 模型在序列标注上的优劣?
2023-03-31
序列标注是一种重要的自然语言处理任务,通常用于实体识别、命名实体识别、分词、词性标注等。在序列标注中,CRF和LSTM是两种常用的模型,本文将比较它们在序列标注上的优劣。 一、CRF 条件随机场(CRF)是一种无向 ...
什么能成为数据分析师
2023-03-30
数据分析师是一个不断变化的职业,随着数字化时代的到来,对数据分析师的需求也越来越高。成为数据分析师需要具备足够的知识和技能,本文将从基础知识、技能、沟通能力和研究能力等方面详细阐述成为数据分析师的知 ...
什么是 end-to-end 神经网络?
2023-03-22
端到端(end-to-end)神经网络是一种广泛应用于机器学习和人工智能领域的模型架构。它是一种能够直接从原始数据中提取特征并输出最终结果的模型,不需要显式地进行手动特征提取或分步骤处理。 在传统的机器学习方法 ...

数据分析之数据挖掘入门指南

数据分析之数据挖掘入门指南
2022-10-25
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

数据分析师之数据挖掘入门

数据分析师之数据挖掘入门
2022-10-19
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...
未来5年,数据科学工作岗位会短缺吗?
2022-02-28
c 在过去的五年里,当python编程成为潮流时,我一直在数据科学领域工作。当时,在2016年,神经网络和深度学习只是一些时髦的词。当时有一场关于谷歌自动驾驶汽车和强化学习的炒作。但是,大多数数据科学爱好者 ...

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例
2022-02-23
随着大数据的时代的来临,各个行业都受到了数据分析不同程度的影响和作用。尤其是在电信行业,数据分析已经逐渐成为电信运营商的战略优势之一。 大家好,我是一名CDA持证人,今天想跟大家分享一下,我如何 ...
如何学习机器学习的数学知识
2022-02-16
分享  数据科学有志之士最常见的问题之一是  行业中的守门人对这种担忧没有帮助,他们给学生贴上了不合格的标签,除非他们拥有该学科的硕士或博士学位。  那么,为了在数据科学行业 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

企业认可 | CDA数字化人才认证标准走进浙江农信

企业认可 | CDA数字化人才认证标准走进浙江农信
2021-10-22
2021年10月22日, 浙江省农村信用社联合社正式开启为期16天的内部培训,本次内训课程内容以CDA认证标准为基础,结合CDA LEVEL Ⅲ的技能要点,从企业数字化发展中必备的高级数据分析方法与技术出发,目标就是为了提升 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十六期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十六期)
2024-08-14
不过,在出题前,要公布上一期Level Ⅲ 中76-80题的答案,大家一起来看! 77、ABD 79、BCD A、方差选择 C、卡方检验 82、对数变换是我们在处理特征工程当中常用的处理方法,以下关于对数变换的描 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
2021-08-05
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 42、A 44、B A.会将数据缩放到0-1范围之内 C.作用是将不同量纲数据的量纲进行统一 47.常见的缺失值填充方法有填充默认值 ...

OK