cda

数字化人才认证

首页 > 行业图谱 >

TensorFlow和spark的ml以及python的scikit-learn 三者的区别是什么?
2023-04-07
TensorFlow, Spark的ML和Python的Scikit-learn是三种不同的机器学习工具,它们各自有其独特的特点和优势。以下是它们之间的主要区别。 TensorFlow TensorFlow是由Google开发的一个基于图形计算的深度学习框架。它 ...
catboost原理介绍,与lightgbm和xgboost比较优劣?
2023-04-03
CatBoost是一种基于梯度提升树的机器学习算法,它在处理分类和回归问题时都具有优秀的性能。CatBoost最初由Yandex团队开发,在2017年推出,并迅速受到了广泛关注和应用。 CatBoost与LightGBM和XGBoost都属于GBDT(Gr ...
用了更多特征,为什么xgboost效果反而变差了?
2023-04-03
XGBoost是一种流行的算法,常用于解决回归问题和分类问题。它通过集成多个决策树来提高模型的精度和泛化能力。尽管有时候添加更多的特征可能会改善模型的性能,但有时候它可能会导致模型的性能反而变差。在本文中, ...
CRF和LSTM 模型在序列标注上的优劣?
2023-03-31
序列标注是一种重要的自然语言处理任务,通常用于实体识别、命名实体识别、分词、词性标注等。在序列标注中,CRF和LSTM是两种常用的模型,本文将比较它们在序列标注上的优劣。 一、CRF 条件随机场(CRF)是一种无向 ...
什么能成为数据分析师
2023-03-30
数据分析师是一个不断变化的职业,随着数字化时代的到来,对数据分析师的需求也越来越高。成为数据分析师需要具备足够的知识和技能,本文将从基础知识、技能、沟通能力和研究能力等方面详细阐述成为数据分析师的知 ...
什么是 end-to-end 神经网络?
2023-03-22
端到端(end-to-end)神经网络是一种广泛应用于机器学习和人工智能领域的模型架构。它是一种能够直接从原始数据中提取特征并输出最终结果的模型,不需要显式地进行手动特征提取或分步骤处理。 在传统的机器学习方法 ...

数据分析之数据挖掘入门指南

数据分析之数据挖掘入门指南
2022-10-25
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

数据分析师之数据挖掘入门

数据分析师之数据挖掘入门
2022-10-19
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...
未来5年,数据科学工作岗位会短缺吗?
2022-02-28
c 在过去的五年里,当python编程成为潮流时,我一直在数据科学领域工作。当时,在2016年,神经网络和深度学习只是一些时髦的词。当时有一场关于谷歌自动驾驶汽车和强化学习的炒作。但是,大多数数据科学爱好者 ...

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例
2022-02-23
随着大数据的时代的来临,各个行业都受到了数据分析不同程度的影响和作用。尤其是在电信行业,数据分析已经逐渐成为电信运营商的战略优势之一。 大家好,我是一名CDA持证人,今天想跟大家分享一下,我如何 ...
如何学习机器学习的数学知识
2022-02-16
分享  数据科学有志之士最常见的问题之一是  行业中的守门人对这种担忧没有帮助,他们给学生贴上了不合格的标签,除非他们拥有该学科的硕士或博士学位。  那么,为了在数据科学行业 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

企业认可 | CDA数字化人才认证标准走进浙江农信

企业认可 | CDA数字化人才认证标准走进浙江农信
2021-10-22
2021年10月22日, 浙江省农村信用社联合社正式开启为期16天的内部培训,本次内训课程内容以CDA认证标准为基础,结合CDA LEVEL Ⅲ的技能要点,从企业数字化发展中必备的高级数据分析方法与技术出发,目标就是为了提升 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十六期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十六期)
2024-08-14
不过,在出题前,要公布上一期Level Ⅲ 中76-80题的答案,大家一起来看! 77、ABD 79、BCD A、方差选择 C、卡方检验 82、对数变换是我们在处理特征工程当中常用的处理方法,以下关于对数变换的描 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
2021-08-05
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 42、A 44、B A.会将数据缩放到0-1范围之内 C.作用是将不同量纲数据的量纲进行统一 47.常见的缺失值填充方法有填充默认值 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第八期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第八期)
2021-08-04
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 37、A 39、C A.PCA的最大化方差理论有时候不适用 C.核主成分分析更加复杂因此效果更好 42.使用带L1惩罚项的逻辑回归模型 ...

集成算法,随机森林回归模型

集成算法,随机森林回归模型
2021-07-20
来源:数据STUDIO 作者:云朵君 所有的参数,属性与接口,全部和随机森林分类器一致。仅有的不同就是回归树与分类树的不同,不纯度的指标, 参数Criterion不一致。 RandomForestRegressor(n_estimators='wa ...

数据挖掘中常用的基本降维思路及方法总结

数据挖掘中常用的基本降维思路及方法总结
2021-06-29
来源:数据STUDIO 作者:云朵君 01、降维的意义 降低无效、错误数据对建模的影响,提高建模的准确性。 少量切具有代表性的数据将大幅 ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2024-10-04
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 二、模型构建流程 既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...

实例 | 教你用python写一个电信客户流失预测模型

实例 | 教你用python写一个电信客户流失预测模型
2020-09-15
   CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】 今天教大家如何用python写一个电信用户流失预测模型。之前我们用Python写了员工流失预测模型 ...

OK