cda

数字化人才认证

首页 > 行业图谱 >

123 2/3
如何解决机器学习中的过拟合问题?
2023-08-21
在机器学习领域,过拟合是一个常见而严重的问题。当模型在训练数据上表现出色,但在新数据上表现糟糕时,我们就可以说该模型过拟合了。过拟合会导致泛化能力差,即无法对未见过的数据做出准确预测。本文将介绍一些常 ...
机器学习中有哪些高级模型和算法?
2023-08-15
在机器学习领域中,有许多高级模型和算法被广泛应用于各种任务。下面将介绍其中一些重要的高级模型和算法。 深度神经网络(Deep Neural Networks,DNN):深度神经网络是一种基于人工神经元之间相互连接的模型。它 ...
如何选择最合适的机器学习算法?
2023-07-31
选择最合适的机器学习算法是实现成功预测和数据分析的关键步骤。在面对大量可用算法时,了解如何进行选择变得至关重要。下面将提供一个关于如何选择最合适的机器学习算法的指南。 首先,明确问题类型。不同的机器学 ...
如何解决数据不平衡问题?
2023-06-15
数据不平衡是指在某个分类问题中,不同类别的样本数量严重失衡。这种情况会对机器学习模型造成一定挑战,因为模型倾向于将大数目类别作为主要预测。解决数据不平衡问题是一个非常重要的机器学习任务,它可以帮助提高 ...
什么是机器学习模型?
2023-06-15
机器学习模型是一种计算机程序,它能够自动从数据中学习,并能用于分类、预测和决策等任务。简单来说,机器学习模型就是将输入数据映射到输出结果的一个函数。 机器学习模型可以分为监督学习、无监督学习和强化学习 ...
XGBoost做分类问题时每一轮迭代拟合的是什么?
2023-04-18
XGBoost(eXtreme Gradient Boosting)是一种强大的集成学习算法,常用于解决分类和回归问题。它是一种基于决策树的机器学习算法,在解决分类问题时,每一轮迭代拟合的是残差。本文将对XGBoost分类问题中每一轮迭代 ...
如何对XGBoost模型进行参数调优?
2023-04-10
XGBoost是一个高效、灵活和可扩展的机器学习算法,因其在许多数据科学竞赛中的成功表现而备受瞩目。然而,为了使XGBoost模型达到最佳性能,需要进行参数调优。本文将介绍一些常见的XGBoost参数以及如何对它们进行调 ...
catboost原理介绍,与lightgbm和xgboost比较优劣?
2023-04-03
CatBoost是一种基于梯度提升树的机器学习算法,它在处理分类和回归问题时都具有优秀的性能。CatBoost最初由Yandex团队开发,在2017年推出,并迅速受到了广泛关注和应用。 CatBoost与LightGBM和XGBoost都属于GBDT(Gr ...
xgboost是用二阶泰勒展开的优势在哪?
2023-03-31
XGBoost(eXtreme Gradient Boosting)是一种高效而强大的机器学习算法,它在大规模数据集上的性能表现非常出色。其中,使用二阶泰勒展开是XGBoost的重要优势之一,下面将详细介绍。 首先,我们来了解一下什么是泰勒 ...
xgboost中的min_child_weight是什么意思?
2023-03-28
在介绍XGBoost中的min_child_weight之前,先简要介绍一下XGBoost。 XGBoost是一种广泛使用的机器学习算法,被用于各种数据科学任务,例如分类、回归等。它是“Extreme Gradient Boosting”的缩写,是一种决策树集成 ...
机器学习算法中 GBDT 和 XGBOOST 的区别有哪些?
2023-03-22
Gradient Boosting Decision Tree (GBDT) 和 Extreme Gradient Boosting (XGBoost) 都是目前机器学习领域中非常流行的算法。两种算法都采用了 boosting 方法来提高分类或回归效果,但在实现细节上还是有一些区别的 ...

数据分析之数据挖掘入门指南

数据分析之数据挖掘入门指南
2022-10-25
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

数据分析师之数据挖掘入门

数据分析师之数据挖掘入门
2022-10-19
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
2021-08-05
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 42、A 44、B A.会将数据缩放到0-1范围之内 C.作用是将不同量纲数据的量纲进行统一 47.常见的缺失值填充方法有填充默认值 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第三期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第三期)
2021-07-28
不过,在出题前,要公布上一期Level Ⅲ 中1-5题的答案,大家一起来看! 7、C 9、A A.Two-Step C.Centroid Method 12.下列哪种集成方法,会重复抽取训练数据集中的数据,且每笔被抽中的概率始终保 ...

数据挖掘中常用的基本降维思路及方法总结

数据挖掘中常用的基本降维思路及方法总结
2021-06-29
来源:数据STUDIO 作者:云朵君 01、降维的意义 降低无效、错误数据对建模的影响,提高建模的准确性。 少量切具有代表性的数据将大幅 ...

机器学习还能预测心血管疾病?没错,我用python写出来了

机器学习还能预测心血管疾病?没错,我用python写出来了
2020-09-07
CDA数据分析师 出品   作者:Mika 数据:真达   后期:Mika 【导读】手把手教你如何用python写出心血管疾病预测模型。 全球每年约有1700万人死于心血管疾病,当中主要表现 ...

数据挖掘分析在CRM系统中的应用

数据挖掘分析在CRM系统中的应用
2018-06-28
数据挖掘分析在CRM系统中的应用 每个企业都会有客户流失的情况发生,已经失去或是即将失去的,这中情况对企业来说是正常现象,在面对这些常见的正常现象时,关键是企业从中能学到什么,得到重要信息并加之分析 ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2018-05-16
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用 ...
python实现随机森林random forest的原理及方法
2018-01-22
python实现随机森林random forest的原理及方法 想通过随机森林来获取数据的主要特征 1、理论 随机森林是一个高度灵活的机器学习方法,拥有广泛的应用前景,从市场营销到医疗保健保险。 既可以用来做市场营销模 ...
123 2/3

OK