cda

数字化人才认证

首页 > 行业图谱 >

1234567 4/7
如何解决数据不平衡问题?
2023-06-15
数据不平衡是指在某个分类问题中,不同类别的样本数量严重失衡。这种情况会对机器学习模型造成一定挑战,因为模型倾向于将大数目类别作为主要预测。解决数据不平衡问题是一个非常重要的机器学习任务,它可以帮助提高 ...
数据分析师算法有哪些
2023-06-01
数据分析师是现代企业中非常重要的角色之一,他们负责从数据中获取信息,并根据这些信息制定决策。而数据分析师要想完成这些任务,必须掌握一系列算法。本文将介绍一些常见的分析师算法。 线性回归 线性 ...
XGBoost做分类问题时每一轮迭代拟合的是什么?
2023-04-18
XGBoost(eXtreme Gradient Boosting)是一种强大的集成学习算法,常用于解决分类和回归问题。它是一种基于决策树的机器学习算法,在解决分类问题时,每一轮迭代拟合的是残差。本文将对XGBoost分类问题中每一轮迭代 ...
为什么xgboost泰勒二阶展开后效果就比较好了呢?
2023-04-13
XGBoost是一种基于决策树的集成学习算法,用于解决分类和回归问题。它在许多数据科学竞赛中表现优异,并被广泛应用于各种领域,如金融、医疗、电子商务等。 在XGBoost中,每个树的构建都是基于残差的。因此,如果我 ...
R语言随机森林ROC曲线下的面积如何计算?
2023-04-13
在R语言中,计算随机森林( Random Forest)的 ROC 曲线下面积是一项重要的任务。ROC曲线下面积也称为AUC(Area Under the Curve),用于评估分类器的性能。在本文中,我们将介绍如何使用R语言计算随机森林的ROC曲线下 ...
用xgboost做分类,预测结果输出的为什么不是类别概率?
2023-04-10
XGBoost是一种基于决策树的集成学习算法,在分类问题中通常被用来预测二元或多元分类结果。与传统的决策树相比,XGBoost具有更优秀的准确性和效率。 然而,在使用XGBoost进行分类时,其输出通常不是类别概率,而是对 ...
对于一个准确率不高的神经网络模型,应该从哪些方面去优化?
2023-03-31
神经网络模型是一种机器学习算法,用于解决许多现实世界的问题。然而,即使使用最先进的技术和算法构建的神经网络模型也可能存在准确率不高的问题。在这种情况下,我们需要考虑从哪些方面去优化。在本文中,我将分享 ...

解读 | 数据分析师(含转行)的面试简历如何写?

解读 | 数据分析师(含转行)的面试简历如何写?
2022-03-09
CDA数据分析师 出品 作者:徐杨老师 编辑:Mika 大家好,我是徐杨老师,很高兴又和大家见面了。 金三银四跳槽季马上就要到来了,是不是有很多同学都已经开始蠢蠢欲动了? 但是不少准备换工作的 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第三期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第三期)
2021-07-28
不过,在出题前,要公布上一期Level Ⅲ 中1-5题的答案,大家一起来看! 7、C 9、A A.Two-Step C.Centroid Method 12.下列哪种集成方法,会重复抽取训练数据集中的数据,且每笔被抽中的概率始终保 ...
大数据是什么和大数据技术十大核心原理详解
2018-08-30
大数据是什么和大数据技术十大核心原理详解 一、数据核心原理   从“流程”核心转变为“数据”核心   大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已 ...

一种面向高维数据的集成聚类算法

一种面向高维数据的集成聚类算法
2018-06-10
一种面向高维数据的集成聚类算法 聚类集成已经成为机器学习的研究热点,它对原始数据集的多个聚类结果进行学习和集成,得到一个能较好地反映数据集内在结构的数据划分。很多学者的研究证明聚类集成能有效 ...
人工智能”是智能么
2018-04-03
人工智能”是智能么 在电影“终结者2”里,人类未来的领袖约翰康纳问从未来穿越回来的T-800机器人他是否可以学习人类的行为,T-800说他的CPU是一个神经网络处理器,一个会学习的计算机,但他的芯片被设定成了“ ...
机器学习入门报告之 解决问题一般工作流程
2018-03-20
机器学习入门报告之 解决问题一般工作流程 对于给定的数据集和问题,用机器学习的方法解决问题的工作一般分为4个步骤: 一.     数据预处理 首先,必须确保数据的格式符合要求 ...
python实现随机森林random forest的原理及方法
2018-01-22
python实现随机森林random forest的原理及方法 想通过随机森林来获取数据的主要特征 1、理论 随机森林是一个高度灵活的机器学习方法,拥有广泛的应用前景,从市场营销到医疗保健保险。 既可以用来做市场营销模 ...

深度学习已成功应用于这三大领域

深度学习已成功应用于这三大领域
2017-11-20
深度学习已成功应用于这三大领域 在本章中,我们将介绍如何使用深度学习来解决计算机视觉、语音识别、自然语言处理以及其他商业领域中的应用。首先我们将讨论在许多最重要的AI 应用中所需的大规模神经网络的实 ...

浅谈大数据在金融业的应用

浅谈大数据在金融业的应用
2017-07-03
浅谈大数据在金融业的应用 毫无争议的,我们已经进入到大数据时代。而金融业无疑又是大数据的最重要的应用领域之一。今天,我们就来简单谈谈大数据在金融业的应用。 什么是大数据 关于这个,已经了比较标 ...

浅谈大数据在金融业的运用

浅谈大数据在金融业的运用
2017-05-15
浅谈大数据在金融业的运用 “很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数据时代又来了。” 毫无争议的,我们已经进入到大数据时代。而金融业无疑又是大数据的最重 ...
大数据行业人士必知十大数据思维原理
2017-01-05
大数据行业人士必知十大数据思维原理 大数据思维原理是什么?简单概括为10项原理,当样本数量足够大时,你会发现其实每个人都是一模一样的。对于“大数据”研究机构Gartner给出了这样的定义。“大数据”是需要新 ...
万字长文全面解析大数据思维的十大原理
2016-10-31
万字长文全面解析大数据思维的十大原理 一、数据核心原理:从“流程”核心转变为“数据”核心 大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“数 ...
大数据思维原理是什么
2016-10-22
大数据思维原理是什么 大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“数据”为核心的范式。非结构化数据及分析需求,将改变IT系统的升级方式:从简 ...
1234567 4/7

OK