cda

数字化人才认证

首页 > 行业图谱 >

1234567 5/7

一文读懂机器学习分类算法(附图文详解)

一文读懂机器学习分类算法(附图文详解)
2019-09-25
作者 | Badreesh Shetty 整理 | 大数据文摘 说起分类算法,相信学过机器学习的同学都能侃上一二。 可是,你能够如数家珍地说出所有常用的分类算法,以及他们的特征、优缺点吗?比如说, ...

特异度等不可不知的11个重要机器学习模型评估指标

特异度等不可不知的11个重要机器学习模型评估指标
2020-05-20
【磐创AI导读】:评估一个模型是建立一个有效的机器学习模型的核心部分,本文为大家介绍了一些机器学习模型评估指标,希望对大家有所帮助。 评估一个模型是建立一个有效的机器学习模型的核心部分 ...

用ROC曲线解析预测模型

用ROC曲线解析预测模型
2019-07-22
出品 | CDA数据分析研究院 数据科学是一个在过去几年里真正成长的术语,似乎每个人都想加入。最具吸引力的目标之一是利用数据资产的力量来创建能够预测各种结果的机器学习模型。通过定义明确的模型 ...

机器学习中的基础知识(二)

机器学习中的基础知识(二)
2019-02-19
在上一篇文章中我们给大家介绍了很多的机器学习中的基础知识,机器学习的基础知识是比较零碎的,但却是十分重要的,所以我们要重视这些内容。在这篇文章中我们会继续为大家介绍机器学习涉及到的基础概念 ...

你应该知道的模型评估的五个方法

你应该知道的模型评估的五个方法
2018-08-19
你应该知道的模型评估的五个方法 好久没更新了,我怕再不更,我要掉粉了,这次来更新的是模型评估的常见的五个方法: 1、混淆矩阵。 2、提升图&洛伦兹图。 3、 基尼系数 4、ks曲线 5、roc曲线。 ...

信用卡通不过?用数据分析技术,带你深度解析信用卡评分体系

信用卡通不过?用数据分析技术,带你深度解析信用卡评分体系
2018-06-23
信用卡通不过?用数据分析技术,带你深度解析信用卡评分体系 随着互联网金融时代的到来,信用评分体系显得越发重要,本文就解读信用卡评分体系是如何建立的。 客户信息涉及到很多因素,因此许多因素无法在机 ...

R语言︱决策树族——随机森林算法

R语言︱决策树族——随机森林算法
2018-06-15
R语言︱决策树族——随机森林算法 一、随机森林理论介绍 1.1 优缺点 优点。 (1)不必担心过度拟合; (2)适用于数据集中存在大量未知特征; (3)能够估计哪个特征在分类中更重要; (4)具有很好的抗噪声能力; (5) ...

【数据看球】2018 年世界杯夺冠预测,CDA带你用机器学习来分析

【数据看球】2018 年世界杯夺冠预测,CDA带你用机器学习来分析
2018-06-14
【数据看球】2018 年世界杯夺冠预测,CDA带你用机器学习来分析 随着2018年FIFA世界杯开赛在即,世界各地的球迷都渴望知道:谁将夺取梦寐以求的冠军奖杯? 如果你不仅是一名资深球迷,而且还是技术宅,那么你 ...

用R软件做分类树和回归树(CART)

用R软件做分类树和回归树(CART)
2018-05-29
用R软件做分类树和回归树(CART) 决策树(Decision Tree)又称为判定树,是运用于分类的一种树结构。其中的每个内部结点(internal node)代表对某个属性的一次测试,每条边代表一个测试结果,叶结点(leaf) ...

R语言利用nnet包训练神经网络模型

R语言利用nnet包训练神经网络模型
2018-05-23
R语言利用nnet包训练神经网络模型 R语言提供了另外一个能够处理人工神经网络的算法包nnet,该算法提供了传统的前馈反向传播神经网络算法的实现。 操作 安装包与数据分类: library(nnet) data(\"iris\") set.s ...

R语言之-caret包应用

R语言之-caret包应用
2018-05-19
R语言之-caret包应用 caret包应用之一:数据预处理 在进行数据挖掘时,我们会用到R中的很多扩展包,各自有不同的函数和功能。如果能将它们综合起来应用就会很方便。caret包(Classification and Regressio ...

不平衡学习算法的评估指标

不平衡学习算法的评估指标
2018-04-05
不平衡学习算法的评估指标 先来看下类不平衡的定义:对于二元分类问题,存在类别分布不平衡的问题,即某一类别的样本数量远远多于另一类(分别称为多数类和少数类)。具有这样特征的二元分类数据集被称为不平衡 ...

在机器学习分类中如何处理训练集中不平衡问题

在机器学习分类中如何处理训练集中不平衡问题
2018-04-01
在机器学习分类中如何处理训练集中不平衡问题 很多机器学习任务中,训练集中可能会存在某个或某些类别下的样本数远大于另一些类别下的样本数目。即类别不平衡,为了使得学习达到更好的效果,因此需要解决该类别 ...

机器学习案例实战-信用卡欺诈检测

机器学习案例实战-信用卡欺诈检测
2018-03-29
机器学习案例实战-信用卡欺诈检测 故事背景:原始数据为个人交易记录,但是考虑数据本身的隐私性,已经对原始数据进行了类似PCA的处理,现在已经把特征数据提取好了,接下来的目的就是如何建立模型使得检测的效 ...

非平衡数据集的机器学习常用处理方法

非平衡数据集的机器学习常用处理方法
2018-03-26
非平衡数据集的机器学习常用处理方法 定义:不平衡数据集:在分类等问题中,正负样本,或者各个类别的样本数目不一致。 例子:在人脸检测中,比如训练库有10万张人脸图像,其中9万没有包含人脸,1万包含人 ...

机器学习中非平衡数据集的常用处理方法

机器学习中非平衡数据集的常用处理方法
2018-03-25
机器学习中非平衡数据集的常用处理方法 不平衡数据集: 在分类等问题中,正负样本,或者各个类别的样本数目不一致。 :在人脸检测中,比如训练库有10万张人脸图像,其中9万没有包含人脸,1万包含人脸, ...

常用的机器学习&数据挖掘知识点

常用的机器学习&数据挖掘知识点
2018-03-07
常用的机器学习&数据挖掘知识点 Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最 ...

利用R语言如何判别和分类

利用R语言如何判别和分类
2018-01-21
利用R语言如何判别和分类 判别分析(discriminant analysis)是一种分类技术。它通过一个已知类别的“训练样本”来建立判别准则,并通过预测变量来为未知类别的数据进行分类。       ...

R语言使用boosting方法对数据分类与交叉验证

R语言使用boosting方法对数据分类与交叉验证
2018-01-19
R语言使用boosting方法对数据分类与交叉验证 数据分类说明 与bagging方法类似,boosting算法也是先获得简单的分类器,然后通过调整错分样本的权重逐步改进分类器,使得后续分类器能够学习前一轮分类器,adab ...

R语言使用逻辑回归分类算法

R语言使用逻辑回归分类算法
2018-01-15
R语言使用逻辑回归分类算法 逻辑回归属于概率统计的分类算法模型的算法,是根据一个或者多个特征进行类别标号预测。在R语言中可以通过调用logit函数执行逻辑回归分类算法并预测输出概率。通过调用glm函数将fami ...
1234567 5/7

OK