cda

数字化人才认证

首页 > 行业图谱 >

用交叉验证改善模型的预测表现-着重k重交叉验证

用交叉验证改善模型的预测表现-着重k重交叉验证
2017-05-25
用交叉验证改善模型的预测表现-着重k重交叉验证 机器学习技术在应用之前使用“训练+检验”的模式(通常被称作”交叉验证“)。 预测模型为何无法保持稳定? 让我们通过以下几幅图来理解这个问题: ...

18本数据科学家必读的R语言和Python相关书籍

18本数据科学家必读的R语言和Python相关书籍
2017-05-25
前言 “这就是阅读。即将新软件安装到大脑里的过程。” 就我个人而言,我从视频和在线教程中所学到的始终没有从书本中学到的多。 了解机器学习和数据科学很容易。目前有许多开放课程,你可以马上就开始学习。但是 ...

R文本分类之RTextTools

R文本分类之RTextTools
2017-05-09
R文本分类之RTextTools 古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本分类开发包。 它集成了(或者说支持)如下算法相关的包: 支持向量机(Support Vec ...

三张图读懂机器学习:基本概念、五大流派与九种常见算法

三张图读懂机器学习:基本概念、五大流派与九种常见算法
2017-05-09
三张图读懂机器学习:基本概念、五大流派与九种常见算法 机器学习正在进步,我们似乎正在不断接近我们心中的人工智能目标。语音识别、图像检测、机器翻译、风格迁移等技术已经在我们的实际生活中开始得到了应用 ...

好课推荐丨CDA建模分析师-R语言

好课推荐丨CDA建模分析师-R语言
2017-05-05
数据科学家被认为是21世纪最性感也是最具发展前景的职业,目前有75%左右的数据科学家使用R语言,有35%左右的数据科学家将R语言作为首选统计分析工具。今天,我们来了解一下R语言的前世今生。 一、R的诞生 ...
【广东粤数大数据有限公司】招聘数据分析师
2017-05-02
【广东粤数大数据有限公司】招聘数据分析师     职位月薪:18000-30000元/月     工作地点:深圳-南山区     发布日期:5/2/2017 11:55:30 AM     工 ...

数据挖掘基本任务

数据挖掘基本任务
2017-05-02
数据挖掘基本任务 数据挖掘主要做什么?换而言之,数据挖掘主要解决什么问题呢?这些问题,可以归结为数据挖掘的基本任务。 数据挖掘的基本任务包括分类与预测、聚类分析、关联规则、奇异值检测和智能推荐等 ...

大数据时代下的数据挖掘简析

大数据时代下的数据挖掘简析
2017-04-12
大数据时代下的数据挖掘简析 随着大数据的兴起,隐藏在大数据背后的相关技术也逐渐被揭开神秘的面纱,其中,数据挖掘即是大数据应用过程中非常重要的环节。以下是国内领先的移动大数据服务商极光大数据的副总裁 ...

简单易学的机器学习算法—AdaBoost

简单易学的机器学习算法—AdaBoost
2017-03-28
简单易学的机器学习算法—AdaBoost 一、集成方法(Ensemble Method) 集成方法主要包括Bagging和Boosting两种方法,随机森林算法是基于Bagging思想的机器学习算法,在Bagging方法中,主要通过对训练数据集 ...

简单易学的机器学习算法—集成方法(Ensemble Method)

简单易学的机器学习算法—集成方法(Ensemble Method)
2017-03-28
简单易学的机器学习算法—集成方法(Ensemble Method) 一、集成学习方法的思想 前面介绍了一系列的算法,每个算法有不同的适用范围,例如有处理线性可分问题的,有处理线性不可分问题。在现实世界的生活中, ...

数据挖掘十大算法之CART详解

数据挖掘十大算法之CART详解
2017-03-16
数据挖掘十大算法之CART详解 CART生成 CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将 ...

干货:逻辑回归构建申请信用评级案例

干货:逻辑回归构建申请信用评级案例
2017-03-08
概述:本文基于 R 语言,通过一个逻辑回归构建汽车贷款申请信用评级的案例,来为大家简单介绍信用风险模型及建模流程、R 语言实现、及中间需要注意的一些问题。包含的主要内容有以下几部分: ● 信用 ...

聊一聊特征学习在用户偏好预测中的应用

聊一聊特征学习在用户偏好预测中的应用
2017-03-02
本文聊聊如何利用客户购买行为预测其偏好。 为了基于客户购买行为预测其偏好,可以利用机器学习中比较新兴的稀疏编码和稀疏限制性玻尔兹曼机将原始数据变换成稀疏高纬表示。这些特征学习技巧独立于预测模 ...

R语言中的缺失值处理

R语言中的缺失值处理
2017-02-27
R语言中的缺失值处理 在处理一些真实数据时,样本中往往会包含缺失值(Missing values)。我们需要对缺失值进行适宜的处理,才能建立更为有效的模型,使得后续预测分析能有更小的偏差。本文将罗列不同的缺失值处 ...

R语言不平衡数据分类指南

R语言不平衡数据分类指南
2017-02-27
R语言不平衡数据分类指南 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而 ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2017-02-26
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户 ...

数据批处理--R语言里最重要的一个函数家族:*pply

数据批处理--R语言里最重要的一个函数家族:*pply
2017-02-22
数据批处理--R语言里最重要的一个函数家族:*pply 之前我们讲过循环,简单讲解了向量计算,它可以代替循环进行比较搞笑的批量计算,试想计算数据框中的总收入加上10,我们没必要进行循环计算这一列的每一个元素 ...

R语言基本操作

R语言基本操作
2017-02-20
R语言基本操作 R语言和Python类似,也是有许许多多的包(Python中是模块)组成,具体用什么就安装什么,用的时候再去加载。 1、安装包: 语法:install.packages(\"包名\")(两个引号\"\"不能省略) ...

R语言初学者必须要知道的事儿

R语言初学者必须要知道的事儿
2017-02-16
R语言初学者必须要知道的事儿 2017年1月24日晚8点半,乐逗游戏挖掘团队负责人、资深R语言用户谢佳标带来了主题为“数据分析利器:R语言快速入门”的Chat交流。以下是主持人孙莫默整理的实录,记录了谢佳标与读 ...

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析
2020-04-20
Python数据挖掘之决策树DTC数据分析及鸢尾数据集分析  今天主要讲述的内容是关于决策树的知识,主要包括以下内容:1.分类及决策树算法介绍2.鸢尾花卉数据集介绍3.决策树实现鸢尾数据集分析。希望这篇文章 ...

OK