cda

数字化人才认证

首页 > 行业图谱 >

数据挖掘基本任务

数据挖掘基本任务
2017-05-02
数据挖掘基本任务 数据挖掘主要做什么?换而言之,数据挖掘主要解决什么问题呢?这些问题,可以归结为数据挖掘的基本任务。 数据挖掘的基本任务包括分类与预测、聚类分析、关联规则、奇异值检测和智能推荐等 ...

大数据时代下的数据挖掘简析

大数据时代下的数据挖掘简析
2017-04-12
大数据时代下的数据挖掘简析 随着大数据的兴起,隐藏在大数据背后的相关技术也逐渐被揭开神秘的面纱,其中,数据挖掘即是大数据应用过程中非常重要的环节。以下是国内领先的移动大数据服务商极光大数据的副总裁 ...

简单易学的机器学习算法—AdaBoost

简单易学的机器学习算法—AdaBoost
2017-03-28
简单易学的机器学习算法—AdaBoost 一、集成方法(Ensemble Method) 集成方法主要包括Bagging和Boosting两种方法,随机森林算法是基于Bagging思想的机器学习算法,在Bagging方法中,主要通过对训练数据集 ...

简单易学的机器学习算法—集成方法(Ensemble Method)

简单易学的机器学习算法—集成方法(Ensemble Method)
2017-03-28
简单易学的机器学习算法—集成方法(Ensemble Method) 一、集成学习方法的思想 前面介绍了一系列的算法,每个算法有不同的适用范围,例如有处理线性可分问题的,有处理线性不可分问题。在现实世界的生活中, ...

数据挖掘十大算法之CART详解

数据挖掘十大算法之CART详解
2017-03-16
数据挖掘十大算法之CART详解 CART生成 CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将 ...

干货:逻辑回归构建申请信用评级案例

干货:逻辑回归构建申请信用评级案例
2017-03-08
概述:本文基于 R 语言,通过一个逻辑回归构建汽车贷款申请信用评级的案例,来为大家简单介绍信用风险模型及建模流程、R 语言实现、及中间需要注意的一些问题。包含的主要内容有以下几部分: ● 信用 ...

聊一聊特征学习在用户偏好预测中的应用

聊一聊特征学习在用户偏好预测中的应用
2017-03-02
本文聊聊如何利用客户购买行为预测其偏好。 为了基于客户购买行为预测其偏好,可以利用机器学习中比较新兴的稀疏编码和稀疏限制性玻尔兹曼机将原始数据变换成稀疏高纬表示。这些特征学习技巧独立于预测模 ...

R语言中的缺失值处理

R语言中的缺失值处理
2017-02-27
R语言中的缺失值处理 在处理一些真实数据时,样本中往往会包含缺失值(Missing values)。我们需要对缺失值进行适宜的处理,才能建立更为有效的模型,使得后续预测分析能有更小的偏差。本文将罗列不同的缺失值处 ...

R语言不平衡数据分类指南

R语言不平衡数据分类指南
2017-02-27
R语言不平衡数据分类指南 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而 ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2017-02-26
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户 ...

数据批处理--R语言里最重要的一个函数家族:*pply

数据批处理--R语言里最重要的一个函数家族:*pply
2017-02-22
数据批处理--R语言里最重要的一个函数家族:*pply 之前我们讲过循环,简单讲解了向量计算,它可以代替循环进行比较搞笑的批量计算,试想计算数据框中的总收入加上10,我们没必要进行循环计算这一列的每一个元素 ...

R语言基本操作

R语言基本操作
2017-02-20
R语言基本操作 R语言和Python类似,也是有许许多多的包(Python中是模块)组成,具体用什么就安装什么,用的时候再去加载。 1、安装包: 语法:install.packages(\"包名\")(两个引号\"\"不能省略) ...

R语言初学者必须要知道的事儿

R语言初学者必须要知道的事儿
2017-02-16
R语言初学者必须要知道的事儿 2017年1月24日晚8点半,乐逗游戏挖掘团队负责人、资深R语言用户谢佳标带来了主题为“数据分析利器:R语言快速入门”的Chat交流。以下是主持人孙莫默整理的实录,记录了谢佳标与读 ...

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析

python数据挖掘之决策树DTC数据分析及鸢尾数据集分析
2020-04-20
Python数据挖掘之决策树DTC数据分析及鸢尾数据集分析  今天主要讲述的内容是关于决策树的知识,主要包括以下内容:1.分类及决策树算法介绍2.鸢尾花卉数据集介绍3.决策树实现鸢尾数据集分析。希望这篇文章 ...
【中国电信集团号百信息服务有限公司】招聘数据分析师
2017-01-13
【中国电信集团号百信息服务有限公司】招聘数据分析师 中国电信集团号百信息服务有限公司(简称:号百公司)是中国电信股份有限公司的全资子公司。公司于2007年8月16日在上海挂牌成立,注册资本3.5亿元。公司业务经 ...

数据挖掘分类技术_数据挖掘分类

数据挖掘分类技术_数据挖掘分类
2016-12-13
数据挖掘分类技术_数据挖掘分类 1、过分拟合问题: 造成原因有:(1)噪声造成的过分拟合(因为它拟合了误标记的训练记录,导致了对检验集中记录的误分类);(2)根据少量训练记录做出分类决策的模型也容易 ...

深度解析制约大数据发展的三大因素

深度解析制约大数据发展的三大因素
2016-11-30
深度解析制约大数据发展的三大因素 近来,大数据如浪潮般席卷全球。越来越多的国家开始从战略层面认识大数据,中国亦如此。然而任何发展都不应盲目跟从,而应该在发展中不断认识其发展的意义与遇到的困难 ...

统计建模和机器学习的区别之我见

统计建模和机器学习的区别之我见
2016-11-26
统计建模和机器学习的区别之我见 最近我多次被问到统计(尤其是统计建模)、机器学习和人工智能之间有何区别。其实这三者之间在目标、技术和算法方面有很多重叠的部分。引起困惑的原因不仅仅是因为这些重叠部分, ...

数据挖掘与生活:算法分类和应用

数据挖掘与生活:算法分类和应用
2016-11-23
数据挖掘与生活:算法分类和应用 相对于武汉,北京的秋来的真是早,九月初的傍晚,就能够感觉到丝丝丝丝丝丝的凉意。 最近两件事挺有感觉的。 看某发布会,设计师李剑叶的话挺让人感动的。“**的设计是内 ...

大数据分析与机器学习领域Python兵器谱

大数据分析与机器学习领域Python兵器谱
2016-11-23
大数据分析与机器学习领域Python兵器谱 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第 ...

OK