cda

数字化人才认证

首页 > 行业图谱 >

123456789 7/9

数据挖掘十大算法之决策树详解(1)

数据挖掘十大算法之决策树详解(1)
2017-03-17
数据挖掘十大算法之决策树详解(1) 从分类问题开始 分类(Classification)任务就是确定对象属于哪个预定义的目标类。分类问题不仅是一个普遍存在的问题,而且是其他更加复杂的决策问题的基础,更是机器学习 ...

机器学习实战之PCA

机器学习实战之PCA
2017-03-14
机器学习实战之PCA 1.  向量及其基变换 1.1 向量内积 (1)两个维数相同的向量的内积定义如下: 内积运算将两个向量映射为一个实数. (2) 内积的几何意义 假设A\\B是两个n维向量, n维向量可以 ...

主成分分析(PCA)特征选择算法详解

主成分分析(PCA)特征选择算法详解
2017-03-12
主成分分析(PCA)特征选择算法详解 1. 问题 真实的训练数据总是存在各种各样的问题: 1、 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显 ...

R语言不平衡数据分类指南

R语言不平衡数据分类指南
2017-02-27
R语言不平衡数据分类指南 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而 ...

R语言学习笔记三

R语言学习笔记三
2017-02-17
R语言学习笔记三 10)求解线性方程组和逆矩阵 Solve函数求出a %*% x = b中的x向量值,即求解线性方程组,通常使用前2个参数,第一个是a,为系数矩阵  ,第二是b为常数项,当b ...

如何正确应用SPSS 软件做主成分分析

如何正确应用SPSS 软件做主成分分析
2017-01-21
如何正确应用SPSS 软件做主成分分析 1引言 主成分分析( principal components analysis) 也称主分量分析,由霍特林(Hotelling)于1933 年首先提出。主成分分析是利用降维的思想,在 ...

因子得分系数矩阵_spss因子得分系数矩阵_因子得分系数矩阵含义

因子得分系数矩阵_spss因子得分系数矩阵_因子得分系数矩阵含义
2016-12-24
因子得分系数矩阵_spss因子得分系数矩阵_因子得分系数矩阵含义 主成分因子分析中的成分得分系数矩阵的数值代表什么含义 通过主成分分析法提取公因子,得到成分得分系数矩阵( Component Score Coefficient M ...

数据挖掘分类方法小结_数据挖掘中的基于决策树的分类方法

数据挖掘分类方法小结_数据挖掘中的基于决策树的分类方法
2016-12-14
数据挖掘分类方法小结_数据挖掘中的基于决策树的分类方法 数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描 ...

数据分析-AHP层次分析法

数据分析-AHP层次分析法
2016-12-04
数据分析-AHP层次分析法 层次分析法(The analytic hierarchy process)简称AHP,在20世纪70年代中期由美国运筹学家托马斯·塞蒂(T.L.Satty)正式提出。它是一种定性和定量相结合的、系统化、层次化的分析方法 ...

数据挖掘与生活:算法分类和应用

数据挖掘与生活:算法分类和应用
2016-11-23
数据挖掘与生活:算法分类和应用 相对于武汉,北京的秋来的真是早,九月初的傍晚,就能够感觉到丝丝丝丝丝丝的凉意。 最近两件事挺有感觉的。 看某发布会,设计师李剑叶的话挺让人感动的。“**的设计是内 ...

R语言里的矩阵处理学习笔记

R语言里的矩阵处理学习笔记
2016-10-25
R语言里的矩阵处理学习笔记 关于矩阵,通常都会使用matlab来做处理。其实使用R也可以对矩阵做出一些简单的处理。而R语言中提供的matrix,matlab包也提供了不少关于矩阵处理的东西(可以通过??matlab来查看具体 ...

大数据时代的网络分析,如何全盘挖掘大数据

大数据时代的网络分析,如何全盘挖掘大数据
2016-10-20
大数据时代的网络分析,如何全盘挖掘大数据 我们生活在一个互联实体(entities)构成的复杂世界中。人类涉足的所有领域,从生物学到医学、经济学和气候科学,都充满了大规模数据集。 这些数据集将实体(entiti ...

用R语言实现对不平衡数据的四种处理方法

用R语言实现对不平衡数据的四种处理方法
2016-09-07
用R语言实现对不平衡数据的四种处理方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。那么,这种结果是为何发生的呢?到底是什 ...

客户细分:如何找到最有价值的TA?

客户细分:如何找到最有价值的TA?
2016-08-08
关于客户分类的内容早就想写却不知道怎么动笔,因为客户分类没有统一方法和规则,行业之间分类的方法、角度完全不同,今天可能犯神经病了,突然想清楚该怎么写啦~~ 上一篇文章介绍了用定位理论打造 ...

数据挖掘中的基于决策树的分类方法

数据挖掘中的基于决策树的分类方法
2016-07-31
数据挖掘中的基于决策树的分类方法 1 分类的概念及分类器的评判 分类是数据挖掘中的一个重要课题。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给 ...

常见机器学习算法比较

常见机器学习算法比较
2016-07-11
常见机器学习算法比较 机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择 ...

数据挖掘工程师笔试及答案整理

数据挖掘工程师笔试及答案整理
2021-02-03
数据挖掘工程师笔试及答案整理 2013百度校园招聘数据挖掘工程师 《数据分析专项练习题库》 《CDA数据分析认证考试模拟题库》 《企业数据分析面试题库》 一、简答题(30分) 1、简述数据 ...

 Spark 文本情感分析

Spark 文本情感分析
2016-06-08
本文描述了一个基于 Spark 构建的认知系统:文本情感分析系统,分析和理解社交论坛的非结构化文本数据。 基于 Spark 的文本情感分析 文本情感分析是指对具有人为主观情感色彩文本材料进行处理、分 ...

对“在线学习行为”可能应用方向的分析建模及挖掘

对“在线学习行为”可能应用方向的分析建模及挖掘
2016-05-10
对“在线学习行为”可能应用方向的分析建模及挖掘 在日趋精密数字技术条件下,学习模式已通过互联网、社会化媒体实现数字化。海量的学习信息以数据的形式蕴含着学习者的隐性行为特征。文章从数据挖掘与领 ...

处理多重共线性问题

处理多重共线性问题
2016-05-07
处理多重共线性问题 一、多重共线性的表现 线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系。看似相互独立的指标本质上是相同的,是可以相互代替的,但是完全共线性的情况并不多见,一般出 ...
123456789 7/9

OK