cda

数字化人才认证

首页 > 行业图谱 >

12345678 5/8
简单理解文本挖掘的定义与过程
2020-07-02
文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法,主要用途 ...
数据清洗中常用的异常值检测的几种方法
2020-06-30
异常值是指样本中的个别值,其数值明显偏离它(或它们们)所属样本的其余观测值。异常值分析目的是检验是否有录入错误的数据以及是否含有不合常理的数据时。如果对异常值的存在忽视不见,在数据的计算分析过程中把异 ...

机器学习python算法应用,监督学习、无监督学习等!

机器学习python算法应用,监督学习、无监督学习等!
2020-05-25
本系列文章主要介绍机器学习在实践中的应用,介绍利用 python 的生态环境,使用机器学习的算法来解决工程实践中的问题,而不是介绍算法本身。本系列文章参考了《机器学习Python实践》,会通过例子一步一步地引导大 ...

通过定量数据构建用户画像的方法与流程

通过定量数据构建用户画像的方法与流程
2020-04-03
作者 | CDA数据分析师 前言 用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。用户画像最初是在电商领域得到应 ...

如何正确选择聚类算法?

如何正确选择聚类算法?
2019-11-26
作者 | Josh Thompson 来源 | 数据派THU Choosing the Right Clustering Algorithm for your Dataset - KDnuggets 聚类算法十分容易上手,但是选择恰当的聚类算法并不是一件容易的事 ...

数据科学家不可不知的10种机器学习方法

数据科学家不可不知的10种机器学习方法
2019-09-19
作者 | CDA数据分析师 10 machine learning methods that every data scientist should know 机器学习是研究和工业中的热门话题,新方法一直在发展。该领域的速度和复杂性使得即使对于专家而 ...

数据挖掘之聚类分析详解(三)

数据挖掘之聚类分析详解(三)
2019-01-16
聚类分析在数据挖掘工作中是十分重要的技能,如果掌握了聚类分析会使得我们在数据挖掘工作中轻松应对各种问题,在这篇文章中我们继续给大家介绍数据挖掘中聚类分析的知识,希望能够给大家带来帮助。 ...

数据挖掘之聚类分析详解(二)

数据挖掘之聚类分析详解(二)
2019-01-16
在上一篇文章中我们给大家介绍了聚类分析的知识以及聚类分析中的部分算法。当然,这些算法都是需要我们掌握的,在这篇文章中我们继续给大家讲解数据挖掘中聚类分析的算法,希望能够给大家带来帮助。 ...

案例详解SPSS聚类分析全过程

案例详解SPSS聚类分析全过程
2018-08-01
案例详解SPSS聚类分析全过程 案例数据源: 有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。 【一】问题一:选择那些变量进行聚类?——采用“R型聚类” ...

R语言聚类算法比较

R语言聚类算法比较
2018-06-09
R语言聚类算法比较 在使用不同的聚类算法完成数据聚类操作后,我们可以对算法的性能进行评估,绝大多数情况下,我们即可以使用簇内距离也可以使用簇间距离作为评价标准。使用fpc算法包的cluster.stat函数来比较 ...

四种聚类方法之比较

四种聚类方法之比较
2018-06-08
四种聚类方法之比较 介绍了较为常见的k-means、层次聚类、SOM、FCM等四种聚类算法,阐述了各自的原理和使用步骤,利用国际通用测试数据集IRIS对这些算法进行了验证和比较。结果显示对该测试类型数据,FCM和k-me ...

聚类分析中几种算法的比较

聚类分析中几种算法的比较
2018-06-06
聚类分析中几种算法的比较 将数据库中的对象进行聚类是聚类分析的基本操作,其准则是使属于同一类的个体间距离尽可能小,而不同类个体间距离尽可能大,为了找到效率高、通用性强的聚 类方法人们从不同角度提出 ...

SPSS聚类分析—一个案例演示聚类分析全过程

SPSS聚类分析—一个案例演示聚类分析全过程
2018-06-03
SPSS聚类分析—一个案例演示聚类分析全过程 案例数据源: 有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。数据来自《SPSS for Windows 统计分析》data11-03。点击下载 ...

使用R语言绘制其他图形之相关系数图

使用R语言绘制其他图形之相关系数图
2018-05-22
使用R语言绘制其他图形之相关系数图 虽然cor()函数可以非常方便快捷的计算出连续变量之间的相关系数,但当变量非常多时,返回的相关系数一定时读者看的眼花缭乱。 下面就以R自带的mtcars数据集为例,讲 ...

数据科学家需要掌握的十大统计技术详解

数据科学家需要掌握的十大统计技术详解
2018-05-15
数据科学家需要掌握的十大统计技术详解 「数据科学家比程序员擅长统计,比统计学家擅长编程。」本文介绍了数据科学家需要掌握的十大统计技术,包括线性回归、分类、重采样、降维、无监督学习等。 不管你对数 ...

数据挖掘的常用方法、功能和一个聚类分析应用案例

数据挖掘的常用方法、功能和一个聚类分析应用案例
2018-04-20
数据挖掘的常用方法、功能和一个聚类分析应用案例 一、数据挖掘的常用方法 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同 ...

数据分析师—技术面试

数据分析师—技术面试
2018-03-29
数据分析师—技术面试 三月份开始找实习,到现在已经有半年的时间了,在这半年的时间中,该经历的基本上都已经经历,春招实习时候,拿到了7个offer,校招时候,成功的拿下一份心仪的工作,结束了我的秋招旅程。 ...

【机器学习】确定最佳聚类数目的10种方法

【机器学习】确定最佳聚类数目的10种方法
2018-02-27
【机器学习】确定最佳聚类数目的10种方法 在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过,看了很多 ...

R语言学习笔记之聚类分析

R语言学习笔记之聚类分析
2018-02-15
R语言学习笔记之聚类分析 使用k-means聚类所需的包: factoextra cluster #加载包 library(factoextra) library(cluster)l  #数据准备 使用内置的R数据集USArrests ...

R语言的三种聚类方法

R语言的三种聚类方法
2018-01-28
R语言的三种聚类方法 摘要: 层次聚类 kmeans dbscan笔记 一、距离和相似系数 r语言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数 ...
12345678 5/8

OK