热线电话:13121318867

登录
2018-11-21 阅读量: 728
数据质量分析

数据质量分析是数据挖掘中数据准备过程的重要一环, 是数据预处理的

前提, 也是数据挖掘分析结论有效性和准确性的基础, 没有可信的数据, 数

据挖掘构建的模型将是空中楼阁。

数据质量分析的主要任务是检查原始数据中是否存在脏数据, 脏数据一

般是指不符合要求, 以及不能直接进行相应分析的数据。 在常见的数据挖掘

工作中, 脏数据包括:

·缺失值;

·异常值;

·不一致的值;

·重复数据及含有特殊符号(如#、 ¥、 *) 的数据。

0.0000
3
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子