2018-11-21
阅读量:
728
数据质量分析
数据质量分析是数据挖掘中数据准备过程的重要一环, 是数据预处理的
前提, 也是数据挖掘分析结论有效性和准确性的基础, 没有可信的数据, 数
据挖掘构建的模型将是空中楼阁。
数据质量分析的主要任务是检查原始数据中是否存在脏数据, 脏数据一
般是指不符合要求, 以及不能直接进行相应分析的数据。 在常见的数据挖掘
工作中, 脏数据包括:
·缺失值;
·异常值;
·不一致的值;
·重复数据及含有特殊符号(如#、 ¥、 *) 的数据。
0.0000
0
3
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论