2018-11-26
阅读量:
3150
数据挖掘方法论(CRISP-DM)流程的6个阶段
(1)业务理解Business understanding
该初始阶段集中在从商业角度理解项目的目标和要求,通过理论分析转化为数据挖掘可操作的问题,制定实现目标的初步计划。
(2)数据理解Data understanding
数据理解阶段开始于原始数据的收集,然后是熟悉数据、标明数据质量问题、探索对数据的初步理解、发觉有趣的子集以形成对探索关系的假设。
(3)数据准备Data preparation
数据准备阶段包括所有从原始的、未加工的数据构造数据挖掘所需信息的活动。数据准备任务可能被实施多次,而且没有任何规定的顺序。这些任务的主要目的是从源系统根据维度分析的要求,获取所需要的信息,需要对数据进行转换和清洗。
(4)建模Modeling
在此阶段,主要是选择和应用各种建模技术。同时对它们的参数进行校准,以达到最优值。通常对同一个数据挖掘问题类型,会有多种建模技术。一些技术对数据格式有特殊的要求。因此,常常需要返回到数据准备阶段。
(5)模型评估Evaluation
在模型最后发布前,根据商业目标评估模型和检查建立模型的各个步骤。此阶段关键目的是,判断是否存在一些重要的商业问题仍未得到充分考虑。
(6)模型发布Deployment
模型完成后,由模型使用者(客户)根据当时背景和目标完成情况,决定如何在现场使用模型。比如,在网页的实时个人化[11] 中或营销数据的重复评分中。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论