18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 数据挖掘过程模型(数据库)

数据挖掘过程模型(数据库)

时间:2022-11-21 18:30:01 | 来源:信息时代

时间:2022-11-21 18:30:01 来源:信息时代

    数据挖掘过程模型 : 用于指导数据挖掘应用建设过程的框架。目前提出的过程模型主要有: Fayyad过程模型和CRISP-DM过程模型。
Fayyad过程模型的主要步骤如下:
(1)数据选择:从现有的数据中,确定哪些数据是和本次数据分析相关的。
(2)数据预处理:对于选择出的数据,进行数据清洗工作,将数据转变成“干净”的数据。
(3)数据转换:将“干净”的数据转换成数据挖掘算法所需要的格式。
(4)数据挖掘:使用合适的数据挖掘算法完成数据分析。
(5)解释和评估:以适当的可视化技术和知识表示技术将模式以合适的形式提供给用户,让用户能够对模型结果作出解释,同时能够评估模型的有效性。
CRISP-DM过程模型分为6个步骤:
(1)业务理解(business understanding):开始阶段专注于从商业的角度理解项目目标和需求,然后将这种知识转换成一种数据挖掘的问题定义,并设计出达到目标的一个初步计划。
(2)数据理解(data understanding): 先收集初始数据,然后进行熟悉数据的各种活动,包括识别数据的质量问题,找到对数据的基本观察,或假设隐含的信息来检测出感兴趣的数据子集。
(3)数据预处理(data preparation): 覆盖了从初步数据构造最终数据(将要输入建模工具的数据)的所有活动。数据预处理任务很可能要执行多次,并且没有任何规定的顺序。任务包括表、记录属性的选择以及为了适合建模工具的要求对数据进行的转换(transformation)和净化(cleaning)。
(4)建模(modeling):选择和应用各种建模技术,并将其参数校正到优化值。通常,对同一个数据挖掘问题类型有几种可用的技术。某些技术对数据的形式有具体的要求。因此,常常要退回到数据准备阶段。
(5)模型评估(evaluation): 评价模型,对所建模型再次考察其执行的步骤,并确信其正确地达到了预定目标。
(6)模型部署(deployment): 用一种用户可以使用的方式来组织和表示所获得的知识。根据要求,可以简单到只生成一份报告,或复杂到实现一个可重复的数据挖掘过程。在许多情况下,这将由客户而不是分析员来实施。
CRISP-DM过程模型比Fayyad模型增加了“业务理解”和“模型部署”这两个步骤,完善并改进了Fayyad模型。CRISP-DM模型也证明了数据挖掘是一个循环迭代的过程。目前大部分的数据挖掘系统都遵循CRISP-DM过程模型标准来执行和完成数据挖掘任务。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭