时间:2022-12-04 04:30:01 | 来源:信息时代
时间:2022-12-04 04:30:01 来源:信息时代
序列数据挖掘 : 针对序列数据进行的数据挖掘。依照时间的先后排列的称为时间序列,依照空间位置的先后排列的称为位置序列(常常简称序列),多个同类型序列的有限集称为多序列(或序列集)。序列数据挖掘可以在一个序列中进行也可以在多序列中进行。目前常见的针对序列数据源的数据挖掘如生物序列(核酸、蛋白质序列)数据挖掘、Web访问序列数据挖掘等。序列数据挖掘包括:
(1)序列模式挖掘:序列模式是在序列集中满足一定出现频率的所有子序列,找出所有这样的序列模式的过程称为序列模式挖掘。
(2)序列关联分析:寻找序列数据项之间感兴趣的关联关系,并用关联规则的形式描述。
(3)演变分析:描述时间序列数据随时间变化的数据规律或趋势,并对其建模,以预测其未来形式。
(4)序列聚类分析: 根据最大化类内的相似性、最小化类间的相似性的原则将序列数据分组,所形成的每个簇可以看作一个序列数据对象类,用显式或隐式的方法描述它们。
(5)序列分类分析:找出描述并区分数据类的模型,以便能够使用模型预测给定序列数据所属的类别。
(6)序列异常分析:一个序列数据集中往往包含一些特别的序列数据,其行为和模式与一般的数据不同,这些序列数据称为异常。对异常数据的分析称为异常分析。