时间:2022-12-20 08:30:01 | 来源:信息时代
时间:2022-12-20 08:30:01 来源:信息时代
多维数据模型 : 一种简明的、面向主题的模式,便于联机数据分析(OLAP)。该模型将数据看作数据立方体(data cube)形式,允许以多维对数据建模和观察。
维是OLAP的核心概念,指的是人们观察客观世界的角度,是一种高层次的类型划分(如时间维、地理维等)。而维成员指维的取值。如果一个维是多层次的,那么该维的维成员是由各个不同维层次的取值组合而成,如“2004年6月30日”是在具有三个层次的时间维上的一个取值。
维的层次是指人们观察数据的某个特定角度,还可以存在细致程度不同的多个描述方面(如时间维: 日期→月份→季度→年)。维的层次性是人们观察数据细致程度的不同造成的,维度层次的确定需要具体问题具体分析,不同分析应用对数据组织的详略程度不同,将使同一维度上的层次繁简不同。
维的类是指按照一定的划分标准对维成员全集的一个划分。比如,产品可划分成“畅销”、“不畅销”;移动通信业务类型可划分为“通话”、“短信”。值得注意的是,维的层次和类是两个不同的概念,维的层次主要是为了进行数据钻取分析(上钻和下钻),让用户能够查看不同层次的数据。维的分类是对维取值的划分,其目的通常是为了在不同的类别间进行比较。比如: “畅销”、“不畅销”产品各占产品总量的比重?“通话”、“短信”对移动公司的收益贡献分别是多少?
在实际的多维数据分析应用中,要在维的层次关系和维成员的类上进行错综复杂的数据分析。这就要求将维的层次与类交叉、组合在一起,形成更为复杂的层次图。
数据立方体是二维表格的多维扩展,如同几何学中立方体是正方形的三维扩展一样,也可以把三维的数据立方体看作是一组类似的互相叠加起来的二维表格。但是数据立方体不局限于三个维度,常常用很多个维度来构建数据立方体,但倾向于一次只看三个维度。数据立方体是一类多维矩阵,让用户从多个角度、多种粒度探索和分析数据集。而从维的角度来看一个立方体(cube),给定一个维的集合,就可以构造立方体的格,立方体的格也就是在不同的汇总级(即根据维的不同子集)得到的立方体。存放在最底层的数据汇总称为基本立方体,它包含了数据立方体定义中说明的所有维,并且每个维的粒度都在连接键层,连接键是连接事实表和维表的关键字,如图1所示,是一个具有产品维、地区维、时间维,度量为销售额的立方体,其基本立方体就是给定维产品、地区、时间的基本立方体,与基本立方体关联的事实表称为基本事实表。
图1 立方体示例