18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 空间数据仓库(数据库)

空间数据仓库(数据库)

时间:2022-11-01 06:30:01 | 来源:信息时代

时间:2022-11-01 06:30:01 来源:信息时代

    空间数据仓库 : 为高效支持包含空间数据的统计聚集汇总查询而设计的一类特殊的数据库。空间数据仓库除了包含非空间数据外,还包含地理数据(如卫星图像、航空照片等)。传统数据仓库与空间数据仓库之间的一个主要差别在于结果的可视化: 传统数据仓库OLAP的结果通常以文本和数字报表或电子表格的形式表现,而空间数据仓库的结果则可能是一幅镶嵌的地图。另一个区别与对空间数据类型(例如点、线、面)聚集算子的选择和标准化有关。
空间数据仓库中的聚集操作可以分为三组,即分布的聚集操作、代数的聚集操作和全局的聚集操作。对于分布和代数聚集函数,即使在数据集大到无法全部装入内存的情况下,也可以通过使用少量的内存缓冲,对数据集进行一次扫描来计算。
分布的空间聚集操作包括凸包(convex hull)、几何并(geometric union)和几何交(geometric intersecttion)。一个点集Q的凸包是一个最小的凸多边形P,对于Q中的每个点要么在P边界上要么在P内部。几何交是个二元操作,它用两组几何区域,并返回由这两个区域共同覆盖的区域集合。集合并也是用两组几何区域为参数的二元操作,返回至少被其中一个区域覆盖的区域集合。对于所有这些聚集,算子先聚集所计算的子集区域,然后计算最终的结果。
代数聚集操作在GIS中是一个中心(center)计算。n个几何点的中心=(Vxi,Vyi)可以定义为:


中心(center)和个数(count)被用来计算下一层的结果。代数聚集函数的其他例子还有质心(center of mass)和重心(center of gravity)等。
全局的空间聚集操作包括均分(equipartition)和最近邻居指数(nearest-neighbor index)。点集的均分生成一条线L,并且L的两侧有相同数量的点。最近邻居指数用于度量某一个空间域中对象的聚类程度,如果一个空间域具有相似值趋于聚在一起的特性,那么该域就表现为高的最近邻居指数。一旦添加了新数据,最近邻居关系中的许多元组都可能会改变,因此,最近邻居指数是全局的。均分线也可能因为新点的加入而改变。为了计算各个维层次上的均分或最近邻居指数,需要有基本的数据。
聚集函数的计算难度是分等级的。分布的聚集函数可以基于低一级维度的值来计算; 代数的聚集函数也可以从低一级维度值的聚集计算出来。分布的和代数的聚集函数,即使是对于占用大量磁盘存储空间的数据集,也可以使用少量的内存缓冲区进行计算,但全局的聚集函数在所有维层次上都需要基本数据来计算结果。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭