时间:2022-12-14 02:30:01 | 来源:信息时代
时间:2022-12-14 02:30:01 来源:信息时代
不确定性管理 : 针对移动对象信息存在不确定性的特点,从数据模型和查询语言等方面对移动对象进行管理的方法与技术。在移动对象管理中,移动对象的位置信息存在不精确性。主要原因是无论利用什么样的策略来更新数据库中对象位置信息,数据库中的位置信息与对象的实际位置并不总是完全相同的。另外,由于缺少精确的度量方式,或者是时间的快速变更,使得空间和时空数据具有不确定性。因此,不确定性管理是指数据模型和查询语言应该有能力反映和表示移动对象的不确定性,从而减少查询结果不确定性给用户带来的影响。
这种固有的不确定性在数据库模型、查询处理和索引方面都有所体现。例如,对于范围查询,可能存在两种不同结果,即“可能”满足查询的对象集合和“一定”满足查询的对象集合。可见,不同的查询会带来不同的语义。因此,数据模型和查询语言应该有能力反映和表示移动对象的不确定性,从而减少查询结果不确定性给用户带来的影响。
1.移动对象的不确定性模型和方法
传统数据库对不确定性问题已有广泛的研究,但是移动对象管理需要新的移动对象不确定性模型和方法。其主要问题是如何量化位置不确定性,如何量化更新负载与不确定性/不精确性之间的权衡及设定何种更新策略更合理,如何处理移动对象连接中断和不能传送更新到数据库的情况。因此,需要采用新技术和新方法来处理上述不确定性问题。
连续监控或者跟踪移动对象的系统在对象运动过程中可收到其位置更新信息。但由于带宽和移动设备电能的限制,数据库不可能包含每个对象在每个时刻的确切位置。例如,如果在位置信息获取和收到之间有时间延迟,那么收到的对象位置值或许不同于其真实位置值。这些应用的固有特性使对象的位置信息不能连续更新,在两次更新之间,对象的位置是不可知的。在这种情况下,数据库中的数据在多数时刻仅是真实位置的估计值。这种固有的不确定性影响着查询结果的精确性。
2. 不确定性产生的原因
虽然由于数据固有的不确定性,很难提供准确意义的结果。然而,对于大多数移动对象,可以假设其位置在短时期内不可能剧烈变化。实际上,移动对象的运动程度和速度往往是受限的。移动对象的位置信息是通过采样获得的,其精确度(或反之,误差度)与采样时的度量过程和采样方法相关。按不确定性的产生原因,误差度可分为两种:
(1) 测量误差: 一般地,不精确的测量会产生误差。而精确性和测量的质量取决于所使用的技术。通常,在讨论GPS时有两种假设: 首先,在三维中每一维的误差和时间的误差,其误差分布都符合高斯函数。其次,即在x-y平面上的水平误差分布是圆形的。GPS位置测量中的误差可以表示成概率函数,它可以由在两个空间维上各自的正态分布构成。
(2)采样误差: 在一定时间段内用GPS接收器来采样移动对象位置,从而捕获对象的运动情况。那么,在两次测量之间就会产生对象位置的不确定性。基于采样率和对象的最大速度,可以建立不确定性模型。对象运动的不确定性受到位置采样频率(即采样率)的影响,采样率可以根据对象的移动速度和连续两次采样间的最大距离期望值来设定。例如,对于一辆行驶的出租车,根据应用需求,假定连续两次采样之间的距离最大为10m,如果出租车的最大速度为每小时150km,那么每秒钟至少采样4.2次。如果一辆出租车的运动速度小于它的最大速度,那么两次采样之间最大距离不能小于10m。
移动对象的不确定性表现在两个方面: 运动轨迹(历史数据)的不确定性和当前位置数据的不确定性。移动对象不确定性的表示可以有三种方法: 圆表示,椭圆表示和圆柱表示。如果知道数据库中某一时刻对象的位置,那么它的实际物理位置到存储的位置之间的距离会在一定范围内。于是,一个移动对象的位置可以用圆形区域来表示。换言之,可以用一个物理范围表示一个对象。数据的采集过程决定在圆形区域内确切对象位置的概率密度分布。圆形表示对象向周围方向的不确定性运动都是相同的,但实际上这种假设不够合理,因此产生了椭圆的表示方式。给定起点和终点以及由最大速度得出的最大运动距离。如果该最大运动距离大于两个端点之间距离,那么移动对象会偏离给定路径。这样,对象的不确定性范围可以表示成椭圆。给定起点和终点,当且仅当一个对象的位置与它的预测轨迹之间的偏差超过某一距离值时,对象才会向服务器提交它的位置变化。这样,不确定性区域就被表示成圆柱形式。
以时空范围查询为例,传统方式是查询在特定时间间隔和区域内的对象。然而,由于存在不确定性,用户在对移动对象提交查询时,可以查询在一段时间内某些时刻出现在某区域的对象或查询在一段时间内总是出现在某区域的对象。类似的,给定对象所在的不确定范围,用户可以查询可能出现在某个区域的对象,或者确定在这个区域中的对象。因此,某时刻,“总是”、“可能”、“确定”可以作为不确定性查询的关键字。
例如,一个货运公司会对以下查询感兴趣:
Q1: “找到在下午3:00和3:15之间的某些时刻可能会出现在区域R中的货车的当前位置”。
而一个军事分析家会提出下面的查询:
Q2: “找到在下午1:30到1:45之间的某些时刻确定出现在区域R中的坦克数目”。
一个警务发报机可能提出下面的查询:
Q3: “找到在上午2:30到2:40之间总是出现在区域R中的警车”。