时间:2022-11-26 02:30:01 | 来源:信息时代
时间:2022-11-26 02:30:01 来源:信息时代
统计数据库安全性 : 统计数据库中存在的特殊安全性问题。即: 统计数据库中存放着大量的统计数据,这些统计数据本身也许是非敏感数据,但是可以通过某些方法从这些非敏感数据得到敏感数据。例如,可以从合法的查询中推导出敏感信息,从而以危害系统安全的隐蔽方式获取敏感信息。所以,统计数据库的安全性是数据库安全性中的一个值得关注的问题。
1.通用跟踪谓词
在统计数据库查询中,为了防止人们通过统计、汇总等手段来推断演绎出秘密数据,如果查询所标识的数据库中的记录的子集小于某一下界b或大于n-b(n是数据库中记录的总数)时,系统将拒绝执行这类查询。但对于任何一个被系统拒绝的查询,总是可以找到这样的谓词,利用它来得到被拒查询的结果答案,这样的谓词称为通用跟踪谓词。实际上,对于结果集合的基数c,满足2b≤c≤n-2b的任何谓词都是通用跟踪谓词,只要b≤n/4。然而,这个条件在任何现实情况下总是能够满足的。
2. 个别跟踪谓词
在统计数据库查询中,如果利用谓词能够发现某一特定的被系统拒绝接受的查询的答案,那么这个谓词称为个别跟踪谓词。如果用户知道谓词P标识统计数据库中某一特定记录R,若P可以用P1AND P2的方式来表示,而且P1 AND NOT P2所标识的结果的集合的基数在b和n-b(n是数据库中记录的总数,b是数据库中被标识的记录的子集的基数的下界)之间,因而这两者都是可以接受的,则谓词P1 AND NOT P2就是R的个别跟踪谓词。
3. 统计推理
统计推理(statistical inference)是统计数据库中存在的一种特殊的安全性问题。统计推理是利用统计算法,由非敏感查询的结果数据推导出敏感数据的一种方法。统计推理方法主要有如下几种:
(1)直接推理(direct inference):试图直接通过查询所获得的一些记录,来直接搜索并确定敏感属性字段的值,称为直接推理。最有效的方法是形成一种特定的查询,它恰好与某个敏感数据项相匹配。
(2) 间接推理(indirect inference): 间接推理试图依据一种或多种统计值来推导出想要的结果。例如,使用某些明显的统计量来推导出隐匿的个人敏感数据。间接推理包括求和推理、计数推理、取中值推理、追踪者推理和线性系统推理等。
(3)求和推理(inference by sum): 求和推理是一种常用的间接推理。它通过求和值来进行推理,从而得到所需要的值。
(4)计数推理(inference by count): 计数推理是一种常用的间接推理。一般把计数推理与求和推理结合起来以揭示更多的信息。例如,己知计数值与求和值,很容易就能推出平均值; 反之,如果已知计数值与平均值,也可以推出求和值。
(5)取中值推理(inference by median):取中值推理是一种间接推理。它的推理过程较为复杂,要寻找那种按顺序排列并恰巧在中间有交叉点的两个查询结果项,才能推导出想要的结果。
(6)追踪者推理(tracker inference): 追踪者推理是一种间接推理。追踪者通过非敏感查询追踪到敏感数据。它关注利用少量条目而能够曝露大比例数据的地方,即通过能够产生少量结果的附加查询,来定位出所期望的敏感数据。例如,对两次不同的查询附加一些条件,得到n个值和n-1个值,而这两组值中可以互相抵消n-1个值,只剩下所期望的那个值。
(7)线性系统推理(linear system inference):线性系统推理是一种间接推理。它利用线性代数知识,加上数据库内容方面的巧合,有可能找出一系列查询,它们返回的结果与线性代数集合有关。例如,查询结果构成关于所期望数据项的一组线性方程组,解这个线性方程组就可以得到所期望数据项的值。