时间:2022-12-02 18:30:02 | 来源:信息时代
时间:2022-12-02 18:30:02 来源:信息时代
XML索引 : 一组支持高效XML数据查询的技术。目前存在多种XML索引技术,可从不同角度来进行分类。
按照索引的对象分类,XML索引技术主要分为:值索引,即在属性值或者结点内容上建立索引;结点名索引,即在结点标记上建立索引;边索引,即在XML数据树的边上建立索引。
按照索引的组织形式分类,XML索引技术主要分为:B+树及变种索引,即利用平衡的、扁平的B+树对XML数据值或者结构信息进行索引; 哈希索引,即利用哈希函数对XML数据值进行索引;倒排表索引,即利用关键字或者XML数据值定位XML文档和XML元素位置。
按照索引数据的粒度分类,XML索引技术分为整树索引和结点索引。整树索引是以XML数据树为单位建立索引,其具体形式可以表示为树状结构和顺序结构。树状结构一般以XML数据树结构中结点的路径信息为基础,采取某种约简方式,使得约简后的树结构只维护不同的路径信息,而不会存在两个结点具有相同的路径。XML查询首先对约简树进行操作,由此避免整棵树的扫描。顺序结构一般以某种次序扫描整个XML数据树,将产生的扫描结点序列看作是索引。XML查询以同样的规则转换成序列,XML查询的执行等价于查询序列和XML数据序列的匹配。结点索引以XML结点为单位索引,根据结点编码的不同分为区域编码索引和路径前缀编码索引。XML查询利用索引,获取相关元素的区域编码或者是路径前缀编码,利用区域编码或路径前缀编码本身的性质判定XML结点的结构关系,实现XML的查询。