时间:2022-12-19 02:30:01 | 来源:信息时代
时间:2022-12-19 02:30:01 来源:信息时代
多媒体数据库标准 : 规范多媒体数据管理与应用的技术标准。
在信息处理领域,通常把传播信息的载体称为媒体(media),如数字、文本、空间、图像、音频和视频等都是媒体。20世纪90年代,ISO/IEC制订SQL99标准,提出对象关系模型,将关系数据库处理的传统数字、字符串的简单数据类型称为常规数据,并定义“多媒体是除了常规数据之外任意的数据类型,例如图像、音频和视觉数据”。从此,多媒体一词就成了除简单常规数据类型之外其他种种数据媒体的通称。接着,ISO/IEC JTC1/SC32/WG4对几种多媒体数据,如全文本、空间、图像等分别制订了与SQL进行数据交换与应用的程序包系列标准,其目的是要让多媒体数据能在SQL数据库中存储和操纵。该项系列标准的编号为ISO/IEC 13249。
多媒体既是各种数据媒体的通称,自然就包括着反映各种不同媒体的数据类,这是一些具有复杂结构的数据对象,属于非结构或半结构化的数据。一般常规数据类型结构简单,是结构数据,它实际可看作是非结构化数据的特例。
多媒体数据除了结构的复杂性之外,还普遍存在着数据量大,且一般具有时空特性,处理要求复杂等特点。就以多媒体中最简单的文本数据为例,通常的一篇文章、一份公文、一件档案或一本图书,它们一般可能还包含着章、节、段,甚至有图、表,有的还带附件。不仅结构复杂,而且数据量大,要作为一个记录存储,显然不可能直接用简单的关系二维表。特别是,这些数据一般要求存储时间很长,有的需要长期提供网上使用,并要求建立多种提供检索查询的索引路径。至于其他多媒体数据,如空间、图像、音频和视觉等数据,它们有更复杂的结构,数据实体之间的联系不仅有严格的时间序列,而且也有准确的空间布局,对这类多媒体数据的表示必须要反映出它们之间的时空关系,数据处理过程要保证实现各种信息单元之间时间上同步和空间上搭接,形成时空同步。处理的复杂性和难度,显然对数据库技术提出了许多新要求,传统的关系数据库用存储和处理常规数据的一些成熟技术就很难适应存储和处理这些多媒体的数据对象。
由于多媒体数据在结构、存储、管理和应用方面的特点,需要用处理复杂对象的数据模型。所以,20世纪80年代开始研究对象数据模型,学术界认为这是实现多媒体数据库的最佳技术途径。然而,由于在关系数据库软件产品处于市场强势地位的情况下,也由于对象数据库建模的复杂性,一个完全形式化得到公认的对象数据库模型很难在市场出现流通。到1999年,当关系数据库SQL标准提出对象关系的模型之后,由国际标准化组织ISO/IEC JTC1/SC32 WG4负责制定了多媒体的ISO/IEC13249系列标准,即基于SQL的多媒体与应用包(SQL Multimedia and Application Packages,通称为SQL/MM)。其中有: 框架(framework)、全文本(full-text)、空间(spatial)和静态图像(still image)。
ISO/IEC 13249标准支持多媒体数据管理与应用的重要设施是由SQL标准提供的“用户定义类型”,它是由〈用户定义类型名〉标识的一个模式对象的设施,是定义多媒体数据对象类的一种特定的数据类型。SQL标准也提供了定义与用户定义类型联系的例程——函数、方法和过程,构成其支持应用的程序包。同时,SQL标准也提供两个支持大数据对象串的数据类型——字符串(character large object,CLO)类型和二进制串(binary large object,BLO)类型。这两个数据类型统称为大对象串类型,大对象串类型的值称为大对象串。它们是在SQL数据库中支持多媒体数据实现数据存储与操纵的数据类型。
全文本数据是多媒体中结构比较简单的类。它在SQL/MM所采用的用户定义类型命名为Full-Text类型。该类型在SQL/MM支持环境的文本处理是通用的,它提供对文本和对文本搜索的搜索模式的构建,并提供测试文本是否有所指定模式的内容,并转变文本成字符串。Full-Text类型还提供系列的结构化搜索模式类型,该类型提供结构化搜索模式的构建,并有一系列的子类型,以及与其联系的例程——函数和方法。它们共同支持文本数据在SQL环境的管理与应用。
空间数据依托几何模型,在SQL/MM采用的用户定义类型命名为ST-Geometry类型。ST-Geometry类型是表示层次的几何空间类型的最高父类型。其子类有点、曲线、表面、几何集合的空间类型,当然还有子类型的子类型。另外,还有表示位置、拓扑关系的其他设施,如空间参照系统类型、拓扑几何、拓扑网络等等。空间数据均按照它们所定义的用户定义类型都分别定义属于它的例程,提供相关的函数、方法和过程,实现其在SQL环境的操纵管理与应用。
随着对空间数据应用需求的增长,除了SQL/MM的空间数据标准之外,ISO/TC 211地理信息技术委员会也在制订许多有关空间数据管理与应用的标准。这也将会促进空间数据管理与应用技术在今后能更快的发展。
静态图像是由取样的二维数组组成的有效图像,在SQL/MM静态图像采用的用户定义类型命名为SI-Sillimage类型。静态图像有黑白和彩色之分,都由一个个像素组成。黑白图像用一个数值即可表示其一个像素,而彩色图像需要用红、绿、蓝三个分量数值来表示其一个像素。图像数据即是以某种编码方式表示各像素的数值的数据集合,能从中获取每个图像的信息,如格式、维数(按照像素计算的高度和宽度)、颜色空间等。顺序地抽取每一个像素的数据信息,就可以用一个离散的阵列来代表一幅连续的图像。图像格式的详细说明就是在原图像自身取样与成分的内部表示。
图像数据的管理与应用涉及面非常广泛,包括医学、建筑、天文、地理等许多领域。就连日常生活最常见的摄影,也离不开图像数据的处理和应用。图像数据在生活、经济、军事等各个领域的广泛应用,使图像数据管理的标准化也受到各方面的关注。目前,除了SQL/MM的图像数据管理标准之外,ISO/IEC JTC1 SC29 WG11也在研究制订定的多媒体内容描述接口标准(简称MPEG-7标准,标准号为ISO/IEC 15938),它为图像等多媒体数据的搜索定义数据描述方法和元数据。
音视频数据管理是当今人们对音频与视频数据组合媒体的惯称。音视频数据是除了文本、图像、空间等多媒体数据之外,数据量大、处理复杂、空间特性很强的多媒体数据,其时序性,特别是音视频之间存在的同步关系,具有非常强的时序特性。音视频数据即是以某种编码方式表示音视频这种时序、空间特性的数据集合。
音视频数据管理标准是多媒体音频和视频的数据库标准。由于音视频数据属性的复杂性,这也使得它成为多媒体数据管理中最为复杂的一类。因此,截至目前为止还没有真正的音视频数据管理方面的标准。但是,关于音视频数据的标准化工作仍是进展迅速。ISO/IEC JTC1 SC29 WG11制定的基于对象的音视频编码标准(MPEG-4)和基于内容检索的音视频多媒体内容描述接口标准(MPEG-7)都是和音视频数据管理与应用相关的最为重要的国际标准。MPEG-4标准的应用已逐渐成熟,MPEG-7的应用已在起步,这为未来多媒体音视频数据管理与应用标准的制订提供了可靠的技术基础。
目前,随着网络信息技术的广泛应用,多媒体数据迅猛增长,据估计多媒体数据将会占到全社会数据管理空间总量的80%以上。目前多媒体数据管理与应用的标准从数量到质量,还都远远不能满足应用发展的要求。所以,研究和制定多媒体数据管理与应用标准已受到各方面的关注,多个渠道的标准化工作也都在积极地进行。