时间:2022-12-18 20:30:01 | 来源:信息时代
时间:2022-12-18 20:30:01 来源:信息时代
多媒体存储 : 在应用环境的基础上通过采取合理、安全、有效的方式将多媒体数据保存到某些介质上并保证能对其进行有效的访问。
由于多媒体数据类型多,每种类型数据的存储和它的表示形式、文件格式以及展现的需求密切相关,并且还要存储数据展现的时空特性,包括: 展现形式、分布特性、动态交互和表现约束的描述;展现的调度; 展现控制的动态管理机制; 连续媒体的存储与管理; 连续媒体存储的容错技术。多媒体的存储比结构化数据的存储要复杂得多,并且由于数据量太大往往要进行压缩处理。
1. 多媒体数据表示
根据多媒体数据类型(文本数据、图形数据、图像数据)的不同有如下表示形式:
(1)音频: 包括语音、音乐和其他声音。除合成的音频外,其他音频是音频信号经过采样、量化等处理得来的,即音频的频率和幅度都用离散的数字表示。
(2)视频: 即运动图像,又称为电视或影像,是数字图像在时域上的序列。视频中的每幅图像称为帧。帧以一定的速率(每秒显示的帧数,fps)连续地播放,使观察者感觉它在动态连续运动。
(3)动画: 和视频类似,也是由连续播放的帧组成,区别在于,它的每一帧都是人工设计的。
(4)触觉: 它的表示比较复杂,难于直接数字化,通常是通过纹理、温度等物体表面特征的采样、量化来反映。真正让人有触感,需要有知识系统和相关的外部设备。
2. 多媒体文件格式
多媒体数据一般体积很大,每个数据可以存成一个文件(常用图形、图像文件格式见图像数据库)。
(1)音频文件格式:①WAV波形文件: WAV是最常见的数字音频文件格式之一,是微软公司专门为Windows开发的数字音频文件,记录的是音频信号在每个时刻的大小值,由文件标识信息、格式块、波形数据块三部分组成。②MP3:MP3格式始于20世纪80年代中期,由德国Erlangen的Fraunhofer研究所制定,是MPEG音频的一个典型应用。MP3音频压缩包含编码和解码两个部分。压缩后的MP3数据由多个帧组成,帧是MP3文件的最小单位。每个帧又由帧头、附加信息和声音数据组成。每个帧播放时间是0.026s,其长度随位率的不同而不等,有些MP3文件末尾有些额外字节存放非声音数据的说明信息。
(2)视频文件格式:①AVI(audio video interleaved)音频—视频交错文件: 目前较为流行的Windows的视频格式。它采用了Intel公司的Indeo视频有损压缩技术将视频信息与音频信息混合交错地存储在同一文件中,较好地解决了音频与视频的同步问题。AVI采用RIFF(resource interchange file format)格式,文件的结构为: 一个RIFF头,两个列表(描述媒体流格式、保存媒体流数据)和一个可选的索引块。②MPEG: MPEG是国际标准,包括视频、音频和系统(视、音频同步)三个部分。MPEG采用有损压缩方法减少运动图像中的冗余信息,同时保证每秒30帧的图像动态刷新率:采集并保存第一帧信息,然后只存储其余帧相对第一帧发生变化的部分,从而达到压缩的目的,它采用运动补偿技术(预测编码和插补码)实现时间上的压缩,变换域(离散余弦变换DCT)实现空间上的压缩。MPEG的平均压缩比为50:1,最高可达200:1,压缩效率高,图像和音响的质量好,并且在微机上有统一的标准格式,兼容性好。
(3)流媒体文件格式: 流媒体格式将多种媒体数据按规则组合,以“流”的形式边传输、边播放,免除用户等待下载的时间,特别适于网上应用。常见的流媒体有:①Windows Media: 核心ASF是一种数据格式,音频、视频、图像以及控制命令脚本等多媒体信息以流式网络数据包的形式传输。ASF文件头能够存储有关播放部件的信息,帮助客户端实现播放部件的自动下载; 大小可伸缩;支持多语言,如果ASF文件包含同一内容的不同语言版本,客户机在播放的过程中可以选择最合适的版本。ASF文件逻辑上是由三个高层对象组成: 头对象、数据对象和可任选的索引对象。ASF数据的基本组织单元叫做ASF对象,由对象标识符、对象尺寸和一个可变长的对象数据组成。②QuickTime:数字媒体领域的工业标准,它定义了存储数字媒体内容的标准方法,不仅可以存储单个的媒体内容,而且能保存对该媒体作品的完整描述。因为它能用来描述几乎所有的媒体结构,所以是各种平台的应用程序间交换数据的理想格式。QuickTime文件格式中媒体描述是元数据,包含轨道数目、视频压缩格式、时间信息以及媒体数据存储区域的索引。媒体数据是所有的采样数据,如视频帧和音频采样,媒体数据可以与元数据存储在同一个文件中,也可以存在一个单独的文件或者在几个文件中。