时间:2022-11-23 14:30:01 | 来源:信息时代
时间:2022-11-23 14:30:01 来源:信息时代
数字媒体内容管理技术 : 实现数字媒体内容管理信息系统时使用的数字媒体内容管理技术。数字媒体内容管理信息系统是集成各种数字媒体内容管理技术的管理平台。数字媒体内容管理技术主要包括可扩展标记语言(extensible markup language,XML)、音视频元数据标准、海量媒体内容数据存储技术、媒体内容检索、智能挖掘技术、媒体内容分发技术、视频数据库技术和媒体内容安全服务技术等。
1. 可扩展标记语言和音视频元数据标准
可扩展标记语言和音视频元数据标准是Internet上数据表示和数据交换的新标准。它具有若干优势:良好的可扩展性,语言简单有效,可自行定义标记;内容与形式的分离,主要表示数据内容,不考虑显示效果; 有严格的语法要求,便于解析和合成,也便于和数据库之间的数据转换; 便于传输,为纯文本形式,可通过http协议直接传输,可跨越防火墙等。这些优势使得XML的出现和发展对于Internet和Intranet产生了巨大的影响。由W3C推出的XML和资源描述框架RDF分别规范了internet上资源描述的语法和语义,为元数据的编码、交换和重用提供了基础架构。
为了支持用户从海量的数字媒体内容资源库中快速、准确找到所需的内容,后台的管理系统必须事先对数字媒体提取元数据,进行编目标引,并建立索引。元数据是关于数据的数据,是以计算机系统能够使用与处理的格式存在的、与内容相关的数据,它是对内容的一种描述方式。在内容管理中,通常是元数据越复杂,内容提升价值的潜力就越大。元数据模型需要一个面向客户内容管理的通用数据模型,以适应客户不断变化的需求,达到提升信息价值的目的。
元数据手工编写工作量大。基于文本的元数据自动提取技术已日趋成熟,但基于动态音视频的相关技术却面临较大的技术障碍。自动提取首先需要实现数据分离,抓取关键帧,采用元数据提取算法对帧序列的镜头、场景、标识、字幕、物体等进行探测。在提炼关键帧的基础上,与语音识别技术相配合,采用视频OCR技术,提取地理、时间、主题、摘要等信息,并产生文本描述。最后,依据元数据标准结构,自动生成元数据库记录(索引项)或XML描述。
网上数字内容资源比较常用的元数据标准有MARC21(中国为CNMARC,1991年《中国机读目录通信格式》—CNMARC正式出版,1996年确立为中华人民共和国文化行业标准WH/T0503—96),Dublin core(DC)、Lom、MPEG-7、VRA核心类目、REACH著录元素集等。DC因其通俗易懂,便于使用,得到国际社会的认可,有望成为国际标准。
2.海量媒体内容数据存储技术
海量媒体内容数据存储技术是数字媒体内容管理信息系统将处理海量的音视频数据,存储系统在整个系统中占据重要位置。
随着数字图书馆、电子商务、多媒体传输等数字媒体内容应用的不断发展,数据存储从GB、TB到PB量级急速增长。存储产品已不再是附属于服务器的辅助设备,而成为互联网中最主要的设备投入。海量存储已成为继计算机浪潮和互联网浪潮之后的第三次浪潮,磁盘阵列与网络存储成为先锋。
磁盘阵列技术(redundant array of inexpensive/independent disks,RAID)在当今的海量信息存储领域中扮演着重要角色,是一种提供增强冗余、容量和存储性能的存储方法,有着较强的可管理性、可靠性和可用性。
网络存储是通过网络存储设备,包括了专用数据交换设备、磁盘阵列或磁带库等存储介质以及专用的存储软件,利用原有网络或构建一个存储专用网络,为信息系统的用户提供统一的信息存取和共享服务。网络存储具有数据大容量存储、数据有限制共享、数据挖掘和信息充分利用、数据可靠性、数据备份与安全性、数据管理的简单化和统一化等特点。并具有很强的可扩展性,可提供海量数据的快速信息传输。
三种主要网络存储技术:
(1) 服务器为中心的传统的直接存储技术(direct attached storage,DAS):将通用服务器的一部分作为存储设备,该服务器同时提供数据的输入/输出及应用程序的运行。数据访问与操作系统、文件系统和服务程序是紧密相关的。目前,这种以服务器为中心的存储方式己不能适应越来越高的信息存储需求。但是,DAS产品的优势在于价格便宜,在那些数据容量不是很大和对数据安全性要求不是很高的部门还有一定的应用市场。
(2)数据为中心的网络存储技术(network attached storage,NAS): 是一种特殊的利用专门的软、硬件构造的专用数据存储服务器,又有“瘦服务器”之称。它将分布的、独立的数据整合为大型集中化管理的数据中心。它将存储设备与服务器分离,单独作为一个文件服务器存在,去掉了通用服务器原有不适用的大多数计算功能,仅保留提供文件系统功能。可用于混合的UNIX/Windows NT局域网,不用购置价格昂贵的多功能服务器。相比较而言,它更适用于一个需要公共文件系统的服务器群,如电子邮件服务器组、Web服务器集群等。
(3) 网络为中心的网络存储技术(storage area network,SAN):是一种将磁盘或磁带与相关服务器连接起来的高速专用网。采用可伸缩的网络拓扑结构,可以使用光纤通道连接,也可以使用IP协议将多台服务器和存储设备连接在一起。将数据存储管理集中在相对独立的存储区域网内,并可提供SAN内部任意节点之间的多路可选择数据交换。SAN独立于LAN之外,通过网关设备与LAN连接,是一个专门的网络。SAN有三个构成要素: 网络互联结构、管理软件和存储系统。
3.媒体内容检索和智能挖掘技术
媒体内容检索和智能挖掘技术可帮助使用者快速定位所需内容。由于信息来源、存储格式、访问和检索方式的不同,出现了异构资源整合检索的问题,用户需要统一对这些内容进行访问和检索。面对海量的内容数据和并发检索压力,要保证检索性能,需要将分布群集检索、高速缓存和负载均衡这些技术结合起来。
基于内容的视频检索,是根据视频的语义特征,提取与特征相符或相似的视频数据或镜头。常用的视频检索方法,是通过特定的查询语言,或通过可视示例方式来进行的。用户查找一个对象时,可以用查询语言或示例形成查询条件。系统把查询条件中描述的特征转化为特征矢量,或对示例进行特征提取。将查询描述的特征与特征库中的特征,按照一定的匹配算法进行相似度计算,并返回一组满足一定相似度要求的候选结果。对系统返回的查询结果,用户可以通过浏览来挑选。或从候选结果中选择一个示例,经过特征调整后,形成一个新的查询条件。这样,不断重复操作,直到用户对查询的结果满意为止。
内容检索的关键技术发展方向是内容智能挖掘技术。分类、摘要、标引、聚类、相关分析等自然语言处理技术,已经开始被应用于媒体内容智能挖掘技术。
4.媒体内容分发技术
媒体内容在网络上大范围传输,必将对主干网络造成拥堵压力,采用合理的内容分发策略可使流媒体文件在网上大规模应用成为可能。一般通过采用中心-边缘CDN分发技术,来实现网络数字媒体内容的自动分发。
(1) CDN(content delivery (distribution) network)的任务: CDN即内容分发网络或内容发布网络。通过在现有的Internet中增加一层新的网络架构,将网站的内容发布到最接近用户的网络“边缘”,使用户可以就近取得所需的内容,提高用户访问网站的响应速度。
网络内容发布和传输服务改变了向用户发送信息的方式。实现智能化通信量转发和网络内容发送,能够识别和理解被请求的特定网络内容,可以确保网络内容的可用性。
网络内容发布和传输服务使Web可以更快地将需要发送的网络内容发送给目标用户。在传统的IP网络中,客户端的请求仅仅被直接按照网络地址发送到数据源服务器。而网络内容发布和传输服务提供了一个服务“层”,可以主动将经常被访问的网络内容“推”到与发出请求的用户距离最近的服务器,并将每个客户端发出的请求,转发到当时对于被请求的网络内容所处最佳的地点或最佳服务器,从而补充和扩展了Internet。
(2) CDN的分发管理: 分发平台一般对内容分发采用灵活智能的分发管理策略,包括即时、定时、增量、根据访问量设置分发门限、自动更新、定向分发等方式,支持客户自定义策略。除此以外,分发平台一般支持对内容的分发优先级、更新频率、新鲜度设定等管理功能,所有按照新鲜度设定的分发内容均可在生存期结束后自动清除,回收有效的存储与缓存空间。
分发平台一般支持分发容错处理,防止分发失败和数据错误导致不能正常进行分发。如果分发平台发现内容在分发过程中出现数据传输错误,那么系统将终止异常分发,并重新尝试错误数据的再传输。
5. 视频数据库技术
视频数据模型是视频数据直接面对应用的表述。视频数据可以用帧、镜头和场景来描述。帧是一幅静态的图像,是组成视频数据的最小单位。镜头是由连续记录的一个或一系列帧组成,它是视频数据的基本结构单元。镜头常用于表示时间和空间连续的一个动作。场景是由时间和空间相关的一组镜头构成,描述的是一个完整的事件。
为了视频检索的需要,可将视频数据分割成单个镜头。镜头的描述数据,包括标识符、区间、属性及其相应值集合。每个镜头都有唯一的标识符,每一区间可以由起始帧和结束帧来表示,代表一个连续的视频帧序列。每个镜头均对应于一个视频帧序列,其内容通过一组属性及其相应值来表示。镜头可定义为: 标识符区间属性/值或特征值集合。
视频数据库系统是用于管理视频数据并为用户提供面向内容查询的视频软件系统。通常,基于内容检索的视频数据库由两个子系统组成,即数据库生成子系统和数据库查询子系统。
数据库生成子系统包括原始视频流、视频分割、代表帧和特征提取等模块。所生成的数据库由视频库和特征库组成。视频库主要存放视频数据,而特征库包含用户输入的特征和自动提取的内容特征。数据库查询子系统包括查询语言或示例、提取特征、计算相似度等模块。
基于内容的视频检索,对视频的处理工作包括视频分割、代表帧及其特征的提取等。视频分割是视频处理中重要的一步。视频分割是将视频数据分割成镜头的过程,其核心是识别镜头的切换。镜头切换是一个镜头到另一个镜头的转换,需要确定镜头的边界,并标出各个镜头的起始帧号和结束帧号。镜头切换方式,可突变或渐变。突变是一个镜头瞬间直接转换到另一个镜头,可使画面情节和动作发生直接跳跃,给人一种轻快、利索的感觉。渐变是指一个镜头到另一个镜头的逐渐过渡过程,没有明显的跳跃,视觉上比较平滑和舒适。渐变包括淡入(fade in)、淡出(fade out)、隐现(dissolve)和旋转(spin)等。
将视频数据分割成镜头后,对每个镜头可提取代表帧来简洁地表达镜头。代表帧是用于描述一个镜头的关键图像,它反映镜头的主要内容。代表帧的选取方法很多,其中计算相对简单的有直方图平均值方法。它是将镜头中所有帧的统计直方图取平均,并选择与该平均直方图最接近的那一帧作为代表帧。对代表帧的特征提取与一般静态图像的特征提取相似,包括颜色、纹理、轮廓和对象等。此外,镜头还有动态特征。动态特征是视频检索时用户所能给出的查询条件,如镜头的运动变化(摇、推、拉、跟踪等)、运动对象的大小变化以及运动轨迹等。
视频浏览是视频数据库的重要组成功能之一。用户对所要查找的目标不十分明确时,需要对视频数据进行快速地浏览,以便寻找感兴趣的内容。视频浏览要解决的技术问题之一是如何跳过一些次要内容,以较少的图像尽可能多地表达出视频数据的主要内容。视频浏览可采用分层结构和集束分类等方法,并提供方便直观的视频浏览界面。
6.数字版权管理技术
数字媒体内容服务一般不能一次性完成,它涉及到内容在网络中的多次拷贝、缓存,这样就存在着很大的安全隐患。内容提供者需要始终控制所发布的内容,例如VOD网站必须控制流媒体内容不被非法缓存和拷贝,很多企业的内容发送也提出了越来越多的安全需求。数字版权管理是数字媒体内容管理信息系统中非常重要的一个方面。实现在线或离线媒体内容的数字版权保护,是开展数字媒体管理、制作、销售、欣赏的重要技术支撑,该技术被称为数字版权管理技术(digital right management,DRM)。DRM数字版权管理技术能够有效地对在线和离线多媒体内容进行数字版权加密,认证和管理,确保知识产权的合法使用。数字版权管理采用的保护方法主要有两类,一类是数字水印技术,另一类是以数据加密和防拷贝为核心的DRM技术。
数字水印(digital watermark)技术是在数字内容中嵌入隐蔽的标记,这种标记通常是不可见的,只有通过专用的检测工具才能提取。数字水印可以用于图片、音乐和电影等数字内容的版权保护,在基本不损害原作品质量的情况下,把著作权相关的信息,隐藏在图片、音乐或电影的数字内容中,而产生的变化通过人的视觉或听觉是发现不了的。但是,目前市场上的数字水印产品在应用方面还不成熟,容易被破坏或破解。而且数字水印方法,只能在发现盗版后用于取证或追踪,不能在事前防止盗版。
以数据加密和防拷贝为核心的DRM技术,是把数字内容进行加密,必须用解密密钥进行解密后才能还原内容。只有授权用户才能得到解密的密钥,而且密钥是与用户的硬件信息绑定的。加密技术加上硬件绑定技术,防止了非法拷贝,从而这种技术能有效地达到版权保护的目的。当前国内外大部分计算机公司和研究机构所提供的DRM系统就是采用这种方法。针对各个应用领域,有不同的DRM系统。目前在流媒体领域,数字版权管理主要以微软提供的技术方案居多。在图片、文档保护方面,微软、Adobe等公司都提出了一系列方案来对著作产品进行签名和授权。在国内,也有一些软件公司专门从事该方面的研究。如:
(1) 电子图书的DRM系统:电子图书eBook的DRM技术相对比较成熟,国内外的应用也较多。国外的产品,有 Microsoft DAS 、Adobe Content Server(原Glassbook Content Server)等。国内有方正Apabi数字版权保护系统。
(2)流媒体的DRM: 主要有IBM的EMMS、微软的Windows Media DRM及Real Media DRM等。
(3) 电子文档的DRM:有SealedMedia 的Enterprise License Server、Authentica的Active Rights Management以及方正的Apabi Office DRM、方正的Apabi CEB DRM等。
(4)其他DRM系统:有Intertrust的DigiBox和Rights System,IBM的Cryptolope,瑞士Geneva大学的Hep,Edgar Weippl的RBAC等,这些系统注重DRM基本原理的研究,并不针对具体的某一类数字内容的DRM应用。