18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 数字图书馆技术(数据库)

数字图书馆技术(数据库)

时间:2022-11-22 16:30:01 | 来源:信息时代

时间:2022-11-22 16:30:01 来源:信息时代

    数字图书馆技术 : 对数字图书馆应用的技术,包括内容创建与获取技术、存储和管理技术、互操作技术及数字产权管理技术等。
数字图书馆已经形成一个新的学科,其成员来自不同学科,是学科综合化的典型代表。因此,数字图书馆建设所使用的技术也是多学科的。数字图书馆使用的技术主要有以下几个方面:
(1) 内容的创建和获取: 是资源的数字化工作。数字化技术是指把原始的声音、文字、图像等信息,用间断的电磁脉冲(用0和1代表)来获取、存储、处理和传递。目前创建与获取数字化资源的方式主要有以下几种:①录入: 即采用计算机进行文字录入,这种方式是新文本产生的主要形式。②扫描: 它是能够快速地将大量印刷型资源进行数字化的技术。具体做法是采用光学扫描仪与数字相机等,将现有的纸质文献经模数转换成位图,以便计算机处理。③数字化文件压缩存储: 数字图书馆数据规模是海量的,数字媒介的主要存储方式有光碟、文件服务器和磁盘阵列等。数字图书馆中占比重大的是多媒体数据,需要对多媒体数据压缩保存,借助于数据库技术进行管理,以提高信息的可用性。④光学字符识别(OCR):使用计算机软件将扫描的图像文献转换成字符文本的方法。转换成文本的最大好处是能够全文检索。
(2)存储和管理:是数字图书馆的核心技术。存储方式决定了应用方式,存储方案决定整个系统的扩展性和灵活性。数字图书馆技术的信息管理包括自动索引、建档、特征抽取和翻译功能。利用先进的组织和筛选工具进行归类,让用户能够以他们的本国语言进行特定信息的查询。数字图书馆将关系数据库技术、对象技术和多媒体等多种技术的功能集合在一起,使用关系数据库来管理表格,进行数据的索引和查询; 通过对象服务器运用集成的分级存储管理方法,连接磁盘、磁带、光碟等外存储器。
元数据是建设全球数字图书馆的基础性关键问题,是对数字图书馆中的数字化资源进行管理首先要解决的内容。元数据的主要研究问题有: 元数据和资源相联系的模型; 服务中介元数据; 元数据的生成和管理; 与信息体系结构标准的集成; 构建注册系统; 人和机器都可以理解的表达模式; 核心元数据集(dublin core是现在研究比较多的有关资源描述的核心元数据集); 互操作性和复杂性; 复杂数字资源(如声频、视频资源、动态变化的对象)元数据;评测和衡量各种元数据标准和提案的可应用性、成本、效益; 相关政策规范制定等。
(3)查询和访问:数字图书馆的目标是提供分布式存储信息的知识化组织和智能化访问。数字图书馆的访问工具主要包括文本和图像分析工具以及数字化音频和视频信息的查询工具。用户在使用自由文本查询工具进行查询时,查询结果是一个按序列值排列的文件列表,相关概率最大的文件排在最前面。数字图书馆查询方案还利用自然语言处理技术和按语言语义统计对文档排序技术,提供基于概念的正文检索系统。图像内容查询是图像信息查询的全新研究领域,用户可按照图像的颜色、灰度、纹理和位置进行查询。查询要求将以图形方式表达,如从颜色表中选取颜色,或从例图中选择图像的纹理等。
在数字图书馆中,高效的分布式检索形成全新信息应用类型、信息类型、用户交互方式和商业模式。分布式查询的研究主要集中在以下几个方面:①提高搜索引擎的高效性; ②提高多种格式文献的分布式索引(以harvest系统为代表); ③探索对分布式资源进行有效查询的新协议和技术,如Stanford大学的元搜索;④元搜索(meta-searching)协议:如斯坦福大学数字图书馆项目提出的联邦搜索协议(STARTS),基于内容的路由技术(GIOSS),Cornell大学的全球数字图书馆Dienst。
(4)交互式用户界面:是数字图书馆的重要组成部分,是系统展现在用户面前的窗口。数字图书馆的用户界面,要让用户使用时得心应手,能够友好、直观、方便,并具有个性化、智能化的特性,充分利用图形、语音,将其融为一体,设计出比较好的界面。
(5)互操作:研究不同的数字图书馆资源和服务的集成。互操作是构建大型数字图书馆的基础性问题,互操作研究的主要问题有: 建立一个全球统一的数据视图,用以表达集成的数据和所提供的服务结构和语义; 协调和控制,精化资源描述语言,应付动态的变化: 一致性问题,即如何为不同的自治服务提供事务执行的保证; 查询处理,不同信息资源的查询规范化、查询评价和查询路由,相关性反馈; 实现机制,如CORBA、DCOM等。
OAI(open archive initiative)的开放文档元数据采集协议(open archive metadata harvesting protocol,OAIMH)是数字图书馆在元数据互操作领域的重要协议。OAI是一个旨在促进网络信息资源开发、发布与共享的合作组织。1999年10月由图书馆和信息资源委员会(CLIR)、数字图书馆联盟(DLF)等组织发起,在新墨西哥州的Santa Fe召开的会议上第一次提出了OAI的设想。OAIMH的目标是通过元数据采集模式实现在Web上发布信息的不同组织之间的互操作,为其提供一个与应用无关的元数据互操作框架。
(6)多语言信息访问:是数字图书馆中一个突出问题。其研究可以分为三类: 用户需求、技术和资源。构建必需的体系结构,以研究用户与多语言信息交互的方式,研究如何帮助用户克服语言障碍。多语言信息访问不是一个简单的由“信息检索+机器翻译+资源”构成的通道。技术研究领域包括: 多语言索引工具、用户查询处理、文档聚类、检索结果的自动总结、可视化工具、多语言的多媒体访问等。开发系列的优秀多语言资源对于实现实用系统至关重要。
(7)与知识产权和经济有关的问题:是拥有高质量内容的数字图书馆大范围应用的最大障碍,合理的经济模型是在分布的、自治的数字图书馆中获取、传播资源和激励高质量资源生产的基础。知识产权和经济问题是数字图书馆研究中相当复杂的问题。知识产权和经济的问题可分为三个方面: ①法律和社会政策方面,制订网络环境下适用于电子资源的知识产权和经济管理法规和机制; ②数字图书馆的体系结构设计方面,制订支持相关知识产权和经济的政策框架; ③内容和服务方面,为内容和服务的提供者提供知识产权保障、场景的信息融合。
数字图书馆的数字产权管理(digital rights management,DRM),包含对各种有形和无形资源产权使用的描述、标识、交易、保护、监测和跟踪。具有知识产权管理的数字图书馆是一种数字化的产权管理系统(digital asset management system ,DAMS),拥有高质量的资源,为教育及其他领域提供高质量的服务。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭