时间:2022-12-05 20:30:02 | 来源:信息时代
时间:2022-12-05 20:30:02 来源:信息时代
引文数据库 : 根据文献之间的引证关系建立起来的数据库。其基本概念有: 引文以及引文索引法。
1. 引文(citation)
引文是指一篇学术论文中所引用的参考文献,通常是以脚注或尾注的形式出现。利用文献之间的这种相互引证关系不仅可以检索到一系列内容相关的文献,还可以揭示科学文献之间(甚至是学科之间)的内在联系。引文索引法就是利用这种现象建立起来的一种信息检索方法,是对传统检索系统的一种补充和改进,它的起点可追溯到1873年,但真正的开始是美国的Eugene Garfield在20世纪50年代初进行的一系列实验,一直到1963年的《科学引文索引》才得以成型。
利用引文索引法,人们可以方便地挖掘出如下一些深层次的信息,如: ①某一观点或某一发现的发展过程; ②这些观点和发现有没有被人应用过;③这些观点和发现有没有被人修正过; ④这些观点和发现有没有被人实行过; ⑤某一学科,或技术发展的进程; ⑥著作者的著作被引用的持续时间,从而可以估计这些著作的影响。
引文法查找文献主要采用循环法。即从一篇较早的论文开始,寻找所有引用此篇论文的文章,再以这些引用论文作为新的检索起点,寻找引用这些论文的文章。这样就像滚雪球一样,可以获得越来越多的文献。
运用引文法中的以上诸多概念,既可以方便地查阅到相关文献,同时也可以据此开展各种科学研究。然而,由于文献之间的相互引用关系毕竟还是一种外在的联系,因而在查阅文献和进行研究时有时也会出现较大的误差。实际上科学引文由众多作者所引用,又分别出自不同的来源期刊或文献中,而且在很大程度上受到人为控制因素的影响,因而具有较大的随机性。造成误差的主要原因有: ①文献的被引用并不等于全都重要; ②著作者选用引文受到可获得性的影响;③引文关系上假联系的影响;④马太效应的影响,即一位作者的文献被引用次数越多,该作者可能成为名作者,从而导致其文章被更多的引用。很多情况下,造成误差的引用主要分布在文献的引言部分,在这一部分引用的可能情况大致有: ①介绍本工作的背景; ②对杰出科学家的尊重; ③对自己以前工作的回顾: ④对有交流的科学家论文的提及。
尽管引文法有许多缺点,但一系列试验表明,引文索引法是一种经济而实用的新技术,相关领域的科学家对它的反应较好,有人甚至认为引文索引对文献主题的描述比传统的主题法和关键词法更具体,其范围也广泛得多。正是在这种背景下,美国科学信息研究所(institute for scientific information,ISI)的《科学引文索引》(science citation index,SCI)于1961年创刊,开始为年刊,1965年为季刊,到1979年又变为双月刊,摘引条目已成倍增加。
SCI的收录范围涉及科学技术的各个领域(包括医学和农业)。它主要摘录科技期刊论文和专利文献,但也摘录正式出版的会议录、论文集、专著、通信、摘要、评论等。
SCI由五种索引组成,即“引文索引”,“专利引文索引”,“轮排主题索引”,“机构引文索引”和“来源索引”。其关键部分是“引文索引”和“来源索引” 。
2. 引文索引(citation index)
引文索引又称作者引证索引。这一部分按照被引文献的第一个作者姓名字顺排列,同一作者的各篇文献按照发表时间前后顺序列出。同样,引用文献的作者也按他们的姓名字顺排列。该索引的作用就是从被引作者出发去寻找引用的作者及他们的文献标题、文献来源等。
引文索引的著录格式包括: ①被引著者; ②出版年份;③刊名缩写; ④被引文献所在期刊的卷号和页码; ⑤引用文章的著者: ⑥引用文章发表的刊物缩写; ⑦刊物卷、页和出版年份。
在引文索引中,出版年份后常标有一个大写字母,这是来源文章的类型代码。其含义分别为: B—来自“Scientist”、“Science”和“Nature”三份杂志上的书评; C—勘误材料; D—讨论记录; E—编辑部文章;I—传记资料;K—编年资料;L—通信;M—综述及书目; RP—重印文章; W—计算机类文献综述(含硬件、软件和数据库)。
3. 专利引文索引(patent citation index)
专门收录被引用过的专利。有时,根据某一篇专利被人引用的次数,可以初步衡量该专利的价值。专利引文索引按专利号码排列。著录内容包括: ①专利号码; ②专利说明书发表的年份; ③专利发明人: ④专利文献的类型,如APPL(application)为专利申请说明书,REISS(reissue)为再版专利; ⑤来源文献著者; ⑥来源出版名称,卷,页码,出版年份及文献类型代码。
4.来源索引(source index)
这一部分可以查到作者及他所写文章的出处及发表年份。来源索引不分资料类型(期刊或专利)统一按作者字顺排列。不署作者(匿名)的文献按出版物名称排列在来源索引的最前面。来源索引只在第一作者下作详细著录,第二、第三、第四作者处可作为款目的标目,但这种标目下面著录内容简单,只指引读者见第一作者,并注明来源刊的缩写名、卷号、页码和年份。著录内容包括: ①第一来源著者; ②文章标题;③来源期刊卷号、期号及起止页码; ④文种代号,表示该篇文章用什么文种写成;⑤引用参考文献的数量等。
“来源索引”是其他四种索引的检索目标。又由于它按文献作者姓名字顺编排,这点相当于其他检索工具中的著者索引,因此也可作为一套综合性科技文献的作者索引使用。
5. 机构索引(corporate index)
机构索引又称机构引证索引,分成两部分: 地理部分(geographic section)和机构部分(organization section)。机构部分不提供文献和文献出处,只列出各机构的所在国家和城市名称。再查地理部分,才能找到文献及文献出处。因此,机构部分是地理部分的辅助工具。
6.轮排主题索引(permuterm subject index)
这是一种篇名关键词索引,1967年开始编写。“permuterm”是“permuted term”的缩写。“轮排主题索引”即是将篇名关键词相互组配,从某一篇名所含的全部关键词中每次取两个来做一个款目的标目,故又称“词对式关键词索引法”(paired keyword indexing)。
除了SCI之外,ISI还出版另外两种多学科引文索引数据库: 社会科学引文索引(social science citation index,SSCI)和艺术与人文科学引文索引(art &humanities citation index,A&HCI)以及六个专业学科引文索引数据库:计算机与数学引文索引(compumath citation index)、生物化学与生物物理引文索引(biochemistry & biophysics citation index)、生物技术引文索引(biotechnology citation index)、化学引文索引(chemistry citation index)、神经科学引文索引(neuroscience citation index)、材料科学引文索引(materials science citation index),这些数据库先后提供过三种不同的版本,分别是: 书本式、光碟版及Internet Web版(Web of Science)。