时间:2022-12-19 00:30:01 | 来源:信息时代
时间:2022-12-19 00:30:01 来源:信息时代
Entrez生物信息数据库检索系统 : 一个综合的查询与搜索系统,1991年由美国生物技术信息中心研制。Entrez的成功之处在于数据库的耦合连接,数据库的记录与本数据库或者其他数据库中的记录相互连接,交叉索引。数据库之间的链接对于生物数据挖掘非常重要。
Entrez系统集成了NCBI各种数据库中的信息,包括核酸序列、蛋白质序列、生物大分子结构、基因组数据、生物分类数据库、孟德尔人类遗传学数据(OMIM)、电子期刊数据库及生物医学文献数据库MEDLINE。
核酸数据主要来自于GenBank、EMBL和DDBJ,也有一部分数据来自于基因组序列数据库GSDB,另一部分数据来源于ProSet数据库。ProSet是一个DNA序列的集合,其中的序列用于分析种群的进化关系; 蛋白质数据库包括根据核酸数据库中DNA编码序列翻译得到的蛋白质序列及PIR、SWISS-PORT、PRF及PDB中的蛋白质序列; 结构数据来自于生物大分子结构及建模数据库MMDB,系统提供三维结构的显示工具Cn3D,用户可以通过交互方式操纵大分子,并从不同角度观察和分析其结构空间;基因组数据提供不同生物的全基因组和染色体的视图,提供基因组的遗传图谱、物理图谱和序列图谱,目前有关于1000多种生物的基因组数据;生物医学数据库文献主要来自于国家医学图书馆MEDLINE数据库和pre-MEDLINE数据库。
Entrez提供多种搜索方式,可以将搜索目标限定在特定的数据库或数据库集合,将搜索范围约束在特定的数据项。Entrez可以允许用户按作者、唯一标识符(如登录号、序列标识)、分子量、序列长度等查询数据库,用户在查询对话框中输入搜索条件,各种搜索条件在默认的情况下是“与”操作,也可以在表述搜索条件的语句两端加上双引号,将搜索条件当成“短语”,在数据库中搜索与“短语”匹配的记录。如果搜索条件不是以短语形式输入,则Entrez将按“与”的关系在数据库中搜索同时出现各查询“单词”的记录。用户可以利用Entrez提供的限制条件(limits)、索引(index)、检索历史(history)和剪贴板(clipboard)等功能来实现复杂的检索工作。
Entrez中的数据库服务器除提供数据查询之外,还提供生物分子数据分析工具。如,ORF Finder(open reading frame finder)是一个图形化的分析工具,能够在用户给定的核酸序列或者数据库中的核酸序列中找到可能的开放阅读框,并推导出相应的氨基酸序列。