时间:2022-12-15 08:30:01 | 来源:信息时代
时间:2022-12-15 08:30:01 来源:信息时代
蛋白质结构数据库 : 描述蛋白质三维空间结构的数据库,是生物大分子结构数据库的主要组成部分。蛋白质结构数据库是随着X射线晶体衍射分子结构测定技术的出现而产生的数据库,其基本内容为实验测定的蛋白质分子空间结构原子坐标。蛋白质结构分类研究的不断深入,出现了蛋白质家族、折叠模式、结构域、回环等数据库。目前主要的蛋白质结构数据库有:PDB、SCOP、CATH、MMDB等。
(1)蛋白质结构数据库PDB(protein data bank,http://www.rcsb.org/pdb):由美国Brookhaven国家实验室于1971年创建,从1998年开始改由生物信息学结构研究联合实验室(research collaboratory for structural bioinformatics,RCSB)管理。PDB是目前最主要的生物大分子(蛋白质、核酸和糖)三维结构数据库,数据主要通过X射线单晶衍射、核磁共振NMR、电子衍射等实验手段获得,也有一部分数据根据理论模型获得。至2006年7月,PDB数据库中已经存放了37000多个结构,其中91%为蛋白质。PDB的每一个结构除了包含原子三维坐标外,还包括物种来源、化合物名称、结构递交者以及有关文献等基本注释信息。此外,还包括分辨率、结构因子、温度系数、二级结构信息等和结构有关的数据。PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库,包括SCOP、CATH、Medline、ENZYME等。PDBsum数据库是一个与PDB数据库密切相关的基于Web的数据库,它提供了对PDB数据库中所有大分子结构关键信息的总结与分析,给出了与PDB库中条目相关的简要信息,并提供一维、二维和三维结构显示。
(2) 蛋白质结构分类(structural classification of proteins,SCOP): 是蛋白质结构研究的一个重要方向(http://scop.mrc-lmb.cam.ac.uk/scop),是英国医学研究委员会分子生物学实验室和蛋白质工程中心开发的基于Web的蛋白质结构数据库分类、检索和分析系统。SCOP数据库除了提供已知蛋白质结构和进化关系信息外,所涉及的蛋白质还包括PDB中的所有条目(如PDB的链接、序列、参考文献、结构图像等信息)。SCOP的结构分类主要是通过人工来完成,通过图形显示器观察和比较蛋白质结构,并借助软件工具进行分析,将PDB数据库中的蛋白质分成7大类型,并在此基础上,按折叠类型、超家族、家族逐级分类。SCOP1.69版本包含了945个折叠类,1539个超家族和2845个家族。
(3) CATH(class architecture topology homology)蛋白质分类数据库(http://www.biochem. ucl.ac.uk/bsm/cath_new): 由英国伦敦大学开发和维护,它通过对PDB数据库中不同记录的类型(class)、构架(architecture)、拓扑结构(topology)和同源性(Homology)四个层次的描述实现对蛋白质的分类。
(4)分子模型数据库(molecular modeling database,MMDB):是美国生物技术信息中心(NCBI)所开发的生物信息数据库集成系统Entrez的一部分,数据库的内容来自PDB,它排除理论模型,而仅收录来自于X射线单晶衍射和核磁共振(NMR)的记录(http://ncbi.nlm.nih.gov/Structure)。MMDB重新组织和验证了这些信息,确保在化学和大分子三维结构之间的交叉参考。与PDB相比,MMDB具有许多附加信息,如分子的生物学功能、分子的进化历史等,同时,还包括生物大分子之间关系的信息。此外,系统还提供生物大分子三维结构模型显示、结构分析和结构比较工具。