18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > FASTA序列比对和搜索(数据库)

FASTA序列比对和搜索(数据库)

时间:2022-12-19 18:30:01 | 来源:信息时代

时间:2022-12-19 18:30:01 来源:信息时代

    FASTA序列比对和搜索 : 一种序列比较的启发式算法,用于序列数据库搜索。它既可以处理蛋白质序列,也可以处理DNA序列。它由David Lipman等人在1985年提出,是在蛋白质同源比较方法基础上发展起来的。
FASTA是第一个被生物学研究人员广泛使用的序列分析工具包,其中包含若干个独立的程序。FASTA比对算法中允许比对过程中插入空格或缺口,与生物进化过程中序列的插入突变或缺失突变相对应。FASTA使用的是Wilbur-Lipman算法的改进算法,进行整体联配,重点查找那些可能达到匹配显著的联配。
FASTA格式的序列以单行描述起始,为与下行的序列数据相区别,第一列的符号为“〉”。每行的字符以少于80个字符为宜。序列用标准的IUB/IUPAC氨基酸或核苷酸代码表示,均用大写字母,连字符或破折号表示序列缺口长度。核酸查询序列或氨基酸查询序列中的数字应以合适代码代替。
对于一个查询序列,序列搜索往往会返回许多数据库序列,并且每个数据库序列都有一个与查询序列比对的得分,分值越高,则两个序列越相似。FASTA返回与查询序列非常相似的数据库序列,并附加序列的比对及其他相关信息。
一般情况下,FASTA的查询序列和数据库是一致的。但是FASTA家族中的一些程序可以进行特殊的数据库搜索,如利用核酸序列搜索蛋白质数据库,或者反之。
FASTA3软件包中包含了六个程序:
(1) FASTA:是将查询的蛋白质序列与数据库中的蛋白质序列进行比较,或将查询的DNA序列与数据库中的DNA序列进行比较。
(2) FASTX/FASTY: 是将查询的DNA序列与数据库中的蛋白质序列进行比较。FASTX是相对简单的一个算法,在序列比对过程中,只允许在密码子之间有移码; 而FASTY允许在密码子内部形成移码,序列比对的结果好,但是运行速度慢。
(3) TFASTA:是将查询的蛋白质序列与数据库中的DNA序列进行比较。
(4) TFASTX/TFASTY:是将查询的蛋白质序列与数据库中的DNA序列进行比较。对于数据库中的DNA序列,同时考虑正向、反向所有可能的阅读框,并允许有移码。
(5) FASTS/TFASTS: 是将一系列短的多肽片段(如来自蛋白质的质谱分析结果)与数据库中的蛋白质序列(FASTS)或DNA序列(TFASTS)进行比较。
(6) FASTF/TFASTF: 是将一个有序的多肽混合物与数据库中的蛋白质序列(FASTF)或者DNA序列(FASTF)进行比较。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭