BioRxiv | 结合共进化和结构临近信息构建新的氨基酸相似性矩阵

2023-05-10 14:56:27

大家好,本周给大家分享的是发表在预印本BioRxiv上的一篇文章,题目是SeqStruct : A New Amino Acid Similarity Matrix Based on Sequence Correlations and Structural Contacts Yields Sequence-Structure Congruence ,通讯作者是IOWA州立大学的教授Jernigan RL.,该课题组的研究方向主要为生物大分子结构的计算和模拟,以及分子结构的数据挖掘。
蛋白质的序列匹配广泛应用于比较建模、蛋白质功能预测等领域,而氨基酸替换矩阵则是其所使用的一项基本工具。氨基酸相似性矩阵是基于多重序列比对(MSA)中单独一列中氨基酸类型变化的统计,之前提出的氨基酸相似性矩阵基本都是针对于单个位置,因此无法解释多个氨基酸替换之间的相互依赖。本文作者从蛋白质序列的残基之间共进化的角度出发,进一步提出使用结构上临近、有较强的相互作用的残基对的信息来构建氨基酸相似性矩阵。
具体操作上,他们首先2005个Pfam的domain提取出序列上共进化的残基对,对每一个Pfam domain,他们选出一个代表性的结构,在结构中进一步筛选出空间上距离近的残基对,统计其MSA中氨基酸替换的信息,得到一个能够反映不那么直观的氨基酸替换关系的替换矩阵,他们将其称作SeqStruct矩阵(Sequence Correlated, Structurally Contacting substitutions)。之后他们将SeqStruct与Blosum矩阵结合来评估其效果。他们认为这种新的矩阵对提高序列匹配的准确性会有很大的帮助。


引用:

doi:dx.doi.org/10.1101/268904

原文链接:

https://www.biorxiv.org/content/early/2018/03/02/268904

友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟