Nature Methods发表最大规模人类蛋白质互作数据库,可帮助解读基因组数据

2023-05-10 14:56:27


麻省总医院(MGH)和Broad研究所的人员领导的一个国际团队开发了最大规模的蛋白质-蛋白质互作网络数据库,称为InWeb_InBioMap(InWeb_IM),这个资源可以阐明多种疾病相关基因是如何引起疾病发生和发展的。相关文章目前已经在《Nature Methods》杂志上在线发表。

文章共同通讯作者、该项目的负责人、MGH外科和Broad研究所斯坦利精神病研究中心的Kasper Lage博士表示,“现代遗传技术让我们可以对癌症或精神疾病患者的基因组进行测序,但是要理解致病基因变异是如何影响细胞系统的仍然非常困难。拥有更完整的人类蛋白质物理互作图谱,能帮助我们以一种更高的分辨率,研究受疾病影响的细胞过程。”

InWeb_IM蛋白数据库可用于基因组数据的分析


虽然绘制大型蛋白质-蛋白质互作网络图谱的重要性已经被广泛认可,但之前只鉴定出了不到30,000个直接互作,仅占最保守估计互作总数的四分之一。

Lage的团队和来自丹麦和英国的研究人员合作,开发了一个计算框架,整合来自43,000多篇已发表文章的数据,包括来自8个已有蛋白质-蛋白质互作数据库的数据。他们在创建InWeb_IM时采用了严格的质控标准,截止2015年2月文章提交时,InWeb_IM中已经含有约586,000个互作,目前包含的互作数量已经超过625,500。

文章共同作者Taibo Li解释道,“人体内蛋白质都是成群发挥作用的,它们通过在蛋白质网络中物理互作完成功能。可将蛋白质互作网络与人类社交网络如Facebook进行类比:Facebook平台基于网络中人与他人的互动模式,推测出相互认识的人或者拥有共同爱好的人;构建蛋白质互作网络同样可以推测出基因群和分子通路,进而提升我们对人类细胞中生物过程的理解。”

Lage补充道,“基因组测序费用的下降速度,远远超过了我们解读在未确诊疾病患者中检测到的基因变异的能力。通过分析可能引起疾病的基因和蛋白质互作网络,临床医生可以找到难以辨别的遗传数据模式,我们在文章中针对癌症和自闭症进行了说明。例如,约30个基因与心肌病相关,但是很多心肌病患者却没有这些基因的突变。通过观察这30个心肌病基因在蛋白质水平上的互作模式,我们可以依据‘心肌病网络’鉴定新的候选基因,这些基因可能是引起疾病的新的分子机制。我们希望InWeb_IM可以作为一种资源,帮助解读临床外显子组测序数据,并在未知疾病患者的诊断中发挥作用。”

该团队正在继续开发使用InWeb_IM解释大规模基因组数据集的方法;通过整合蛋白质组、转录组和基因组数据,以组织特异性的方式加强对复杂生物系统的理解。另外他们还与几个MGH的研究小组合作,利用这些信息去了解心血管疾病、出生缺陷、癌症、生殖疾病和精神疾病。InWeb_IM将按季度进行维护和更新,学术用户可通过http://www.lagelab.org/resources/ 或 http://www.intomics.com/inbiomap 访问InWeb_IM。

参考文献:Taibo Li et al, Ascored human protein–protein interaction network to catalyze genomic interpretation, Nature Methods (2016). DOI: 10.1038/nmeth.4083 

- END -


点击下方二维码,关注 测序中国回复以下关键词获取更多内容

回复【精准医疗】:聆听各方专家观点!

回复十年 查看业内专业人士与NGS的十年故事!

回复周报目录查看往期周报信息,掌握每周测序热点消息!




测序中国 seq.cn
基因科技|精准医疗


友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟