各大数据库分类集锦——蛋白质功能研究数据库(上)

2023-05-10 14:56:27

蛋白质功能研究数据库(上)


1

InterPro数据库

        InterPro是一种蛋白质家族的联合资源,结构域和位点的综合的资源数据库。是蛋白序列分析与分类系统,识别全部蛋白质的结构域和序列,另外InterPro还存储了蛋白结构域序列的特征模型。InterPro将来自多个不同数据库的资源信息合并到一个可搜索的资源中,减少冗余并帮助用户解读其序列分析结果。通过与其他数据库联盟,InterPro生成了强大的诊断工具和集成资源。其中联盟的数据库包括: CATH-Gene3D , CDD, MobiDB, HAMAP, PANTHER, Pfam, PIRSF, PROSITE , PRINTS, ProDom, PROSITE, SFLD, SMART, PIRSF, SUPERFAMILY和TIGRFAMs。

http://www.ebi.ac.uk/interpro/


2

Uniprot数据库

       提供蛋白质序列和功能信息的数据库。收集了最全面的公开可利用的蛋白质数据源。包括蛋白质名称、氨基酸序列、描述以及蛋白质功能,酶的具体信息等内容。同时提供其他数据库,包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。是欧洲生物信息学研究所(European Bioinformatics Institute,EBI)瑞士生物信息学研究所(Swiss Institute of Bioinformatics,SIB)蛋白质信息资源(Protein Information Resource,PIR)三个研究机构将SWISS-PORT、TrEMBL和PIR资源数据库整合构建Uniprot数据库。

       数据库主要由UniProtKB、UniRef和UniParc s等组成。其中,UniProtKB又包括Swiss-Prot和TrEMBL两部分,在最新版本的Uniprot数据库中,Swiss-Prot包括了 555,426条序列,TrEMBL包括了89,396,316条序列。UniProtKB数据库中的大多数序列都已经注释,可信度很高。UniRef数据库包括UniRef100,UniRef90和UniRef50,表示相似度为100%、90%和50%的序列总和。UniParc数据库给予序列特异性,非同一物种的相同序列被认为是同一个蛋白质,每条序列均给予一个特异的编号。


http://www.uniprot.org/


3

STRING数据库

       STRING是已知和预测的蛋白质 - 蛋白质相互作用的数据库。互作包括直接(物理)和间接(功能)关联,它们来源于计算预测,以及来自其他(主要)数据库聚合的交互。是一个在线的蛋白网络预测分析网站,用来浏览和分析这些相关性的一个预计算的全局资源,能够检索某个特定蛋白质相互作用的其他蛋白的信息,目前STRING数据库涵盖了2031生物体的9643763个蛋白质。


https://string-db.org/


       本期数据库介绍到此为止,敬请期待蛋白质功能研究数据库(下)!


转自“上海生物芯片”


伯豪专业服务

成就科学发现

长按扫码关注我们

友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟