#软件工具#String:PPI蛋白互作数据库,蛋白质互作研究宝贵的资源

2023-05-10 14:56:27

STRING是蛋白质相互作用数据库,是SearchTool for the Retrieval of Interacting Genes/Proteins的缩写,该数据库中收录了已知的和预测的蛋白质/基因之间的直接物理结合和间接的功能相关的相互作用关系。




String整合收录的数据主要来自于四大资源:基因组上的关联(Genomic Context)、高通量实验数据(High-throughput Experiments)、共表达数据(Coexpression)和之前文献只是的累积挖掘(Previous Knowledge)。目前为止,该数据库中所收录的数据涵盖了1133个物种,5214234个蛋白/基因之间的相互作用数据,为学者们在相互作用的研究方向上提供了宝贵的资源。


这里我们将以一组基因为例,详细展示如何利用该数据库得到基因集合中的相互作用关联关系。


详细操作步骤:


1.  基因集合的输入:

String既可以用作对单一蛋白质/基因相互作用对象的预测,也能够对输入的基因集合之间的相互作用关系。数据库的搜索提供两种类型的输入格式:基因名称(Gene Symbol)和序列(FASTA)。如果是对单个基因的相互作用对象进行预测,点击“search by name/protein sequence”,需要搜索目标基因集合中的基因进行集合内基因间的互作关系,则点击“multiple names/sequences”;再在下拉物种中选择您基因集合所属的物种,点击“GO”就能开始进入搜索阶段。



 2.  输入基因的再一次核准

String数据库会根据您的输入基因集合,在自身数据库中进行基因的对应,对应完毕后会出现让您确定需要找的基因的名称,以确保之后得到的关联作用的确是您需要的基因间的。确认完后点击“Continue”




3.  得到可视化结果

String会为您提供一个可视化的网络连接结果,即输入的基因集合中存在的相互关联作用均会在图中展示出来。图形背后的基因之间的连接关系的文本文件也是可以获取得到的,点击如图的“Save—>Other formats”进入连接文件获取的地方。




4.  文件的保存:

String为您提供了多种格式的可下载文件:如高dpi的网络图、TXT格式的基因关联文件、输入基因的序列信息等,我们点开TXT格式的网络连接文件进行进一步说明。



5.  文档格式的基因互作关联文件结果:

点击“tabdelimited.zF_MoeCQBRsr.txt”我们就能够得到网络图中每对基因之间的关联作用关系文件,此文件中提供有搜索string数据库得到的多方面的得分:如在共表达方向、文本挖掘方向等的分别的得分,最后以各方向的得分汇总后得到最终的相互作用关联得分“combined_score”(最后一列),该数据反映出了第一、二列基因节点的相互关联作用的综合得分,我们可以根据不同的关联得分的阈值,对相互作用的基因对进行连接得分阈值筛选(如筛选关联得分高于0.6的相互作用对等)。



 

6.  利用cytosacpe等软件本地编辑PPI网络,展示漂亮的PPI互作



结语:String数据库收录的数据根据其资源来源的数据库的更新保持时时的更新,使用户能够得到最新的搜索资源,对研究基因、基因集合之间的相互作用关系的学者来说,该数据库提供了相当大的便捷和使用价值。

没有临床数据做生存率分析,结果可以作为论文的一部分

生信小白如何用云生信分析芯片数据发表接近10分文章

轻戳即可了解

长按二维码关注云生信

欢迎加入云生信QQ群:424014618跟大家一起学习生信知识,关注生信发展,分享生信经验~

回复“生信基础”即可获得收集的237M的生物信息学基础学习资料

回复“R相关”即可获得收集的163M的生物信息学技术学习资料

回复“编程即可获得整理的生物信息学编程学习资料(最新更新)


谢谢您阅读云生信。个性化的生物信息学分析服务,助您发表高分文章!如果您有合作需求,点击阅读原文了解更多

友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟