STRING是蛋白质相互作用数据库,是SearchTool for the Retrieval of Interacting Genes/Proteins的缩写,该数据库中收录了已知的和预测的蛋白质/基因之间的直接物理结合和间接的功能相关的相互作用关系。
String整合收录的数据主要来自于四大资源:基因组上的关联(Genomic Context)、高通量实验数据(High-throughput Experiments)、共表达数据(Coexpression)和之前文献只是的累积挖掘(Previous Knowledge)。目前为止,该数据库中所收录的数据涵盖了1133个物种,5214234个蛋白/基因之间的相互作用数据,为学者们在相互作用的研究方向上提供了宝贵的资源。
这里我们将以一组基因为例,详细展示如何利用该数据库得到基因集合中的相互作用关联关系。
详细操作步骤:
1. 基因集合的输入:
String既可以用作对单一蛋白质/基因相互作用对象的预测,也能够对输入的基因集合之间的相互作用关系。数据库的搜索提供两种类型的输入格式:基因名称(Gene Symbol)和序列(FASTA)。如果是对单个基因的相互作用对象进行预测,点击“search by name/protein sequence”,需要搜索目标基因集合中的基因进行集合内基因间的互作关系,则点击“multiple names/sequences”;再在下拉物种中选择您基因集合所属的物种,点击“GO”就能开始进入搜索阶段。
2. 输入基因的再一次核准:
String数据库会根据您的输入基因集合,在自身数据库中进行基因的对应,对应完毕后会出现让您确定需要找的基因的名称,以确保之后得到的关联作用的确是您需要的基因间的。确认完后点击“Continue”
3. 得到可视化结果:
String会为您提供一个可视化的网络连接结果,即输入的基因集合中存在的相互关联作用均会在图中展示出来。图形背后的基因之间的连接关系的文本文件也是可以获取得到的,点击如图的“Save—>Other formats”进入连接文件获取的地方。
4. 文件的保存:
String为您提供了多种格式的可下载文件:如高dpi的网络图、TXT格式的基因关联文件、输入基因的序列信息等,我们点开TXT格式的网络连接文件进行进一步说明。
5. 文档格式的基因互作关联文件结果:
点击“tabdelimited.zF_MoeCQBRsr.txt”我们就能够得到网络图中每对基因之间的关联作用关系文件,此文件中提供有搜索string数据库得到的多方面的得分:如在共表达方向、文本挖掘方向等的分别的得分,最后以各方向的得分汇总后得到最终的相互作用关联得分“combined_score”(最后一列),该数据反映出了第一、二列基因节点的相互关联作用的综合得分,我们可以根据不同的关联得分的阈值,对相互作用的基因对进行连接得分阈值筛选(如筛选关联得分高于0.6的相互作用对等)。
6. 利用cytosacpe等软件本地编辑PPI网络,展示漂亮的PPI互作
结语:String数据库收录的数据根据其资源来源的数据库的更新保持时时的更新,使用户能够得到最新的搜索资源,对研究基因、基因集合之间的相互作用关系的学者来说,该数据库提供了相当大的便捷和使用价值。
轻戳即可了解
欢迎加入云生信QQ群:424014618,跟大家一起学习生信知识,关注生信发展,分享生信经验~
回复“生信基础”即可获得收集的237M的生物信息学基础学习资料
回复“R相关”即可获得收集的163M的生物信息学技术学习资料
回复“编程”即可获得整理的生物信息学编程学习资料(最新更新)
谢谢您阅读云生信。个性化的生物信息学分析服务,助您发表高分文章!如果您有合作需求,点击阅读原文了解更多
Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟