【领视频&沙龙第十五期回放】免编程学生信:蛋白互作--构建生物网络案例实践

2023-05-10 14:56:27

发送 生信 到本公众号(freescience联盟)后台,查看相关系列文章~

发送 沙龙 到本公众号(freescience联盟)后台,查看往期直播回放~


本周是生信专题直播周,赵老师和大家分享的是免编程学生信系列蛋白互作--构建物网络案例实践,并现场解答群友提出的相关提问(qq群463367325)。


发送 GSNX 到公众号后台,得现场课程+答疑视频 ~


最近提过问题但错过现场答疑的同志,仔细看推送中有没有自己的提问,领到录像好好学习……


要是有追问,可以组织语言在群里求助(提问前请仔细阅读这篇求助得回应秘诀,如果没有解答,周六统一直播回答。这里查看优质提问的示例~


发送到有道云笔记的优质提问将获得专场解答,将问题写在有道云笔记里,进qq群463367325,把有道云笔记链接私信发给小觅0号这里看欧阳同学整理的有道云使用心得)。


问答版与现场答疑内容仅供参考,并非标准答案,欢迎大家深入思考,提出不同的见解。回顾推文的内容排序即现场直播课程顺序,先领视频,再对照回顾推文看视频,学习效果好:)


赵老师的生信沙龙问答版

赵老师,对于GEO芯片数据标准化之后,质量控制的箱线图和密度曲线图是怎么去理解的,怎么判断数据之间差异不大?芯片号:GSE74530,用 Bioconductor里面的gcrma函数对原始数据进行了进行标准化,用boxplothist画出的图如下面。


想问一下,第七个样本是不是有问题?用的是affyPLM里面的NUSE函数

这个实验是一个配对对照设计,如果有问题怎么进行下一步处理?



这个是该样本的affyPLM信号图


赵忻艺现场录像中已回答 发送 GSNX 到公众号后台领录像)


老师,想请教您一个问题哈,之前讲的cytoscape里面的KEGG富集后那个分析结果里面的 term p value和 group p value代表什么含义啊,谢谢?



问(留言栏):可以推荐一个适合处理蛋白芯片矩阵的R包吗?

赵忻艺现场录像中已回答

 

:怎么预测已知序列的lincrna binding到某些蛋白如酶的启动子。上ucsc 行吗?

赵忻艺现场录像中已回答


 

问大家个问题,我把差异基因分成上调下调之后,分别富集通路,得到的通路是不是可以认为是激活和抑制的通路?

赵忻艺现场录像中已回答 

 

:请问有人会对一堆蛋白做GO-KEGG的富集分析吗

赵忻艺现场录像中已回答 


:请教一下大家,CHIP-seq数据可以在什么网站查到吗?有木有什么推荐网址

 赵忻艺现场录像中已回答 


:群里有没有人知道怎么做多平台芯片的批次效应消除呢,一般是用InsilicoMerging 和sva,但前一个方法由于网站维护,没办法用,后一个正在摸索,有文献中讲到了以将芯片数据定量归一化,然后利用PCA和聚类检查批次效应消除,这种方法正确么

赵忻艺现场录像中已回答  发送 GSNX 到公众号后台领录像)


课件的分割线


零成本发SCI,上期我们介绍了什么是蛋白与蛋白互作和为什么要构建蛋白与蛋白互作网络?(复习一下,点击这里,内有文献标题)这期将简单的介绍几个实用的在线工具。

1.STING: 只需通过输入一个基因名或列表就能寻找和它互作的蛋白,包含各种物种类型,涵盖多种互作类型,如共表达,同家族等。优点在于免费,公开,操作简单,数据涵盖广,但正是因为其纳入的互作关系复杂性,也降低其准确性。

2.HPRD(Human Protein Reference Database): 人类蛋白参考数据库作为人类蛋白的参考数据库,只收录人的蛋白信息,来源于文献挖掘的最大的人蛋白互作数据库,有翻译后修饰、亚细胞定位、结构域等信息。优点在于免费,公开,操作简单。缺点在于不能批量查询,只限于人类物种。

3.IPA(Ingenuity Pathway Anaylsis),是基于云计算的一体化生物通路分析软件。以准确,易用,及时,全面等优点广泛地被生命科学研究学界接受,并且目前使用IPA处理数据发表的论文高达上万篇,如在疾病发病机理、癌症等方,是目前行内最好的蛋白互作软件,但唯一的缺点收费,且非常贵。

4.Cytoscape,是一款公开、免费的用于复杂网络的可视化,分析化的平台软件。以各种功能的App插件的不断开发和完善使它成为系统生物学最好,最强大的工具,堪称神器。

5.其他蛋白互作数据。类似HPRD数据库,还有许多准确性,权威性较好的数据库,例如BIND,BIOGRID,DIP,MINT,INTACT。


接下来就以STING为例,演示些简单的操作。

一、单蛋白查询互作信息操作。


1. 点击search,选择输入蛋白或基因名称和物种类型即可。这里以TP53为例。


2. 确认基因,默认即可。


3. 互作网络。


4. 选择互作类型。例如只需要实验验证的互作关系,最高可信度(0.9),排名前50的互作关系。当然这里可以根据用户自己调整。


5. 下载互作信息和网络图。点击as a high-resolution bitmap下载 为网络图;点击as simple tabular text为互作信息,可用excel打开。


6. 蛋白网络的分析。例如平均Degree统计,GO和KEGG Pathways富集分析等。


7.  查看具体的互作文献来源。
a)点击互作图中的边,显示详细信息。

b)后点击SHOW后,选择证明互作的实验信息。


c)点击后,显示具体的摘要等文献来源。





二、列表蛋白间互作的操作。


即查询一群蛋白之间是否有互作关系,存在哪些互作关系。


1. 点击Multiple Proteins,输入蛋白或基因列表和选择物种类型即可。这里以93个基因为列表。

2. 之后操作流程与单蛋白操作类似不再详细展示。


3. 注意在互作图显示中hide disconnected node选上,能将没有互作关系的蛋白隐藏。

这样利用String的在线工具通过简单的操作就能将筛选获得的差异基因列表构建成以下“高大上”的互作网络图。



最终我们回归到本章进行还原的文章” Identification of breast cancer candidate genes using gene co-expression and protein-protein interaction information ”。在文中它是将String整个蛋白互作数据库下载到本地,这样就不怕断网和String数据库服务器维护无法使用。



那么如何实现这个功能?这就要用到我们的神器了Cytoscape了,接下来将对这一过程进行演示。



之前介绍了一个简单的String查找蛋白互作的工具,现在将用到我们的神器Cytoscape了,接下来介绍如何将String的蛋白互作数据下载到Cytoscape本地中。


1.下载Cytoscape,http://www.cytoscape.org。

下载与操作系统匹配的版本(支持Mac OS XWindows 64bitLinux),下载后安装过程与常规软件相同。




2.在Cytoscape中下载StringAPP


3.点击安装StringAPP


4.安装完毕后,回到文件>输入>网络>公共数据库

5.选择string数据库,以基因或蛋白输入

 
6.以TP53为例,选择score0.1,连接的基因最大为100个。这个根据用户需求设定。


7.并且在已构建好的网络中可以扩展新的连接蛋白数或者重设confidence score来调整网络大小。

    
这样构建的网络就下载到本地的Cytoscape中,可以随意编辑网络,查看和保存信息。


通过以上操作我们解决了蛋白互作数据库的问题。



长按以上二维码留言“生信”进生信微信交流群

安卓手机用户需先保存二维码到手机再扫描


生信大数据版主介绍:赵忻艺,将大数据应用于医学科研,主要包括临床医学数据的挖掘、收集、整理和利用(标准化和科学化的数据库),医学分子大数据的整理、利用及研究(基因、蛋白及代谢)。特别针对肿瘤个体化的基因测序和数据快速处理,寻找个体化的分子标志物、药物靶标和治疗方案。目前,已建立浙大大数据挖掘团队,旨在降低研究者学习大数据的门槛,推动大数据共享与研究协作,发表更高质量的研究成果,为科研决策提供精准的预测和实验证据。


友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟