福建水产设备联盟

最新医学分析套路来袭

生信人 2019-05-14 14:10:09

在结肠癌中,AURKA与Wnt和Ras-MAPK信号通路间相互作用关系

Aurora kinase A (AURKA) interaction with Wnt and Ras- MAPK signalling pathways in colorectal cancer

生信套路千千万,最近小编又发现了一个好套路,和大家一起分享下~

其背景部分大体的说辞也无非就是结肠癌对于人类健康危害大、发病率高,哪些情况会引发结直肠癌的发生发展,同时,他用“Wnt和Ras-MAPK信号传导的过度活化是结肠直肠腺瘤发展中的常见事件”,“从腺瘤到癌症的进一步进展通常与20号染色体长臂拷贝数增加(20q gain)和极光激酶A(AURKA)的过度表达相关”引出他文章所研究的主要内容。

下面我们就来看看这具体是个怎样的套路~

方法:

1.使用了两种不同的细胞系,SW480和Caco2,均来自20q拷贝数增加的和突变的TP53的结肠癌样本。通过细胞培养以及用siRNA转染获得对照组。

2.RNA分离。RNA分离、纯化、测定浓度、纯度、电泳评估质量,并取RIN> 9.0被认为是高质量的RNA。

前方高能!有生物信息套路来袭~

3.芯片表达分析。对每个siRNA实验(AURKA和非靶向)获得的数据(数据已提交至GEO,GSE108320)使用R-Bioconductor软件包Limma31和SVA-combat32进行预处理和差异表达分析(DEA)。显著表达基因的阈值设定为FDR < 0.05且logFC值 > 1.5 或 < -1.5。并对筛选出的基因进行GO分析(http:// cbl gorilla.cs.technion.ac.il/)

根据上述的方式我们就可以找出显著表达的基因以及显著富集的生物学过程。可视化的方式依旧是展示显著差异的火山图,展示两个细胞系显著表达基因交集个数的韦恩图,以及GO分析的柱状图。


4.探针映射。使用BioMart(www.ensembl.org/biomart/martview/)映射将探针ID映射到它们各自的Ensembl ID和HGNC ID。使用Agilent (http://www.chem.agilent.com/cag/bsp/gene_lists.asp)完成其他探针ID到HGNC ID与Ensembl ID的映射。

5.构建蛋白质互作网络。从STRING数据库中获得蛋白质 - 蛋白质相互作用(PPI)网络。使用BioMart映射将蛋白质映射到Ensembl ID(自我交互和重复的被删除)。基于AURKA敲低的DEA数据与STRING PPI数据中交集的Ensembl ID为每个细胞系SW480和Caco2分别构建一个节点文件和一个边缘文件。边缘文件由两列组成,Ensembl ids代表两个相互作用的蛋白质。节点文件由三列组成:节点(Ensembl id),p值和log2倍数变化。

6.识别最显著失调的基因模块。应用Heinz算法,利用构建的边缘和节点文件对网络中的每个节点都被赋予一个反映其差异表达分析的p值的权重,确定每个细胞系SW480和Caco2中最显着失控的基因模块。Heinz算法计算STRING PPI网络的最大得分子网络,其代表最显着失调的基因模块。

将显著失调的基因模块用Cytoscape进行可视化既可。想要下面这样美美的图那就努力钻研的修图吧!

7.获得Wnt和Ras-MAPK信号通路基因。从KEGG数据库下载了'Wnt信号通路','MAPK信号通路'和'Ras信号通路'的基因列表。

8.最短路径分析。为了找到AURKA和感兴趣的信号通路之间的可能联系,进行最短路径分析。首先,将STRING PPI网络简化为只包含由DEA确定的显着失控基因和位于Heinz分析中位于最显着失调基因模块中的基因的子网络。然后,我们应用Python软件包NetworkX计算AURKA和Wnt和Ras-MAPK信号基因之间的所有最短路径。

这样我们就可以AURKA与信号通路相关基因的最短路径子网。

9.TCGA CRC数据分析。为比较AURKA对CRC组织数据与我们的CRC细胞系Wnt和Ras-MAPK信号传导的影响,分析了的TCGA中COADREAD RNA-seq和体细胞拷贝数畸变数据。首先,基于编码AurkA基因的基因组区域中的拷贝数变异数据,用Aurka-gain和Aurka-no-gain对样品进行标记。段的平均值大于或等于0.4的样本被标记为AURKA-增益,而段的平均值小于0.4的样本被标记为AURKA-no-gain。其次,在AURKA-no-gain和AURKA-gain样本之间进行差异表达分析,p值小于10-5时确定为显著表达的基因。然后获取了位于20号染色体长臂的基因,并且从BioMart获取位于上的基因的Ensembl ID;将这些Ensembl ID映射到TCGA样本中的Ensembl ID;确定TCGA DEA与SW480和Caco2的DEA之间显着失调基因的重叠,并将logFC值进行展示。

当然,结论里结果的可视化固然重要,但也要包含你发现的各种显著表达基因与信号通路的联系,可能的作用等相关的文字解说呦~


定制化你的数据分析

仅10席

欢迎扫码