蛋白组和转录组联合分析如何搞事情?

2023-05-10 14:56:27


蛋白质是生命功能的执行者,其含量的变化在生物体的生长、环境应激、疾病发生发展等过程中发挥着重要的作用。且从DNA、mRNA到蛋白质的过程中涉及到一整套精细的表达调控机制,如转录调控、转录后调控、翻译调控、翻译后调控等。因此,要全面探究生物体疾病机理、环境应激、生长发育机制等,精细描绘关键基因的表达模式,同步检测mRNA和蛋白质的表达量并进行联合分析已成为当前研究的必然趋势。通过蛋白组和转录组的联合分析,我们可以

·实现mRNA和蛋白质的互补和整合,对生物体特定状态下的应激机理进行全方位分析。

· 通过分析同一基因转录水平和翻译水平的变化,挖掘关键基因表达调控机制,全面阐释生物基因表达调控机制。

·针对蛋白数据库不全的物种,利用转录组数据看构建的蛋白质库,可提高蛋白鉴定数目与质量。

 下面我们来看看两篇文章

 

牛奶是我们平时日常生活营养来源的必需品。饲料的质量对奶的品质影响十分重要。本研究利用RNA-seq和iTRAQ蛋白质组学测序技术对玉米秸秆(CS,低质量)和苜蓿(HA,高质量)喂养的奶牛的乳腺组织进行研究,一共发现1631个差异基因(1046上调,585下调)和346差异蛋白(138上调,208下调)。通过分析作者发现CS喂养与HA喂养的奶牛的乳腺相比在能量代谢,蛋白质合成,细胞生长上基因表达水平较低,参与蛋白质降解的基因表达水平较高。

文章的实验流程如下

 

通过对差异蛋白质和差异基因进行对比分析,我们可以发现18个共同上调,15个共同下调。

接下来作者将DEP和DEG放在同一个图中进行GO功能分析比对。

整篇文章的分析都是比较中规中矩的,后面还做了几个基因和蛋白的验证。

下面我们来看看一篇发表在nature communication上的文章,利用蛋白组和转录组联合分析揭示乳腺癌异种移植的治疗靶点。

人源性肿瘤组织异种移植(patient-derived xenografts,PDX)是指将患者的新鲜肿瘤组织处理后移植到免疫缺陷鼠上,依靠小鼠提供的微环境进行生长。PDX模型保持了源病人肿瘤的组织病理学特征和肿瘤遗传学特征,为肿瘤的生物学研究、诊断标志物的寻找和药物筛选提供了一个重要的体内模型。

作者选取24例乳腺癌PDX模型,(分别来自原发性或转移性乳腺癌肿瘤,其中10例basal,1例CLDN-low,9例luminal B及4例HER2阳性)进行蛋白质组学iTRAQ分析,利用lable-free定量(LFQ)对18个PDX模型进行验证和确定。23个PDX模型进行DNA和RNA测序,并对一个样本进行Sanger测序分析热点突变。

实验流程



蛋白组和转录组整合分析。RNA-seq数据确定了16209个基因的表达,iTRAQ则确定了并筛选了10069种蛋白和36609个磷酸化位点用于后续分析。iTRAQ和 LFQ数据在标准化后显示合理的相关性,表明这两种检测手段利用相同的PDX模型能够交叉验证蛋白组结果。mRNA表达和蛋白质丰度之间的相关性分析结果显示,83.6%的基因表现出显著正相关。随后检测mRNA-蛋白相关性是否与特定的KEGG信号通路有关,结果表明,一些管家基因在两个组学中都表现出非常强的正相关性,其中谷胱甘肽代谢通路显著性最高。

进一步检测乳腺癌关键基因CNV、mRNA和蛋白质表达水平的相关性:EGFR,ERBB2(HER2),ESR1,GATA3,PGR,PIK3CA,AKT1 / 2/3,MTOR和TP53,在大多数样本中,CNV、mRNA和蛋白质的表达水平是一致的,并且关键基因的整体表达模式和临床亚型诊断也是一致的。

 

人乳腺肿瘤和异种移植的蛋白质分型。为了探究蛋白质组亚型和磷酸化蛋白质组亚型,对iTRAQ结果的前436种不同表达的蛋白质进行聚类分析,发现了两个不同的集群,一类包含所有basal和唯一的CLDN-low乳腺肿瘤(WHIM12),另一类包含所有luminal B和HER2-E乳腺肿瘤。

同时利用iTRAQ磷酸肽表达数据推断蛋白磷酸化亚型,也产生了两个主要的集群,将luminal B和basal亚型分隔开。

对TCGA人肿瘤的77个蛋白质组数据进行蛋白质分型的验证,分析结果和24个PDXs聚类的亚型类似。为了寻找luminalB和basal亚型的定义标记,作者对各个亚型的PDXs进行差异表达分析,最终发现了一些在LFQ和iTRAQ中均差异表达的蛋白标记物,包括SPR、GSTP1和SERPINB5。

磷酸化图谱揭示肿瘤特异性激活的信号通路。利用KEGG信号通路中基因的蛋白质磷酸化图谱,寻找PDXs中肿瘤特异性激活的信号通路,结果显示,磷酸化富集分析确定了12个显著激活的信号通路,包括Ras、MAPK和NFκB通路。一些已知的信号通路(如PI3K/AKT/MTOR)在大多数乳腺癌中被激活,但由于特异的基因组或蛋白组的改变,其他互补的肿瘤发生相关通路也在一小部分乳腺癌中被激活,如RAS/MAPK,显示出可替代的治疗机会。除此之外,蛋白质磷酸化组分析揭示了不易被基因组数据预测到的的信号通路的激活。

通过对PDX和人乳腺癌患者蛋白基因组学分析确定药物靶点。原癌基因的激活突变可以作为治疗靶标,同时异常过表达或活化蛋白产物也提供了可利用的治疗机会,比如HER2。因此,作者进一步寻找过表达基因/蛋白质或者具有高度磷酸化位点的蛋白质。

利用表达值四分位距(IQR)大于1.5筛选离群值,结果显示,mRNA和蛋白表达离群值显示出中度的正相关,但mRNA异常表达不保证蛋白的高表达。

相似地,部分磷酸化离群值也没有在蛋白水平检测到。因此,基于转录后和翻译后事件确定的潜在药物治疗需要同时考虑蛋白表达和基因表达。

蛋白质异常,如基因组驱动突变,在PDXs和人肿瘤中均观察到,一些蛋白质异常可能代表肿瘤发生的“蛋白驱动”,因此也可能是乳腺癌的潜在药物靶标。

利用乳腺癌异种移植模型进行靶向治疗。利用PDX模型进行靶向HER2和PI3K信号通路的药物治疗,研究结果显示,药物反应的程度可能与下游信号靶标有关,如AKT蛋白的过度和磷酸化。并且,PI3KCA在基因水平和AKTs在蛋白水平的双重激活可能是乳腺癌的共同特征。研究结果还显示出了利用对乳腺癌蛋白基因组特征进行组合治疗的可能性。

通过以上的分析和实验,文章的贡献在于利用PDX模型可获得与临床样本相似的结果,暗示了该模型应用于肿瘤治疗和研究的潜在价值;将基因组和蛋白组进行整合分析,更精确地预测癌症变化机理,寻找癌症治疗靶标;大多数药物作用靶标是蛋白,针对蛋白质组进行治疗药物筛选及药物应答效果预测比基因组更为有效。

扫码关注


友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟