微视频系列(下)|无参物种全长转录组分析也升级了!

2023-05-10 14:56:27



字 幕 内 容 概 要


为了打造更全面更实用的分析内容,诺禾致源针对无参考基因组物种全长转录组在原有分析基础上进行分析新升级活动。本次升级的内容包括:


高级分析内容

1. PCA分析

2. 差异表达基因PPI分析

3. 差异表达LncRNA分析

4. 差异转录因子分析


个性化分析

5. Cogent基因重构

6. 无参可变剪接分析

7. 比较转录组分析


PCA分析
1


主成分分析 (Principal components analysis,PCA),也称主分量分析或主成分回归分析法,是指利用线性变换,将数据变换到一个新的坐标系统中;再利用降维的思想,使得任何数据投影的第一大方差在第一个坐标上,第二大方差在第二个坐标上。这样便可以将样品有关变量绘制成图,使得样品间的相似性和相异之处一目了然,对不同样品是否可以归为一组,有清楚直观的展示。

图1 多样本的PCA分析结果图


差异表达基因PPI分析
2


蛋白互作网络 (protein protein interaction network,PPI) 分析是研究蛋白与蛋白之间相互作用关系的方法,对差异基因进行PPI的分析,有助于从系统的角度研究差异基因蛋白对生物学问题的调控机制。针对无参考基因组物种首先将目标基因集序列利用blastx软件比对到string数据库中包含的参考物种蛋白质序列上,并利用参考物种的蛋白质互作关系构建互作网络。


图2 蛋白互作网络在Cytoscape软件中的展示结果


差异表达LncRNA分析
3


长链非编码RNA (long noncoding RNA,LncRNA):是一类转录本长度超过 200bp,不编码蛋白质的 RNA 分子。LncRNA可调控一系列生理过程,可在转录水平及转录后水平调控基因的表达。使用多重软件及数据库预测到的共有结果认为是预测到的LncRNA。


结果展示


对预测为LncRNA的基因进行差异表达分析,满足P<0.05为差异LncRNA,进而可以挖掘差异LncRNA在调控生理过程中发挥的功能与作用。图3中红色点表示上调表达的LncRNA,绿色点表示下调表达的LncRNA。


图3 LncRNA差异表达分析火山图


差异转录因子分析
4


转录因子 (transcription factor,TF) 是一群能与基因5’端上游特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。


对注释为转录因子的基因进行差异表达分析,表达量呈显著差异 (P<0.05) 的基因即为差异转录因子。据文献报道,差异转录因子可能在动植物对胁迫作用的防御和应激等反应中发挥重要作用[1]


结果展示


图4A中统计不同转录因子家族数量进行作图展示,差异转录因子的分析可以得到转录因子家族中上调和下调表达的基因,图4B中红色柱子表示上调表达转录因子个数,绿色柱子表示下调表达转录因子个数。


图4 植物转录因子的预测(左)和差异转录因子分析(右)


Cogent基因重构
5


Cogent (Coding GENome reconstruction Tool) 是在无参考基因组或者参考基因组不完善的情况下利用高质量的全长转录组序列来进行基因重构的软件。

基因重构原理


① 首先根据 k-mer 相似性将转录本聚类成不同基因家族;

② 再通过 De Bruijn graph 的方法进行基因重构 (de novo reconsuction);

③ 重建构成转录序列的原始基因组序列,形成一个或者多个 contigs,即作为不同的基因。


图5 Cogent软件的基因重构原理示意图


无参可变剪接分析
6


无参考基因组的物种由于没有准确的可参照序列,在进行可变剪接方面的研究时会存在困难。但是通过 Cogent 软件进行基因重构可以得到准确的基因参考序列,使得在无参考基因组的情况下也可以进行可变剪接分析,为研究无参物种转录组的复杂性和多样性提供了新的思路和方法。

结果展示


图6中展示的无参可变剪接分析的结果,最6B表示同一基因的两个不同的转录本,可以看出发生了一个外显子跳跃的可变剪接事件,图6A中四个图表示该基因在4个不同样本中的二代reads覆盖度情况。


图6 利用Cogent重构后的基因进行无参可变剪接的分析

注:红色和橙色为Illumina reads比对情况和覆盖度,曲线上的数字代表支持跨越不同外显子的reads个数


比较转录组
7


利用PacBio长读长测序技术,无需组装即可得到高质量的全长转录本,避免了拼接引入的错误,分析更精准,因此可以借助全长转录组信息对同一科或属内不同物种之间进化关系的比较转录组研究。


结果展示


1. 进化树构建分析及结果展示

对物种间的直系同源基因进行分类是在转录组水平上比较物种差异的基础,采用 OrthoMCL 方法对 CDS 序列进行了直系同源基因搜索分析,并筛选出一对一的直系同源基因。经过序列比对后,通过 phyml 构建系统进化树,可直观展示物种之间进化关系,为研究多物种之间的进化关系提供有效帮助。图7中展示的是棉花属内不同物种的系统进化关系。


图7 系统进化树示意图


2. 直系同源基因 Ka/Ks 分析及结果展示

通过计算一对一的直系同源基因Ka/Ks,对分析结果进行筛选,分为分化 (divergent) 直系同源基因、保守 (conserved) 直系同源基因。分化直系同源基因对于物种的进化有着非常重要的意义,将作为后续研究的重点。


图8 直系同源基因ka和ks分布图

注:绿色点代表Ka/Ks>1,蓝色点代表0.1≤Ka/Ks≤1,

红色点代表Ka/Ks<0.1


诺禾致源全长转录组分析优势总结

1. 全方位多层次覆盖转录组分析内容。

2. 准确高效的无参可变剪接分析。

3. 多维度分析样本差异 (差异转录因子,差异LncRNA),挖掘性状相关基因。



参考文献:

[1]Tao P, Ye CY, Xia X, et al. De novo sequencing and transcriptome analysis of the desert shrub, Ammopiptanthus mongolicus, during cold acclimation using Illumina/Solexa[J]. Bmc Genomics, 2013, 14(1):488.


为了让大家体验我们的分析优势,享受最前沿的无参考基因组物种分析条目,特推出以下优惠活动:

活动时间:

即日起至2018年6月30日

活动方式:

凡签订10G以上全长转录组送任意两条高级分析



有参分析新升级详情请点击:微视频系列(上)|诺禾君大课堂开讲啦!有参物种全长转录组分析新升级



三代测序业务线    张   舵丨文案

王婷婷丨编辑





为你读文献

为你分享资源

为你分析研究思路

为你提供最前沿的科研动态

学霸,逗逼,科学家,文艺青年同在!

诺禾致源丨提供领先的基因组学解决方案

长按识别二维码,关注诺禾致源


友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟