测序前沿技术 | 单分子光学图谱技术详细介绍

2023-05-10 14:56:27

真核基因组由于存在着各种重复序列(如着丝粒、端粒等)和较长的gap,现有测序技术的缺陷变得日益突出。二代测序技术虽可以廉价的获得大量的测序数据,但由于其读长限制导致无法简单而直观地看到整个基因组范围的结构变化;PacBio三代测序技术因其长读长的技术优势,极大地弥补二代由于读长短所引起的问题,如重复序列的组装,结构变异的识别等。然而无论NGS还是PacBio,都面临着重复区域所带来的问题 ,只是阻碍他们的重复区域或gap区域相对的长短不同 ,影响的程度轻重而已。而且我们将零碎的片段信息 ,虽拼接出了完整的基因组模样,但由于现阶段测序技术无法彻底摆脱单纯利用测序数据进行拼接组装的局限,往往会出现“美好的理想”。因此,需要一项辅助技术解救众生于水火之中,而这便是这期的主角:单分子光学图谱技术(optical mapping)


推荐阅读

Decoding Life | DNA测序技术的前世今生


基因组单分子光学图谱是来源于单个DNA分子有序的全基因组限制性内切酶酶切位点图谱。能提供宏观的框架支持,反应整个基因组的结构信息,可以辅助保证拼接组装结果的准确性和真实性,接近真实的“蒙娜丽莎”。目前,单分子光学图谱技术主要应用于辅助基因组组装(hybrid scaffolding)和大尺度结构变异检测(large structure variation)。

单分子光学图谱技术的技术提供商主要有两家,OpGenBioNano。OpGen公司于2010年推出Argus系统,通过限制性内切酶对固定于MapCardDNA surface 区域中的单分子DNA进行原位切割,使切割后的DNA片段顺序保持不变。DNA片段经荧光染料染色后置于荧光显微镜下,采集每个限制性内切酶片段的大小和顺序的信息,基于Overlap拼接得到全基因组限制性内切酶酶切位点图谱。BioNano公司推出的Irys/Saphyr系统利用内切酶对DNA进行识别酶切并标记荧光,再利用极细的毛细管电泳来把DNA分子拉直,将每个DNA单分子线性化展开,进行超长单分子高分辨率荧光成像,即生成了一幅酶切位点分布图。比较遗憾的是,OpGen基本上退出市场,目前能见到的单分子物理光学图谱技术只有BioNano。

BioNano的单分子物理光学图谱技术利用单链切刻酶在gDNA上的特异位点“割”开磷酸二酯键(DNA分子并没有断),在具有链置换特性的DNA聚合酶的作用下引入带有荧光的碱基,再用连接酶将缺口填补;同时将整条DNA染色。

图片来源:genomap-tech

对长链DNA分子进行高并行及高分辨率的单分子成像,其结果为几百Kb甚至Mb的极长读长的片段信息,其中包含了极具价值的结构信息,也就是酶切位点。在测序深度足够时,可获得基因组初步的草图。

图片来源:genomap-tech

光学图谱的优势在于无序列倾向性和超长读长,完全可以跨越重复单元和可变区,如利用光学图谱技术可准确的确定人类MHC在基因组中的全长和Gaps大小。对于全基因组De novo 测序组装,及大片段基因结构变异分析研究有着极大的技术优势。


光学图谱一个重要应用就是辅助基因组组装。众所周知,二代测序的短reads组装的一个缺点就是结果太碎,导致组装结果可能与实际情况产生偏差,而通过Irys/Saphyr系统可以将原scaffold锚定到光学图谱上,从而构建出更长的super-scaffold,让组装结果更接近实际情况。


光学图谱可更好的保持低覆盖NGS数据的序列顺序。实验显示光学图谱结合50x NGS拼接的基因组甚至比单独的80x NGS效果好。利用光学图谱数据修正NGS后得到更加可靠的拼接结果。光学图谱越来越多的与三代测序结合,被认为是目前de novo基因组的最佳组合,包括暨南大学发表的中国人参考基因组[1]和首尔大学发表的韩国人基因组[2],都是应用到这两个技术的结合。


越来越多的证据表明,人全基因组de novo组装变得越来越重要,而重测序比对丢失了太多有价值的信息[3]。科学家尝试利用光学图谱和10XG Chromium技术结合,通过比较低廉的价格获得高质量的个人de novo基因组[4] 。使得个人基因组时代变得可行。


光学图谱另一个重要应用就是结构变异分析。一般认为未来高质量基因组分析结构变异是必需的,而不是仅限于分析SNP。基因组结构变异(sturcture variation, SV)通常是指基因组内大于1 kb的DNA片段缺失、插入、重复、倒位、易位以及DNA拷贝数目变化(CNVs)。也有学者将结构变异定义为50bp以上的变异,而将1kb以上的结构变异定义为大尺度结构变异(Large SV)。


SV对人类遗传多样性和疾病易感性起着重要的作用。如佩梅病与PLP1基因重复,CMT病中SV致病机制的多样性,EPAS1基因侧翼缺失与藏族高原适应等。利用Irys系统发现在单个人类基因组中拥有600种以上大于1kb的结构变异,而且大部分的SV影响了蛋白质编码[5]。此外,通过光学图谱技术全面呈现了家系(NA12878/891/892)结构变异遗传图谱。发现大量未报道的结构变异,并认为光学图谱技术在结构变异中具有明显优势[6]。当然,如果需要全面的获得所有的变异信息,还是需要多种方法如光学图谱、Hi-C、测序(三代/二代)相互结合[7]。


结构变异作为复杂疾病的Biomarker越来越受到关注。首先对于遗传疾病,目前大约只有26%的遗传疾病是已知基因位点的[8]。而绝大部分的遗传疾病并未明确位点,或许它们不是由SNP决定的,它们可能是由结构变异引起的。为此,UCLA等专门研究未诊断的罕见遗传疾病,通过光学图谱等技术研究这些罕见疾病是否是基因组结构变异导致的。其成果之一发现:结构变异可以作为杜氏肌营养不良(Duchenne Muscular Dystrophy,DMD)的Biomarker。其中一个结构变异是一个长达5.1Mb的倒位,这是第一次在人群队列中应用光学图谱技术诊断疾病。这也印证了光学图谱在疾病Biomarker发现的价值。


此外,在前列腺癌的研究中,通过光学图谱技术发现之前尚未报道的结构变异导致的基因融合等[9]。作者通过对一例具有明显家族遗传性但已知Biomarker阴性(SPOP、 FOXA1、 IDH1)的前列腺癌患者进行光学图谱分析,找到了85个大尺度结构变异,其中37个影响了肿瘤基因。其中发现在DUSP1和C2orf78之间发生了14.3 Kb的缺失,导致基因融合出现。这可能是一个新的前列腺癌的诊断和治疗靶标。


光学图谱技术,在个人基因组组装以及大尺度结构变异筛查方面具有天然的优势,为原始数据的精确性以及行业差异化发展提供帮助,推动精准医学的进步和研究应用。


参考文献:

[1] Shi L, Guo Y, Dong C, Huddleston J, Yang H, Han X, et al. Long-read sequencing and de novo assembly of a Chinese genome. Nat Commun 2016;7:12065.
[2] Seo J-S, Rhie A, Kim J, Lee S, Sohn M-H, Kim C-U, et al. De novo assembly and phasing of a Korean human genome. Nature 2016;538:243-7.
[3] Li Y, Zheng H, Luo R, Wu H, Zhu H, Li R, et al. Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly. Nat Biotechnol 2011;29:723-30.
[4] Mohr DW, Naguib A, Weisenfeld N, Kumar V, Shah P, Church DM, et al. Improved <em>de novo</em> Genome Assembly: Linked-Read Sequencing Combined with Optical Mapping Produce a High Quality Mammalian Genome at Relatively Low Cost. bioRxiv 2017.
[5] Cao H, Hastie AR, Cao D, Lam ET, Sun Y, Huang H, et al. Rapid detection of structural variation in a human genome using nanochannel-based genome mapping technology. GigaScience 2014;3:34.
[6] Mak AC, Lai YY, Lam ET, Kwok TP, Leung AK, Poon A, et al. Genome-Wide Structural Variation Detection by Genome Mapping on Nanochannel Arrays. Genetics 2016;202:351-62.
[7] Dixon J, Xu J, Dileep V, Zhan Y, Song F, Le VT, et al. An Integrative Framework For Detecting Structural Variations In Cancer Genomes. bioRxiv 2017.
[8] Lee H, Deignan JL, Dorrani N, Strom SP, Kantarci S, Quintero-Rivera F, et al. Clinical Exome Sequencing for Genetic Identification of Rare Mendelian Disorders. JAMA 2014;312:1880-7.
[9] Jaratlerdsiri W, Chan EKF, Petersen DC, Yang C, Croucher PI, Bornman MSR, et al. Next generation mapping reveals novel large genomic rearrangements in prostate cancer. Oncotarget 2017;8:23588-602.

长按识别二维码加微信

入官方微信群,备注:

姓名-单位/学校-研究方向

·END·

科研小助手 关注的都说好

轻松科研|趣读文献|前沿资讯|逗逼科普

微信号:SciRes


友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟