沧海拾遗:一言不合筛分子,土豪玩家任性之选

2023-05-10 14:56:27

快速锁定靶分子,还看筛、猜二字诀!


文/子非鱼


三十六策第一章众妙之门作为总论,讲述了科研的框架性思维——五恒量+三变量,以模块化要素帮大家打牢地基。而后续的课程内容则为分论,聚焦分子变量,讲解候选靶分子(candidate)的选择以及蛋白、miRNA/lncRNA等分子类型操作的规范性步骤,并提供一份实践指南,让大家在独立做课题、发SCI有着切实的着入点。

 

分子变量之所以复杂,主要在于其数量很大且其本身也会发生各种修饰变化。那么如何在浩如烟海的分子中做出取舍,就成为了科研启航至关重要的一步。而酸菜原创心法——十二字真言:要么筛(筛选)、要么猜(预测);有钱筛、没钱猜,就是基本敲定一个候选分子的不二法宝。本策沧海拾遗则先聊一聊关于分子筛选的那些事儿。


1

 

高通量数据筛选方法虽然多,但最常见的技术平台就三个:芯片、测序和质谱。其中,芯片和测序均可从DNA/RNA水平来筛选靶分子,而质谱则可从蛋白水平和代谢组学水平来筛选靶分子。通常这三种高科技含量的实验技术是不需要自己做的,可找相应的外包公司获取服务。

 

其实,在测序技术发展起来之前,芯片是高通量检测核酸的主要技术手段。基因芯片(Genechip),也叫生物芯片,是国内比较早进入科研界的一项生物技术,而且产业化程度相对比较成熟,目前国家级生物芯片工程研究中心有两个:博奥生物芯片和Shanghai biochip(SBC)。

 

其原理就是通过玻片(指甲盖大小)上所固定成千上万条已知序列的核酸探针,与样品的DNA或者RNA去杂交,一旦两者能形成碱基互补配对,就会释放一个荧光信号,报告检测到了目的序列,可以实现一次性检出大量分子的表达数据。

 

芯片技术原理虽简单,但其技术细节却很复杂。就医生而言,只需了解怎么准备样品、怎么分好组即可,然后送给公司检测、付钱、收报告就行了。报告里会详细解释这些分组间哪些基因表达是有差异的。

 

此外,也可通过抗体芯片以抗原-抗体反应来检测蛋白。但通常直接用蛋白做筛选的课题项目较少,往往是在已有的分子做出了表型,而要往下游筛选调控的信号通路时,才会使用到分析通路变化的蛋白芯片。


2


高通量筛选里的测序,一般特指二代测序(Next-Generation Sequencing,NGS)或深度测序Deep Sequencing)。可通过全转录组测序一次性挖掘出编码基因的mRNA和非编码RNA(miRNA/lncRNA/circRNA)的全面信息,以这些整合的数据就可以研究分子间的交互调控模式。

 

而平日里分子实验中构建好质粒后所做的测序则为一代测序或Sanger测序,其原理是双脱氧末端终止法,即DNA先扩增,然后通过毛细管电泳再去识别序列。可以说,一代测序是通过一个个碱基来检测的,其费用相当便宜(¥20/次),能够读约800个碱基,已成为科研临床领域中一个常规的分子生物学技术。

 

NGS则以大规模平行测序为思想,边合成边测序,在DNA合成过程中把序列信息得到。具体而言就是用不同颜色的荧光染料标记4种不同的核苷酸ATCG,在当DNA聚合酶合成模板链的互补链时,每添加一种核苷酸就会释放出与之对应的荧光信号,捕获荧光信号再经过计算机处理就可以获得DNA的序列信息了。

 

而所谓的大规模平行测序就是在处理样品时进行“建库”(把待测的DNA/cDNA随机片段化成几百碱基甚至更小的片段),并在序列两端加上接头,这样可同时测很多短序列,然后把短序列再利用接头拼接起来,多线程工作,效率大大提高,从而实现了高通量测序。

 

后续出现的三代或四代测序技术,则均为单分子测序(Single Molecule Sequencing, SMS)。有别于需要PCR扩增放大信号检测的一代、二代测序技术,SMS可用仪器实时观测DNA聚合酶复制DNA的过程,并把碱基信息记录下来。如此反应速度特别快,一秒10个碱基,而且一次反应能测非常长的序列,精度也很高。但缺点在于成本昂贵,且处于科研实验室应用阶段。


3


蛋白是生理、病理功能的执行单位,是永恒的经典,且基因编码的蛋白功能目前还大量未知,所以筛选蛋白、研究新蛋白功能不会过时。但蛋白的高通量筛选近年来一直不温不火,而这是因为蛋白筛选通常比核酸筛选难做。

 

要从蛋白水平筛选分子,常规套路就是两步:分离蛋白和蛋白鉴定。分离蛋白质最经典的方法是二维电泳。基于每个蛋白的空间结构和序列均是不一样的,因而二维电泳跑胶通过两个维度——等电点和分子量,将混合蛋白样品中的单个蛋白分离出来,随后将胶里的蛋白切出来进行质谱鉴定即可。除了蛋白筛选,在蛋白互作实验中被拉下的结合蛋白,也需要用质谱对其身份进行鉴定。


4

 

芯片、测序和质谱是三个主要的高通量筛选平台,可以从DNA、RNA和蛋白三个层次找候选分子。筛选的靶分子中,通常以转录水平的分子为最优选。其原因有三:


1)DNA不能直接体现细胞功能,且在疾病中不发生变化;


2)蛋白虽是功能的执行单位,但因其有观察的时间窗口、半衰期,有些差异很细微不一定能捕捉到,且蛋白样品的制备过程对结果影响也很大;


3)转录水平的分子上可追溯基因改变,下可观察蛋白动态变化;且验证表达差异时只需做qPCR进行验证即可,成本低。

 

至于选择哪个平台来进行分子的筛选,可从以下几个角度来考虑:

 

如果研究经费充足(8-10万或更多),在进行临床样本的高通量筛选时,可用二代测序去检测非编码RNA(如lncRNA、circRNA)的差异分子。如果预算紧凑(三五万),表达谱分析编码基因差异也是个不错选择。

 

最后囊中羞涩的科研小伙伴们也不要方,下一策则会教授大家如何在已有的高通量数据中挖掘自己个性化分子研究分析。敬请期待!

 

友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟