加标蛋白项目分组上机与仪器精度说明

2023-05-10 14:56:27

在omicshare论坛上,有用户提这样的问题



那么,什么是分组?什么是上机时间?对结果又会有何影响?


今天我们来具体谈谈这些问题。


1
分组份和每个组份上机时间问题


对于我们目前的加标蛋白组学定量项目(主要指itraq和TMT)而言;一般步骤是同一批次的若干样本总蛋白用胰蛋白酶酶解成肽段后,在不同样本的肽段上加上不同的itraq或TMT标签,然后将加完标签的不同样本肽段混合。


接下来就是混合肽段预分离,这一步一般是用一个层析柱进行层析预分离,目前我们用的是高pH反向柱分离(也有用SCX离子交换柱分离,单pH反向柱比SCX分离的效果更好);总之这一步利用混合肽段的亲水、疏水性不同或者是不同肽段的氨基酸残基所带电荷不同通过层析柱进行分离,在洗脱液的不断冲洗下,不同亲疏水性或不同电荷肽段会在不同的时间从层析柱中洗脱下来,达到分离的效果。这一步将肽段不同时间洗脱下来收集的不同肽段组份即是分组。不同公司分8-24个组份不等。这里分了几个组份最终做完项目就会得到几个蛋白的下机原始数据文件。


分完组份后,后面一步就是上机,每个组份分别去过液质联用(HPLC-MS/MS),即每个组份去过高效液相色谱然后一级质谱、二级质谱。这里的每个组份过HPLC-MS/MS的时间就是我们说的每个组份的上机时间;这里每个组份上机时间不同公司给的标准不一样,一般在0.5h-2h之间。这一步,每组上机时间最多不会超过3h,因为这步的上机时间主要在高效液相色谱(HPLC),而常用的色谱柱没法做3h以上。


为什么要将加标的混合肽段分组,然后每组份别上机呢?因为质谱仪其分辨能力也有局限性,这么做是为了提高鉴定的蛋白效果或者说尽可能多的鉴定出蛋白。质谱仪是在一定的分辨率的情况下进行一级、二级分子或分子碎片的扫描,读出扫描信号,如果原来上机的组份中肽段太过于复杂多样,会导致有些肽段和肽段碎片(尤其二级质谱)信号识别不了,就得不到对应的图谱,影响蛋白鉴定数量。


举个例子


关于分组对蛋白鉴定的影响,下图是某动物肝脏组织在不同分组数目下(不分组份、分3个组份、6个组份、12个组份),每组份上机2h情况下鉴定的图谱数和蛋白数;可以看到在上机时间2h固定情况下,分的组份越多鉴定的图谱数就越多(左图),而蛋白是靠图谱来和数据库比对鉴定的,最终导致鉴定的蛋白数目越多(右图)。



所以,组份分的越多,每个组份上机时间越长,降低混合肽段样本中蛋白的复杂程度和质谱扫描分辨难度,鉴定的蛋白数量就越多。倘若要粗略的综合评估的话,应该看实验总时间,即 组份数*每个组份上机时间。


下面,针对上文图片提到的问题,我说说我的看法。


我觉得要看你的样本是什么样本,如果是高等 动物整个个体或者植物整个个体,蛋白种类比较复杂丰富 ,建议分更多组份,做24组份,每组份上机1小时,总共上机24小时。


如果是低等细菌真菌或藻类,蛋白种类较少,8组份,每组份上机2小时,总共上机16小时效果可能更好;因为前面分组,蛋白种类本身就少的话,分15个或者15个组份以上,里面有的组份可能只含有洗脱液,没有肽段在里面(当然更负责的公司会看连续的洗脱时间对应的峰图,有洗脱峰的组份才做后续上机)。


如果是高等动植物的某一个具体组织部位,蛋白种类 复杂度一般,我觉得两种方案差不多,无法具体评估谁好谁坏;但8组份太少,24组份太多;可以和公司沟通,换一下策略。分12组份,每组份2h,这样可能更好。最好不要走极端。


目前,我们普遍的项目使用的12组份*1.5h,即18h;该方案性价比较高,适用于绝大多数项目样本;一般较少人做高等动植物整个个体样本蛋白的,当然这种样本蛋白比较丰富的情况,我们可以建议多分组份或者增加每组份上机时间,这样价格会贵些,你可以自己决定(拟南芥幼苗整个个体分15级组份,每组上机2h,可以做到鉴定10000+以上蛋白数目)。


一般某个组织部位蛋白项目,若你担心漏掉某些蛋白的鉴定,可以采用12组份*2h 策略,再继续增加分组和每个组份上机时间,能够鉴定的蛋白数目趋向饱和,不会增加太多,但价格是要明显增加的。如果是低等生物蛋白种类少,分级多收益就不明显,就更没必要浪费钱了。


讨论完分组和上机时间问题,还有一个影响结果的因素,接下来我们谈谈仪器问题


2
实验仪器的选择



不同质谱仪器的分辨率和质量精度不一样;如图从左到右,质谱仪分辨率和质量精度逐渐升高;这个就好比人眼的视力一样,分辨率和质量精度越高越有利于分辨不同的二级肽段离职碎片,得到更多图谱,可能鉴定更多蛋白;但这不是最重要的,最重要的是定量,提高定量的准确性;我们做蛋白组学,就是为了比较不同样本中蛋白的含量相对差异,这个是最主要目的。


加标蛋白项目,对于定量而言,对二级质谱中报告基团信号的识别和区分,是定量的关键;因为相对定量的原理就是通过二级质谱中不同报告基团的信号和信号大小,确定同一肽段在不同样本中的相对含量情况,最终得到同一蛋白在不同样本中的相对含量(这个不清楚可百度itraq和TMT原理)。


Itraq最多是可以做8标,标签报告信号分子量为113、114、115、116、117、118、119、121;TMT最多可以做10标,但是TMT10标里面,有的标签报告基团分子量是非常接近的,如图10种Mass Reporter信号,有的标签报告基团分子量是千分级别0.006差异。



因为TMT的标签报告基团其中4对分子量非常接近,另外同一批次上机的是10个样本的肽段混合物,复杂程度偏高,因此需要用仪器Fusion 和 Lumos 的分辨率才可以很好的区分TMT的标签报告基团信号,增加定量准确程度;


所以10标的TMT,必须用Fusion或Lumos,不能用QE,QE的性能分辨率标准不适合,无法做10标的TMT;


某些公司因为只有QE,但是因为要做10标的TMT,它们的策略是增加分组 和每组份上机时间,这种方法无法弥补仪器分辨率的不足,无法增加定量准确程度;增加分组 和每组份上机时间只能增加蛋白的鉴定数目。这就回到文章开头论坛的帖子问题,10标TMT,用QE做,我们是不建议的。如果你是6标,可以,但7标或更多,必然有样本标签报告信号过于接近仪器难以区分,会导致定量不准。


Fusion仪器精度有多准?下图是Fusion项目的肽段质量偏差评估。



如图,横轴是图谱质量偏差,实验控制的比较好的情况,大部分质量偏差可以控制在±5ppm精度;而QE 根据以往项目经验可能会是±10ppm,如下图。



3
加标蛋白项目分析中的两个重要参数



如上图,一般情况下我们用mascot分析蛋白项目,对于加标蛋白项目分析中有两个非常重要参数(图中用红框框出),这两个参数更改直接会导致分析结果大不一样。


fragment mass tol 参数是肽质量偏差容忍度(即上文提到的肽段质量偏差),我们默认是±20ppm,实际上该默认参数算是比较宽松的了,有的杂志要求±10 ppm甚至±5 ppm;要满足该条件的肽段,才用于后续分析。当然要仪器够高端,实验控制的好,才会有更多有效肽段落在该区域。


peptide mass tolerance 参数是报告基团报告信号分子量容忍度,比如 113信号,判断这个是不是真的113信号;itraq流程默认是±0.05 ppm,假如113报告基团信号理论质量为M,则检测到M±0.05的信号 都认为是113的信号,如果是10标的TMT,该参数要调整的更严格,我们用±0.003 ppm,为严格有效区分分子量接近的报告基团信号。


这里提这两个参数的原因是,可能有的蛋白项目质控做的非常不好,肽质量偏差非常大,用默认参数(±20ppm)鉴定不出多少蛋白;但是提高一倍±40ppm,鉴定的蛋白数目会增加不少;还有定量部分,如果提高报告基团报告信号分子量容忍度,可以增加可定量的蛋白数目;但是这些严格来说是一种“作弊”行为,为了貌似提高鉴定和定量的蛋白数量而牺牲掉准确性。


如果对于蛋白组项目你还有疑问,可以点击“阅读原文”到论坛参与讨论


友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟