蛋白质表达元器件

2023-05-10 14:56:27

表达载体的构型

构建表达质粒需要多种元件,需要仔细考虑它们的组合,以保证最高水平的蛋白质合成。E.coli 表达载体的基本结构

启动子(以杂和的tac 启动子为例)位于核糖体结合位点(RBS)上游10-100bp处,由调节基因(R)控制,调节基因可以是载体自身携带,也可以整合到宿主染色体上。E.coli 的启动子由位于转录起始位点上游约35bp的六核苷酸序列(-35区)和一短序列隔开的另一六核苷酸序列(-10区)组成

有许多启动子可用于在E.coli中的基因表达,包括来源于革兰氏阳性菌和噬菌体的启动子。理想的启动子具有以下特性:作用强;可以严格调控;容易转导入其他E.coli 以便筛选大量的用于生产蛋白的菌株,而且对其诱导是简便和廉价的。

在启动子下游是RBS,其跨度约为54个核苷酸,两端限定在 -35(±2)和mRNA编码序列的+19到+22之间。Shine-Dalgarno(SD)位点在翻译起始阶段与16S rRNA的3’端相互作用。SD与起始密码子间的距离约为5-13bp,而且此区的序列在mRNA转录物中应避免出现二级结构,否则将会降低翻译起始的效率。

在RBS的5’和3’端均为A丰富区。转录终止子位于编码序列的下游,作为转录终止的信号和组成发卡结构的保护性元件,阻止核酸外切酶对mRNA的降解,从而延长mRNA的半衰期。

除了上述对基因表达的效率有直接影响的元件以外,载体还含有抗生素抗性基因,以方便质粒的筛选和传代。氨苄青霉素是最常用的抗性标记。但在生产人用治疗性蛋白时,最好选择其他抗性标记(如Tet)以避免可能发生的过敏反应。质粒的拷贝数由复制起点决定。

在特殊情况下,选用失控复制子能够获得大量的质粒拷贝数和较高产量的质粒编码蛋白。但在另外一些情况下,选用超过pBR322的高拷贝质粒似乎并没有好处。而且已有资料表明,增加质粒的拷贝数降低E.coli中胰酶的产量,在高拷贝质粒中,强启动子的存在严重影响了细胞的活性。

转录水平调控

1.启动子

能在E.coli中发挥作用的启动子很多。这些启动子必须具有适合高水平蛋白质合成的某些特性。

首先启动子的作用要强,待表达基因的产物要占或超过菌体总蛋白的的10-30%;

第二,它必须表现最低水平的基础转录活性。若要求大量的基因表达,最好选用高密度培养细胞和表现最低活性的可诱导和非抑制启动子。

如果所表达的蛋白具有毒性或限制宿主细胞的生长,选用可抑制的启动子则至关重要。例如,轮状病毒的VP7蛋白能有效地杀死细胞,因此必须在严格控制的条件下表达。

但在某些情况下,启动子的严格性并不合理,因为即使最小量的基因产物也能由于其毒性而杀死细胞。如能灭活核糖体或破坏膜渗透压的分子对细胞来说是致死性的。对宿主的毒性并不仅限于外源基因,某种自身蛋白的过量表达也能造成同样的结果。如编码外膜磷脂蛋白的traT基因。

另外,不完全抑制的表达系统会造成质粒的不稳定,细胞生长速度的下降和重组蛋白产量的降低。Lanzer和Bujard曾对常用的lac启动子-操纵子系统进行了广泛的研究,证明操纵子放在启动子序列的不同位置会造成70倍差异的抑制。将17bp的操纵子置于-10和-35六聚体区之间所形成的抑制比将其放在-35区的上游或-10区的下游要高50-70倍。

启动子的第三个特性是其简便和廉价的可诱导性。大量生产蛋白质最常用的启动子是热诱导(λPL)和化学诱导(trp)启动子。异丙基硫代-β-D-半乳糖苷(IPTG)诱导的杂交启动子tac或trc都是强启动子,在基础研究中应用很广。但在大量生产人用治疗性蛋白时用IPTG做诱导剂是不可取的,因为IPTG具有毒性而且价格昂贵。

IPTG的这些不足至今仍限制tac或trc强启动子在大量生产人用治疗性蛋白中的应用。编码热敏lac阻遏蛋白[38]的突变lacI(Ts)基因的出现使得目前能够对这些启动子进行热诱导。

另外,还出现了一些新型载体,它们允许在30℃对trc启动子进行严紧调节。最近还报道了两种不同的lac阻遏蛋白突变体,能够同时允许热诱导和IPTG诱导。尽管野生型lacI基因也能热诱导,但不能对其进行严紧型调节,且不能用于lacIq 菌株,因为温度的变化不能遏制由lac阻遏蛋白的过量表达所造成的严紧性抑制。因此,该系统只能用用于生产对宿主菌无害的一些蛋白。

冷反应启动子尽管不象其他启动子那样得到广泛的研究,但已经被证明能在低温条件下进行有效的基因表达。噬菌体λPL启动子的活性在20℃时最高,随着温度的升高,其活性逐渐降低[44]。PL启动子的冷反应由E.coli整合宿主因子,一种与DNA结合的序列特异性多功能蛋白来正调控。

主要冷应激基因cspA启动子同样也被证明在低温具有活性。对cspA和PL启动子进行分子剖析,鉴定了在较低温度下参与增强转录的特异性DNA区域。从而开发了一系列在20℃低温具有高活性的PL衍生启动子。选用冷反应启动子的基本原理是在15-20℃的条件下,蛋白质的折叠速度只受到轻微的影响,而作为生物化学反应,转录和翻译的速度将被充分降低。

这就为蛋白质折叠、产生有活性的蛋白和避免非活性蛋白聚合体即包涵体的形成提供了充足的时间,而目的蛋白的最终产量并未减少。最近新报道的一些启动子具有诸多诱人之处,为选择新的高效表达系统提供了方便。如非常强的pH启动子],重组蛋白的产量可达总蛋白的40-50%。

但表达的水平会因不同的基因而有差异。因为蛋白质的合成不仅依赖于启动子的强弱,而且有赖于转录的效率。

人们通常只考虑E.coli启动子的核心区域,即-10和-35六核苷酸区和一15-19bp的间隔序列。但有人提出核心序列以外的元件也能刺激启动子的活性。许多研究也已证明,核心启动子上游的序列能够在体内提高转录起始的效率。Gourse等证明,位于E.coli rRNA启动子rrnB P1 -35区上游的DNA序列即UP元件,能够在体内和体外提高转录效率30倍。UP元件是作为一个独立的启动子组件发挥作用的,因为将其融合到其他启动子如lacUV5中也能刺激转录。UP元件与其他启动子融合所表现的这种转录增强子效应,使其有望通用于高效表达系统。尽管已经证明rRNA启动子P1、P2的超强能力,但它们仍未被用于E.coli进行高水平表达,其主要原因是难以对其进行调控。rRNA的体内合成从属于细胞增殖速度的控制。在细胞快速增殖期,P1和P2是活化的,当细胞处于生长的静息期,则P1、P2被负调节。因此,rRNA启动子在前诱导期将持续活化。在体内快速增殖的细胞中,P2的活性很弱,而且可诱导性差,但若与P1分开,P2启动子的活性明显升高(达到P1的70%),且对应激反应敏感。这表明在天然的串联体中,P2是部分关闭的。Brosius和Holy将lac操纵子序列插入到rrnB rRNA P2启动子的下游,在带有lacIq基因的菌株中成功地抑制了P2的活性。转录活性是以氯霉素乙酰转移酶的产生和4.5s RNA的表达为标准的。然而,P2构建体的活性只相当于tac启动子活性的1/2,而且当rrnB P1启动子被置于P2启动子下游时,不能完全抑制转录。有人试图利用反转启动子的方向来严格调控rRNA启动子。将rRNA启动子克隆于目的基因的上游,但转录方向相反。利用λ整合位点和可调控的λ整合酶来实现启动子的反转,从而达到进行诱导的目的,而且,在高度活化的启动子上游有一强转录终止子将避免在前诱导期可能出现的载体的不稳定性。

.转录终止子

在原核生物中,转录终止有两种不同的机制。一种是依赖六聚体蛋白rho的rho依赖性转录终止,rho蛋白能使新生RNA转录本从模板解离。另一种是rho非依赖性转录终止,它特异性依赖于模板上编码的信号,即在新生RNA中形成发卡结构的一回文序列区,和位于该回文序列下游4-9bp处的dA、dT富含区。虽然转录终止子在表达质粒的构建过程中常被忽略,但有效的转录终止子是表达载体必不可少的元件,因为它们具有极其重要的作用。贯穿启动子的转录将抑制启动子的功能,造成所谓的启动子封堵。这种效应可以通过在编码序列下游的适当位置放置一转录终止子,阻止转录贯穿别的启动子来避免。同样地,在启动目的基因的启动子上游放置一转录终止子,将最大限度地减小背景转录[65]。另有资料证明,由强启动子启动的转录会使转录通读到复制区,造成控制质粒拷贝数的ROP蛋白的过量表达,从而导致质粒的不稳定[66]。另外,转录终止增强mRNA的稳定性[67],从而提高蛋白质的表达水平。如果来源于E.coli rrB rRNA操纵子的两个转录终止子T1和T2串联,则效果更好[68]。但其他的许多转录终止子通常情况下都是十分有效的。

转录抗终止子

细菌中许多参与氨基酸生物合成的操纵子在其第一个结构基因的5’端含有转录衰减子。衰减子由特定操纵子的氨基酸产物调节。这样关联的带电荷tRNA的存在就会在核糖体剪切之后引导初始转录本中二级结构的形成。如果没有关联的带电荷tRNA,则会形成抗终止子结构,从而抑制终止子中发卡结构的形成和转录的终止。抗终止元件能使RNA 多聚酶越过核糖体RNA操纵子中的rho依赖性终止子即boxA。转录抗终止是有一个极其复杂的过程,其中包含许多已知和未知因子。有关这方面的知识已有详尽的综述。在此我们主要讨论抗终止元件在E.coli中表达外源基因的应用。

在E.coli表达系统中作用比较强、应用较广的一个启动子是噬菌体T7晚期启动子。该系统的活性依赖于提供T7 RNA多聚酶的转录单元。RNA多聚酶的严格阻遏对防止T7启动子的渗漏是必需的。有许多用于调节T7多聚酶表达的途径,但每一种方法都有其各自的缺陷。Merten等通过构建一基于λPL调节的反转衰减T7 RNA多聚酶表达盒阐明了这一问题。可以通过在启动子和编码T7多聚酶的基因之间插入三个串联排列的转录终止子来削弱T7多聚酶的基础表达水平。在诱导的情况下,噬菌体λ来源的nutL依赖的抗终止功能也可以协同来阻止转录终止。来源于E.colirrnB rRNA操纵子的转录抗终止区已被用于某些表达载体如pSE420。该载体应用trc启动子。其基本原理是使得转录通过重度二级结构区,从而减少宿主RNA 多聚酶引起的转录提前终止的可能性。但是rrnB抗终止子在这种情况下似乎并不十分有效。

严紧型调节表达系统

可严紧调节的启动子的优点使得我们能够设计许多巧妙、可高度抑制的表达系统。这在表达那些产物对宿主的生长不利的基因时尤其有用。所用的策略包括“铺平板”法[76];提高抑制基因和操纵基因的比例[77];用突变的噬菌体感染诱导[28 ];致弱高拷贝数载体上的启动子活性[78];利用转录终止子和抗终止子[79];在拷贝数可控的质粒中使用可诱导的启动子[80];使用“交叉调节”系统[81];共转导使用SP6 RNA多聚酶的质粒[82];利用与克隆基因mRNA互补的反义RNA[31]。最后一个巧妙的方法是反转启动子:在启动子两侧为两个λ整合位点,启动子的方向与基因的表达方向相反,而且只通过由λ整合酶介导的诱导位点特意性遗传重组来完成反转。

上述这些系统也各有其优缺点。即依赖固体培养基的方法不适用于大批量表达,高水平抑制系统常造成蛋白质产量的下降[85],这就有必要优化抑制基因和操纵基因的比例[86]。由λ噬菌体介导的诱导更增加了系统的复杂性,利用反转启动子迂回方法又引入了复杂的载体结构。尽管这些表达系统大多数尚未用于蛋白质的大规模、高产量生产,但是它们为基因表达提供了重要的工具。

翻译水平的调控

mRNA翻译起始

有关转录过程的大量知识使得能够在不被附近核苷酸序列影响的情况下,在表达盒中使用原核启动子。对于决定蛋白质合成的起始因素,虽然尚不能完全弄清楚,但目前已经明白,mRNA转录本5’末端的独特结构是mRNA翻译起始效率的最主要决定因素。至今还没有发现通用的有效起始翻译的共同序列。已知序列的绝大部分(91%)E.coli基因的翻译起始区均含有起始密码子AUG,GUG的利用率为8%,而UUG的利用率则为1%[88,89]。Shine-Dalgarno(SD)位点在翻译起始阶段与16S rRNA的3’端相互作用。SD与起始密码子间的距离约为5-13bp,这一距离影响翻译起始的效率[90]。人们对此进行了深入的研究,以确定最佳的SD区序列和SD与起始密码子之间的最有效间隔。Ringquist等[93]研究了RBS的翻译功能,得出了以下结论:(1)在间隔相同的情况下,UAAGGAGG的SD序列比AAGGA的SD序列能使蛋白质的产量提高3­­-6倍;(2)对于同一SD序列,存在一最佳的间隔。AAGGA的间隔为5-7个核苷酸,而UAAGGAGG的间隔为4-8个核苷酸;(3)对于同一SD序列,有一翻译所必需的最小间隔。AAGGA的最小间隔为5个核苷酸,而UAAGGAGG的最小间隔为3-4个核苷酸。这些间隔提示,在16S rRNA的3’末端和结合于核糖体P位点的fMet-tRNAf的反义密码子之间存在精确的物理关系。

在mRNA的翻译起始区的二级结构在决定基因表达效率方面具有重要作用。如用一发卡结构封闭SD区和/或AUG密码子就会阻止其与30S核糖体亚单位的结合,从而抑制翻译。已经设计了几种不同的策略以使mRNA形成二级结构的可能性最小。提高RBS中A、T残基的丰度能增强某些基因的表达[98]。同样地,突变SD区上游或下游的某些特定核苷酸就会抑制mRNA二级结构的形成和提高翻译效率另一途径得益于在E.coli中自然发生的一种翻译偶联现象。翻译偶联的机制已被用来解释来自多顺反子mRNA的不同基因的并列表达。已经证明,当galK与上游基因偶联翻译时,经修饰的gal强启动子能够指导半乳糖激酶的高水平合成。这提示即使很弱的RBS,如果与核糖体结合也能非常有效。这种调节机制有可能在蛋白质超量生产生物技术中发挥重要作用。事实上,翻译偶联已经被广泛用于不同基因的高效表达。

除了SD区与16S rRNA结合之外,mRNA和核糖体的其他相互作用也参与翻译的起始。如核糖体S1蛋白直接参与30S亚基对mRNA的识别和结合

.翻译增强子

已经在细菌和噬菌体中鉴定了一些在E.coli中显著增强异源基因表达的序列。Olins等从T7噬菌体基因10前导序列(g10-L)中鉴定了一9bp的序列,该序列似乎能替代有效的RBS。同SD共有序列相比,g10-L能使多种基因的表达水平提高40-340倍[102]。若将其置于合成SD序列的上游,按照β-半乳糖苷酶的活性与LacZ mRNA的水平来估计,g10-L序列能使 LacZ的翻译水平提高110倍[103]。另外的研究小组在mRNA的5’非翻译区(UTR)鉴定了一U富含序列,该序列同样具有翻译增强子活性。McCarthy等[104]在 E.coli atpE基因中紧接于SD位点下游鉴定一类似区域。有文献用一30bp的序列超量产生IL-2和IFN-β[105]。另有人证明在编码RNase D的rnd mRNA SD位点的上游,有一U8序列对该mRNA的有效翻译是必需的。缺失这一区域会显著降低翻译,但不影响rnd mRNA的水平和转录起始位点[106]。研究证明这些类似序列的靶位是30S核糖体亚单位的S1蛋白[107]。在另一项有趣的研究中,研究者证明在紧接起始密码子下游的序列在翻译起始过程中发挥重要作用。位于T7基因0.3编码区+15至+26之间或位于T7基因10编码区+9至+21之间被称做下游框(DB)的特定区域具有翻译增强子的功能。DB区与16S rRNA的1469-1483核苷酸互补,这一区域称做反下游框(ADB)。缺失DB将废除翻译活性。相反,如果优化DB和ADB之间的互补则会以最高水平表达dhfr融合基因。有趣的是,如果将DB从起始密码子的上游移到SD序列的位置,DB则失去功能。DB序列存在于一些E.coli和噬菌体基因中[108,109]。

上述这些发现充分证明,除了SD位点和起始密码子以外,mRNA中的其他序列对于有效的翻译也是重要的。尽管其精确的机制还不太清楚,但有可能利用翻译增强子来达到超量表达蛋白质的目的。

mRNA的稳定性

mRNA的快速降解势必影响蛋白质的产生。因此在这一部分重点阐述决定mRNA稳定性的因素,这将在E.coli高效表达外源基因中有实际应用。在E.coli中有多种不同的RNase参与mRNA的降解,其中包括内切核酸酶(RNase E,RNase K和RNase III)和3’外切核酸酶(RNase II和多聚核苷酸磷酸化酶[PNPase]),目前尚未在原核细胞中发现5’外切核酸酶[110]。mRNA的降解并非由非特异性的外切核酸酶随机剪切而引起,因为在mRNA的长度和半衰期之间并没有反向相关性[111]。已经证明,在E.coli中有两类保护性元件能够稳定mRNA。一类由mRNA的5’UTRs中的序列组成[112];另一类由3’UTRs和多顺反子间区的发卡结构组成[113]。其中一些元件与异源mRNA融合后起稳定剂作用,但只在严格的条件下如此。例如,噬菌体T4基因32的5’UTR在T4噬菌体感染的细胞中延长非稳定mRNA在E.coli中的半衰期[114]。革兰氏阳性菌如金黄色葡萄球菌和枯草杆菌的红霉素抗性基因(erm)编码的mRNA 5’UTR含有稳定元件。但ermC和ermA 5’UTRs的稳定作用需要由抑制翻译和引起核糖体失控的抗生素来诱导[115]。同样,噬菌体λPL对于λPL-trp转录本的稳定作用需要λ噬菌体的感染[116]。与此相反,E.coli ompA转录本能够在细胞快速增殖的正常情况下延长一系列异源mRNA在E.coli中的稳定性[117]。Emory等证明,在接近或紧接ompA 5’UTR的5’末端存在发卡结构对于其稳定效果是必需的。而且可以通过在5’末端添加发卡结构来延长在正常情况下不稳定的mRNA的半衰期[118]。这样看来,对异源基因添加ompA 5’稳定元有可能提高E.coli中的基因表达。另一类由3’UTR组成的mRNA保护性元件能够形成发卡结构,因而能够阻断外切核酸酶从3’末端对转录本的降解[113]。Wong和Chang[119]在苏云金杆菌的晶体蛋白基因的转录终止子中鉴定了一个这样的元件。将该“阳性反调节子”与地衣杆菌的青霉素酶基因(penP)的3’末端和人IL-2 cDNA融合,能够延长mRNA的半衰期,且提高了相应多肽在枯草杆菌和E.coli中的产量。然而,同某些5’稳定元一样,这类3’反向调节子不可能作为一个通用的mRNA稳定元。而且有证据表明,可以通过选用缺乏某些特定RNase如RNaseII或PNPase的宿主菌来提高基因的表达。这同样并非一有效途径。因为缺乏RNaseII或PNPase与RNase过量表达一样,对于E.coli整体mRNA的平均半衰期并无多大影响。而且缺乏RNaseII或PNPase的菌株常常是不稳定的[120,121]。

翻译终止

在mRNA中存在终止信号是翻译终止过程必不可少的。除了三个终止密码子UAA、UGA、

和UAG外,翻译终止这一复杂事件还包括核糖体、mRNA和终止位点的几种释放因子的特异相互作用[122]。在E.coli中,RF-1在终止密码子UGA处终止翻译;RF-2在UAA密码子处终止翻译[123]。最近还克隆了另外一个因子RF-3[124]。

在设计表达载体时,通常插入三个终止密码子以防止核糖体的跳跃。在E.coli中偏向于使用UAA密码子[125]。一项对于2000多个E.coli基因的统计分析表明,在终止密码子和紧接三联体的核苷酸序列中存在局部非随机性[126]。同时他们还利用体内终止试验测定12个可能的四核苷酸“终止信号”(UAAN、UGAN、UAGN)的终止力量。在体内终止试验中,通过其与框架移位的竞争测定其终止效率。转录效率依据终止密码子和第四个核苷酸而有显著的差异,这种差异从80%(UAAU)到7%(UGAC)不等。这些研究表明,紧接终止密码子后的核苷酸特性强烈地影响E.coli中的翻译终止效率[127]。UAAU是E.coli中最有效的转录终止序列。此外,终止密码子5’末端的邻近序列也影响终止的效率。因此,新生肽中倒数第二位(-2位)C-末端氨基酸残基的电荷和疏水性能引起多达30倍不同的UGA终止效率,而在UAG位的终止对于-2位氨基酸残基的特性不敏感[128]。对于-1位,α-螺旋、β-链和回转倾向是UGA终止中的决定因素


qq1036529206

qq2200164569

qq1689909502

友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟