近期蛋白质组研究进展

2023-05-10 14:56:27

本文系生物谷原创编译，欢迎分享，转载须授权！

蛋白质组（Proteome）的概念最先由Marc Wilkins提出，指由一个基因组，或一个细胞、组织表达的所有蛋白质。蛋白质组的概念与基因组的概念有许多差别，它随着组织、甚至环境状态的不同而改变。在转录时，一个基因可以多种mRNA形式剪接，一个蛋白质组不是一个基因组的直接产物，蛋白质组中蛋白质的数目有时可以超过基因组的数目。蛋白质组学(Proteomics)处于早期“发育”状态，这个领域的专家否认它是单纯的方法学，就像基因组学一样，不是一个封闭的、概念化的稳定的知识体系，而是一个领域。

蛋白质组学集中于动态描述基因调节，对基因表达的蛋白质水平进行定量的测定，鉴定疾病、药物对生命过程的影响，以及解释基因表达调控的机制. 作为一门科学，蛋白质组研究并非从零开始，它是已有20多年历史的蛋白质(多肽)谱和基因产物图谱技术的一种延伸. 多肽图谱依靠双向电泳(Two-dimensional gel electrophoresis, 2-DE)和进一步的图象分析；而基因产物图谱依靠多种分离后的分析，如质谱技术、氨基酸组分分析等。

基于此，谷君针对近年来蛋白质组研究取得的最新进展，进行一番梳理，以飨读者。

1.Science：重大突破！首次绘制出人蛋白质组亚细胞定位图
doi:10.1126/science.aal3321

图片来自Human Protein Atlas。

在一项新的研究中，对人细胞中的蛋白是如何分布的首个分析结果揭示出大部分人蛋白能够在一个给定的细胞中的一个以上位置发现到。利用位于瑞典的细胞图谱（Cell Atlas），研究人员研究了人蛋白质组（对应着绝大多数蛋白编码基因）的空间分布，而且他们史无前例详细地描述了蛋白在多个细胞器和细胞亚结构中的分布。相关研究结果于2017年5月11日在线发表在Science期刊上，论文标题为“A subcellular map of the human proteome”。

这项研究是由瑞典皇家理工学院副教授Emma Lundberg领导的。Lundberg及其团队产生了30多万张图片来系统性地确定人蛋白在体外培养的细胞系中的空间分布，并且在单细胞分辨率上将它们定位到细胞区域和亚结构中。

这种细胞图谱是人类蛋白图谱（Human Protein Atlas）计划10多年研究的结果，它是在2016年12月发起的。这项新的研究详细地分析了这几十万张图片。这些图片是作为一项国际合作行动的一部分产生的。这个国际合作行动也包括来自中国、韩国、印度、丹麦和德国的研究团队。

这些研究人员将由13,993种抗体靶向的总共12,003种蛋白定位到30个细胞区室和亚结构中的一个或多个，此外，他们还详述了13个主要细胞器的蛋白质组。具有最大蛋白质组的细胞器是细胞核（有6,930种蛋白）及其亚结构（如核小体和核小斑点），和细胞质（有4,279种蛋白）。

2.我国科学家建立世界上首个蛋白质组规模的健康人尿蛋白定量参考范围可用于健康状态监测及肿瘤筛查
doi:10.1016/j.ebiom.2017.03.028

液是临床检验中除血液外最常用的体液样本。从尿液中寻找新的生物标志物，是当前临床蛋白质组学研究的热点之一。但由于尿蛋白质组的生理波动性和个体间差异很大以及缺乏在健康人群中对这些波动性和差异的长期监测和系统性评估，致使基于尿蛋白的生物标志物研究的假阳性发现很高，基本无法通过后续的大规模临床验证。5月2日，国家蛋白质科学中心（北京）秦钧课题组在EBioMedicine杂志上发表了题为“Proof-of-Concept Workflow for Establishing Reference Intervals of Human Urine Proteome for Monitoring Physiological and Pathological Changes”的研究论文。

文章第一作者为冷文川副研究员，该研究以国际两中心的方式采集了来自167名健康自愿者的500个尿蛋白质组数据，对健康人尿蛋白质组的生理波动性和个体间差异进行了系统性评估，在此基础上建立了世界上首个蛋白质组规模的健康人尿蛋白定量参考范围。通过利用此定量参考范围对跨大陆飞行及肿瘤病人尿蛋白质组数据进行分析的实例，充分展示了健康人尿蛋白定量参考范围在健康监测及肿瘤筛查方面重要应用价值。

3.Cell：重磅！史上首次定量检测完整的人类蛋白质组
doi:10.1016/j.cell.2016.06.041

在一项新的研究中，来自瑞士苏黎世联邦理工学院（ETH Zurich）和美国系统生物学研究所等机构的研究人员开发出人类SRMAtlas（Human SRMAtlas），即靶向识别和可重复地定量预测的人类蛋白质组中所有蛋白质的高度特异性质谱检测方法汇编目录，包括许多剪接变异体、非同义突变和翻译后修饰。利用一种被称作选择性反应监控（selected reaction monitoring, SRM）的技术，研究人员利用166174种已被充分了解的化学合成蛋白特征性肽（proteotypic peptide）开发出这些检测方法。相关研究结果发表在2016年7月28日那期Cell期刊上，论文标题为“Human SRMAtlas: A Resource of Targeted Assays to Quantify the Complete Human Proteome”。论文第一作者为来自美国系统生物学研究所的Ulrike Kusebauch博士。论文通信作者为来自美国系统生物学研究所的Robert Moritz教授和来自瑞士苏黎世联邦理工学院的Ruedi Aebersold。

SRMAtlas资源在http://www.srmatlas.org网站上可以免费获取，将有助于公平地开展重点的、假设驱动的和大型蛋白质组规模的研究。研究人员期待这一资源将极大地加快基于蛋白质的实验室生物学发展从而有助理解疾病转化和健康轨迹，这是因为如今在理论上能够鉴定和定量检测出任何样品中的任何人类蛋白。

能够可靠地和可重复性地检测任何组织或细胞类型的人类蛋白质组中的任何一种蛋白在理解系统层次的性质以及正常生理下和患病时的特异性途径方面引发变革。在Moritz教授实验室中，研究团队能够利用SRM方法产生并验证了一种由高度特异性地靶向蛋白质组检测方法组成的汇编目录，而且通过这种广泛获取的、灵敏的和强健的靶向质谱方法SRM，能够定量检测20,277种已被标注的人类蛋白中的99.7%。这种人类SRMAtlas提供明确的检测坐标来确定性地鉴别生物样品中蛋白质特征性的肽。

4.Science：对肝脏线粒体功能进行系统蛋白质组学研究
doi:10.1126/science.aad0189

科学家们通过对小鼠开展大规模蛋白质组学研究获得脂肪和能量代谢的分子遗传背景方面的新认识。蛋白质组是一种生物体或某一种细胞、一种组织的基因组所表达的全部蛋白。在一项新的研究中，由瑞士联邦理工学院教授（ETH Zurich）Ruedi Aebersold领导的一个专门从事蛋白质组学研究的团队和由瑞士洛桑联邦理工学院（EPFL）教授Johan Auwerx领导的一个专门从事于线粒体生理学与肝脏疾病研究的团队合作开展这项突破性的研究项目。就这项研究而言，蛋白质组指的是小鼠肝脏中表达的全部蛋白。相关研究结果发表在2016年6月10日那期Science期刊上，论文标题为“Systems proteomics of liver mitochondria function”。

研究人员将来自一个大型小鼠群体的综合性蛋白数据汇集在一起，从而有助他们解释额外的代谢差异。他们采用一种被称作SWATH-MS的质谱测量技术，这种技术是由ETH Zurich的Aebersold团队最近开发出来的。它允许研究人员测量这种实验性小鼠肝脏中一系列蛋白的浓度。

研究人员研究的一群小鼠是由40种小鼠品系组成的，这些小鼠品系可追溯到两个相同的祖先，因此彼此之间的亲缘关系比较密切。由来自这些10种小鼠品系的代表性小鼠组成多组相同的小鼠，给它们喂食高脂肪食物（即人们所述的垃圾食品）或健康的低脂肪食物。在几周之后，他们记录了这些小鼠的常规医学（生理学）数据，尤其是测试了它们的表现和它们如何快地通过身体活动降低它们的体重。正如研究人员期待中的那样，这些小鼠对高脂肪食物摄入作出不同的反应。一些小鼠患上代谢疾病，如脂肪肝，但是其他小鼠则不会如此。

为了进行评估，研究人员将这些生理学数据与基因组、转录组和蛋白质组数据结合在一起。从这些结合的数据中，他们能够更加准确地描述几种特定的蛋白在脂肪和能量代谢中的作用。其中一种蛋白是COX7A2L。他们发现，在小鼠体内，这种蛋白负责形成在线粒体---细胞内部的能量工厂---中发现的超级蛋白复合体（supercomplex）。这种超级蛋白复合体由100多种不同的蛋白组成，负责以合适的形式给细胞提供所需的能量。具有太少COX7A2L蛋白的小鼠不能够提供足够数量的所需能量，因而给整个有机体带来负面影响。

5.芝加哥大学赵英明教授课题组Chemical Reviews撰文系统归纳组蛋白密码定量蛋白质组学
doi:10.1021/cr500491u

近日，芝加哥大学赵英明教授课题组在国际顶尖化学期刊《Chemical Reviews》(影响因子45.661)上发表题为"Quantitative Proteomic Analysis of Histone Modifications"的论文，系统、深入地总结了当前组蛋白密码定量蛋白质组学研究前沿成果，并详细归纳了20种共四百多个组蛋白密码。其中，赵英明教授课题组率先发现其中一半组蛋白密码，是目前国际上发现组蛋白密码最多的研究团队。

组蛋白密码蕴含了基因序列和生物个体性状间的关键调控信息。它动态地调节染色质的结构和功能，极大扩展了传统遗传密码的信息含量。定量蛋白质组学由于可检测蛋白质定量变化而日益被广泛应用到组蛋白密码动态研究中。目前已发现组蛋白密码异常与多种重大疾病密切相关，因此发现全新组蛋白密码，以及研究组蛋白密码动态变化对基因功能的调节机制，对深入了解疾病的发生机理、靶向性药物开发乃至个体化治疗等都有着极其重要的意义。

本论文系统归纳了利用生物质谱和定量蛋白质组学来解决组蛋白密码研究领域问题的策略、技术及进展，并扩展了此方法在多个方面的应用，如：全细胞非组蛋白修饰的鉴定、蛋白质修饰调节酶的底物鉴定、蛋白质修饰结合蛋白的鉴定等。此项工作由赵英明课题组和宾夕法尼亚大学Benjamin Garcia教授课题组共同完成，黄河博士是文章的第一作者，赵英明教授是通讯作者。

6.Anal Chem：董梦秋等开发出定量蛋白质组学数据解析软件pQuant
doi:10.1021/ac404246w

中科院计算所pFind研究团队与我所董梦秋实验室合作开发了定量蛋白质组学数据解析软件pQuant，用计算方法排除干扰信号的影响、提高肽段和蛋白质的定量准确度并对每个定量值进行准确性评价。

基于质谱的定量蛋白质组学是现代生物学技术的生长点之一，用于测量复杂生物体系中蛋白质及其翻译后修饰在不同条件下的丰度变化，是研究蛋白质功能和药物作用机制的重要工具。已有的定量软件往往不能有效排除干扰信号，定量值的计算方法有待完善，而且缺乏准确性评价，致使输出结果“鱼龙混杂”，引起的假阳和假阴两方面的困扰都比较严重。为了更好地解决这些问题，pQuant开发者—计算所的刘超同学—研究了几百个可疑定量值的原始质谱图和色谱图数据，找原因、攒经验，充分挖掘肽段的质谱、色谱信号特点以及从肽段定量到蛋白质定量的方法，灵活应用各种组合和统计算法，建立了一整套非常细致的数据分析流程。为了验证pQuant的性能，董梦秋实验室的宋春青同学通过轻重SILAC或14N／15N标记哺乳动物细胞或细菌，从10：1到1：10按不同比例混合得到14套标准样品，产生了14套测试数据集。测试结果表明，pQuant定量结果的准确性明显超过定量蛋白质组学领域的两个主流软件Census和MaxQuant，主要表现在：（1）pQuant输出的非数比值数目（即不能定量的部分）占总比值数目的0.01–0.5%，远低于Census的MaxQuant的对应比例2.5–10.7%和1.8–2.7%；（2）Census和MaxQuant输出了许多不准确结果，其定量值的标准差是pQuant的1.3–2倍；（3）pQuant给出了肽段和蛋白质定量比值的置信区间，而Census和MaxQuant没有准确性评价。

上述结果以“pQuant Improves Quantitation by Keeping out Interfering Signals and Evaluating the Accuracy of Calculated Ratios”为题，于2014年6月3日在美国化学会主办的《Analytical Chemistry》期刊上发表。

7.Nature：科学家发布人类蛋白质组草图里程碑成果
doi:10.1038/nature13319; doi:10.1038/nature13302

日前，两个国际小组均在《自然》杂志上公布了人类蛋白质组第一张草图，这些在大部分非患病人体组织和器官中表达的精选蛋白，为更好的理解疾病状态下发生的机体变化，奠定了坚实的基础。这两项最新研究揭示了人类基因组的更多复杂性，并从之前认为属于非编码区域的基因组中发现了新蛋白。

在第一篇文章中，来自约翰霍普金斯大学的蛋白质组研究员Akhilesh Pandey，与来自印度生物信息学研究所等处的研究人员合作，分析了30种不同的组织类型，编撰了由84％所有预期编码蛋白的人体基因翻译得到的蛋白。

这项研究识别出17， 294个蛋白编码基因，并通过表达分析证明了组织和细胞特异性蛋白的存在，并且研究人员还通过从注解的假基因、非编码RNA和未翻译的区域识别翻译的蛋白，表明了“蛋白基因组”分析的重要性。

同时另外一篇文章中，来自德国研究人员慕尼黑工业大学的Bernhard Küster等人创新性的推出了一个搜索性公共数据库：ProteomicsDB，这一数据库公布了18，097个基因获得的蛋白，占目前预计人类蛋白总数（19， 629）的92％。这种数据能用于识别数百个翻译的lincRNAs，对药物敏感的标记，以及用于发现mRNA和组织中的蛋白水平之间的定量关系等。

这两个研究组都利用了质谱方法分析人类组织，Pandey研究组分析的是全新的数据，针对了多种不同健康人体组织的数据，其中包括七种胎儿组织和六种血细胞类型。

而Küster研究组则采用了稍微有些不同的方法，他们汇集了已有质谱分析数据，以及同事的一些成功，这些大约占据ProteomicsDB数据的60％。为了填补这些数据间的空白区域，Küster实验室构建了自己的质谱数据，分析了60个人类组织体液，13个体液，以及147个的癌细胞系。Küster表示，他们只挑选了高分辨率的公共数据，这些数据具有严格的计算过程，高质量控制标准。

8.Cell：iPS形成具体步骤与蛋白质组变化
doi:10.1016/j.cell.2012.08.023; doi:10.1016/j.celrep.2012.10.014

iPSC具有和胚胎干细胞（ESC）类似的特征和功能，却极大程度避免了ESC研究和应用中面临的伦理和排斥等诸多障碍，因此这一新技术给基于干细胞的个性化治疗和再生医学带来了光明的前景。诺贝尔奖得主Yamanaka教授及后来的大量研究都表明Oct4、Sox2、Klf4和c-Myc（OSKM）等转录因子对iPSC的形成具有至关重要的作用，但是对于上述转录因子激发iPSC形成的步骤和机制尚不明确。

为了揭开这个谜底，来自哈佛-麻省总医院的两位知名科学家：Sridhar Ramaswamy和Konrad Hochedlinger进行了iPS细胞形成的转录分析，发现了一种双相过程。其中c-Myc/Klf4驱动了第一波，Oct4/Sox2/Klf4驱动了第二波，这种双相过程导致了一些细胞难以重编程，如果能提高4个因子的表达，就可以解决这一问题。

在另外一篇文章中，研究人员采用了一种称为深度定量蛋白质组学（in-depth quantitative proteomics）的方法，分析成纤维细胞重编程为iPS细胞过程中蛋白质组的变化，从蛋白种类和数量上的变化来阐述重编程过程。

研究人员收集了6个时间段的样品进行分析：蛋白收集，在多肽上加上稳定的同位素标记，然后利用高通量纳米液相色谱-串联质谱进行分析，由此发现重编程的第一天和倒数第三天出现了蛋白质组的一个两步复位过程，这些蛋白以一个高度协调的方式发生着变化，出现了几种生物学进程，比如电子传递链复合物的电化学变化，中间阶段囊泡的运输，还有最后阶段中的EMT样进程等。

这项研究以定量蛋白质组学为基础，进行了大规模（8000种蛋白），大范围（7个数量级）的分析，明确的指出了重编程过程是一种多步骤进程，目前大部分研究集中在起始阶段，而这项研究发现了前三天和后十二天的变化，解析了其中微妙的中间阶段，将进一步增强我们对细胞重编程机理的认识。

9.Dibetes：尿蛋白质组学可用于早期诊断糖尿病肾病
doi:10.2337/db12-0348

糖尿病肾病（DN）是一种逐渐进展的肾脏疾病，由长期高血糖引起的糖尿病的重要并发症。在西方国家，糖尿病肾病是透析的最常见原因。早期发现糖尿病肾病或许能运用药物进行干预治疗，从而延迟或避免使用肾脏替代治疗。为此，德国研究者Zürbig P进行了一项关于运用尿蛋白质组学诊断糖尿病肾病的研究（Urinary Proteomics for Early Diagnosis in Diabetic Nephropathy）。研究结论发表在Dibetes 2012年12月刊。Dibetes 影响因子为8.1。

该研究运用毛细血管耦合质谱仪(CE-MS)来分析尿中小分子量蛋白质组。共选用35例1型和2型糖尿病患者的尿标本进行研究，所有试验对象的尿标本以前均使用慢性肾功能不全的生物标记分类器作为诊断糖尿病肾病的标准。

研究发现，与把尿白蛋白作为诊断糖尿病肾病的标准相比较(AUC 0.67)，使用毛细血管耦合质谱仪(CE-MS)能在大量蛋白尿出现前5年就可检测出阳性结果(AUC 0.93)。统计分析后得出使用以前诊断慢性肾功能不全的生物标记分类器作为诊断糖尿病肾病的标准已经过时。白蛋白分泌增加之前，胶原蛋白片段已经开始减少。因此，胶原蛋白片段是发生大量蛋白尿3-5年前的主要标记物。

10.PLoS ONE：蛋白质组学研究的一种新的技术手段
doi:10.1371/journal.pone.0046530

岛津全球应用技术开发中心赵宁伟研究团队在蛋白质组学的研究上取得了新进展。他们描述了一种新的融合免疫沉淀，蛋白电泳，纳升液相和液质离子阱飞行时间质谱用于分析小鼠烧伤模型血清中β-Catenin protein complex的研究策略。结果发现了有显著差异表达的3种伴侣蛋白。实验证明免疫沉淀配合电泳一次分离和纳升液相二次分离的的检测方法可推广至更广泛的in vivo protein complex研究，且这种方法不仅有效地提高了蛋白质识别的灵敏度，也极大地增加了蛋白质序列覆盖率和Mascot的统计学得分，从而最大限度地降低了质谱应用在蛋白质组学研究上长期以来的诟病，即蛋白质识别的假阳性。

该项工作由赵宁伟研究团队，江苏省中医院药理系，南京大学医药生物技术国家重点实验室和温州医学院附属第一医院合作研究完成，已经被在线发表于国际生物医学综合类知名期刊 PLoS ONE ，此项成果作为蛋白质组学研究的一种新的技术手段，在生物标志物的发现、细胞信号转导等领域将有着广阔的应用前景。

11.MCP：鉴定出小鼠胚胎成纤维细胞和人胚胎干细胞的分泌蛋白质组
doi:10.1074/mcp.M112.020503

来自美国北卡罗来纳州立大学的研究人员开发出一种新技术来鉴定细胞分泌的蛋白。这种新方法应当有助于研究人员在细胞生物学上收集精确的数据。

在这项新研究中，研究人员开发出的这种新方法是基于一个事实：每个细胞利用它的分泌途径来包裹它的蛋白。每个细胞合成蛋白，然后通过这种途径运输它：将它包裹在袋状的膜中，最终将它运输到胞外。

在这种新技术中，研究人员采集细胞样品，分离出分泌途径中含有蛋白的细胞器。他们然后利用质谱分析这些细胞器中的物质以便观察细胞正在分泌哪些蛋白。利用这种方法，他们能够鉴定出小鼠胚胎成纤维细胞和人胚胎干细胞分泌的蛋白。

12.MCP：开发出检测细菌蛋白质分泌的蛋白质组学技术
doi:10.1074/mcp.M112.017533

近日，来自圣母大学艾克研究所的研究者开发出了一种新型方法可以直接检测细菌分泌蛋白，这或许为治疗包括肺结核在内的许多疾病提供了新的思路和方法。相关研究成果刊登在了国际杂志Molecular and Cellular Proteomics上。

研究者Champions指出，细菌可以使用多种分泌系统来通过细胞膜转运蛋白质，从而于外界环境进行相互作用。对于引发肺结核的致病菌结合分歧杆菌来讲，这些系统可以转运蛋白质来促进细菌于宿主细胞的反应，从而引发机体产生毒性表现。

研究者使用MALDI-TOF质谱仪，对细菌蛋白质组学进行了特异性修饰，使得科学家用激光电离蛋白质从而达到检测细菌蛋白质的目的。这种新型方法可以用于特异性地监控蛋白质分泌的特殊形式，比如检测结合分歧杆菌或者金黄色葡萄球菌主要的毒力决定蛋白质。

相关会议推荐

参会和媒体合作：

朱赛博

E-mail： saibo.zhu@medsci.cn

M t ：150 2126 9895(手机号） 183 5368 9926（微信号）

赞助和大会咨询：

彭平

E-mail： ping.peng@bioon.com

M t ：13262613017

点击【阅读原文】了解会议详情与报名！

大家在看

什么是五胜肽四胜肽三胜肽(康婷人不知道的秘密) 2023-05-10 14:56:27
小分子胜肽的生理功能让蛋白质望尘莫及 2023-05-10 14:56:27
珊瑚的7天拯救日记 2023-05-18 23:00:13
杜马斯燃烧法测食品和农产品中的氮/蛋白质含量 2023-05-18 23:00:13
蛋白质:为什么是必须品? 2023-05-18 23:00:13
免疫法与转铁蛋白检测法联合检测提高粪便潜血阳性检出率 2023-05-18 23:00:13
饲料和饲料原料中粗蛋白含量测定的影响因素分析 2023-05-18 23:00:13
高通量检测单细胞中RNA和蛋白质的新方法 2023-05-18 23:00:13
Luis Gonzalez的珊瑚缸 2023-05-18 23:00:13
第十期:循环水养虾模式 2023-05-18 23:00:13