通过血液检测的多重分析实现可手术癌症的发现与定位

2023-05-10 14:56:27

 

Joshua D. Cohen等在2018年二月的Science 发表了一篇文章【Detection and localization of surgically resectable cancers with a multi-analyte blood test】作者通过此文描述了一种通过评估循环蛋白水平和游离DNA突变水平来发现8种常见癌症的血液检测方法。作者利用这项名为“Cancer SEEK”的检测对1005名无远处转移,临床发现患有卵巢、肝脏、胃、胰腺、食管、结直肠、肺或乳腺癌症的患者进行了试验。这八种类型癌症患者中Cancer SEEK检测阳性率中位数为70%。该检测敏感度在对中危风险人群尚无有效筛查手段的5种癌症(卵巢、肝脏、胃、胰腺和食管)中在69%98%范围。其特异度>99%:在812名健康对照人群中有7人发现阳性得分。此外,对于中位83%的患者,Cancer SEEK可以将肿瘤发生的解剖位置范围缩小。


大部分局灶性癌症可通过手术治愈,而无需全身治疗1。然而,一旦出现了远处转移,仅凭手术切除是难以治愈癌症的。因此癌症研究的一项主要目标就是在癌症发生远处转移前便发现癌变灶。对于许多成年人常见癌症,其从初期成瘤进展为晚期往往需要2030年的时间2-4。在这漫长的过程中肿瘤细胞似乎仅仅在最后的几年才会成功种植并形成远处转移灶2-5。因此,在肿瘤出现转移之前留给了作者很长的窗口期来发现癌症。甚至当肿瘤刚刚发生影像学检查无法发现的转移时,超过50%的病例仍可以通过全身治疗而治愈,如细胞毒药物和免疫治疗6-9。然而,一旦大的转移性肿瘤形成,现有的治疗方式便力不从心了6-9

目前唯一广泛应用的癌症早筛血液检测是基于前列腺特异性抗原(PSA)的评估,而如何恰当使用该检测始终存在争议10。已批准的可用于癌症早筛的检测并不是以血液学检测为基础的,其包括结肠镜检查、乳腺癌钼靶和宫颈细胞学检查。应用于癌症的新型血液学检测必须具有很高的特异性;否则,将会有过多的健康人群出现假阴性结果,从而导致不必要的随访,增加受试人的焦虑。可发现体细胞突变的血液学检测(“液体活检”)具有极高的特异性,这是由于其以检测理论上只存在于异常突变细胞(如癌症)的驱动基因突变为基础11-18。到目前为止,接受基于突变检测的液体活检的癌症患者绝大多数处于病程晚期。此外,尚无研究对健康对照人群进行大规模的上述检测,而这对于评价检测特异度又是至关重要的19。检测敏感度也是液体活检的一个关键点。现有证据表明,早期癌症患者血浆中印记分子含量小于1/ml11,20,对于先前报道的那些同时检测多种突变的技术来说,检测如此量的突变往往超出了其能力范围19,21。液体活检的另一项关键点是鉴定组织来源。同样的基因突变可诱发多种肿瘤,因此仅凭体液活检基因组分析仍无法精准定位原发肿瘤的解剖位置。

作者在此描述了一种新型的血液检测方式,名为CancerSEEK,这项检测可以兼顾上述液体活检的关键点。该检测应用了基因变异和蛋白标志物联合检测方法,不仅仅能发现相对早期的癌症,还可以定位癌症的原发部位。

初步研究证实血浆DNA检测(“液体活检”)最大灵敏度受局部癌症影响11。进一步研究发现4种蛋白标志物与1种基因标记联合检测(KRAS)可增强胰腺癌早筛灵敏度20。作者试图以此方式探索出一种通过评估一组在多种实体肿瘤转移前可以检测到的蛋白和基因标记水平的筛查方式。作者首先设计了一个PCR为基础的试验以同时评估不同类型癌症驱动基因的多个常见突变区域。在设计此试验的过程中,作者面临着很多挑战。首先,这项试验需要获取足够的试验基础以适合发现多种癌症的需要。再次,所查询到的结果必须经过数千次测序以发现罕见突变11,19,21,22。第三,查询到的结果必须是有限数目的,因为所获得的越多,出现人造突变的可能就越大,这就会导致信噪比降低。第四,作为一项将来用于癌症筛查的检测,该检测必须具有高性价比且经得起高通量考验,并受到可完成测序数限制。为了克服这些困难,作者开始寻找最小数目的短扩增子以便于作者筛查出纳入研究的8种肿瘤各至少一个驱动基因突变。通过分析公开可用的测序数据,作者发现了所需扩增子数目和筛查敏感度的幂率关系,即在60个扩增子时达到稳定(图1)。一旦达到这种稳定状态,增加扩增子数目便无法发现更多的肿瘤反而会出现假阴性结果增加的可能性。这种出现效力下降的边际效益确定了扩增子检测的最佳数量。

基于这些数据,作者设计了一个61-扩增子板,在16个基因(表1S)中每个基因中每个扩增子平均有33个碱基对。如图1所示,该板理论上可筛查出OSMIC数据库中41%(肝)至95%(胰腺)的癌症23。而实践当中,该扩增子板表现更佳,其在82%的病例(纳入研究的805例癌症患者)中发现了至少1种突变,47%病例中发现了2种突变,8%病例中发现了2种以上突变(图1,彩色点;图S1;表S2)。作者采用的PCR为主的测序分析在发现突变方面相比传统的基因组测序更加敏感,因此作者发现肿瘤的概率大大高于通过COSMIC数据库预测值。基于这项原发肿瘤DNA分析,作者此项研究ctDNA的预期最高筛查率在肝癌的60%至卵巢癌的100%范围(图1)。

利用这小而强的扩增子板,作者探索了两种途径来发现血浆中预期的ctDNA罕见突变。首先,作者采用多重PCR的方法使用DNA条码以直接并独特地标记每个原始印迹分子。这种设计将大规模平行测序固有误差降至最低24并能将血浆中稀少的游离DNA充分利用。此外,作者将血浆中DNA等分为多片段,然后在每个复制子中进行独立分析。实际上,这样可以减少每个加样孔的DNA分子数目;同时也可以增加每个加样孔出现突变分子的概率,使突变更容易被发现。由于筛查敏感性常常受制于每个复制子突变等位基因的出现概率,这种划分策略使作者增加了信噪比,同时如果所有血浆DNA可以同时进行评估,作者将能更容易发现罕见突变。

CancerSEEK的第二部分基于蛋白质生物标志物。以前的研究已经证明,即使使用极其敏感的技术来鉴定,大部分早期肿瘤也不能释放出可检测量的ctDNA。许多蛋白质可能用于癌症的早期检测和诊断已经在文献中描述。作者搜索了这篇文献,找到之前已被证明可以检测出上述8种癌症类型中至少一种的蛋白质,其敏感性> 10%,特异性> 99%。作者鉴定了41种潜在的蛋白质生物标志物,并对来自正常人和癌症患者的血浆样品进行了初步研究。作者发现可以通过单一免疫测定平台重复评估这些蛋白质中的39种,然后作者使用该平台测定所有血浆样品。39种蛋白质中有8种被证明对鉴别癌症患者和健康对照者特别有用。

然后,作者使用CancerSEEK研究了1,005位被诊断患有卵巢癌,肝癌,胃癌,胰腺癌,食管癌,结直肠癌,肺癌或乳腺癌的IIII期癌症的患者。在采集血样之前,这些患者均未接受新辅助化疗,并且在进入研究时没有明显的远处转移。诊断的中位年龄为64岁(2293岁)。选择这8种癌症类型是因为它们在西方人群中很常见,并且因为这些癌症类型尚无广泛应用于临床的、基于血样的早期筛查手段。表S4总结了患者的组织病理学和临床特征。介绍中最常见的阶段是美国癌症联合委员会(AJCCII期,占患者中的49%,其余患者包括I期(20%)和III期(31%)。表S11总结了8种肿瘤类型每个阶段的样本数量。健康对照队列由812名中位年龄为55岁(范围1788)的个体组成,其没有已知的癌症病史、高度发育不良、自身免疫性疾病或慢性肾病。

CancerSEEK评估了8种蛋白质的水平和2,001个基因组位置中存在的突变; 每个基因组位置可以以几种方式突变(单个碱基取代、插入或缺失)。检测基因中突变的存在或任何蛋白质水平的升高都将会将患者归类为阳性。因此,必须采用严格的统计方法来确保测试的准确性。作者使用对数比来评估突变,并将它们纳入逻辑回归算法,该算法考虑到突变数据和蛋白质生物标志物水平以对CancerSEEK测试结果(补充材料)进行评分。平均敏感性和特异性由10次交叉验证的10次迭代确定。在一个代表性迭代中,整个癌症患者和对照组队列的受试者工作特征(ROC)曲线显示在图2A中。

在所评估的8种癌症类型中,CancerSEEK的中位敏感性为70%(P <10-96单侧二项试验),在卵巢癌中为98%,乳腺癌中为33%(图2C)。在此敏感度下,特异性> 99; 即没有已知癌症的812名健康个体中只有7个得分为阳性。作者不能确定在健康队列中发现的少数“假阳性”个体确实未罹患癌症,但将它们归类为假阳性提供了对数据进行分类和解释的最保守的方法。

该算法最重要的测试特征是存在ctDNA突变,其次是CA-125CEACA19-9PRLHGF(肝细胞生长因子),OPN(骨桥蛋白),MPO(髓过氧化物酶)和TIMP-1(金属蛋白酶1)蛋白水平的组织抑制剂(表S9)。CancerSEEK中使用的每种ctDNA和蛋白质特征的瀑布图显示了它们在患有和不患有癌症的个体中的分布(图S2)。表S9显示了CancerSEEK中所使用的ctDNA和蛋白质特征的重要性等级排列,而图S3所示的主成分分析则显示了有无癌症的个体的聚类。表S5S6中提供了完整的数据集,包括研究的血浆样品中所有蛋白质水平和所鉴别的DNA突变。从图S4可以看出,这里用来称取样本正数的方法的概率性而不是确定性性质; 各图代表了当一个特定要素从分析中排除时CancerSEEK的灵敏度表现。

筛查试验最重要的特征之一是能够在早期发现癌症。CancerSEEK在最常见肿瘤分期(II期)的中位敏感性为73%,III期癌症相似(78%),而I期癌症的敏感性下降(43%)(图2B)。在对于早期癌症(I期)的敏感性中,肝癌(100%)是最高的,食管癌(20%)是最低的。

液体活检的原理是血浆中的突变DNA模板来源于死亡的癌细胞,因此可用作肿瘤形成的精确特异性标记。为了调查CancerSEEK是否符合这一预期,作者评估了153位患者的肿瘤组织,这些患者ctDNA可以在有统计学意义水平(补充材料)中检测并且可以获得原发性肿瘤。作者发现在这153例患者中有138例(90%)血浆中DNA突变与其原发肿瘤中发现的突变相同(表S7)。在所有8种癌症类型中,血浆和原发肿瘤的DNA突变都具有明确的一致性,在卵巢癌和胰腺癌中为100%,在胃癌中为82%。

液体活检的局限性之一在于它们无法确定检测阳性的患者的癌症类型,这给临床随访带来了挑战。为了检查CancerSEEK测试是否可以帮助识别癌症组织的来源,作者使用有监督的机器学习来预测CancerSEEK阳性患者的潜在癌症类型。输入算法考虑了ctDNA和蛋白质生物标志物水平以及患者的性别(补充材料)。预测的主要目的之一是确定在癌症诊断或癌症监测后最恰当的后续检测手段。因此,作者将食管癌和胃癌患者作为一组,因为内窥镜检查是这两种情况下的最佳后续检查。然后作者使用这个算法(补充材料)来研究在CancerSEEK测试中得分为阳性的626个癌症患者。在没有任何有关患者的临床信息的情况下,作者能够在中位数值为83%患者中将癌症的来源定位于两个解剖部位(图3,表S8; P <10-77单侧二项试验)。此外,作者能够中位数值为63%患者中将癌症的来源定位于单个器官(图3,表S8; P <10-47单侧二项试验)。鉴于基因的驱动突变通常没有组织特异性,绝大多数的定位信息其实来源于蛋白质标记。预测的准确性因肿瘤类型而异;其中结直肠癌最高,肺癌最低(图3和表S10)。

总之,作者设计了一种可以检测八种常见实体瘤类型的多分析物血液检测方法。将完全不同的介质与不同的作用机制相结合的优势在治疗学方面已经得到了广泛认可(28-30),但尚未常规应用于临床诊断。作者将蛋白质生物标志物与遗传学生物标志物结合起来,在提高灵敏度的同时,保证了特异性不会出现显著下降。其他癌症生物标志物,如代谢产物,mRNA转录物,miRNA或甲基化DNA序列可以类似地组合以提高癌症位点定位的敏感性。这种多分析物测试并不着取代其他非血液类的筛查测试,如乳腺癌或结肠直肠癌的筛查测试,而是从另一角度帮助识别最可能患有恶性肿瘤的患者。

作者的研究存在如下的局限性。第一,作者研究中的患者队列由患有已知癌症的个体组成,大多数是基于疾病症状诊断的。这些患者在研究入组时没有临床上明显的肿瘤转移,但真正筛查环境中的大多数患者的疾病进展较晚,且检测的敏感性可能低于此处报道的敏感性。第二,作者的对照仅限于健康个体,而在真正的癌症筛查环境中,一些个体可能患有炎性疾病或其他疾病,可能导致假阳性结果的比例高于作者的研究中观察到的结果。第三,尽管多重交叉验证是一项有效的且广泛使用的技术,可以用于证明本研究规模队列的敏感性和特异性,但作者无法使用完全独立的一组案例进行测试,。第四,作者的队列中每种类型的癌症的比例都是有目的的,并不代表美国整体人群的癌症比例,因为作者想要利用现有资源评估每种癌症类型至少50例。当对美国的实际发病率加权时,作者估计CancerSEEK在所有八种癌症类型中的敏感性为55%。重要的是,这种加权不会影响CancerSEEK5种癌症类型(卵巢、肝脏、胃、胰腺和食道)的高敏感性(69%98%),因为这些癌症没有针对平均风险个体的筛查测试。

作者的研究为许多类型的癌症的多分析物血液检测奠定了概念和实践基础。作者估计这项测试的费用将少于500美元,这比某些仅针对单一类型的癌症的筛查测试(比如结肠镜检查)费用要低得多。本文研究的8种癌症类型在201736(60%),这些癌症的早期发现可以有效地减少患者的死亡。为了真正保证CancerSEEK的临床实用性并证明其可以拯救生命,作者还需要对大量人群进行所有癌症类型的前瞻性研究。

 


1.基于PCR测定血浆样品中肿瘤特异性突变的研究。彩色曲线表明在本研究中评估的八种类型的癌症的比例可以用数量增多的短(<40bp)扩增子进行检测。检测的灵敏度随着扩增子数量的增加而增加,但是在60个扩增子达到稳定水平。彩色圆点表示在本研究评估的805例癌症中使用的61-扩增子面板检测到的癌症部分,平均值为82%(见正文)。公开可用的测序数据获自癌症体细胞突变目录(COSMIC)库。


2. CancerSEEK的性能。ACancerSEEK的受试者工作特征(ROC)曲线。曲线上的红点表示测试的特异性> 99%时的平均表现(62%)。误差线表示敏感性和特异性在这个特定点的95%置信区间。如正文中所述,评估的8种癌症类型中位数表现为70%。(BCancerSEEK对不同肿瘤分期的敏感性。柱形图代表八种癌症类型的中位敏感度,误差线代表中位数的标准误差。(CCancerSEEK对不同肿瘤类型的敏感性。误差线代表95%的置信区间。


3.通过监督学习识别CancerSEEK分类为阳性的患者的癌症类型。百分比对应于两种最可能类型之一(浅和深蓝条之和)或最可能类型(浅蓝条)分类正确的患者比例。S8中提供了所有癌症类型的所有患者的预测。误差线代表95%的置信区间。

 

 


友情链接

Copyright © 2023 All Rights Reserved 版权所有 福建水产设备联盟