AJRCCE:用于检测早期肺癌的多维无细胞DNA碎片学分析
时间:2023-06-20 10:53:40 热度:37.1℃ 作者:网络
肺癌是世界上第二大常见癌症,也是癌症相关死亡的主要原因。在早期局部和晚期诊断的肺癌患者的存活率差异很大,这凸显了早期诊断对预后的重要性。不幸的是,只有约16%的患者在局部阶段接受诊断。虽然放射学方法,如低剂量计算机断层扫描测试,可以减少20%的癌症相关死亡,但由于高假阳性率、辐射诱发的癌症风险和货币成本,它们的使用受到限制。需要开发一种可靠的非侵入性方法,以准确和具有成本效益的方式检测早期肺癌。
基于液体活检的无细胞DNA(cfDNA)分析最近为疾病检测开辟了一条新途径。在凋亡和坏死期间,DNA片段被释放到循环中,形成cfDNA。它们携带来自细胞和起源组织的遗传和表观遗传信息。具体来说,cfDNA的一部分,即循环肿瘤DNA(ctDNA),代表从肿瘤细胞脱落的DNA。可以检测到肿瘤体细胞突变来区分ctDNA和非肿瘤cfDNA,但ctDNA突变调用策略的性能对早期肺癌的敏感性低至40%。
表观遗传修饰,如DNA甲基化和ctDNA碎片特征,包括碎片大小,已经显示出诊断潜力。然而,现有的甲基化或基于碎片大小特征的I期肺癌方法的敏感性不足以用于临床使用,从约25%-60%。cfDNA切割部位基序的轮廓代表了肿瘤学中液体活检的另一种生物标志物。最近,研究人员揭示了肝细胞癌患者与肿瘤相关的cfDNA首选末端坐标,在特异性>90%的情况下,敏感性>80%。cfDNA末端基序的效用,特别是对肺癌的效用,仍有待验证。
最近的研究表明,在多维度中纳入大量功能可以提高机器学习模型在早期癌症检测方面的辨别能力。例如,一项结合cfDNA甲基化、碎裂、末端基序和核小体足迹模式的概念验证研究在95-98%的特异性下达到了约95%的肝细胞癌预测敏感性,基于单个特征优于模型。将临床风险因素、蛋白质生物标志物浓度、成像分析等与cfDNA片段大小相结合,可以进一步提高预测能力。然而,可以想象,检测的复杂性可能会增加货币成本。
此外,该模型对疾病的预测能力因机器学习分类算法的选择而异。利用机器学习的力量,研究人员使用堆叠集成方法仅从全基因组测序(WGS)中整合cfDNA基因组特征,并为早期结直肠腺癌检测创建了一个高度敏感的模型。这种方法的有效性将在肺癌的背景下进行探索。
2023年5月1日发表在AMERICAN JOURNAL OF RESPIRATORY AND CRITICAL CARE MEDICINE的文章,建立了一个多维堆叠集合模型,用于对早期非小细胞肺癌(NSCLC)进行健壮检测。该模型从综合表征中集成了五个cfDNA碎片特征和五个机器学习基础模型,并使用WGS数据达到了卓越的检测能力。
这项研究包括350名没有癌症的参与者和432名癌症患者。通过全基因组测序对参与者的血浆cfDNA样本进行了剖析。在训练队列中比较了多个cfDNA特征和机器学习模型,以实现最佳模型。在三个验证队列中评估了模型性能。研究人员证明,预测模型对检测早期非小细胞肺癌病理特征非常敏感。在低测序深度低至0.5倍时,其性能的一致性对于负担得起的肺癌早期筛查特别理想。
验证队列中的模型插图和诊断性能评估
一个堆叠的集合模型集成了训练队列中构建的五个cfDNA特征和五个机器学习算法(癌症:113;健康:113)的表现优于所有基于单个特征-算法组合的模型。该综合模型在队列验证I(曲线下的面积[AUC],0.984)的95.7%特异性下产生了91.4%的优异性,在验证II(AUC,0.987)的99.2%的特异性下分别为84.7%(AUC,0.987)在94.2%的额外验证特异性下产生了92.5%(AUC,0.974)。当测序深度降至0.5×(AUC,0.966–0.971)时,该模型的高性能保持一致。此外,模型对识别早期病理特征很敏感(第一阶段的敏感性为83.2%,0.66截止时<1厘米肿瘤的敏感性为85.0%)。
在这项研究中,研究人员旨在改善肺癌的早期检测,并建立了一个集式机器学习模型,该模型集成了多个cfDNA片段组学特征,以在区分早期非小细胞肺癌受试者和无癌症受试者中实现高灵敏度。这项研究有几个局限性。该模型是建立在中国人口中早期非小细胞肺癌患者之上的。NSCLC约占所有肺癌的85%,这项研究不包括小细胞肺癌样本。
在这项研究中,研究人员展示了cfDNA碎片组学在高灵敏度肺癌检测中的应用,但该领域的潜在机制仍未确定。目前正在进行全面调查,以选择变量并探索新功能,以利用我们的模型。此外,研究规模相对较小,因此几个小亚群的敏感性,如SCC患者,以及低分化和高分化肿瘤,可能会被低估或高估。研究人员正在扩大研究的规模和多样性,以实现更巩固的结论。
此外,研究人员试图通过直接使用ctDNA分数低的真实患者血液样本来确定癌症检测模型的极限。这种分析证实了用VAF 0.05%检测样品,这是当前技术可靠ctDNA分数检测的最低限。除此之外,使用标准分析有效性将有助于准确确定检测的检测极限。然而,现有的商业cfDNA参考标准是人工准备的,基于基因组变异的参考。还有来自混合人类细胞系的参考资料,这些细胞系被人工碎片化,类似于人类血浆cfDNA,但导致碎片大小和末端基序与真正的人类血浆cfDNA不同。因此,这些标准不适合代表真正的人类血液cfDNA和评估堆叠合体多维片段模型。
综上所述,本文章建立了一个堆叠集合模型,集成了血浆cfDNA WGS数据的五个片段特征。模型在区分早期非小细胞肺癌患者和无癌症对照受试者方面表现出很高的敏感性。此外,研究人员通过测试其在不同WGS覆盖深度的性能,证明了该检测的一致性和鲁棒性。加上其对非小细胞肺癌患者早期小规模肿瘤的卓越检测能力,本文的多维模型为促进非小细胞肺癌的早期检测和改善患者预后提供了一种准确且负担得起的方法。
原文出处
Wang, S.; Meng, F.; Li, M.; Bao, H.; Chen, X.; Zhu, M.; Liu, R.; Xu, X.; Yang, S.; Wu, X.; Shao, Y.; Xu, L.; Yin, R., Multidimensional Cell-Free DNA Fragmentomic Assay for Detection of Early-Stage Lung Cancer. American Journal of Respiratory and Critical Care Medicine 2022, 207 (9), 1203-1213.