European Radiology:肺间质性疾病的定量CT和机器学习分类
时间:2022-10-26 14:59:36 热度:37.1℃ 作者:网络
间质性肺病(ILD)包括200多种不同的慢性疾病,常导致肺纤维化。肺纤维化的三个主要病理模式是普通间质性肺炎(UIP)、非特异性间质性肺炎(NSIP)和以气道为中心的纤维化,相应的影像学模式分别是UIP、NSIP和慢性超敏性肺炎(CHP)。鉴于临床、组织病理学和影像学表现的重叠,即使对专家来说,区分这三个分类也是一种挑战。
现阶段,机器学习(ML)在医学成像任务中取得了很高的性能。用于ILD量化的传统ML算法是计算机辅助肺部信息学的病理评估和评级(CALIPER),其利用特征工程从放射医师标记的数据中提取计算机断层扫描(CT)特征来量化CT模式。卷积神经网络是ML的一个子类,其判别特征是从训练数据中进行学习,没有预定的特征。除了上述限制,到目前为止,CALIPER只被用来量化CT图像特征,而不对ILD进行分类。
近日,发表在European Radiology杂志的一项研究将CALIPER衍生的CT定量数据与临床数据合成构建了一个ML模型,并评估了此类模型以及单个CALIPER特征在UIP、NSIP和CHP组织病理学分类中的诊断性能,为实现临床对ILD不同病理分型的快速识别及诊断提供了技术支持及参考依据。
本研究回顾性地纳入了1085名经病理学证实的普通间质性肺炎(UIP)、非特异性间质性肺炎(NSIP)和慢性超敏性肺炎(CHP)的患者,每位患者均接受了活检前的胸部CT扫描。使用Kruskal-Wallis检验评估了QCT特征与每种ILD的关联。QCT特征、患者人口统计学和肺功能测试(PFT)结果训练了eXtreme Gradient Boosting(训练/验证集n = 911),产生3个模型。M1=只有QCT特征;M2=M1加上年龄和性别;M3=M2加上PFT结果,同时建立了一个DL模型。对多类(UIP与NSIP与CHP)和二类(UIP与非UIP)分类性能,比较了ML和DL模型的受试者工作特性曲线下的面积(AUC)和95%置信区间(CIs)。
大多数(69/78[88%])的QCT特征成功地区分了3种ILD(调整后的P≤0.05)。所有的QCT-ML模型都取得了比DL模型更高的AUC(M1、M2、M3和DL的多类AUC微观平均值为0.910、0.910、0.925和0.798,宏观平均值为0.895、0.893、0.925和0.779;M1、M2、M3和DL的二元AUC分别为0.880、0.899、0.898和0.869)。与M2相比,M3在多类预测方面表现出明显的性能优势(∆AUC:0.015,CI:[0.002, 0.029])。
表 XGBoost(M1-M3)和深度学习(DL)模型之间的多类分类(CHP vs. NSIP vs. UIP)性能差异。模型1(M1):只有CALIPER特征的XGBoost模型;模型2(M2):M1带有年龄和性别;模型3(M3):M2带有肺功能测试结果。阴影单元格内的粗体值具有统计学意义,置信区间不超过0
本研究表明,CALIPER的定量特征与UIP、NSIP和CHP的病理诊断明显相关。本研究基于CALIPER的ML模型在对UIP、NSIP和CHP进行分类时表现出很高的诊断性能。
原文出处:
Chi Wan Koo,James M Williams,Grace Liu,et al.Quantitative CT and machine learning classification of fibrotic interstitial lung diseases.DOI:10.1007/s00330-022-08875-4