基于AI 机器学习的影像组学模型研究
2019年12月以来,由SARS-CoV-2病毒感染导致的新型冠状病毒疾病(COVID-19)在全球开始蔓延。报道显示,SARS-CoV-2感染患者的中位住院时间为10天,而武汉患者在发病10天后症状有可能加重。因此,住院时间是COVID-19临床预后的重要指标之一。 目前,CT影像学已成为COVID-19肺炎的诊断和监测工具,主要表现为磨玻璃影、实变及混合密度影。然而,现阶段的影像学研究主要集中于对病灶的定性和半定量描述,缺乏对病灶的全定量分析。因此,基于前期提出的CT定量监测COVID-19肺炎病程,团队假设在CT病灶背后的高通量影像特征“隐藏”了患者预后转归的“秘密”。 本研究纳入了兰州、安康、丽水、镇江、临夏5家新冠肺炎定点医院,自2020年1月23日到2月8日期间住院患者的临床资料和首次CT资料,所有患者经RT-PCR证实SARS-CoV-2病毒感染。至2月20日,研究共纳入31例治愈出院的患者(排除14例未出院患者和7例首次CT检查无肺炎表现患者),并将10天作为住院时长的二分类阈值。基于有限的样本量,团队将4个中心作为训练队列,另外一个中心作为验证队列。通过自动分割肺叶和半自动分割病灶,31名患者中累计分割出72个病灶。在对病灶图像预处理后,提取影像组学特征并筛选。为了研究影像组学特征的稳定性,团队使用了Logistics回归模型和随机森林模型对筛选的特征分别进行建模和验证。结果发现,6个筛选出的二阶特征在两种不同分类器中均表现出良好的预测价值。在外部测试队列中,Logistics回归模型的AUC为0·97(95%CI 0·83-1·0), 敏感性 1·0, 特异性0·89;随机森林模型的AUC为0·92 (95%CI 0·67-1·0),敏感性 0·75, 特异性1·0。随后,研究又纳入了2月20日-28日新出院的6名患者,利用已建立的影像组学模型可以正确预测所有6名患者的住院时间。
东南大学
2021-04-10