新冠肺炎影像学AI智能辅助诊断研究

“现阶段医生需要在大量影像数据中快速诊断出新冠肺炎的病例，此外还需要诊断出病灶分布的位置、大小等来评估严重程度。”薛向阳介绍，针对临床的现实需求，团队将设计目标定位于“肺炎分类鉴别”和“关键病灶检测”两大功能，前者是为区别健康状态、新冠肺炎、其他病毒性肺炎、细菌性肺炎，后者则为找到并分隔出磨玻璃影等病灶区域。

针对这些需求，团队设计诊断算法模型，让机器利用模型进行训练，学习不同类型肺炎在CT影像表现上的不同特征，最终具备智能辅助诊断的能力。而这需要突破小样本学习、小目标检测等多个技术难题。

“小样本学习”即在较少训练数据样本的条件下进行机器学习。在疫情发生前期，能够获取的新冠肺炎影像数据相对较少，且由于一线影像医生任务繁重，无法获得大量专家标注，因此需要算法在少量样本的条件下“自学成才”。

为此，团队采用基于自迁移学习的半监督学习等技巧，使算法具备一定的“小样本学习”能力，在不增加医生标注工作量的情况下较好地提高了算法模型的普适性。

由于CT影像切片中的病灶区域有大有小，且往往大中小病灶区域面积悬殊，如何使算法能同时检测大、中、小各个目标是另一大难题。

团队利用神经网络的层次性特点与病灶区域的大小进行对应，“网络的底层关注细节，即小病灶区域，而网络中层到高层所关注的病灶区域则越来越大，因此模型通过不同层次的加权和融合，最终便能达到同时检测大小病灶区域的目标。”薛向阳解释道。

“不过，即便有诊断‘神器’，影像科医生也是不可替代的。”薛向阳说，人是复杂的机体，病毒在不同人体内感染的反映也不一定相同。”他表示，当遇到机器未曾学习过的微小病变或疑难病例时，仍需要影像医生的经验和智慧。

以解决实际问题为目标，该项目在研究过程中始终与临床应用紧密结合。无论是机器学习数据，还是测试评估数据，都来源于临床真实病例。在算法模型定型过程中，为了检验模型的准确率和泛化性，团队也利用现实疑似病例进行了测试。