“现阶段医生需要在大量影像数据中快速诊断出新冠肺炎的病例,此外还需要诊断出病灶分布的位置、大小等来评估严重程度。”薛向阳介绍,针对临床的现实需求,团队将设计目标定位于“肺炎分类鉴别”和“关键病灶检测”两大功能,前者是为区别健康状态、新冠肺炎、其他病毒性肺炎、细菌性肺炎,后者则为找到并分隔出磨玻璃影等病灶区域。
针对这些需求,团队设计诊断算法模型,让机器利用模型进行训练,学习不同类型肺炎在CT影像表现上的不同特征,最终具备智能辅助诊断的能力。而这需要突破小样本学习、小目标检测等多个技术难题。
“小样本学习”即在较少训练数据样本的条件下进行机器学习。在疫情发生前期,能够获取的新冠肺炎影像数据相对较少,且由于一线影像医生任务繁重,无法获得大量专家标注,因此需要算法在少量样本的条件下“自学成才”。
为此,团队采用基于自迁移学习的半监督学习等技巧,使算法具备一定的“小样本学习”能力,在不增加医生标注工作量的情况下较好地提高了算法模型的普适性。
由于CT影像切片中的病灶区域有大有小,且往往大中小病灶区域面积悬殊,如何使算法能同时检测大、中、小各个目标是另一大难题。
团队利用神经网络的层次性特点与病灶区域的大小进行对应,“网络的底层关注细节,即小病灶区域,而网络中层到高层所关注的病灶区域则越来越大,因此模型通过不同层次的加权和融合,最终便能达到同时检测大小病灶区域的目标。”薛向阳解释道。
“不过,即便有诊断‘神器’,影像科医生也是不可替代的。”薛向阳说,人是复杂的机体,病毒在不同人体内感染的反映也不一定相同。”他表示,当遇到机器未曾学习过的微小病变或疑难病例时,仍需要影像医生的经验和智慧。
以解决实际问题为目标,该项目在研究过程中始终与临床应用紧密结合。无论是机器学习数据,还是测试评估数据,都来源于临床真实病例。在算法模型定型过程中,为了检验模型的准确率和泛化性,团队也利用现实疑似病例进行了测试。
扫码关注,查看更多科技成果