基于医保系统大数据构建“癌症发病监测”模型
癌症是全球第二大死因,对人类的健康构成严重威胁。我国人口基数庞大,老龄化进程不断加快,癌症防控工作也面临巨大挑战。准确、实时的恶性肿瘤发病数据可为防控相关的政策制定、资源配置和科技项目实施与效果评估等提供重要依据。肿瘤发病数据的获得主要通过“肿瘤登记”实现,其中最理想的模式为“基于人群的肿瘤登记体系(Population-based Cancer Registry,PBCR)”。我国现行的肿瘤登记工作可追溯到上世纪50年代末60年代初。历经几十年发展,“从无到有”、“从弱到强”,为相关工作的开展提供了关键的基础数据。然而,受限于“基于监测哨点开展、定点医院人工填报”的主要形式,目前我国肿瘤发病登记工作的发展遇到挑战。其中主要包括:肿瘤登记点数量不足和分布不均衡;肿瘤登记数据深度和广度不足;很难在现有模式下建立真正覆盖全人群的肿瘤监测系统。同时,对上报数据的采集、补充、质控需要较长周期,导致我国肿瘤发病年报通常会滞后3年发布。河南省滑县与广东省汕头市合计在籍人口约700万人。近十年以来,各项医保系统的总参保比例分别稳定在99%及90%以上。两地区过去一直被认为是食管癌高发区,但目前尚无国家肿瘤登记系统覆盖,因此实际的癌症负担及食管癌发病水平仍不明确,无法有针对性地制定并实施肿瘤防控计划。过去十余年,柯杨教授课题组在我国太行山食管癌高发区开展了多项大规模前瞻性人群研究。在长期的队列随访工作中,课题组探索出利用“医保报销数据”追踪肿瘤新发病例的工作模式。经比较性研究评估,该模式对新发癌症病例捕捉的灵敏度高达96%,特异度接近100%[4]。在此基础上,该团队进一步与河南省滑县和广东省汕头市政府有关部门与医疗机构建立深度合作,在高度重视数据安全与隐私保护的基础上,创新性地基于医保系统的医疗费用报销与疾病诊断数据,建立了一套标准化的数据清理流程和质控标准,研发了医保系统数据挖掘的相关算法(已申报相关发明专利),实证性构建了南、北方两个试点地区的肿瘤发病监测系统。对当地全瘤种的癌症发病数据及其流行分布特征、时间趋势等进行了深入分析与报告,为两地区明确癌症疾病谱特征及相关负担、有针对性地建立并完善癌症防控工作策略提供了详实的数据。2012-2018年河南省滑县与广东省汕头市参保全人群的年龄分布 (高参保率及稳定、详实的人口分布数据使MIS-CASS实现“全人群覆盖”)2018年河南省滑县与广东省汕头市男、女性主要恶性肿瘤发病例数及发病率 (医保数据的“实时性”与“高质量”使MIS-CASS的发病数据报告延迟缩短至6个月)2014-2018年河南省滑县与广东省汕头市男、女性主要瘤种发病率变化趋势 (MIS-CASS敏锐地捕捉到了滑县开展乳腺癌筛查引起的发病率“突增”)2018年广东省汕头市食管癌发病率地域分布特征 (MIS-CASS报告显示,汕头市整体食管癌发病水平不高,但内部地域差异明显,地处东北、四面环海的南澳岛为高发区域,西南方向渐呈下降趋势)我国《“十三五”规划(2016~2020)》和《“健康中国2030”规划纲要》均提出,要推进健康大数据在各相关部门间的整合、共享、挖掘和应用。该项工作将医保系统创新性地与癌症发病监测工作相结合,建立了基于医保大数据监测癌症发病的MIS-CASS模式。经评估,该模式具有区域内全人群覆盖、数据质量高、报告延迟短、运维成本低等优点。在信息化与大数据时代背景下,为我国癌症及其他重大慢性非传染性疾病的监测与登记工作提供了有益经验和发展方向。
北京大学
2021-04-10