人工智能标准数据库系统建立与应用
人工智能是一项严重依赖数据的技术,数据量的多少会直接影响产品的性能。而医疗数据又具备其特殊性,受到了严格的保护和使用限制。国外由于有健全的数据管理机制和严格的监管,有很多公开数据集,可供研究单位使用,用于推进人工智能技术的发展。这部分公开数据集虽然也可以被我们所使用,但是受到人种差异限制,某些疾病并不适合亚洲人群(比如:欧美人种和亚洲人种存在乳腺类型差异),且欧美疾病发病率和我国也存在差异。我国医疗数据量远远超过国外,但是受到法规等限制,无法进行数据挖掘,严重限制了我国医疗人工智能技术的发展。目前国家鼓励“产、学、研、用”综合发展,也鼓励科技成果转化。但是,医院空有数据,没有技术,无法进行数据挖掘;研究单位和厂家空有技术,缺乏合法高质量的数据,也无法开展相关研究更无从进行产业化。
该项目已获得“人工智能训练标准库的处理与检测方法、系统”发明专利授权(专利号:CN201710546301.8),本专利的目的是能够建立人工智能所需的标准数据库,通过数据和训练库分离和提供标准数据接口的方式,在保证数据安全的前提下,为研发机构和厂家提供研发数据和验证数据,以便促进我国医疗人工智能技术的发展,产生更多原创算法和适合我国国情的产品。
北京大学
2023-02-27