将计算机自然语言处理方法和生物本体学方法结合起来,发展一套面向生物医学文献的数据挖掘技术,建立了一个文献挖掘平台。该平台可以对生物医学文献进行数据挖掘,发现隐含在文献中的生物学实体及其联系,发现深层次的生物医学知识,自动获取大量的第一手生物医学数据。例如,挖掘与人类基因相关的信息,挖掘蛋白质相关信息,发现基因的功能,发现基因与疾病之间,发现蛋白质之间的相互作用等。/line对于一组给定的文献,该平台首先进行句法分析和生物学术语标定,然后进行语义分析,提炼每条语句的生物学含义,提取文献中的生物医学关联特性,以发现文献中的基因、蛋白质、疾病以及它们的关系。