发明公开了一种基于关联分析与关联分类的蛋白质二级结构预测技术,以双库协同机制为基础,将KDD*过程模型引入蛋白质二级结构预测问题中,KAAPRO方法以数据挖掘(知识发现)为主体,采用基于KDD*过程模型Maradbcm算法以及关联规则分类D-CBA方法。KAAPRO方法所取得关联规则在一定程度上揭示了氨基酸物化属性对蛋白质二级结构的影响关系,从而提高了预测的精度。其中Maradbcm算法挖掘意外规则的特性对纯度较高的α蛋白质库与β蛋白质库进行关联规则的挖掘,由此获得的挖掘结果是精化的规则。D-CBA关联分类方法使用可信度与支持度的测度作为一个复合型度量来进行蛋白质关联分类。在保证预测精度的同时,为生物学家对二级结构进一步分析提供了依据。
扫码关注,查看更多科技成果