由瑞士生物信息研究所和巴塞尔大学联合举办的全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Model EvaluatiOn),与CASP(Critical Assessment of Techniques for Protein Structure Prediction)并列为蛋白质结构预测领域的最重要的两大权威竞赛。CAMEO竞赛的得分和排名每周更新,每个参赛组每周需对约20个由权威结构生物学家最新破解出的蛋白质结构进行预测。该竞赛自举办以来,吸引了来自世界范围内众多生物计算领域顶级实验室和企业参加,包括清华大学、北京大学、谷歌、百度、腾讯和华为。
蛋白质对于生命体至关重要,了解其空间结构可以促进对蛋白质功能的原理性理解。因此,根据氨基酸序列预测蛋白质结构一直以来是生物领域的核心任务之一,具有重大的生物学研究意义。DeepMind开发的AlphaFold2采用AI技术,取得了与冷冻电子显微镜等实验技术相当的精度水平,被称作结构生物学“革命性”的突破、蛋白质研究领域的里程碑,因此被《Science》和《Nature》评为2021年度十大发现和突破。AlphaFold2开启了AI+生命科学的新时代,但一切都处于起步阶段,仍有许多挑战性难题亟待解决。
由西湖大学李子青团队开发的ManiFold,致力于为蛋白质结构预测这一生命科学领域的关键性问题提供可拓展的系统化解决方案,是一个采用AI技术、集成结构生物学领域知识和高维数据流形约束解决蛋白质结构预测的系统。ManiFold融合了单序列蛋白质语言模型,减少了对同源序列信息的依赖,增强了蛋白质序列编码器的表征能力;采用旋转和平移等变约束增强了结构解码器;进一步采用主链与侧链迭代方式,优化预测结果。
在最近的三个月(2022.08.05-2022.10.29),ManiFold蛋白质结构预测系统均表现优异,连续三个月的综合表现位居全球第一名,参赛四个月多次取得月排名、周排名第一至第三的佳绩。这证明了ManiFold系统的优越性和稳定性,也展示了开发团队在AI+蛋白质计算建模的实力。
西湖大学讲席教授李子青负责的人工智能研究与创新实验室,致力于AI基础方法和AI for Science技术研究。未来,团队将继续致力于研究新型AI方法,解决蛋白质结构、蛋白质设计和药物研发等的前沿科学技术问题。