重要进展 预测蛋白质序列的新AI模型问世

瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来重大进展。这一成果发表在最新一期《自然·通讯》杂志上。 CARBonAra是在一个包含约370000个亚基的数据集上进行训练的。它还从蛋白质数据库中额外选取了100000个亚基用于验证,70000个亚基用于测试。 CARBonAra模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列。该模型在预测蛋白质序列时,表现出了高度的“上下文”感知能力,即在包含分子“上下文”(如蛋白质与其他蛋白质、核酸、脂质或离子的界面)时,其恢复率显著提高。 CARBonAra建立在该团队开发的蛋白质结构转换器框架的基础上。它使用了几何转换器,是一种深度学习模型,可以处理点之间的空间关系(如原子坐标),以学习和预测复杂的结构。该模型突出特点是“上下文”感知能力,这在提高序列恢复率方面尤为明显。 当CARBonAra包含分子“上下文”,如蛋白质与其他蛋白质、核酸、脂质或离子的界面时,其恢复率显著提高。CARBonAra模型的问世,标志着人工智能在蛋白质序列预测领域取得了重要进展。该模型不仅具有高度的预测准确性和灵活性,还展现出了广泛的应用前景。随着研究的深入和技术的不断发展,相信CARBonAra模型将在更多领域发挥重要作用,为科学研究和产业发展带来新的机遇和挑战。