01版:医药专刊
PDF版下载   
2024年10月24日

Rosetta 破解“上帝之手”的奥秘

中国医药报 01版医药专刊
2024年10月24日

1996年,David Baker与研究生们开始编写一个叫做Rosetta的程序,这个程序有潜力根据一段氨基酸序列解出蛋白质的结构。

虽然Baker最初的研究方向是预测蛋白质的结构,但在这个方向上取得突破之前,他已着手向另一个截然相反且更具挑战性的领域——“蛋白质的从头设计”发起了冲击。相比于预测蛋白质的结构,从头设计出一个蛋白质需要向弄清蛋白质折叠的原理再迈进一步。这要求科学家们能根据一个具有特定形状的蛋白,倒推出其DNA序列。

到目前为止,从头设计蛋白依然是一个不断试错的工作,需要大量的资源投入。以设计结合蛋白为例,从流程上看,科学家会首先用Rosetta模拟出所感兴趣蛋白表面上的一个“口袋”,然后再设计出大量不同的螺旋结构,形成稳定骨架。这些骨架上含有一些特定的氨基酸,有可能会与“口袋”进行完美的契合。这个工作就像是在一把钥匙上不断打磨,最终使其完美地对应一把锁。

随后,研究人员会根据设计合成所要的DNA序列,将其引入细菌细胞,期望它们能够产生所需要的蛋白。获取这些蛋白后,他们还会做两个测试:评估这些蛋白是否能如预期般折叠,以及折叠后的蛋白是否能如预期般结合特定蛋白。通常来讲,人工设计的蛋白极少能同时满足这两个条件。而那些脱颖而出的蛋白,则会成为新一轮设计与筛选的起点,直至获得最佳的构象。

在2018年以前,Baker及其团队开发的Rosetta在蛋白质结构预测领域完全没有对手。而那一年,AlphaFold的出现令Baker嗅到了危机,于是,他要求团队紧跟时代的风向,加紧研究机器学习。Baker的预感没有错,在2020年的竞赛中,第二代AlphaFold击败了Rosetta,一举成名。

不过,Baker率领着团队很快就追赶了上来。2021年7月15日,当DeepMind公司在《自然》杂志上发表论文,公开AlphaFold2的源代码,并且详细描述它的设计框架和训练方法时,Baker的团队也于《科学》杂志上介绍了其开发的RoseTTAFold算法。

RoseTTAFold的神经网络能够同时考虑蛋白序列的模式、蛋白中不同氨基酸之间的相互作用,以及蛋白质可能出现的3D结构。在这个系统中,一维、二维和三维的信息能够相互交流,让神经网络综合所有信息,决定蛋白质的化学组成部分和它折叠产生的结构之间的关系。

研究人员表示,RoseTTAFold系统在解析蛋白质3D结构方面的表现与AlphaFold2的水平几乎相当,在有些蛋白上甚至优于AlphaFold2。利用来自AlphaFold的公开信息,也得益于多年来对于机器学习的积累,这个算法的开发只用了区区几个月的时间。

作为蛋白质从头设计的先驱者,David Baker希望通过“蛋白质设计革命”开启一个全新的时代,人类将学会使用一种前所未有的方式来操控生物分子,例如从头设计出全新的药物、疫苗、疾病疗法等,拓展新药研发的边界。

2022年8月,Baker及其团队在《细胞》杂志上发表论文,他们已利用AI技术平台精准地从头设计出能够穿过细胞膜的大环多肽分子,开辟了设计全新口服药物的新途径。同时,Baker团队成员联合创建的初创公司Vilya也正式亮相,并从著名风投机构ARCH Venture Partners获得5000万美元A轮融资。利用这一技术,跳过高通量筛选、直接合成候选药物的策略不再遥不可及。

今年以来,Baker及其团队已在《自然》和《科学》杂志上发表了数篇重磅论文,其开发的全新蛋白质从头设计策略法可靶向不可成药靶点,并能实现按需设计生物分子,为蛋白设计提供了更广阔的可能性。

(药明康德内容团队供稿)

分享按钮