文献速递
NEWS

Science丨2021年度突破:蛋白质结构预测

2021-12-21

2021年的余额已经不足半月,Science编辑部发文题为Protein structures for all,揭开本年度科研界的重大突破:利用人工智能进行蛋白质的结构预测

 

1972年诺贝尔化学奖获得者Christian Anfinsen

 

在1972年诺贝尔奖的获奖感言中,美国生化学家Christian Anfinsen曾经提出一个设想:有朝一日,我们仅仅通过氨基酸的序列组成就可以对任何蛋白质的结构进行预测。人体内有成千上万的蛋白质,蛋白质的结构预测将有助于为基础生物学提供新的见解,并揭示出具有临床意义的新药靶点。近年来研究人员发现,人工智能驱动产生的软件可以生产出成千上万种蛋白质的结构,从而将Anfinsen的梦想真正付诸现实,也是2021年科学界的年度突破。

 

以前蛋白质结构只能通过繁重的实验室分析来确定。蛋白质是生物学功能实现的主力军,参与到肌肉收缩、能量转换、氧气输送以及抵御微生物入侵等过程中。虽然蛋白质的功能各不相同,但是基本组成是类似的,20种不同的氨基酸组成肽链,进一步地组装成为具有独特的、复杂的三维结构。蛋白质的三维结构决定了这些蛋白质如何与其他分子相互作用,同时也决定了它们在细胞中的作用。

 

在20世纪50年代,研究人员开始通过X射线对蛋白质的三维结构进行分析和绘制,这也逐渐成为的如今蛋白质结构分析领域的主流技术之一。根据X射线衍射结构构建了蛋白质结构领域的数据库Protein Data Bank(http://www.rcsb.org/pdb/),该数据库包含了大约185,000个实验室解析的蛋白质结构【1】。但每个蛋白质的结构绘制都需要数年的时间,同时也需要数十万的实验经费。

 

 PDB数据库

 

为了加速这一过程的进展,科学家们在20世纪70年代开始建立计算机模型,以预测给定的蛋白质如何折叠。起初,这只可能用于小蛋白质或大蛋白质的短片段。到1994年,计算机模型已经发展到足以发起两年一次的蛋白质结构预测竞赛(Critical Assessment of protein Structure Prediction,CASP)。组织者向建模者提供了几十种蛋白质的氨基酸序列。在活动结束时,建模者的结果与X射线晶体学和新兴技术如核磁共振波谱和低温电子显微镜的最新实验数据进行比较,得分超过90分被认为与实验解决的结构相同。但最开始大家进行结构预测的评分低于60分。到2018年,建模者的得分通常也不过是在70分左右。

 

DeepMind

 

随后,人工智能软件AlphaFold粉墨登场。这个程序是由谷歌的姐妹公司DeepMind开发的,它通过实验解决结构的数据库来训练自己。在第一场比赛中,它的中位数得分接近80分,在与其他算法的90场比赛中,它赢得了43场。2020年,它的继任者AlphaFold2表现得更加出色【2】。AlphaFold2由182个为机器学习优化的处理器组成的网络驱动,其平均得分为92.4分,与实验技术相当。DeepMind的科学家报告称,他们对人体中发现的35万种蛋白质做了同样的实验,占所有已知人类蛋白质的44%【3】。在接下来的几个月里,他们预计他们的数据库将增加到1亿种蛋白质,涵盖到几乎所有物种,是现有蛋白质总数的一半。DeepMind下一步是预测哪些蛋白质一起工作以及它们如何相互作用。随后,在10月份的预印本中,该组织的科学家公布了4433种蛋白质-蛋白质复合物,揭示了蛋白质相互作用方式。AlphaFold2的代码目前可以公开获取,从而帮助其他科学家能够更好地利用该工具。去年11月,德国和美国的研究人员使用AlphaFold2和低温电子显微镜绘制了核孔复合体的结构,该复合体由30种不同的蛋白质组成,控制着进入细胞核的途径。今年8月,中国研究人员使用AlphaFold2绘制了近200种与DNA结合的蛋白质的结构,这些蛋白质可能涉及从DNA修复到基因表达的方方面面。

 

现在,研究SARS-CoV-2的科学家们也在使用AlphaFold2来模拟新冠病毒Omicron变种对刺突蛋白突变的影响【4】。突变改变了蛋白质的形状,也许足以阻止抗体与之结合并中和病毒,这可能会成为新的疫苗或者药物开发的抓手。蛋白质结构不是静态的,在工作过程中会产生弯曲和各种形变,而对这些变化进行建模仍然是一个挑战。另外,要对细胞中大型多蛋白复合体的结构进行可视化也并非易事。因此,蛋白质结构预测和分析领域仍然大有可为。今年由人工智能驱动的技术突飞猛进,提供了一种前所未见的视角,这一时刻将永远改变生物学和医学。

 

2021年度突破入选

 

1. 古土壤DNA提取时代到来,揭示先祖人类和物种种系进化,迁移活动。

 

2. 新冠抗病毒药物强力登场:新冠疫苗接种在逐步铺开。今年秋天,大厂Merck和辉瑞分别公布研发的抗新冠病毒口服药的临床实验结果,展示了良好的疗效。Merck研发的是Molnupiravir为核苷类似物,将新冠住院和死亡率降低30%(50%为首次申报的数字,后Merck将这一数字校正为30%)。辉瑞口服抗病毒药物PAXLOVID(PF-07321332+Ritonavir),PF-07321332为新冠病毒3CL蛋白酶抑制剂,和Ritonavir(天冬氨酸蛋白酶抑制剂)连用可将住院率和致死率降低89%。

 

3. “迷幻摇滚”治疗创伤应激综合症:今年5月,Nature Medicine发表了一项研究:谈话治疗和摇头丸(MDMA)帮助PTSD病人渡过艰难时光,取得显著疗效。目前,致幻类药物进入临床实验,帮助治疗抑郁、焦虑以及成瘾等多种疾病。

 

 

4. 人工抗体“驯服”传染疾病:因为克隆筛选,动物模型和晶体结构解析的进步,抗体筛选和优化变得更便捷。抗体治疗和研发进入传染病领域,今年,多项新冠抗体药物已展现实力。另外还有针对流感、寨卡病毒、呼吸合胞病毒,HIV和疟原虫的抗体药物在研发。FDA已批准了针对Ebola、吸入性炭疽病、艰难梭菌感染、呼吸合胞病毒在婴儿、对所有药物失效的HIV感染者的抗体治疗。

 

5. 体内直接CRISPR基因编辑治疗:今年六月,NEJM杂志发表了Intellia Therapeutics and Regeneron Pharmaceuticals的实验结果,针对遗传性转甲状腺蛋白淀粉样变,基因编辑系统进入体内四周后,六位患者的血液中转甲状腺蛋白分别降低52%和87%。九月,Editas Medicine公布了先天性黑朦的基因治疗结果,通过直接眼部注射病毒包装基因编辑系统,在两位患者中观察到了一些效果,有可能在将来帮助患者重见光明。

 

 

6. 体外胚胎培养突破帮助探索早期胚胎发育秘密:通过一种特制旋转仪,科学家将小鼠胚胎的体外培养时间从3-4天延长至11天。科学家还能从人类胚胎干细胞和诱导多能干细胞获得囊胚,这些干细胞研究成果将帮助我们进一步探索早期胚胎发育的秘密。

 

还有其他三项研究进入年度突破候选:

7. 核聚变反应新高度,逼进得失相当点(breakeven)。

9. “洞察”号火星探测器揭示火星内部地质构造。

10. 缪子行为异常,粒子物理学标准模型出现了裂缝。

 

2021年科学还有许多失望之处,Science特别指出了三项:

1. 全球气候合作仍然举步维艰。

2. 首个Alzheimer疾病靶向药物aducanumab获批,没有迎来欢呼雀跃,获得众多质疑和极大争论。

3. 多个科学家受到极大敌意,人身攻击和威胁。

 

最后的最后,新冠肆掠全球两年,仍有很多中低收入国家不能获得足够的疫苗,这场战斗道阻且长,胜利难望,希望来年突破中出现更多更好的药物!

 

参考文献

1. Berman, H. M. et al. The Protein Data Bank. Nucleic acids research 28, 235-242, doi:10.1093/nar/28.1.235 (2000).

2. Cramer, P. AlphaFold2 and the future of structural biology. Nature structural & molecular biology 28, 704-705, doi:10.1038/s41594-021-00650-1 (2021).

3. Tunyasuvunakool, K. et al. Highly accurate protein structure prediction for the human proteome. Nature 596, 590-596, doi:10.1038/s41586-021-03828-1 (2021).

4. Kryshtafovych, A. et al. Modeling SARS-CoV-2 proteins in the CASP-commons experiment. Proteins 89, 1987-1996, doi:10.1002/prot.26231 (2021).

原文链接:

https://www.science.org/content/article/breakthrough-2021