近日,美国华盛顿大学和英国DeepMind公司分别公布了多年事情的成果:前辈的建模程序,可以预测蛋白质和一些分子复合物的精确三维原子构造
个中一个研究小组报告说,他们已经利用最新开拓的人工智能(AI)程序预测了来自人类和20种模式生物的35万种蛋白质构造——如大肠杆菌、酵母和果蝇。
未来几个月里,他们操持将所有已编目的蛋白质列入模型蛋白质名单,大约有1亿个分子。

“这是相称惊人的。
”美国马里兰大学蛋白质专家John Moult说,他每两年举办一次名为“关键的蛋白质构造预测方法”(CASP)的比赛。
Moult表示,几十年来,构造生物学家一贯梦想有一天,打算机模型能增加从X射线晶体学等实验方法中得到的极精确蛋白质形状的数量。
“我从没想过这个梦想会成真。
”Moult说。

这一名为AlphaFold的模型是DeepMind公司研究职员的成果,DeepMind是一家从属于谷歌母公司Alphabet的英国AI公司。
2020年,AlphaFold“横扫”了CASP。
但是DeepMind研究职员没有透露绘制蛋白质形状的理论细节,特殊是AlphaFold的底层打算机代码。

这种情形已开始改变。
7月15日,华盛顿大学的Minkyung Baek和David Baker研究小组报告说,他们创建了一个名为RoseTTAFold的高度精确的蛋白质构造预测程序,并公开拓布了该程序。
干系成果在线揭橥于《科学》。
与此同时,《自然》揭橥了一篇由DeepMind研究职员Demis Hassabis和John Jumper撰写的论文,公布了AlphaFold的细节。

妄图成真AI猜测蛋白质结构

两个程序都利用AI在弘大的蛋白质构造数据库中识别折叠模式。
这些程序通过考虑蛋白质中相邻氨基酸相互浸染的基本物理和生物学规则,打算出未知蛋白质最可能的构造。
论文显示,Baek和Baker利用RoseTTAFold创建了一个包含数百个G蛋白偶联受体(一类常见的药物靶点)的构造数据库。

而DeepMind研究职员创造了35万个预测构造,因此前实验方法得到的结果的两倍多。
研究职员表示,AlphaFold产生了近44%的人类蛋白质构造,涵盖了人类基因组编码的近60%的氨基酸。
AlphaFold确定许多其他人类蛋白质是“无序的”,这意味着它们的形状不是单一构造。

此外,DeepMind与欧洲分子生物学实验室互助共建了一个新的蛋白质预测数据库,可以在网上免费访问。
“能供应这种做事真是太棒了。
” Baker说,“这真的会加快研究步伐。
”由于蛋白质的3D构造在很大程度上决定了它的功能,以是这一数据库便于生物学家厘清数千种未知蛋白质是如何事情的。
(文乐乐)

来源: 《中国科学报》