3年后,扎沃龙科夫获得了成功,扎沃龙科夫开发出的系统,发现了潜在药物靶点的爆炸性增长和一个更有效的测试过程,让一场以往持续时间长达10年或“持久战”变成了一个月内就可以结束的“小冲突”。在2018年年底,InsilicoMedicine在不到46天的时间里就得到了一系列新分子,而且他们的成果不仅包括最初的发现,还包括药物的合成和计算机模拟的验证实验。
新药发明的过程还包括了一个关键的步骤,即识别新药靶点,也就是药物在体内的结合位置,这是药物研发过程的另一个关键部分。
实际上,从1980年到2006年,尽管每年的投资高达300多亿美元,但是平均而言研究人员每年仍然只能找到5种新药。其中关键的问题就在于复杂性。大多数潜在药物的靶点都是蛋白质,而蛋白质的结构,即2D氨基酸序列折叠成3D蛋白质的方式决定了它的功能。
一个只有100个氨基酸的蛋白质,已经是一个非常小的蛋白质了,但就是这么小的蛋白质,可以产生的可能形状的种类依然是一个天文数字,大约是一个1后面跟着300个0。这也正是蛋白质折叠一直被认为是一个即使大型超级计算机也无法解决的难题的原因。
从1994年开始,为了监测这种超越超级计算机能力的蛋白质折叠过程,科学界每年都会举办一次蛋白质结构预测关键评估(CASP)大赛。直到2018年几乎没有人取得过成功。但是,DeepMind的开发者们利用神经网络化解了这个难题。他们开发出了一种人工智能,可以通过挖掘大量的数据集来确定蛋白质碱基对与它们的化学键的角之间的可能距离——这是蛋白质折叠的基础。他们把这个人工智能命名为AlphaFold。典型的量变,巨大的质变
2018年,AlphaFold首次参加了CASP大赛,并摘得头魁。在2018年的比赛中,AlphaFold需要与其他参赛的人工智能比赛,解决43个蛋白质折叠的问题。最终,AlphaFold答对了25个,而获得第二名的人工智能只勉强答对了3个。AlphaFold的诞生,成为了蛋白质结构解析领域里程碑,也彻底改变了成千上万生物学家的研究。
2020年,DeepMind发布了AlphaFold软件的第二个版本。相较于第二个版本,2018年的更早版本并不够好,不能取代使用实验方法解析的结构,而AlphaFold2的预测结果平均而言已与实验结果相差无几。当时,AlphaFold2再一次在CASP大赛上一举夺魁。CASP大赛每两年举办一次,呈现了生物学界在一项艰巨挑战上的最新进展。
2020年的这项挑战是如何仅凭蛋白质的氨基酸序列确定其3D结构。计算机软件给出的结构会拿来与经过X射线晶体学或冷冻电镜(cryo-EM)这类实验方法确认的结果进行对比。X射线晶体学和冷冻电镜分别通过X射线和电子束照射蛋白质的方式来对蛋白质的结构进行成像。
AlphaFold的预测用被称为“427组”,多个预测达到了惊人的准确性,让它们脱颖而出。当然,AlphaFold的预测水平有高有低,但将近三分之二的预测结果都与实验结果在质量上不相上下。AlphaFold的预测甚至帮助确定了Lupas实验室多年来一直想要破解的一种细菌蛋白的结构。
一年后,2021年7月15日,AlphaFold2的论文发表,同时公开的还有免费的开源代码等信息,让业内的研究人员们可以打造属于自己的版本。一周后,DeepMind宣布已经用AlphaFold预测了人体内近乎所有蛋白质的结构,以及20个其他被大量研究的生物体的完整“蛋白质组”,其中包括小鼠和大肠杆菌,累计共有36.5万个结构。
DeepMind还将这些信息上传到了由EMBL欧洲生物信息学研究所(EMBL–EBI)维护的数据库。在那之后,这个数据库已经收录了近100万个结构。根据DeepMind的统计,目前已有超40万人使用过EMBL-EBI的AlphaFold数据库。此外,还有一些AlphaFold的“超级用户”:这些研究人员在自己服务器上安装了AlphaFold,或是打造了AlphaFold的云版本,用来预测不在EMBL-EBI数据库中的结构,或是探索AlphaFold的新用途。
今年,DeepMind还计划发布总计1亿多个结构预测——相当于所有已知蛋白的近一半,是蛋白质数据银行(PDB)结构数据库中经过实验解析的蛋白数量的几百倍之多。
要知道,过去半个多世纪,人类一共解析了五万多个人源蛋白质的结构,人类蛋白质组里大约17%的氨基酸已有结构信息;而AlphaFold的预测结构将这一数字从17%大幅提高到58%;因为无固定结构的氨基酸比例很大,58%的结构预测几乎已经接近极限。这是一个典型的量变引起巨大的质变,而这一量变是在短短一年之内发生的。
AlphaFold的最佳用法
除了在制药领域发挥作用,AlphaFold还被应用到了更多领域。
一方面,AlphaFold的结构解析能力极大解放了生物学家们的研究:有研究团队还在搜索另一个包含从海洋和废水中提取的DNA序列的数据库,试图发现新的食塑酶。通过让AlphaFold快速预测数千个蛋白的结构,该团队希望能更好地理解酶是如何通过演化拥有分解塑料的能力,并能进一步优化它们。
哈佛大学演化生物学家SergeyOvchinnikov认为,这种将任何蛋白编码基因序列转化为可靠结构的能力,对于演化研究来说非常有用。研究人员通过比较基因序列来确定不同物种的生物体与它们基因之间的亲缘关系。而对于亲缘关系较远的基因来说,这种比较可能无法发现演化近亲,因为这些序列已经变了很多。但通过比较变化速度比基因序列更慢的蛋白质结构,研究人员或许能揭示之前没注意到的古代关系。
另一方面,AlphaFold还是个绝佳的实验工具,AlphaFold能提供一个初步预测,之后再由实验验证或优化。比如,来自X射线晶体学的原始数据以衍射X射线的图样呈现。一般来说,科学家需要对蛋白质结构有个初步猜测,才能解释这些图样。而AlphaFold的预测让大部分X射线图样不再需要这些方法。
另外,AlphaFold不仅改变了科学家测定蛋白质结构的方式。一些研究人员还在利用这些工具打造全新的蛋白质。华盛顿大学生物化学家、蛋白质设计和结构预测领域带头人DavidBaker表示,深度学习彻底改变了他们团队设计蛋白质的方式。Baker的团队让AlphaFold和另一个AI工具RoseTTAFold来设计新的蛋白。他们改写了人工智能的代码,让软件在得到随机氨基酸序列的情况下,对它们进行优化,直到合成出能被这些神经网络识别为蛋白的东西。
2021年12月,Baker的研究团队报告了他们在细菌中表达了129种这些幻想蛋白,发现其中约1/5的蛋白会折叠成类似他们预测的结构。而这是这种网络能用来设计蛋白质的首个证明。
基于此,今年7月21日,来自华盛顿大学等机构的科学家们在Science杂志上发布了一款新的AI软件,该软件能够为自然界中尚不存在的蛋白质绘制结构。更重要的是,科学家们已经利用这一软件创造出潜在用于工业反应、癌症治疗、甚至用于预防呼吸道合胞病毒(RSV)感染的候选疫苗的原始化合物。
虽然AlphaFold的出现推动了巨大进展,但科学家认为有必要说明它的局限性:一些研究人员尝试将AlphaFold应用于会破坏蛋白天然结构的各类突变,包括与早期乳腺癌有关的一个突变,这些尝试证实了AlphaFold还无法预测新的突变对蛋白质的影响,因为没有演化上相关的序列可以用来研究。
并且,AlphaFold无法很好地处理会在不同构象中呈现不同结构的蛋白。这些预测是针对单独的结构,而许多蛋白质其实会与配体一起发挥功能,如DNA和RNA、脂肪分子、铁等矿物质。
目前,AlphaFold掀起的革命会走向何方依然无法预见,但每一天,AlphaFold都显示出推动的巨大力量。EMBL-EBI的计算生物学家JanetThornton认为AlphaFold带来的最大转变之一,可能是让生物学家更愿意接受计算机和理论的研究方法。换言之,真正的变革是人们思维方式的变化,这其实就是AI工具的最佳用法。AlphaFold所彰显的意义,是科技的力量。
试想一下,在未来,如果把人工智能AlphaFold与生成式对抗网络Insilico结合起来,再加上量子计算领域可预期的突破,我们就将真正走出制药的迷雾,连同生物领域的百年来的困惑,而走向一条未来生物学的坦途。

铁锚
大桥
金桥
京雷
天泰
博威合金BOWAY
马扎克Mazak
威尔泰克
迈格泰克
斯巴特
MAOSHENG贸盛
Miller米勒
新世纪焊接
西安恒立
上海特焊
新天激光
海目星激光
迅镭激光
粤铭YUEMING
镭鸣Leiming
领创激光
天琪激光
亚威Yawei
邦德激光bodor
扬力YANGLI
宏山激光
楚天激光
百超迪能NED
金运激光
LVD
Tanaka田中
BLM
易特流etal
百盛激光
Messer梅塞尔
PrimaPower普玛宝
上海通用电气 全焊机系列展示
全自动焊接流水线
KUKA 库卡摩多机器人流水线作业
创力 CANLEE光纤激光切割机
大焊 焊机匠心品质 精工之作 行家之选
松下 旗下LAPRISS机器人激光焊接系统
川崎工业焊接机器人 焊接管架
新型产品 焊接滚轮架 自动调心 自调式滚轮架 河北辉腾 生产
诚德*PVC塑料焊条
供应山鼎重工焊接变位机
供应越达自调式滚轮架可调式滚轮架
博塔制造的重型、特殊可调防窜滚轮架 供应洛阳博塔滚轮架
日本电王HW310发电电焊机 石油然气管道电焊机 西安电焊机
广州市 二手库卡碳钢焊接机器人 二手机器人
西安 YASKAWA/安川 MA2010 焊接机器人 变位机







