幼儿饰品瑜伽美体用品微软
投稿投诉
微软创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品

从AlphaGo到AlphaFold,什么是AI工具的最佳用

  图片来源视觉中国
  文观察未来科技
  两年前,2020年12月,Science杂志评选了该年度十个重大科学突破,除了在特殊大背景下的mRNA疫苗,还有一项就是蛋白质结构预测的人工智能AlphaFold。AlphaFold是由谷歌公司深度学习方面的核心团队DeepMind所开发,该团队一直致力于用人工智能和神经网络技术解决不同场景下的学习问题大名鼎鼎的AlphaGo就出自DeepMind麾下。
  在围棋博弈算法AlphaGo大获成功后,DeepMind又转向了基于氨基酸序列的蛋白质结构预测,提出了名为AlphaFold的深度学习算法,并在国际蛋白质结构预测比赛CASP13中取得了优异的成绩。AlphaFold的横空问世在几年的时间里彻底改变了生物学,不过,目前,科学家们似乎仍在寻找AlphaFold这类人工智能工具的最佳用法。
  拨开制药迷雾
  制药业是危险与迷人并存的行业。传统上,如果某家制药公司想要开发一种新药,只能为了找到潜在的候选药物而去搜索庞大的医学资料库。但显然,这种方法存在巨大的不确定性,需要科学家们付出多年的努力,而且即使找到了候选药物也只是一个起点。一旦确定了候选药物,接下来,科学家们就要对它们进行分析、合成,整个过程可能又需要好几年。
  最后,研究人员还要对发现的药物进行临床试验,一开始是在动物身上进行,然后是在一小群人身上,最后是在一大群人身上。简而言之,药品的开发是一场耗时又耗钱的漫长战争。除此之外,这场战争中的阵亡者数量也很大根据《自然》数据,一款新药的研发成本大约是26亿美元,耗时约10年,而成功率则不到十分之一。
  尽管面临重重阻碍,但计算机科学家出身的生物物理学家亚历克斯扎沃龙科夫(AlexZhavoronkov)却创造性地提出了一条可能的捷径。2012年前后,扎沃龙科夫开始注意到,人工智能在图像、语音和文本识别方面变得越来越擅长了。在他看来,这三个任务都有一个关键的共同点,那就是在每一种情况下都需要庞大的数据库,从而用于训练人工智能。
  类似的数据库也出现在了药理学中。因此,在2014年,扎沃龙科夫开始考虑是否可以利用这些数据库和人工智能技术来加快药物开发的过程。
  为了把这些想法变成现实,扎沃龙科夫在马里兰州巴尔的摩市的约翰霍普金斯大学一个名为InsilicoMedicine的机构,开始了研究。InsilicoMedicine的药物发现引擎的起点就是对数百万的数据样本进行筛选,以确定特定疾病的生物学特征,然后再利用这个引擎确定最有希望的治疗靶点,并运用生成性对抗网络去生成完全适合这些靶点的分子。
  3年后,扎沃龙科夫获得了成功,扎沃龙科夫开发出的系统,发现了潜在药物靶点的爆炸性增长和一个更有效的测试过程,让一场以往持续时间长达10年或持久战变成了一个月内就可以结束的小冲突。在2018年年底,InsilicoMedicine在不到46天的时间里就得到了一系列新分子,而且他们的成果不仅包括最初的发现,还包括药物的合成和计算机模拟的验证实验。
  新药发明的过程还包括了一个关键的步骤,即识别新药靶点,也就是药物在体内的结合位置,这是药物研发过程的另一个关键部分。
  实际上,从1980年到2006年,尽管每年的投资高达300多亿美元,但是平均而言研究人员每年仍然只能找到5种新药。其中关键的问题就在于复杂性。大多数潜在药物的靶点都是蛋白质,而蛋白质的结构,即2D氨基酸序列折叠成3D蛋白质的方式决定了它的功能。
  一个只有100个氨基酸的蛋白质,已经是一个非常小的蛋白质了,但就是这么小的蛋白质,可以产生的可能形状的种类依然是一个天文数字,大约是一个1后面跟着300个0。这也正是蛋白质折叠一直被认为是一个即使大型超级计算机也无法解决的难题的原因。
  从1994年开始,为了监测这种超越超级计算机能力的蛋白质折叠过程,科学界每年都会举办一次蛋白质结构预测关键评估(CASP)大赛。直到2018年几乎没有人取得过成功。但是,DeepMind的开发者们利用神经网络化解了这个难题。他们开发出了一种人工智能,可以通过挖掘大量的数据集来确定蛋白质碱基对与它们的化学键的角之间的可能距离这是蛋白质折叠的基础。他们把这个人工智能命名为AlphaFold。
  典型的量变,巨大的质变
  2018年,AlphaFold首次参加了CASP大赛,并摘得头魁。在2018年的比赛中,AlphaFold需要与其他参赛的人工智能比赛,解决43个蛋白质折叠的问题。最终,AlphaFold答对了25个,而获得第二名的人工智能只勉强答对了3个。AlphaFold的诞生,成为了蛋白质结构解析领域里程碑,也彻底改变了成千上万生物学家的研究。
  2020年,DeepMind发布了AlphaFold软件的第二个版本。相较于第二个版本,2018年的更早版本并不够好,不能取代使用实验方法解析的结构,而AlphaFold2的预测结果平均而言已与实验结果相差无几。当时,AlphaFold2再一次在CASP大赛上一举夺魁。CASP大赛每两年举办一次,呈现了生物学界在一项艰巨挑战上的最新进展。
  2020年的这项挑战是如何仅凭蛋白质的氨基酸序列确定其3D结构。计算机软件给出的结构会拿来与经过X射线晶体学或冷冻电镜(cryoEM)这类实验方法确认的结果进行对比。X射线晶体学和冷冻电镜分别通过X射线和电子束照射蛋白质的方式来对蛋白质的结构进行成像。
  AlphaFold的预测用被称为427组,多个预测达到了惊人的准确性,让它们脱颖而出。当然,AlphaFold的预测水平有高有低,但将近三分之二的预测结果都与实验结果在质量上不相上下。AlphaFold的预测甚至帮助确定了Lupas实验室多年来一直想要破解的一种细菌蛋白的结构。
  一年后,2021年7月15日,AlphaFold2的论文发表,同时公开的还有免费的开源代码等信息,让业内的研究人员们可以打造属于自己的版本。一周后,DeepMind宣布已经用AlphaFold预测了人体内近乎所有蛋白质的结构,以及20个其他被大量研究的生物体的完整蛋白质组,其中包括小鼠和大肠杆菌,累计共有36。5万个结构。
  DeepMind还将这些信息上传到了由EMBL欧洲生物信息学研究所(EMBLEBI)维护的数据库。在那之后,这个数据库已经收录了近100万个结构。根据DeepMind的统计,目前已有超40万人使用过EMBLEBI的AlphaFold数据库。此外,还有一些AlphaFold的超级用户:这些研究人员在自己服务器上安装了AlphaFold,或是打造了AlphaFold的云版本,用来预测不在EMBLEBI数据库中的结构,或是探索AlphaFold的新用途。
  今年,DeepMind还计划发布总计1亿多个结构预测相当于所有已知蛋白的近一半,是蛋白质数据银行(PDB)结构数据库中经过实验解析的蛋白数量的几百倍之多。
  要知道,过去半个多世纪,人类一共解析了五万多个人源蛋白质的结构,人类蛋白质组里大约17的氨基酸已有结构信息;而AlphaFold的预测结构将这一数字从17大幅提高到58;因为无固定结构的氨基酸比例很大,58的结构预测几乎已经接近极限。这是一个典型的量变引起巨大的质变,而这一量变是在短短一年之内发生的。
  AlphaFold的最佳用法
  除了在制药领域发挥作用,AlphaFold还被应用到了更多领域。
  一方面,AlphaFold的结构解析能力极大解放了生物学家们的研究:有研究团队还在搜索另一个包含从海洋和废水中提取的DNA序列的数据库,试图发现新的食塑酶。通过让AlphaFold快速预测数千个蛋白的结构,该团队希望能更好地理解酶是如何通过演化拥有分解塑料的能力,并能进一步优化它们。
  哈佛大学演化生物学家SergeyOvchinnikov认为,这种将任何蛋白编码基因序列转化为可靠结构的能力,对于演化研究来说非常有用。研究人员通过比较基因序列来确定不同物种的生物体与它们基因之间的亲缘关系。而对于亲缘关系较远的基因来说,这种比较可能无法发现演化近亲,因为这些序列已经变了很多。但通过比较变化速度比基因序列更慢的蛋白质结构,研究人员或许能揭示之前没注意到的古代关系。
  另一方面,AlphaFold还是个绝佳的实验工具,AlphaFold能提供一个初步预测,之后再由实验验证或优化。比如,来自X射线晶体学的原始数据以衍射X射线的图样呈现。一般来说,科学家需要对蛋白质结构有个初步猜测,才能解释这些图样。而AlphaFold的预测让大部分X射线图样不再需要这些方法。
  另外,AlphaFold不仅改变了科学家测定蛋白质结构的方式。一些研究人员还在利用这些工具打造全新的蛋白质。华盛顿大学生物化学家、蛋白质设计和结构预测领域带头人DavidBaker表示,深度学习彻底改变了他们团队设计蛋白质的方式。Baker的团队让AlphaFold和另一个AI工具RoseTTAFold来设计新的蛋白。他们改写了人工智能的代码,让软件在得到随机氨基酸序列的情况下,对它们进行优化,直到合成出能被这些神经网络识别为蛋白的东西。
  2021年12月,Baker的研究团队报告了他们在细菌中表达了129种这些幻想蛋白,发现其中约15的蛋白会折叠成类似他们预测的结构。而这是这种网络能用来设计蛋白质的首个证明。
  基于此,今年7月21日,来自华盛顿大学等机构的科学家们在Science杂志上发布了一款新的AI软件,该软件能够为自然界中尚不存在的蛋白质绘制结构。更重要的是,科学家们已经利用这一软件创造出潜在用于工业反应、癌症治疗、甚至用于预防呼吸道合胞病毒(RSV)感染的候选疫苗的原始化合物。
  虽然AlphaFold的出现推动了巨大进展,但科学家认为有必要说明它的局限性:一些研究人员尝试将AlphaFold应用于会破坏蛋白天然结构的各类突变,包括与早期乳腺癌有关的一个突变,这些尝试证实了AlphaFold还无法预测新的突变对蛋白质的影响,因为没有演化上相关的序列可以用来研究。
  并且,AlphaFold无法很好地处理会在不同构象中呈现不同结构的蛋白。这些预测是针对单独的结构,而许多蛋白质其实会与配体一起发挥功能,如DNA和RNA、脂肪分子、铁等矿物质。
  目前,AlphaFold掀起的革命会走向何方依然无法预见,但每一天,AlphaFold都显示出推动的巨大力量。EMBLEBI的计算生物学家JanetThornton认为AlphaFold带来的最大转变之一,可能是让生物学家更愿意接受计算机和理论的研究方法。换言之,真正的变革是人们思维方式的变化,这其实就是AI工具的最佳用法。AlphaFold所彰显的意义,是科技的力量。
  试想一下,在未来,如果把人工智能AlphaFold与生成式对抗网络Insilico结合起来,再加上量子计算领域可预期的突破,我们就将真正走出制药的迷雾,连同生物领域的百年来的困惑,而走向一条未来生物学的坦途。(本文首发钛媒体APP)

爱吃豆腐这类食物的人,少生病,有助于延年益寿,降低死亡风险点击关注不迷路普及科学知识,传播科学精神大家知道,蛋白质作为人类必需的营养物质之一,对于维持人体肌肉、骨骼和神经稳定,增强免疫系统功能以及促进新陈代谢等,发挥着重要……2022感叹自己有白发的句子1、人生入秋,白发也美!2。笑一笑十年少,愁一愁白了头。3。白发频催岁月勤,相逢一笑卸尘。4。这不是头发,而是知识的力量。5。白发自嘲青春,痴心白作邪恶……夺标2022第十集张伟丽女性的力量北京时间6月12日,UFC终极格斗冠军赛拉开帷幕,中国选手张伟丽在与波兰名将乔安娜的二番战中,一记转身鞭拳KO老对手,重获UFC草量级金腰带挑战权,用这场酣畅淋漓的胜利再次向世……CBA3消息广东旧将正式下岗斯科拉劝姚明改革辽篮老总连签在5CBA联赛已经于今天正式拉开大幕,期待了五个多月,球迷们终于可以继续观看精彩的比赛。首个比赛日共有两场大战,分别是深圳对战山东,广厦对战辽宁。而首轮揭幕战的突发情况则是广东队确……这段话,足以叫醒所有人!这世上,总有人不懂知足,明明生活很安稳,却说乏味,明明工作很轻松,却说太累。看不到身边的幸福,也感受不到拥有的快乐。其实,当你抱怨没鞋可穿的……微信键盘内测0。9。8剪切板终于来了!(附安卓下载)就在前些天安卓微信键盘又又又更新了,距离微信键盘0。9。7更新还没多久,0。9。8版本刷的一下就更新了,不得不说确实快啊,那么此次短短半个月又更了啥?01菜单界面改版……有种接地气的穿法叫风衣小脚裤,时髦保暖,小个子都爱正因为每年秋冬季节都有风衣的存在,所以我们在秋冬穿衣搭配也不会觉得无聊,就算是一件普通款的风衣,但总是会被我们穿出无数种时尚风格,而今年秋天越来越多的女生都穿上了风衣配小脚裤,……张本智和大获全胜!狂轰20比分,日本世界冠军横扫对手北京时间11月5日,乒乓球T联赛继续进行,国乒劲敌张本智和迎来了本月的首秀,与世界冠军吉村真晴一起代表琉球俱乐部出战,结果他俩都大获全胜,连续零封对手,帮助本队31战胜了彩玉俱……如何判断IP地址是否在同一网段网络标识:只要把IP和子网掩码的对应二进制位AND得到的结果就叫做网络标识。这种运算通常称为与。AND方法:0和10,0和00,1和11。在不在同一网段就用网络标识,即与结果去……在多伦多帮女儿带孩生活碎碎念(2)今天又是4点半醒,已经连续几天这样了。只要晚上12点以前睡着,第二天就一定会早醒。不知道这算不算是一种睡眠问题。好在白天没有太多的不适,不会因此影响情绪和生活。只是冬天多伦多天……图学习温故初探PaddleGraphLearning构建属于项目链接:https:aistudio。baidu。comaistudioprojectdetail5000517?contributionType1如遇到问题查看原项目……随评指南咳嗽门毛案气血时空疾病上年夏秋病伤,冬季不得复原,这是一个背景,体质状态;没说病伤具体是什么病,可以就是咳嗽,也可以是其他大病、重病。是春地气阳升,这是讲发病、时间。冬天阳气收藏,春季阳气升发……
中国男篮又遇韩国男篮7月12日男篮亚洲杯中国队首场对韩国队的比赛就要开打。中国男篮的亚洲老对手韩国男篮为了亚洲杯尽遣主力,其实这几年韩国男篮在亚洲的成绩不怎么样。但每一次和中国队交手,都是拼尽全力……这段话适合任何人(经典)人之所以累,就是因为压力太大。心之所以烦,就是因为想得太多。总想去攀比,才会累,凡事想不开,才会烦。其实活着,没必要去羡慕别人,……夏季好眠亦养生!这几点夏季睡眠原则你掌握了吗?据保健时报消息夏季好眠亦养生本报记者燕声夏季天气炎热,湿气较重,很多人晚上热得睡不好觉,常在床上辗转反侧,难以入眠。睡眠养生是夏季养生的重要内容,睡好觉能提高……三星中国雇员近5年间缩水超一半韩国国内雇员增幅近20据韩媒报道,韩国三星电子近年来陆续缩减在中国的业务,过去5年间在中国当地雇佣的员工人数缩水一半以上。三星电子6日发布《2022可持续经营报告》显示,截至去年底,三星中国法……因祸得福,恒大年薪1。57亿的执行董事行政总裁夏海钧被辞职7月22日晚,恒大物业134亿事件水落石岀,被恒大挪用了,恒大总裁夏海钧,潘大荣因此被要求引咎辞职可谓是因祸得福,大手一挥屁股一抬拜拜了。恒大集团总裁夏海钧,天价年薪1。……下一代的前端工具链,Vite3。0发布距离v2发布16个月后,Vite3。0现已正式发布。公告指出,去年2月Vite2发布以来,其采用率就在不断增长;每周npm下载量超过100万次,迅速形成了庞大的生态系统。Vit……妻子的选择结局了,方糖最终拿到所有的财产,把渣男扫地出门《妻子的选择》结局了,方糖最终拿到了所有的财产,把渣男扫地出门。孙莉发文称:方糖以后的人生都是甜的。方糖是《妻子的选择》中的女主角,跟丈夫高家为是一对人人称羡……深度体验Inteli512600KFi5默秒全的时代又回来了去年十一月十二代酷睿横空出世,以其出色的架构设计和强劲的性能赢得了消费者的一致好评,而同期发布的继i512600K发布之后不就,i512600KF作为不含核显的产品也横空出世,……武汉欢乐谷HOHA电音节7月2日开幕武汉欢乐谷HOHA电音节将于7月2日开幕。本次HOHA电音节推出四大复古音乐主题,分别为迷幻万花筒、猩红浪潮、摩登时刻、银河迪厅,将复古元素和未来科技结合,打造大型Z世代音乐社……安卓之光小米11Ultra降价后狂卖四万台,是真香机吗2021年3月份小米发布了小米11Ultra。首发标准版5999。时隔一年出头的手机降价到3999,却被狂卖四万台,(根据官方数据,加上第三方售出的应该不止四万台。……中国男排公布世锦赛22人集训大名单,最强接应回归,目标小组出2022年的排球世锦赛已经迫在眉睫,特别是男排世锦赛,将于本月底正式开赛,时间是8月26日9月11日,不过今年的男排世锦赛规则发生改变,24支球队分为6组,每组4支球队,先进行……一个手电也能这么炫酷,十二大功能让我备受震撼各位对于手电的印象,是否还停留在小时候,那个只能用来照明的设备呢?最近提前体验到了一款户外手电产品,彻底让我改变了从前的观念,原来一个手电竟然有这么多的功能。它的玩法,可谓花样……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网