「数据库」物理学家使用人工智能来寻找迄今为止最复杂的蛋白质结
原文标题:物理学家使用人工智能来寻找迄今为止最复杂的蛋白质结
以下文章来源于 ScienceAI ,作者 ScienceAI
编辑 | 萝卜皮
计算机人工智能系统 AlphaFold 最近预测了数万种蛋白质的以前未知的三维结构。
美因茨约翰内斯 · 古腾堡大学(JGU)的研究团队专注于具有高置信度分数的子集,研究人员通过算法分析这些预测,发现蛋白质骨架表现出罕见的拓扑复杂性,即打结。
其中,研究人员发现了一个 71- 结,这是迄今为止在蛋白质中发现的最复杂的拓扑结,以及几个由两个甲基转移酶或碳酸酐酶结构域组成的六交叉复合结,每个结构域都包含一个简单的三叶结。这些深深嵌入的复合结显然是通过基因复制和打结二聚体的相互连接而发生的。
另外,该团队还报告了两个新的五交叉结,包括第一个 51- 结。该工作分析的结构列表构成了未来实验研究的基础,以确认这些新型打结拓扑并探索其复杂的折叠机制。
该研究以「AlphaFold predicts the most complex protein knot and composite protein knots」为题,于 2022 年 7 月 13 日发布在《Protein Science》。
谷歌 DeepMind 开发的人工智能(AI)系统 AlphaFold 两次主导蛋白质结构预测技术(CASP)的关键评估。AlphaFold 2 是一个深度学习系统,它结合了基于蛋白质结构的进化、物理和几何约束的训练程序。它的特点是预测的迭代细化,并允许使用自蒸馏和自估计准确性从未标记的蛋白质序列中学习,以使用一级结构和同源物的对齐序列直接预测给定蛋白质的所有重原子的 3D 坐标。
AlphaFold 2 目前已经预测了数十万种蛋白质结构,其中大部分不包含在蛋白质数据库(PDB)中,该数据库主要存档实验确定的结构。因此,AlphaFold 的预测数据库可能具有巨大的价值,特别是对于研究不常见但仍与了解蛋白质折叠潜在机制的复杂性具有高度相关性的蛋白质现象。对于在其多肽骨架中包含拓扑结的蛋白质,会出现一个特别令人着迷的现象,即从两端拉出后不会完全解开的蛋白质。
在过去的二十年中,仅发现了大约 20 种不同的含有结的蛋白质家族。然而,打结的蛋白质对蛋白质折叠和进化提出了挑战。模拟算法经常高估蛋白质的打结概率,因为后者低于随机链的打结概率。
此外,同源物之间的蛋白质拓扑结构通常相似,这意味着在进化中密切相关的蛋白质中往往会保留打结的折叠。由于这些原因,并且由于天然蛋白质之间打结的罕见性,在预测蛋白质结构的庞大新数据库中可能存在打结拓扑结构引起了人们的浓厚兴趣。
目前,在蛋白质中发现的最复杂的结是单个结,在任何投影到平面上都有六个基本交叉点;尚未观察到复合结。
JGU 团队搜索了整个 AlphaFold 2 数据库,包括「模式生物蛋白质组」、「Swiss-Prot」和「全球健康蛋白质组」数据集,以寻找包含以前未知的深结的拓扑复杂蛋白质。研究人员从分析中排除了那些具有较低置信度得分(<80)或超长蛋白质链(>600 aa)的蛋白,其中预测的准确性和实验验证结构的能力可能受到限制。基于这种搜索和目视检查,该团队已经确定了第一个 71- 结(在平面上的任何投影中至少有七个交叉点)以及生成 31#31 复合结的可能进化机制。
复合结的产生机制
研究人员通过调查发现了 9 个以前未知的复合结案例。这些都是两个基本上独立的三叶结存在于一个较长的蛋白质链中的例子。
于是他们提出了一种基于基因复制和打结同源二聚体互连来生成这种复合结的新机制。有趣的是,这种机制类似于用于创建第一个人工蛋白质结的策略,其中未打结的二聚体被「连接」以形成三叶草。
该团队已经观察到包括甲基转移酶和碳酸酐酶在内的多个实例,其中含有复合三叶结(31#31)的蛋白质与每条链中具有一个三叶结的已知打结同源二聚体同源。
经过验证,复合三叶结可以认定为俗称的「奶奶结」。复合结的手性与先前报告甲基转移酶和碳酸酐酶中单个三叶结的正手性的结果一致。研究人员在两个不同的蛋白质家族和两种结构变化中观察到了相同的现象,他们认为这是一种产生复合结的潜在机制。
图示:蛋白质 Q313J9(甲基转移酶)中六交叉复合结的 3D 结构(上)和简化表示(下)。(来源:论文)
图示:蛋白质 P54212(碳酸酐酶)的 3D 结构(上)和简化表示(下)。
蛋白质中的第一个 71- 结
下图描述了蛋白质 P73136 和 Q9PR55,其长度分别为 112 和 89 个氨基酸。两者都没有特征,使用 PDBeFold 无法识别可能的同源物。然而,它们具有 48% 的序列同一性和 71% 的二级结构匹配,这表明它们可能是同源物。
蛋白质 Q9PR55 包含最复杂的结,一个 71- 结,迄今为止已知在残基 27 和 83 之间有一个打结的核心。蛋白质 P73136 的类似结构包含一个 51- 结,在残基 45 和 94 之间有一个打结的核心。以前没有观察到这两种蛋白质具有不同的非平凡拓扑结构的这种同源物对。
仔细观察会发现,蛋白质 Q9PR55 更复杂的拓扑结构是由一个引入额外缠绕的蛋白质片段引起的;71 环面结本质上是一个 51 环面结,在环面上有一个额外的缠绕;两个结都具有正手性。
图示:蛋白质 P73136(左)和 Q9PR55(右)的结构和拓扑结构。(来源:论文)
新的 51 和 52 结
该团队发现了两个以前未知的具有五个基本交叉点的结,包括第一个 51- 结。
图示:蛋白质 A0A0K0IQS9(左)和 C1GYM9(右)的结构和拓扑结构。(来源:论文)
准确性测试
由于该发现的新颖性,通过独立方法进行验证将很重要。在实验研究之前,研究人员应用正交计算工具 ERRAT 来评估预测的打结结构。ERRAT 算法评估 C、N 和 O 原子之间的非键合接触模式,并与高分辨率结构进行统计比较。通过与 AlphaFold(和其他预测方法)中使用的指标不同,它提供了独立的评估。
研究人员在打结结构集上运行了 ERRAT。剔除某些模型中偶尔出现的扩展末端,所有测试的模型都显示出良好的分数;所有蛋白都有 >90% 的蛋白质链落在(低于)拒绝不太可能构象的 95% 阈值内。因此,总体来看,预测的结构是正确的,至少在很大程度上是正确的。
然而,在某些情况下,结构的局部区域似乎存在潜在问题。重要的是要注意蛋白质链路径中的微小差异——例如,那些会改变上 / 下交叉的差异——可能会改变拓扑结构,可能导致结的错误分配。
研究人员注意到,对于复合结 Q4D5S2,ERRAT 程序将残基 100-110 周围的 beta 链段标记为结构上可能不正确。值得注意的是,该区域中链的通过对于打结拓扑很重要。
结语
总之,该团队分析了 AlphaFold AI 系统对新拓扑复杂蛋白质的所有蛋白质 3D 结构预测。我们对 AlphaFold 提供的数据的完整分析揭示了几种包含深度复杂结的高置信度蛋白质,这些蛋白质适用于对其 3D 结构的实验验证。
在这个数据集中,研究人员发现了一个 71- 结,这是迄今为止在蛋白质中发现的最复杂的一个,以及同源结构中的一个新的 51- 结,以及复合蛋白质节的第一个实例。对于后者,研究人员提出了一种通过基因复制创造它们的进化机制。
由于蛋白质拓扑结构是蛋白质折叠算法的持续挑战,因此通过实验验证所讨论的结构预测将非常重要。不仅可以获得对 AlphaFold 系统正确预测复杂蛋白质拓扑结构的能力的精细衡量,而且重要的是确认这里发现的大量新蛋白质结。
论文链接:https://onlinelibrary.wiley.com/doi/10.1002/pro.4380
相关报道:https://phys.org/news/2022-07-physicists-ai-complex-protein.html
人工智能 × [ 生物 神经科学 数学 物理 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
热门文章:解密352X80空气净化器<\a>
其他人还看了
IBM推出AI处理器AIU:采用5nm工艺,包含230亿个晶体管
郑重声明:本文“「数据库」物理学家使用人工智能来寻找迄今为止最复杂的蛋白质结”,https://nmgjrty.com/shumacp_505838.html内容,由机器之心提供发布,请自行判断内容优劣。
- 全部评论(0)
- 大香煮伊区一二三四区2021维护成功,可以无限制进出了!
- 大香煮伊区一二三四区2021不再收费了!网友:终于可以免费看了
- 大香煮伊区一二三四区2021不再收费!网友:可以白嫖了
- 一卡二卡3卡4卡视频免费播放重新开放了!网友:久违了
- 一卡二卡3卡4卡视频免费播放出入无限制!网友:平台都这样才好!
- 一卡二卡3卡4卡视频免费播放人气暴涨!网友:毕竟来了很多大主播!
- 欧美xbox和ps大片重新开放了!网友:久违了
- 欧美xbox和ps大片人气暴涨原因,无限制出入是关键!
- 欧美xbox和ps大片免费播放!网友:已经来了不少
- 成品网站w灬源码1688直播身材好!网友:比明星还赞!
- 成品网站w灬源码1688直播更新引热议!上线了多种新功能!
- 成品网站w灬源码1688直播适合晚上看!粉丝:我们懂!
- XXXXXL19waswas重新开放,并且免费使用!
- XXXXXL19waswas不再收费了!网友:终于可以免费看了
- XXXXXL19waswas不再收费!网友:付费内容都取消了
- Japonensisjavacomplete重新开放!网友:爷青回!
最新更新
- 大香煮伊区一二三四区2021维护成功,可以
- 大香煮伊区一二三四区2021不再收费了!网
- 大香煮伊区一二三四区2021不再收费!网友
- 一卡二卡3卡4卡视频免费播放重新开放了
- 一卡二卡3卡4卡视频免费播放出入无限制
- 一卡二卡3卡4卡视频免费播放人气暴涨!
- 欧美xbox和ps大片重新开放了!网友:久违
- 欧美xbox和ps大片人气暴涨原因,无限制出
- 欧美xbox和ps大片免费播放!网友:已经来
- 成品网站w灬源码1688直播身材好!网友:
- 成品网站w灬源码1688直播更新引热议!上
- 成品网站w灬源码1688直播适合晚上看!粉
- XXXXXL19waswas重新开放,并且免费使用!
- XXXXXL19waswas不再收费了!网友:终于可以
- XXXXXL19waswas不再收费!网友:付费内容都
推荐阅读
- 「生物」我们应该寻找什么样的外星生命,高等的还是低等的?
- 「空间望远镜」韦布空间望远镜捕捉到布满恒星的创生之柱
- 「行者」从《双城之战》到《边缘行者》,游改动画迎来盛世?
- 「国际象棋」智能肛珠作弊案反转:19岁小将告世界冠军诽谤索赔7亿
- 「英伟达」不止是游戏党,他们才是被英伟达坑怕的人。
- 「索尼」索尼官宣!猜猜A7R5多钱?R2要价1.9万、R3要价2.4万、R4要价2.7万……
- 「癌症」一种癌症转移的关键因素
- 「智能手表」面世八年后,谷歌的智能手表生态终于迎来开放曙光
- 「adobe」用VR手捏3D模型,PS直接与甲方对线,Adobe新技术确实给设计师炫到了
- 「amd」RTX40的对手来了!AMDRDNA3显卡发布会官宣
- 「奥斯汀」苹果M3准备登场,库克展示奥斯汀AppleSilicon工程团队努力成果
- 「马修」Copilot要摊官司了!工作20年老程序员重新激活律师证,发起集体诉讼,
猜你喜欢
- [iPhone]iPhone13promax远峰蓝128G入手
- [安卓手机]realme真我GTNeo2开箱,金刚石冰芯散热系统+E4屏,5000mAh大电池
- [贴膜]红米9爆屏更换记录,弯曲的中框修复
- [智能机器人]编程从娃娃抓起,MakeBlock程小奔上手体验
- [智能摄像机]内置大电池,无需打孔走线,小米室外摄像机给你满满的安全感
- [充电器]65w网红氮化镓一次看个够
- [电脑支架]原汤化原食,LGErgo显示器支架
- [蓝牙耳机]中端耳机音质天花板,降噪很有一手,鹿图COCO真蓝牙降噪耳机评测
- [音频播放器]关于R01主板的主观看法,和一些碎碎念
- [充电器]双口快充,满足日常需求
- [VR设备]GOOVISLite头戴影院评测
- [蓝牙耳机]魅蓝Blus耳机体验,魅蓝依旧还是当年坚持做良品的青年良品
- [安卓手机]从5988跌至2749,256GB+鸿蒙OS+7nm麒麟,从高端市场跌至中端市场
- 「轻众测|素诺智能可视冲牙器」别急,对准再冲!素诺可视冲牙器让残渣无所
- 「九号新品Nano及Air T15」萌娃初体验——Ninebot九号平衡车Nano