刘涛 ai换脸 化学学院来鲁华/张长胜团队在全原子卵白质序列联想中取得新进展
基于骨架结构的卵白质序列联想是全新卵白质联想的重要问题之一。连年来,跟着深度学习要领和时期的发展,全新卵白质序列联想取得了紧迫进展。其中代表性的使命包括ProteinMPNN、ABACUS-R、ProDesign-LE等,齐在序列联想中取得了紧迫进展,并进行了相应的实验考据。然则,这些代表性的要领在模子训练和放胆输出中均莫得平直筹商卵白质侧链的原子细节信息。一方面,卵白质侧链构象对卵白质执行功能具有紧迫作用。另一方面,无数的序列设操想法依赖结构瞻望来评估联想序列的可靠性,而单序列结构瞻望依旧是一个终点大的挑战。近期,北京大学化学与分子工程学院/前沿交叉学科连系院定量生物学中心/北大-清华人命科学合并中心/北京大学成齐前沿交叉生物时期连系院教育来鲁华和北京大学化学与分子工程学院副连系员张长胜团队发展了全原子卵白质序列联想的深度学习算法GeoSeqBuilder,这一效用近期发表于Angewandte Chemie1,著述初稿2024年3月以预印本款式发表2。GeoSeqBuilder在生成序列的同期,也给出了高精度的侧链构象,不错更平直给出原子之间的相互作用刘涛 ai换脸,不需要进行单序列结构瞻望。GeoSeqBuilder在自然卵白质结构、全新联想结构和酶的序列联想的实验测试中赢得了高得胜率,证明的晶体结构与联想结构模子在原子措施细节上高度吻合。
GeoSeqBuilder主要包含三部分:(1)多措施图卷积收罗用于学习中心残基周围5阶邻居的环境信息;(2)三角收罗用于示意学习残基水平的二体和三体相互作用;(3)迭代模块基于以上收罗从肇端序列启程更新序列,多步迭代后得到敛迹序列。GeoSeqBuilder最终输出联想序列对应的卵白质全原子模子。具体见图1。
图1 GeoSeqBuilder框架图
GeoSeqBuilder在CATH4.3数据集上进行训练和考据,序列规复率达到了52%,与ProteinMPNN等要领的推崇肖似。此外,色吧性爱GeoSeqBuilder联想出来的列位点的残基类型常常和野生型具有同样的物理化学性质。GeoSeqBuilde生成的各样残基的品貌与自然卵白肖似。GeoSeqBuider对侧链构象瞻望的放胆也远优于基于传统能量函数的要领FASPR和Scwrl4(见图 2)。
萝莉图2 GeoSeqBuilder的序列和侧链构象瞻望放胆刘涛 ai换脸
该使命率先接纳了两个典型的卵白质折叠骨架对GeoSeqBuilder生成的序列进行实验考据,包括自然硫氧还原卵白(1FB0)和通过幻念念模子东谈主工联想的螺旋束骨架(0705)。作家差别为其联想了9条和6条序列,这些序列均不错在大肠杆菌中以可溶款式抒发。对硫氧还原卵白从新联想的序列具有很高的热褂讪性,热变性温度较野生型卵白提升了40摄氏度,X-射线晶体学结构证明标明联想的全原子模子与所解出的晶体结构高度吻合,而况联想卵白质领有新的疏水堆积中枢,具体见图3。
图3 GeoSeqBuider得胜为靶标1FB0和0705联想了序列,联想模子与晶体结构高度一致
以上放胆标明GeoSeqBuilder学习到了卵白质折叠结构和序列的关系,不错在保捏卵白质折叠结构正确性的同期联想出新的疏水中枢。一般以为疏水中枢在卵白序列的当然进化历程中是比拟保守的,疏水中枢从新联想后的卵白是否还会保捏原有的功能是一个很酷爱的问题。作家接纳细胞铁弃世中的重要卵白谷胱甘肽过氧化物酶(gpx4,PDB代码2obi)动作连系对象,固定gpx4的溶剂显现残基位点,只联想gpx4的疏水中枢区域,并接纳5条序列进行实验考据,其中4条序列的卵白不错测出gpx4的酶响应活性,3条活性高于野生型卵白。作家随后解出了这4个有酶活性的联想卵白的高分辨晶体结构,均与操办联想的结构模子在原子水平上高度一致(图4)。
图4 诓骗GeoSeqBuilder为靶标gpx4联想了5种新的疏水中枢堆积方式,其中3条序列对应卵白的酶活性有显耀提升
该使命发展了一种基于卵白质骨架结构和全原子模子的序列联想要领GeoSeqBuilder。该要领所联想的卵白质可溶性好、抒发量和热褂讪性高,不错折叠成预联想的卵白质结构。值得提神的是,GeoSeqBuilder不仅提供了与实验结构一致的侧链构象,新联想的序列还提供了各样化的疏水中枢堆积方式,从而扩大了序列景不雅。GeoSeqBuilder不仅在卵白质序列从新联想中具有紧迫酷爱,而且为卵白质工程和卵白质序列结构关系连系提供了新的视角。GeoSeqBuilder当今已开源(https://github.com/PKUliujl/GeoSeqBuilder),为卵白质干系的科学连系和分娩开导提供了过劲的器具。
该使命的第一作家为北大-清华人命科学合并中心2020级连系生刘佳乐,通信作家为来鲁华、张长胜。北大-清华人命科学合并中心连系生郭政、北大化学学院博士后由瀚天对该使命的完成作出了紧迫孝敬。干系使命得到了国度重心研发连系(2022YFA303700)和国度当然科学基金委员会名堂(21977007,22237002,T2321001)的资助。
参考文件
[1] Jiale Liu, Zheng Guo, Hantian You, Changsheng Zhang*刘涛 ai换脸, and Luhua Lai*. All-Atom Protein Sequence Design Based on Geometric Deep Learning.Angew. Chem. Int. Ed. 2024, e202411461.
[2] Jiale Liu, Zheng Guo, Changsheng Zhang*, and Luhua Lai*. All-atom protein sequence design based on geometric deep learning. bioRxiv(2024):2024-03.