分子对接软件总结

来源:分子对接  › 交流  › 倒序浏览
  • 回答数

    0

  • 浏览数

    1241

  • 收藏数

    0

作者:隔壁庄 发表于 2022-1-14 15:05:03
跳转到指定楼层
分子对接方法探讨了小分子在靶蛋白结合位点的行为。随着使用X射线晶体学或核磁共振(NMR)光谱实验确定更多的蛋白质结构,分子对接越来越多地用作药物发现的工具。对于结构未知的蛋白质,也可以与同源性建模的靶标对接。通过对接策略,可以计算出化合物的可药用性及其对特定靶标的特异性,以进行进一步的前导优化过程。分子对接程序执行搜索算法,其中递归评估配体的构象,直到达到最小能量的收敛。最后,亲和力评分函数ΔG[U total in kcal / mol] 运用来对候选姿势进行排名,作为静电和范德华力之和。生物系统中这些特定相互作用的驱动力旨在使结合位点表面与配体或底物的形状和静电之间具有互补性。

介绍
在现代药物发现中,当配体与蛋白质受体或酶结合时,通过形状和静电相互作用对其进行定量,蛋白质-配体或蛋白质-蛋白质对接在预测配体的取向方面起着重要作用。除了库仑相互作用和氢键形成以外,范德华相互作用也起着重要作用。所有这些相互作用的总和由对接分数近似,对接分数表示结合的潜力。在最简单的刚体系统中,在六维旋转或平移空间中搜索配体以适合结合位点,这可以用作药物设计的先导化合物(Alberg和Schreiber 1993)。
对于结合的复合物,刚性方法的对接精度要比未复合的分子高(Shoichet and Kuntz 1991)。即使观察到的结合形式和自由形式之间的结构变化很小,但准确性的差异也暗示了不能完全保证刚性的假设(Totrov和Abagyan 1994)。同样,即使具有简单的评分功能,例如表面互补性的量度(Katchalski-Katzir等人,1992年),溶剂可及的表面积(SASA)埋藏,无溶剂化,也无法区分附近的天然结构和远离天然的结构之间的差异。能量,静电相互作用能或总分子力学能(Shoichet and Kuntz 1991)。因此,通过允许受体和配体的柔性,对接程序被几个小组改进。
在受体的各向异性环境中,刚性配体的六个自由度中的柔性配体的熵损失以及结合后其内能的变化会极大地影响结合亲和力。在CHARMM软件包中引入分子机械能函数的局部最小化只会产生有限的改善(Brooks等,2009)。因此,关于对接过程之前的结合位点位置的信息对于增加对接效率非常重要。有几种空腔检测程序或在线服务器可以检测蛋白质中假定的活性位点,例如GRID(Goodford 1985),POCKET(Levitt and Banaszak 1992),SURFNET(Laskowski 1995)。),PASS(带有球体的预期活动位点)(Brady和Stouten 2000)和MMC(映射大分子地形)(Mezei 2003)。
报道的最早的对接方法是基于菲舍尔(Fischer)提出的锁键假设,指出配体和受体都可以被视为刚体,并且它们的亲和力与它们的形状之间的几何拟合成正比(Mezei 2003)。 。后来,由科什兰(Koshland)提出的“诱导适应”理论提出,配体和受体在对接过程中应被视为灵活的(Hammes 2002 ; Koshland 1963)。与相对独立的侧链相反,每个主链运动都会影响多个侧链。因此,就自由度的数量而言,完全柔性受体/配体对接中的采样过程比具有刚性受体的柔性对接中的采样过程具有更高的数量级。因此,这些灵活的对接算法不仅比刚性算法更准确地预测分子的结合模式,而且相对于其他化合物还具有结合亲和力(Verkhivker等,2000)。
在过去的二十年中,已经为学术和商业用途开发了60多种不同的对接工具和程序,例如DOCK(Venkatachalam等人,2003),AutoDock (Österberg等人,2002),FlexX(Rarey等人,1996)。),Surflex(Jain 2003),GOLD(Jones等人1997),ICM(Schapira等人2003),Glide(Friesner等人2004),Cdocker,LigandFit(Venkatachalam等人2003),MCDock,FRED(麦加等2003),教育部-码头(科尔贝等2012),LeDock(赵和·卡弗利2013),AUTODOCK维娜(特洛特和奥尔森2010),rDock(Ruiz-Carmona等人,2014年),UCSF Dock(Allen等人,2015年)等。
尽管配体放置策略彼此不同,但这些程序大致分为增量构建方法(例如FlexX(Rarey等人,1996)到基于形状的算法(即DOCK)(Kuntz等人,1982)。 ,遗传算法(GOLD)(Jones等,1997年),系统搜索技术(Glide,Schrödinger,波特兰或OR 97201)和蒙特卡洛模拟(LigandFit)(Venkatachalam等,2003年)。除GOLD外,几乎所有当前的柔性配体对接程序都将受体视为刚性受体(Jones等,1997)。)。对这些程序进行了评估,以测试其产生配体与其生物学靶标的正确结合模式的能力,并在虚拟筛选试验中鉴定得分最高的已知化合物。为了评估对接的准确性和结合方式,最初对FlexX进行了19种蛋白质-配体复合物的评估,随后对更大的200种复合物进行了评估(Rarey等,1996)。通过对282个共结晶的PDB配合物重新配位,评估了Glide的对接准确性,而在100和305个配合物上验证了GOLD(Friesner等,2004; Jones等,1997)。此外,据报道配体配合可用于19种蛋白质-配体配合物(Venkatachalam等人,2003年)),而DOCK多年来已在多个目标上得到验证(Bodian等人,1993; Debnath等人,1999; Shoichet等人,1993)。AutoDock和AutoDock Vina均使用30个结构已知的蛋白质-配体复合物的相同测试集进行校准,并具有实验确定的结合常数(Österberg等,2002; Trott和Olson,2010)。
在这些程序中,AutoDock Vina,GOLD和MOE-Dock预测得分最高的姿势。GOLD和LeDock能够识别正确的配体结合姿势。Glide(XP)和GOLD都以90.0%的准确度一致地预测姿势(Wang等人2016)。还显示,在针对因子Xa的虚拟筛选试验中,GOLD比Glide产生更高的富集因子,而在类似的虚拟筛选试验中,针对相同目标的Glide优于GOLD。总体而言,最近有报道说,这些对接程序能够预测平均1.5至2Å的均方根偏差(RMSD)的实验姿势(Bissantz等,2000; Dixon,1997)。)。然而,柔性受体对接,特别是受体中的骨架柔性,仍然对可用的对接方法提出了重大挑战。
刚体对接
刚体对接产生大量具有良好表面互补性的对接构象,然后使用近似自由能对构象进行重新排序。快速傅里叶变换(FFT)相关方法(Katchalski-Katzir等1992)使用静电相互作用(Mandell等2001)或静电和溶剂化术语(Chen等2003)系统地探索了对接构象的空间,但是势限于相关函数形式。后来,极傅立叶相关性被用来加速寻找候选低能构象(Ritchie和Kemp 2000)。此外,还有其他方法,例如计算机视觉概念(Wolfson和Nussinov2000年),布尔运算(Palma等,2000年)和遗传算法(Gardiner等,2001年)也被使用。实际上,傅里叶变换算法也可以使用球谐分解来加速在FRODOCK中使用的3D旋转空间的搜索。为了进一步改善FFT对接,添加了原子接触能以估计RDOCK中的去溶剂化能和ZDOCK中的静电校正(Bissantz等,2000; Metropolis和Ulam 1949)。
在没有基于3D网格的搜索系统的情况下,还有其他类型的基于FFT的有用的刚体对接工具,例如Hex(Ritchie和Kemp 2000; Ritchie和Venkatraman 2010)。HEX对旋转和平移空间均使用球极傅立叶相关性。此外,傅立叶基于变换的算法的效率进一步计算与先进的软件包,诸如三维卷积库(Pierce等人的帮助加速2011),和新的硬件技术,诸如图形处理单元(GPU) (Ritchie和Venkatraman,2010年)和Cell BE处理器(Pons等,2012年))。对接程序“ DOT”对一个分子执行系统的刚体搜索,对第二个分子执行平移和旋转定向。最后,利用FFT有效计算了所有生成构型的相关函数的静电和原子去溶剂能的分子间能量之和(Roberts等,2013)。
MEGADOCK与ZDOCK相似之处在于,它使用FFT在基于网格的3D空间中生成对接构象。但是MEGADOCK的计算比ZDOCK快8.8倍,这是因为分数函数简单得多,其中仅考虑形状互补性和静电(Ohue等人,2014a)。使用这两个程序,已经确定了细菌趋化途径中的核心信号过程(Matsuzaki等,2014)。后来,开发了FFT中的软对接方法,其中将配体和受体视为刚性体,并通过允许一定程度的蛋白间渗透来计算其构象变化(Katchalski-Katzir等人1992)。这些域间姿势也通过结合能和基于从pyDockTET中的连接子和端到端距离(束缚式对接)得出的约束的伪能量项进行评分。
其他程序包括SOFTDOCK(Jiang和Kim,1991),BiGGER(Palma等,2000)和SKE-DOCK(Terashi等,2007)。为了匹配效率,当每个网格点被蛋白质占据时,其值为“ 1”,否则为“ 0”。该基于网格的系统类似于基于FFT的网格搜索,不同之处在于它在网格上的值更简单。尽管配体-蛋白质复合物的亲和力主要由互补的物理化学特征决定,但是形状互补成为刚体对接程序中必不可少的部分(O'Sullivan等,1991)。)。除了静电以外,基于几何学的疏水互补性也被纳入MolFit FFT程序中,以计算蛋白质与蛋白质复合物的界面(Katchalski-Katzir等,1992)。最近,开发了PIPER以利用原子i和j之间的成对相互作用势预测两种蛋白质的相互取向。在离散6D空间中,作为表示形状互补性,静电和去溶剂化能的项之和,评估了对评分功能的贡献。由于特征值-特征向量的分解,PIPER中获得的结构非常接近其天然构象,这是有效利用这一潜力的关键(Kozakov等人,2006年)。
然而,尽管这些算法具有良好的表面互补性,但它们并不十分适合于未绑定的晶体结构,并且产生了许多远离天然复合物的假阳性。为了进一步改善计算机模拟预报,开发了F 2 Dock,它还使用了形状互补性和基于库仑势的得分。该程序的结构还包含Lennard-Jones势,并且根据去溶剂化能对对接解决方案进行了重新排序。这些贡献被证明在有约束力的复合体中超过70%的情况有效。最低RMSD通过至少0.5埃45结合的非结合的复合物改进的和小于1的被视为27结合的结合的复合物(巴贾吉等人2011)。实际上,DOCK是第一个涉及通过一组球确定形状互补的程序,以确定配体与蛋白质的相互作用。配体所占据的体积取决于蛋白质结合口袋内部球体的直径(Kuntz等,1982)。通过基于距离相容性的最大团簇检测方法确定结合口袋内配体的初始取向。但是,通过匹配三元组中的特征,可以通过几何哈希快速访问数据。这些特征以球体的形式表示,并聚集为姿势(Fischer等,1993)。)。SDOCK通过将范德华吸引力,几何碰撞,屏蔽静电势和Lazaridis-Karplus去溶剂化能量纳入评分功能来执行全局搜索。结构的灵活性是基于从相应的连续形式中产生的逐步电位(Zhang and Lai 2011)。
Cell-Dock还基于表面互补性和静电,使用两个分子的平移和旋转空间执行全局扫描。与FTDock的最重要区别在于,网格大小的值固定在许多单元格中,这些单元格反映网格单元的分辨率和以埃为单位的总跨度(Pons等人,2012年)。此外,为了减少大型化合物库中分子的大小,在MS-DOCK中的配体和蛋白质之间引入了形状互补性,以执行有效的多构象刚体对接(Sauton等人,2008年)。配体和蛋白质之间的接触表面通过FLOG(Miller等,1994),CLIX(Lawrence和Davis,1992)中的高斯形状拟合函数进一步优化。),FRED(McGann等,2003)和PAS-Dock(蛋白质Alpha Shape-Dock)(Tøndel等,2006)进行刚体对接。
TagDock工具包通过生成随机摆放的对接(诱饵)来从刚性单体中生成大分子复合物,这些对对(诱饵)与单体间的距离限制相吻合,该限制是通过对每个诱饵使用惩罚来实验确定的(Smith等人,2013年)。使用局部形状特征算法的其他对接程序的示例包括LZerD(Venkatraman等,2009),PatchDock(Schneidman-Duhovny等,2005)和GAPDOCK(Gardiner等,2001)。几何哈希算法还使用局部形状描述符执行全局蛋白质-蛋白质对接,例如PatchDock中的表面斑块(Harrison等,2002年)或LZerD中的3D Zernike描述子(Venkatraman等,2009年)),蛋白质之间。最近,设计了一种集成算法MEMDOCK(Membrane Dock),用于在膜内对接。该方法同时对侧链和骨架柔性进行建模,并使用改良的Patchdock和Fiberdock对配体取向进行刚体优化(Hurwitz等,2016)。
刚体对接精度
如果配体与其活性位点的结合距离X射线溶液的给定阈值更近,则认为对接成功。应用于HIV天冬氨酸蛋白酶的DOCK程序产生了具有高效力的候选抑制剂,结果证明其对于临床使用而言太低了几个数量级。但是,该分子可用作设计更有效抑制剂的先导化合物。
Ring和同事设计了针对血吸虫和疟疾寄生虫蛋白酶的抑制剂,这些抑制剂通过使用形状互补功能和简化的分子机械势来逼近蛋白酶和配体之间的相互作用能,从而对致病性至关重要(Ring等人,1993年)。DOT程序成功地预测了带正电的细胞色素c到由亚基II形成的细胞色素c氧化酶表面的负区域的电子转移复合物(Roberts和Pique 1999)。使用BiGGER程序测试的25种蛋白质-蛋白质复合物中,有22种复合物接近天然对接的几何结构,与实验结构的CαRMS偏差≤4.0 A,其中20种顶级溶液中发现14种(Palma等等2000)。由于省略了水分子,使用几何和几何静电对接的MolFit程序中排名最高的解决方案可以在解构和未绑定结构的界面处识别出具有有限旋转自由度的几乎正确的解决方案簇(Heifetz等,2002)。与通过其他方法获得的结果相比,在CAPRI(交互作用的关键评估)实验的第1轮中,GAPDOCK正确预测了与靶标1的52个蛋白间接触中的17个和与靶标2的52个接触中27个(Gardiner等,2003)。)。使用PatchDock,在35个示例中,有31个示例的RMSD低于2Å。在26种情况下,正确的姿势排名第一,而在其他九种情况下,正确的解决方案排名在前30个构象中。但是,SymmDock仅预测具有循环对称性的结构。如果输入的单体在其天然复合物中具有不同的对称性,则SymmDock不适合这种预测(Schneidman-Duhovny等,2005)。
与未结合的简单-结合的目标的情况下,接口触点的47%被正确地预测ZDOCK,表明在结合位点预测其强度(Wiehe工厂等人2005)。INTELEF是SOFTDOCK的更新版本,它预测了83种解决方案中的66种经过纠正的解决方案,并排在前2000名解决方案中(Li等,2007)。使用SE-Dock服务器,所获得的模型与实验结构之间的最小RMSD分别为3.307和3.324Å。在对接步骤中,对于八个目标,SKE-DOCK服务器生成了配体RMSD为10或更低的可接受模型。对于三个目标的结果,SKE-DOCK在几何对接中失败,因为在对接步骤中获得了不合适的构象(Terashi等人,2007年))。仅考虑具有至少一个由ZDOCK生成的可接受解决方案的情况时,用于预测前10个和50个解决方案中可接受构象的pyDockTET的成功率分别为69%和77%,而仅pyDock的成功率是分别为62%和69%(Cheng等,2008)。
除了五个已知的困难情况(1BGX,1I4D,1SBB,1HE8、1IB1)以外,在FRODOCK得出的10,000个默认预测中,在几乎所有对接情况下,RMSDL≤10Å或RMSDL≤4Å的情况下,都找到了几种可接受的解决方案。 。2009年)。对于64%的乙酰胆碱酯酶复合物,通过HEX鉴定的形状互补性与天然结合位点重叠(Wass等,2011)。此外,Cell-Dock还在84个案例形成的蛋白质-蛋白质对接基准2.0版的未绑定结构上进行了测试。在89%的情况下使用CELL-256和85%的情况下使用CELL-128,对接姿势都更接近于天然构象。pyDOCK还根据静电,去溶剂化和范德华能量对这些结果进行了评估。pyDOCK的评分显示,CELL-256的成功率略高于CELL-128。使用CELL-256,使用CELL-128的案例中有19.7%的案例接近自然构象,而使用CELL-128的案例中有18.3%的案例中接近自然构象(Pons等人,2012)。)。在这两种情况下,差异都是最小的,通常在对FTDOCK模型进行评分时,其值与pyDOCK相似(Pons等人,2010年)。
根据2013年进行的最新CAPRI实验,ClusPro服务器在自动蛋白质对接方面表现最佳,与最佳人类预测因子组相当。其次是HADDOCK(de Vries等,2010),SwarmDock(Torchala等,2013)和PIE-Dock(Ravikant和Elber 2010)。在人类预测变量类别中,HADDOCK(Dominguez等人,2003年)排名第一,其次是SwarmDock(Venkatraman和Ritchie,2012年)。ICM(Fernández-Recio等,2002)排名第二至第五(Kozakov等,2013; Lensink和Wodak,2013))。CCDC-Astex组的85种蛋白质-配体复合物的预测结合模式在大约80%的rDock病例中是正确的(Ruiz-Carmona等,2014)。通过合并静电项,MEGADOCK 2.1成功地预测了得分最高的100个诱饵中结合集中的128个蛋白复合物和未结合集中的23个复合物中的至少一个近天然诱饵。与ZDOCK 3.0相比,MEGADOCK 2.1的成功率较低(Ohue等人,2014b)。
灵活对接
在标准的虚拟对接研究中,配体可自由对接到刚性受体中。然而,越来越清楚的是,侧链的柔性在配体-蛋白质复合物中起着至关重要的作用。这些变化使受体能够根据配体的方向改变其结合位点。在(6 + N)的配体定向的平移,旋转的维空间,和构象变量在该受体的各向异性环境(Jackson等人1998 ;月球和豪1991 ; Rotstein和Murcko 1993年ab ; Nishibata和板井1993年)。当前有四种不同的策略用于对接柔性配体,即:(a)蒙特卡罗或完整分子的分子动力学对接;(b)现场组合搜索;(c)配体积累;(d)站点定位和片段组装。
蒙特卡罗方法通过使用Metropolis准则接受或拒绝热力学可及状态的随机变化(Metropolis和Ulam 1949)。温度T升高的配置将通过所谓的模拟退火(Kirkpatrick等,1983)进行缓慢冷却而被接受。构象变化很大,允许配体穿过势能表面上的能垒。这种构象搜索技术与分子亲和力的潜力相结合,提供了一种有效的底物对接已知结构的方法(Goodsell和Olson 1990)。伴随着亲和势,在模拟退火中还增加了距离约束作为软势(Yue 1990)。
应用蒙特卡罗方法的示例包括AutoDock的早期版本(Novotny等,1989),ICM(国际计算机管理)(O'Sullivan等,1991),QXP(快速浏览)(Pellegrini和Doniach,1993),以及亲和力(Ring等,1993)。AUTODOCK 2.4生成使用利用公共力场分子亲和力网格利用蒙特卡罗模拟退火具有快速能量评估实际空间构象异构体(里奇1994)。ICM软件通过蒙特卡洛(Monte Carlo)运动和最小化相互作用势来在3D网格空间中生成配体。使用该软件,对FNR(铁氧还蛋白:NADP +还原酶)与其氧化还原伴侣之间的相互作用进行了建模,并预测了它们的结合界面。获得的结果与鱼腥藻和玉米的FNR:Fd复合物高度相似,在计算上显示出良好的相关性。QXP是一个多步对接程序,它使用局部Monte Carlo搜索并限制了旋转角度(Pellegrini和Doniach 1993)。
最近,发布了新设计并实现的AutoDock程序版本,称为AutoDock Vina。该版本放弃了以前的经验评分功能和基于GA的优化器,但采用了基于知识的评分功能,并采用了蒙特卡洛采样技术和Broyden-Fletcher-Goldfarb-Shanno(BFGS)方法进行局部优化。他们的仿真结果表明,预测准确性和对接时间均得到了显着改善。PSOVina是AutoDock Vina框架内的第一个PSO(粒子群优化)蛋白质-配体对接算法(Ng等人,2015年))。通过将Vina的高效本地优化器仔细集成到规范的PSO程序和适当的参数调整中,PSOVina在不影响对接精度的情况下,将执行时间显着减少了51–60%。近年来,群体智能算法已成为解决计算机科学中复杂搜索问题的一种快速而合理的技术。迄今为止,只有少数基于群的对接方法:SODOCK,PSO和Solis and Wets的本地搜索方法的混合体(Chen等,2007)。PLANTS,一种蚁群优化方法(Korb等,2009);pso @ autodock,一种速度自适应和再生压缩PSO方法(Namasivayam和Günther,2007年)); ParaDockS,一个并行对接套件,具有PSO作为优化算法(Banitt和Wolfson,2011年);完全知情的PSO方法FIPSDock(Liu等人,2013年)。其中三个程序是对流行的开源对接程序AutoDock的修改,尽管版本不同,并且与原始AutoDock实施相比,它们均显示出更好的预测性能。
此外,为了解决高度灵活的对接问题,引入了一种称为QPSO-ls(量子行为粒子群优化)的新颖搜索方法,该方法是量子行为粒子群优化(QPSO)和Solis的局部搜索方法的混合。润湿(Fu等人。2015年)。在另一个名为GalaxyDock的程序中,使用基于AutoDock的灵活侧链对接算法对受体侧链进行了预选和全局优化(Shin和Seok 2012)。FLIPDock使用AutoDock力场来生成多个受体构象,称为柔性树(FT)(Zhao和Sanner 2007)。此外,“ RosettaLigand”在初始步骤中使用低分辨率对接,同时进行平移和旋转调整(DeLuca等人,2015年)。GOLD通过使用遗传算法和位移松散结合的水在配体结合探讨了配体通过进化过程中的灵活性(Jones等人。1995年1997年)。后来,广泛的核磁共振(NMR)和可用的实验数据以及生物信息学数据被用来驱动HADDOCK的对接过程(Dominguez等,2003年)。
先前使用NMR数据对蛋白质-DNA和蛋白质-RNA复合物进行建模研究已被证明是成功的(Gu等人,2015; Bursulaya等人,2003; Paul和Rognan,2002; Berman等人,2002)。通过糖磷酸骨架和DNA碱基对的半柔韧性对DNA的各种构象柔韧性进行了采样,以进行进一步的对接计算。在FTDOCK中,对接得分是通过利用形状和静电互补性(具有近似的柔韧性)通过沿着DNA旋转和翻译蛋白质来测量的(Bruccoleri和Karplus 1990)。可以使用其他旋转异构体库将侧链放置问题简化为具有最小能量(即全局最小能量构象(GMEC))的组合优化问题(Kohlbacher和Lenhof 2000; Canutescu等人2003)。这些方法之一是基于Desmet等人的无死角消除(DEE)定理。(1992)。后来,在分支切割算法中,GMEC被研究为所有可行解的凸包,其中包含某些类别的定义不等式。然后,利用分子力学力场对通过这些技术生成的侧链构象进行几何优化。最后,估算了优化结构的结合自由能(Jackson and Sternberg 1995)。
此外,开发了算法,以灵活的对接和设计策略直接在结合位点建立配体。其中之一是使用分离的氨基酸残基的低能构象库作为构件,从头设计肽抑制剂(Moon和Howe 1991)。随后,该方法被扩展到非肽配体使用利用GroupBuild和LEGEND官能团或单原子设计(Nishibata和板井1993 ; Rotstein和Murcko 1993年ab)。Goodford引入了使用官能团(水,甲基,胺氮,羧基氧和羟基)作为分子探针绘制大分子结合位点的想法(Goodford 1985))。因此,各种探针的能量轮廓表面区分了探针和蛋白质之间的吸引力区域。该程序非常适合多拷贝技术(Miranker和Karplus 1991)。由Lewis和Dean(1989ab)率先提出的片段组装方法的目的是将单个分子片段连接成一个可行的分子。CLIX程序试图在蛋白质的结合位点进行一对有利的相互作用,并进行一对化学取代(Lawrence and Davis 1992)。LUDI放置分子片段以与酶形成氢键,从而填充了疏水口袋。这些片段,然后用合适的间隔物连接到一起(伯姆1992)。Verlinde及其同事的链接片段方法基于形状描述符(Verlinde等,1992)。Caflisch和他的同事使用针对HIV蛋白酶的MCSS(最大通用亚结构搜索)来绘制一个结合位点,并通过建立键连接他们发现的各种最小值来构建肽抑制剂(Caflisch等,1993)。在HOOK中,MCSS也用于制图阶段,但是最小值通过分子支架数据库连接可能的连接子(Eisen等,1994)。FlexX使用树型搜索技术将配体放入活性位点,从碱基片段开始逐渐增加(Rarey等,1996)。
与其他对接程序不同,Glide通过OPLS-AA力场(液体模拟的最佳电位)对对接配体的构象,方向和位置空间进行完整的系统搜索。最佳可能的构象使用蒙特卡洛采样法进一步完善(Friesner等,2004)。SLIDE(“有效地通过诱导拟合对接筛选配体”)优化基于均值场理论,平衡了配体和蛋白质侧链之间的柔韧性(Schnecke等,1998)。此外,在Surflex(Jain 2003)中实施了基于表面的分子相似性方法,以使用Hammerhead对接系统(Jain 2003)为分子片段快速生成合适的假定姿势。)。另外,已经提出了一种多目标对接策略MoDock,以进一步利用可用的评分功能将姿势预测分为以下三种类型:基于力场,基于经验和基于知识。所获得的结果表明,多目标策略可以提高与可用的评分函数对接的姿态预测功率(Gu等人。2015年)。
灵活对接的精度
最初,针对胸苷激酶(TK)和雌激素受体评估了具有六个评分功能(Chemscore,Dock,FlexX,Fresno,Gold,Pmf评分)的三个不同的对接程序(Dock,FlexX和GOLD),以测量虚拟筛选方法。在这三个对接程序中,GOLD的对接精度为60%,RMSD小于1.2,包括最差的对接方向,RMSD为3.1。令人惊讶的是,Dock和FlexX都无法针对至少三个TK配体(IdU(5-碘脱氧尿苷),hmtt(6- [6-羟基甲基-5-甲基-2,4-二氧六氢-嘧啶-5-基-甲基] -5-甲基-1H-嘧啶-2,4-二酮)和mct((North)-甲氨基甲酰胸苷)用于Dock; hmtt,更昔洛韦和喷昔洛韦用于FlexX)。此外,ERα受体与雷洛昔芬的对接效果最好,使用GOLD并在一定程度上使用FlexX获得了4-羟基他莫昔芬。另一方面,DOCK完全无法预测雷洛昔芬的可靠姿势。然而,在这些程序中,对接准确性和排名得分之间没有发现任何关系(Bissantz等。2000)。
2003年,使用37种蛋白质-配体复合物的数据集访问了五个对接程序,DOCK 4.0,FlexX 1.8,AutoDock 3.0,GOLD 1.2和ICM 2.8,并筛选了针对11种不同蛋白质的包含10,037个条目的化合物。结果表明,ICM对这些受体的对接精度最高,与AutoDock,DOCK,FlexX和GOLD相比,值为0.93,可接受的精度分别为0.47、0.31、0.35和0.52。在17种情况下,ICM预测筛选出的总库库中前1%内的原始配体,其中50%的潜在活性化合物低于最高得分溶液的约1.5%,而DOCK和FlexX预测仅约9%的潜在活性化合物。还发现,约有46%,30%,35%,46%和76%的分子通过AutoDock,DOCK,FlexX,2003)。
此外,在2004年,对来自蛋白质数据库(PDB)的100种蛋白质-配体复合物(Paul和Rognan 2002)进行了八个对接程序的评估(Berman等,2002)。)。在RMSD截止值为2Å时,使用FlexX,Glide,GOLD和Surflex成功地对接了50-55%的配体,而DOCK,FRED,SLIDE和QXP的成功率未超过40%。使用结合蛋白质的X射线构象,OMEGA可以预测100个配体中的99%的至少一个比2Å更近的构象。对于随机的配体构象,用FRED获得的对接位姿令人满意,从X射线构象得到的RMSD在1.76至2.14Å的对接位姿之间。所有这些对接程序在较小的疏水配体下均表现良好,而GOLD和Surflex的性能大致保持不变。而且,Glide和FRED在配体位置上仍然很有效,但排名能力很差(Kellenberger等,2004)。
在2004年的同一年,在150个不同的蛋白质-配体复合物的顶点数据集上评估了三个备受推崇的对接程序,即Glide,GOLD和ICM,以预测其重现晶体学结合方向的能力。在61%的情况下,Glide可以正确识别2.0Å以内的晶体姿势,而ICM的GOLD分别为48%和45%(Perola等,2004))。关于配体的复杂性,所有这些对接程序都表现良好,配体具有十个或更少的可旋转键。然而,当配体具有十个或更少的可旋转键时,LigandFit识别出其紧密构象的75%,而FlexX识别出少于十个可旋转键的69%接近构象,如果配体具有15个或更少的自由度,则增加到92%。与此相反,滑音的灵敏度以下,用78%的成功率与较小的复杂性小于15,而GOLD是最不敏感的所有(Kontoyianni等人2004)。
对40种锌依赖性金属蛋白酶配体复合物的已知晶体结构的评估显示,通过GOLD和DrugScore与适当的ZBG(锌结合基团)结合,能量构象最低。但是,DOCK,GOLD和DrugScore产生的RMSD值大于8,ZBG结合不正确,表明对接的位姿和晶体结构之间存在显着差异。相比之下,AutoDock和FlexX的效果更好,RMSD为2.91和2.63Å,并具有适当的ZBG绑定。如果将RMSD限制增加到2.5Å,则对所有五种方法而言,具有良好/公平ZBG绑定的良好姿势的百分比将增加到90%(Hu等人2004)。在预测最高得分分子的2%水平上,Glide可以识别五个蛋白质靶标中四个的已知活性分子。但是,对于10%和20%的水平,Glide是唯一一个可以识别五个靶蛋白中一个或多个已知活性分子的程序。当DOCKVISION和Glide考虑到5%的最高得分分子时,成功率达到了2%。通过为五个目标中的四个确定一个或多个活性种子,所有其他计划都取得了10%到20%的成功水平(Cummings等,2005)。
针对164个靶标的进一步结果显示,ICM和Glide与天然配体的最低平均RMSD分别为1.08和2.37Å,而GOLD和FlexX的平均RMSD则更差,RMSD分别为2.80和3.98Å。在2.0Å的RMSD截止值下,通过在此阈值内正确分类164种化合物中的149种和164种化合物中的104种,ICM和Glide的成功率分别为91%和63%。GOLD的表现也不错,将164个中的91个分类(占55%),而FlexX则较差,其中164个中有70个分类,占42%。ICM和Glide在更严格的RMSD截止值为1.0Å时再次表现出色,正确地将164个中的93个和164个中的81个正确对接,分别获得57%和49%的成功率。在164例病例中,GOLD成功了64例,成功率为39%,2006)。具有八个蛋白质靶标,通过至少一个程序将50%的配体对五个靶标放置良好。事实上,90%的配体能够以正确的方向停靠,100%可以在几种蛋白质目标的正确位置(Warren等。可以停靠2006年)。基于RMSD的针对13种类型的116种复合物的评估显示,没有对接程序明显优于GOLD。仅有GOLD的13种络合物发现RMSD为2Å或更好的溶液,而单独的AutoDock或DOCK都找不到溶液。仅由GOLD成功解决的复合物结合位点的大小分布广泛,从2253到7900Å,代表了各种蛋白质类型(Onodera等,2007)。
随后,针对7种蛋白质类型分析了10个对接程序和37种评分功能,以预测结合模式,使用虚拟筛选的潜在顾客识别和潜在顾客优化。在这十个程序中,Glide,GOLD和QXP在RMSD截止值为1Å的情况下,显示了成功案例的61–63%。在此临界值下,分别只有48%和54%的FLEXX和Surflex病例成功对接。RMSD阈值为2Å,使用Glide,GOLD,Surflex和QXP的配体占80–90%,而FLEXX和FRED分别有66%和62%的案例位于X-的2.0Å之内射线姿势。最后,DOCK和SLIDE仅在2Å RMSD阈值内放置了50%的配体。研究还表明,GOLD在亲水性靶标中表现良好,在亲水性靶标中,活性位点具有一定的亲脂性(即 嗜热菌素和PPAR-γ)。与GOLD相反,LigandFit和Glide在COX-2上表现良好,COX-2是一种主要具有疏水结合口袋的靶标(Kontoyianni等人。2004)。
此外,在PDBbind数据库上评估了七个常用程序,其中包含1300种蛋白质复合物(Plewczynski等人,2011年)。)。结果表明,Surflex,FlexX,LigandFit,eHiTS和GOLD是合理的,失败的复合物不超过30个,而其在GOLD和eHiTS中复合物的60%的最高得分构象低于2Å。AutoDock无法dock近90对,而只有1170个(占整个数据库的90%)配合物克服了Glide配体对可旋转键数(至35个)和配体大小为200个原子的限制。Glide,AutoDock和Surflex的姿态预测和评分功能均达到了约50%的结果。LigandFit的对接精度在可旋转键数较高的情况下达到了近60%,而中,弱键对接的准确性仅为50%。疏水分子的相关水平为0.2,尽管配体与蛋白质的接触基于范德华力和极性相互作用。
后来,使用19个对接方案来预测可用蛋白质/配体晶体结构的七个不同靶标(激酶,蛋白酶,异构酶,聚合酶,合成酶,金属蛋白酶和NHR)的136种化合物的结合构象。对于除HCVP以外的所有靶标,至少有一个程序能够将40%的配体停靠在晶体构象的2Å之内。在2010年,对195种蛋白质-配体复合物进行了测试,对四个流行的对接程序进行了评估,分别是Glide(4.5版),GOLD(3.2版),LigandFit(2.3版)和Surflex(2.0版)。在这四个对接程序中,GOLD和Surflex对数据集的处理良好,而Glide和LigandFit分别无法处理25和8个复合物。除了Surflex以外,其他程序在40%的情况下产生的对接解决方案均不到RMSD的1.0Å,而Glide和GOLD在这项高度多样化的测试中显示出60%的成功率。根据这些结果,这些对接程序的排名为Glide > GOLD + gold score > GOLD + Chemscore ∼ GOLD + ASP ∼ Ligandfit > Surflex(Li等。2010)。
最近,评估了十个对接程序。得分最高和姿势最好的成功率分别为40%至60%和60%至80%。在得分最高的姿势和原始姿势之间获得的RMSD小于2Å。根据得分最高的姿势的结果,学术课程的表现符合以下顺序:LeDock(57.4%)> rDock(50.3%)-AutoDock Vina(49.0%)> AutoDock(PSO)(47.3% )> UCSF DOCK(44.0%)> AutoDock(LGA)(37.4%),商业程序的代码按以下顺序确认:GOLD(59.8%)> Glide(XP)(57.8%)> Glide(SP)( 53.8%)> Surflex-Dock(53.2%)> LigandFit(46.1%)> MOE-Dock(45.6%)。商业对接程序在预测得分最高和最佳姿势时的平均成功率分别为54.0%和67.8%,2016)。这表明所有这些对接算法都能够探索构象空间,从而在各种蛋白质-配体复合物上的结合口袋中产生足够正确的对接姿势。
一般来说。当结合位点主要受疏水性接触影响时,Glide在结合位点多样化和配体柔性方面表现良好,而ICM和GOLD则表现较差。这些结果还表明,尽管从全球角度来看,尽管商业程序预测配体结合姿势的能力比学术程序的能力稍好,但是商业程序和学术程序之间的区别并不明显。
结论
基于结构的药物设计是一种针对X射线,NMR或同源性模型可针对大分子靶标的3D结构快速识别小分子的强大技术。由于有关蛋白质序列和结构的大量信息,单个蛋白质的结构信息及其相互作用对于进一步的药物治疗变得非常重要。尽管存在许多用于构象搜索和绑定姿势预测的对接程序,但评分功能并不准确,需要进一步改进。尽管如此,尽管每种对接策略都有弊端,但仍在进行积极的研究以解决所有与评分,明确的蛋白质柔韧性,明确的水分等有关的问题。
即使在缺乏有关结合位点和有限的骨架运动的知识的情况下,在过去的二十年中,也已经开发出了多种搜索算法来进行蛋白质-蛋白质对接。由于刚体对接可以系统地探索蛋白质之间的形状互补性,所以这可能不适用于对接单独结晶的蛋白质。因此,非常需要高分辨率的协议来理解基本原理,以检测蛋白质与蛋白质相互作用的基本机制以及与其他蛋白质的实际结合。利用经验势头进行核算甚至都不能消除所有假阳性。通过重新设计蛋白质界面,甚至可以个别调节蛋白质之间的相互作用,这取决于高分辨率对接方案产生的蛋白质复合物的准确结构。
尽管ZDOCK,rDOCK和HEX为结果提供了高对接精度,但由于刚体对接的限制,所提供的复合物在设计蛋白质界面抑制剂方面并不是很有用。因此,与刚体方法相比,开发了通常检查非常有限的构象的灵活方法。这些对接方法可预测最有可能在宽阔的表面区域上发生结合的姿势,然后将这些位点定义为高亲和力的复杂结构。最好的例子是HADDOCK软件,该软件已经成功解决了许多蛋白质-蛋白质复合物的精确模型。一个很好的例子是对先天性免疫系统成员Plectasin与细菌壁前体脂质II之间形成的复合物的研究。
然而,当前算法不能以令人满意的精度估计与分子间相互作用相关的绝对能量。溶剂效应,熵效应和受体柔韧性的主要问题仍然需要特别注意。截至目前,已证明在大多数情况下,诸如MOE-Dock,GOLD,Glide,FlexX,Surflex等用于处理侧链灵活性的方法是有效且足够的。小分子与受体之间的现实相互作用仍然依赖于实验技术。此外,使用当前的对接方法,尽管它们基于结合亲和力高精度地区分不同的配体,但是结合方式,溶剂作用,熵作用以及活性位点中带电残基的质子化状态的影响仍然是主要问题。 在社区努力的帮助下,例如CAPRI(交互作用预测的关键评估),基准测试克服了许多对接算法及其局限性。但是,灵活性问题仍在研究中,随着该领域研究的加速发展,将在不久的将来解决它。

分享:
回复

使用道具

成为第一个回答人

高级模式 评论
您需要登录后才可以回帖 登录 | 立即注册 微信登录
关于作者
隔壁庄

用户组:版主

  • 主题

    3

  • 帖子

    3

  • 关注者

    0