PNAS 2025 | PackDock: 基于扩散模型的柔性蛋白-配体对接与侧链堆积
今天介绍的这项工作来自 Proceedings of the National Academy of Sciences of the United States of America。该论文提出了PackDock是一种面向柔性蛋白-配体对接的混合框架,通过将扩散模型驱动的侧链堆积模块PackPocket与基于物理的对接流程结合,同时学习并采样口袋在无配体与配体结合两种状态下的侧链构象分布,从而以更高效率覆盖侧链重排等关键柔性并减少传统启发式搜索的计算负担。该方法在侧链堆积、重对接、基于apo结构的对接、非同源配体诱导holo结构的交叉对接以及共折叠预测结构等多类基准任务中实现了更稳定的构象预测与更高的对接成功率,尤其在低相似度与更贴近真实应用的场景中体现出优势。前瞻性应用方面,PackDock在ALDH1B1虚拟筛选中筛得具纳摩尔级活性且骨架未报道的抑制剂,并能解析关键残基的构象分布趋势,为蛋白动力学视角下的分子识别研究与结构基础药物设计提供了更具物理可解释性与泛化能力的实用工具。

获取详情及资源:
- 📄 论文: https://www.pnas.org/doi/10.1073/pnas.2511925122
- 💻 代码: https://github.com/Zhang-Runze/PackDock
0 摘要
理解蛋白质结构与动力学对于基础生物学与药物设计至关重要。传统方法往往给出偏静态的构象,难以充分表征蛋白质在结合过程中的柔性变化,从而限制了对真实蛋白-配体相互作用的刻画。PackDock是一套将深度学习与基于物理的建模结合起来的框架,用于更细致地表示蛋白-配体相互作用。其中的核心模块PackPocket以扩散模型为基础,能够采样多样化的结合口袋构象,并预测配体诱导的口袋变化,从而在对接过程中显式纳入侧链重排等柔性效应。在侧链堆积、重对接(redocking)以及交叉对接(cross-docking)等测试中,PackDock表现出对蛋白柔性挑战的良好适应性,能够在不同场景下更准确地预测复合物构象,并生成覆盖度更高的口袋构象集合,以支持对配体结合方式的合理解释.在真实应用中,PackDock为目标蛋白筛选到纳摩尔亲和力且具有未报道骨架的化合物,体现出在发现新型先导结构方面的潜力。与此同时,该框架还能揭示关键氨基酸的构象变化,为理解蛋白-配体作用机制提供更直接的结构线索。总体而言,PackDock通过在多种对接情境下实现更可靠的复合物构象预测,有助于加深对蛋白质动力学的认识,并为基础研究与药物发现提供新的视角与工具支持。
1 引言
理解蛋白-配体相互作用是生物学研究的基础,既关系到细胞过程的机理阐释,也直接支撑疾病治疗手段的开发。蛋白质作为细胞内的核心功能执行者,常通过与小分子或其他蛋白质结合来发挥作用,从而触发信号级联、催化化学反应或调控基因表达。当这些相互作用能够在分子层面被准确刻画时,不仅可以解释生物系统如何运转,也为通过外源干预实现治疗调控提供依据。在药物发现领域,这种认识进一步落到结构基础药物设计这一更具工程属性的框架之中,其目标是围绕明确的分子靶点开发新药。近年来,结构生物学与从头蛋白折叠算法的快速进展显著提升了三维蛋白结构的可获得性,但这类结构多以静态形式呈现,往往难以满足结构基础药物设计对真实结合构象的需求。例如,无配体的apo结构,以及与非同源配体形成的holo结构,都可能使配体结合模式的推断产生偏差。同时,折叠算法预测得到的结构也并非都能直接用于结构基础药物设计,其中一个重要原因在于蛋白质会持续调整内部运动以适配不同的分子伙伴,从而呈现出结构柔性与构象多样性。
近期,共折叠类方法的出现显著改变了蛋白-配体复合物结构预测的讨论格局,相较传统对接方法展现出更突出的基准表现。然而,多项评测也提示,现有共折叠框架仍未能稳定地反映物理一致且可解释的相互作用原则。因此,能够显式考虑蛋白-配体复合物结构柔性的建模方法成为迫切需求。这类方法不仅有助于克服当前结构使用与预测的局限,也可能扩展结构基础药物设计可覆盖的靶点范围,为药物发现与开发打开新的空间。
蛋白-配体结合过程的动力学常用两种经典机制来描述。其一是构象选择,即受体在游离态本就存在多个构象,配体倾向性地结合其中少数构象,并通过破坏原有的构象动态平衡,促使更多构象向被选择的构象聚集。其二是诱导契合,即配体首先结合受体的主要游离构象,随后受体发生构象变化,形成结合更紧密的复合物构象。不同体系中的结合过程可能遵循不同机制,也可能两种机制同时存在。在这一经典框架之上,相关研究引入基于扩散的模型,学习在无配体与配体结合两种状态下侧链构象的条件分布,以表征支撑蛋白-配体识别的构象转变过程。
深度学习近年来显著提升了刚性分子对接的性能,并推动其在高通量虚拟筛选中的应用。但真实场景中holo结构往往难以获得,而直接在apo结构上对接又容易导致结合模式预测错误。大量失败案例表明,只要对口袋周围apo状态的侧链方向进行合理调整,不少配体即可被成功对接,且其姿态往往与晶体构象非常接近,与晶体构象相比通常可达到2.5ÅRMSD以内。与之相对,从apo到holo的主链移动通常较小,多在1Å以内;对接失败更常源于口袋附近侧链构象的改变。基于这一观察,兼顾准确性与复杂度的策略往往不是追求全柔性对接,而是聚焦于局部柔性,尤其是口袋周围侧链的可动性。现有多数柔性对接算法沿用这一思路,通常依赖旋转异构体库与启发式搜索来处理侧链柔性,但其计算代价会随可动侧链数量呈指数增长。同时,这类方法往往需要人工指定关键侧链,从而限制其在结构基础虚拟筛选中的可用性。部分管线方法还会在经验打分函数、隐式溶剂力场能量等支撑下对口袋区域主链进行轻微调整,但通常需要更高的计算资源。
在深度学习方法中,一些模型仅以蛋白质的粗粒度Cα表示进行建模,在获得配体姿态时隐式考虑一定柔性,但难以给出结构基础药物设计所需的原子级复合物细节。也有方法通过蛋白-配体距离图重建复合物构象,或利用等变神经网络预测配体三维坐标,还有方法将对接简化为生成配体的旋转、平移与扭转角。近期也出现了直接预测复合物三维坐标、并将蛋白侧链柔性纳入预测的工作,以及同时统一建模蛋白与配体柔性、以支持酶与小分子协同设计的框架。然而,这些深度学习方法各自仍存在不足,例如因物理约束学习不足而生成不合理的配体构象,或因未充分考虑侧链构象而导致蛋白与配体发生空间冲突。因此,仍需要一种更灵活且高效的方法,能够在避免上述限制的同时,有效表征蛋白侧链的构象变化,并可直接服务于基础生物学研究与药物设计。
该研究提出了PackDock这一柔性蛋白建模框架,将基于物理的建模与深度学习方法结合,用于刻画蛋白-配体相互作用。其中的核心模块PackPocket是一个基于扩散模型的侧链堆积模型,能够同时从蛋白“游离态”与“配体结合态”的构象分布中采样,并通过预测侧链扭转角来简化侧链柔性建模的难题,从而在保持表达能力的同时提升建模效率。
为评估方法的可行性与实用性,研究围绕多个与基础生物学和药物设计密切相关的任务设计了一系列实验,包括侧链恢复、柔性重对接以及在apo结构、holo结构与折叠预测模型上的交叉对接。这些测试尽量贴近真实生物学场景,用于检验PackDock在不同条件下的表现。此外,该方法还在一个面向醛脱氢酶1B1(ALDH1B1)的真实项目中得到验证,以展示其在基础研究与药物发现中的应用潜力。研究进一步对过程中生成的侧链构象进行可视化,用以探索该框架捕捉关键氨基酸潜在侧链构象变化的能力。通过上述较为系统的评估,PackDock被定位为一种有望突破静态结构限制、增强多种生物学语境下蛋白-配体相互作用理解的实用策略。
2 结果
2.1 PackDock总体框架
当缺乏蛋白-配体结合模式的先验信息时,柔性对接往往更能满足药物设计需求。然而,传统柔性对接算法通常依赖旋转异构体库并通过启发式搜索遍历侧链构象,效率较低;而部分深度学习方法由于物理约束刻画不足,可能生成不合理的复合物构象。为缓解这些问题,PackDock被提出为一种结合深度学习与传统对接优势的对接方案,其设计目标是在不牺牲结构基础药物设计所需的原子级复合物细节前提下,提升柔性对接效率,并尽量去除不必要的迭代过程。如图1A所示,PackDock采用两阶段采样,联合考虑蛋白在无配体与结合配体两种状态下的构象分布,从而避免多步搜索流程中常见的大量计算迭代。在口袋构象采样阶段,PackDock利用扩散模型的条件生成能力构建两个相互独立的侧链堆积模型,使得口袋在配体缺失与配体存在两种情况下的潜在构象能够被同时纳入考虑。该框架对对接算法具有兼容性,能够接入任意对接程序,并且可通过引入其他对接算法进一步增强柔性对接表现。具体的对接协议,包括口袋构象的聚类策略与柔性残基的定义,在附录S2中给出。
PackDock的第一阶段用于模拟无配体状态。在口袋中不存在配体的条件下,第一个口袋侧链堆积模型借助扩散模型生成多样性的能力,可产生口袋“游离态”的
PackDock的核心模块PackPocket旨在学习蛋白口袋侧链在无配体与配体结合两种状态下的构象分布。与将侧链预测视为回归任务不同,PackPocket使用扩散模型将其定义为生成任务,从而更适合刻画蛋白侧链构象的多峰概率分布。其扩散过程从随机初始化的侧链构象出发,在每个时间步由几何图神经网络预测侧链扭转角的score,并据此逐步去噪以得到合理构象。在表示上,PackPocket定义了氨基酸侧链与其扭转角(Tor1-Tor4)之间的双射映射,各残基的具体基于原子的扭转角定义在附录表S1中列出。几何图神经网络由三类节点构成:蛋白残基、蛋白原子与配体原子,示意见图1D。网络中还构建了多种边,包括基于距离的边、共价键边,以及蛋白原子与蛋白残基之间的关联边等,以促进不同节点间的信息交换,示意见图1E。这些交互信息随后被聚合到侧链原子层面,用于指导对随机侧链构象的去噪过程,示意见图1F。模型细节在方法部分给出,训练相关的参数配置,如优化器设置、训练时长与硬件环境等,在附录S6中说明。
总体而言,PackDock通过PackPocket将基于物理的对接算法与基于深度学习的蛋白柔性建模整合到统一框架之中,在显著提升柔性对接效率与稳定性的同时,能够对蛋白-配体复合物构象进行更精细的建模与预测,从而为结构基础药物设计提供更具可用性的构象结果。

图1 | 展示了PackDock的整体流程与PackPocket模块的关键组成。(A)PackDock以两阶段运行。第一阶段使用扩散模型PackPocket探索空口袋的侧链构象,以覆盖多样的受体口袋形态。第二阶段将第一阶段获得的多样口袋构象作为受体用于对接,并利用对接后配体的构象来建模配体在结合过程中对口袋构象的影响,最终得到能够反映结合过程动态变化的受体-配体复合物构象集合。(B)PackPocket既可以在无配体条件下考虑侧链构象空间,也可以在配体存在时刻画结合态的侧链构象空间。(C)PackPocket模块的扩散去噪过程示意,该过程既可在给定配体的条件下执行,也可在不提供配体时执行。(D)口袋区域的原子图与配体图表示:口袋区域的原子图由残基节点构成,每个残基节点包含该残基对应的原子节点;当存在配体时,配体原子也作为节点纳入图结构。(E)嵌入更新过程:残基节点的信息由其对应残基的原子节点进行更新;配体原子节点的信息作为输入,用于更新相应的残基节点与原子节点。其中橙色边表示原子与其所属残基之间的连接,灰色边表示共价连接,绿色边表示基于距离的连接。(F)扭转角score:score模型在原子级嵌入表示的基础上更新侧链的扭转构象,从而逐步得到合理的侧链排布。
2.2 口袋侧链预测性能
蛋白质构象并非静止不变,尤其在配体结合口袋区域,口袋呼吸效应或变构口袋等现象可能导致不同的侧链构象。当前尽管已有多种成功的蛋白结构预测算法,但其通常侧重评估单一结构的准确性,难以生成多样且具有代表性的蛋白构象集合。该模型旨在捕捉口袋区域的构象多样性。该节主要讨论PackPocket在保证侧链多样性的同时,预测口袋构象准确性的能力。
评估使用两个相互独立的测试集:PDBBind按时间切分的测试集与CASP13/14测试集,用于检验PackPocket在有配体或无配体条件下恢复口袋侧链的能力。用于侧链堆积评估的CASP与PDBBind蛋白靶标完整列表见附录表S2。训练完成后,在PDBBind数据集中测试距离配体5Å范围内的侧链构象,平均覆盖约20个残基;在CASP13/14测试集中则使用Fpocket口袋搜索工具提取口袋区域,平均覆盖约23个残基。为便于对比,同时测试了多种常用侧链堆积模型或工具,包括传统方法SCWRL、FASPR,以及深度学习方法AttnPacker、DiffPack。对于基于生成模型的堆积方法DiffPack与PackPocket,采用多次并行运行,并在统计分析时选择与真实蛋白口袋构象最接近的一次结果。RMSD计算仅在预定义口袋区域的侧链原子上进行。
结果显示,如图2A、图2B及附录表S3所示,基于生成模型的堆积方法在单次预测构象的准确性方面,相较基于回归的堆积模型并未体现显著优势,这一表现可视为生成式堆积模型的性能下界。然而,生成式堆积模型的准确性会随采样数量增加而提升,这一趋势在DiffPack与PackPocket中均可观察到。此外,由于PackPocket在训练中使用了不同数量的口袋晶体结构作为数据,并引入配体条件信息,其在口袋区域的性能提升相较DiffPack更为明显。当采样规模为
总体而言,这些实验验证了PackPocket能够在口袋区域捕捉较为准确的构象,同时通过多次采样维持侧链构象多样性,显示出其用于建模口袋柔性与侧链构象空间的可行性。

图2 | 展示了不同基准数据集上的侧链堆积与重对接结果,用于评估采样规模与柔性对接效果之间的关系。 (A)在CASP数据集的堆积实验中,比较不同采样数量下侧链原子RMSD的变化趋势,虚线表示采样数为1时方法的性能作为参照。(B)在PDBBind数据集的堆积实验中同样考察不同采样数量下的侧链原子RMSD,用于对比不同数据分布下采样对恢复精度的影响。(C)在重对接实验中,统计柔性对接方法在不同侧链RMSD阈值下的比例,以刻画在不同精度要求下方法能够达到的覆盖水平。(D)对接过程中由PackDock与Vinaflex生成的侧链扭转角
2.3 基于holo结构的重对接性能
柔性对接算法的重对接(redocking)指在holo结构背景下对接时显式考虑侧链构象柔性。其隐含前提是,柔性对接方法首先能够预测接近天然态的holo侧链构象,随后再以该构象为基础预测配体结合姿态。因此,在评估柔性对接方法时,重对接过程中对holo侧链构象的准确预测是首要指标。为降低训练集与测试集蛋白相似性对重对接结果的影响,测试采用PDBBind按时间切分的测试集,并确保配体与受体无重叠。对PackDock生成的侧链构象进行分析后发现,如图2C所示,其侧链构象RMSD显著优于Vinaflex。进一步对侧链不同扭转角的平均绝对误差(MAE)进行统计,结果表明
2.4 基于apo结构的对接性能
在多数真实应用场景中,目标配体对应的holo结构往往难以获得,实际可用的通常是apo结构或由非同源配体诱导形成的holo结构。在此类条件下,将蛋白视为刚体且仅考虑配体柔性会带来明显局限。该节对齐上述现实情境,使用apo结构评估对接性能。已有研究从DUD-E数据库收集了32个靶点的apo结构,并为每个靶点配套多个与不同非同源配体结合的holo结构,同时依据结合位点处CαRMSD将其划分为三组:第1组CαRMSD<
结果如图3A与图3B所示,PackDock在全部靶点上显著优于现有对接方法。表1进一步汇总了不同分组的配体平均RMSD,以及RMSD<
除总体对接精度外,还对PackDock在修正apo侧链构象方面的改进进行了分析。结果显示,PackDock能够显著降低apo侧链构象相较原始apo结构的侧链RMSD,不同主链RMSD阈值下侧链RMSD的分解统计见附录图S5。与此同时,PackDock在不同复杂度配体上仍保持优势,配体复杂度由重原子数与可旋转键数定义,相关趋势见附录图S6与S7。代表性体系中apo、holo与柔性对接复合物(PackDock对比Vinaflex)的可视化比较见附录图S8,展示了PackDock在消除位阻冲突、补全缺失相互作用以及保持关键接触方面的能力。总体来看,在第2组与第3组中,随着主链RMSD增加,各方法性能均略有下降,但PackDock仍保持较高水平;在所有分组中,PackDock相较其他方法将对接成功率提高了17.85%。综合而言,PackDock能够有效考虑配体诱导的蛋白构象变化,并在apo结构条件下更准确地预测配体的结合姿态。

图3 | 展示了跨基准的交叉对接结果,重点评估在apo与holo两类受体条件下不同方法对配体结合姿态的预测能力。 (A)在使用apo结构时,给出所有分组在不同RMSD阈值下配体RMSD的比例分布,用于反映总体对接精度随阈值变化的趋势。(B)同样在apo条件下,汇总不同方法在所有分组中达到配体RMSD<
2.5 基于holo结构的交叉对接性能
当使用由非同源配体诱导形成的蛋白结构并将其视为刚体时,往往会导致配体结合姿态预测不准确。该节聚焦于仅能获得非同源配体对应蛋白结构时的柔性交叉对接测试。DISCO是一个大规模交叉对接测试集,考虑到交叉对接任务本身的复杂性,既有工作对DISCO进行了下采样,得到7970对蛋白-配体结构对,并确保每个受体不会与其同源配体配对。该研究以这7970对结构对作为交叉对接测试集。对每一种方法均生成36个复合物构象,并选择与真实配体结合姿态最接近的构象进行统计分析;同时对所有传统柔性对接算法统一将柔性区域定义为距离配体
如图3C所示,不同RMSD阈值下配体姿态所占比例被可视化,PackDock对应曲线整体高于其他方法。进一步按不同RMSD阈值统计对接成功率,结果见图3D与附录表S5:当要求RMSD<
此外,还分析了holo主链构象差异对对接性能的影响,PackDock在不同主链变化与口袋变化阈值下的表现见附录图S11与S12。由于PackPocket主要聚焦侧链柔性,主链构象变化增大时对接成功率会相应下降;值得注意的是,口袋变化RMSD导致的性能下降明显慢于主链变化RMSD引起的下降,这从侧面体现了PackPocket对侧链柔性建模的有效性。总体而言,交叉对接数据集上的测试表明,PackDock相较传统柔性对接方法与深度学习对接方法均具有显著优势,并验证了在仅提供非同源配体诱导蛋白结构时开展柔性对接的可行性。
2.6 基于共折叠预测结构的对接性能
过去几十年里,实验手段解析了约10万条蛋白结构,但这仅覆盖已知蛋白序列空间的一小部分。近年来,蛋白折叠算法被用于探索更广阔的序列景观,然而多项研究表明,使用AlphaFold2预测结构进行对接的准确性仍明显低于晶体结构,主要原因在于缺乏配体信息且忽略了蛋白动力学。近期出现的共折叠方法在预测过程中引入配体信息,相较传统对接展现出显著性能提升,为结构基础药物设计带来新的机会,但最新基准评测也揭示了其局限性。例如,有研究在多种GPCR结构上评估AlphaFold3后发现,其主链准确性相对AlphaFold2有所提升,但配体位置预测仍常常不准确;也有工作指出AlphaFold3对分子大小、电荷、极性与柔性等理化扰动缺乏鲁棒性,提示其尚未形成一致的物理相互作用表征框架。另有证据表明,不少共折叠的“成功”可能源于训练集对配体姿态的记忆,当应用到分布外结构时性能会显著下降,从而引发对其泛化能力的担忧。PackDock采用物理对接与深度学习驱动的受体柔性建模相结合的混合策略,这种组合在记忆式泛化失效的场景中尤具价值。
为评估该设置下的表现,采用了相关工作整理的Runs N Poses数据集,并将评估限制在Boltz-2训练截止日期(2023年6月)之后发布的结构上,同时按与训练集相对的口袋覆盖度与姿态重叠度乘积SuCOS进行分层统计。由于Runs N Poses协议在每个体系上使用25次预测(5个随机种子×5个构象)评估共折叠方法,所有对比的柔性对接方法也统一生成25个姿态以对齐评估框架。为避免晶体主链与共折叠主链带来的偏差,PackDock的输入使用共折叠预测的主链;同时还评估了带口袋约束的Boltz-2(Boltz-2-pocket),其平均表现优于Boltz-2。
结果显示,在低相似度(<60%)场景中,PackDock取得了显著更高的成功率。尤其当相似度<40%时,PackDock相较Boltz-2约提升20%,相较Boltz-2-pocket提升约10%。这类低相似度样本通常最具挑战性,但也最贴近前瞻性药物发现的实际需求。在高相似度条件下,共折叠方法往往接近接近完美的准确性(>90%),PackDock的表现略低但仍保持竞争力,这与其依赖基于物理的搜索策略而非纯数据记忆的机制一致。按训练集相似度、配体复杂度(可旋转键数、重原子数)、口袋残基数与打分函数分层的成功率分析,以及PackDock与Boltz-2在Top-1与Top-5成功率上的直接对比,详见附录图S13-S17,且PackDock在Top-1与Top-5指标下均保持竞争性。
与代表性的传统柔性对接算法Sminaflex相比(该比较在提供准确主链并剔除主链偏差较大的体系,RMSD>
总体来看,共折叠方法为结构基础药物设计带来新的方向,但在物理可解释性与泛化能力方面仍面临基础性限制。与其将共折叠视为对传统对接的替代,更可行的路径是结合两类范式的互补优势。PackDock体现了这种协同思路,通过物理基础的搜索与受体柔性建模的结合,提供了更具实用性、物理可依赖性与可泛化性的结构基础药物设计框架,并为更广泛的结构基础药物设计应用提供支持。
表1 | 展示了与apo结构的对接实验。

2.7 ALDH1B1抑制剂的虚拟筛选
为评估PackPocket在真实药物发现中的应用潜力,相关研究围绕醛脱氢酶1B1(ALDH1B1)开展了前瞻性实验。ALDH1B1参与醛类代谢,研究显示其在结直肠癌与胰腺癌等多种肿瘤中呈高表达并发挥重要作用,且选择性抑制ALDH1B1可显著抑制结直肠癌球体与患者来源类器官的生长。目前已报道的ALDH1B1抑制剂类型较少,且均处于临床前研究阶段,因此发现靶向ALDH1B1的新型小分子抑制剂具有必要性。实验首先采用酶动力学测定评价候选化合物对ALDH1B1的抑制活性,并以IGUANA-1作为阳性对照;完整的虚拟筛选流程(包括化合物聚类标准与化合物库信息)见附录S3。ALDH1B1的表达与纯化、酶活实验、蛋白热转移(PTS)实验、表面等离子共振(SPR)实验以及NMR实验的详细方案见附录S19。最终筛得5个命中化合物,命中率为7.14%(图4A、图4B及附录S20与表S7)。这些化合物对ALDH1B1表现出显著抑制活性(图4C、图4E),并能明显提高重组ALDH1B1蛋白的热稳定性(图4D)。补充实验结果还包括命中化合物的SPR亲和力曲线(附录图S19)、对ALDH1B1及对照同工酶的抑制曲线(附录图S20)、筛选的70个化合物抑制率统计(附录图S21)、刚性对接与PackDock下命中化合物的打分与排序对比(附录表S7),以及晶体配体姿态(7mjd)与PackDock预测的484H9姿态对比(附录图S22)。实验结果表明,这5个化合物在ALDH家族内具有选择性,在所测试的多个蛋白中仅对ALDH1B1呈现显著抑制效应。SPR结果显示,这5个化合物的结合亲和力分布在0.109至1.67μM范围内(图4E、图4F及附录图S19)。此外,对其中活性最高的化合物484H9,进一步使用NMR验证其与ALDH1B1的结合,在与重组ALDH1B1孵育后观察到484H9信号衰减(图4G),并在STD谱中检测到正的STD信号,这些结果共同证实了484H9与ALDH1B1之间的相互作用。

图4 | 展示了PackDock在ALDH1B1靶点上的筛选流程与实验验证结果。 (A)给出了面向ALDH1B1的筛选方案。(B)展示了PackDock识别到的5个命中化合物的化学结构,并同时列出作为阳性对照的IGUANA-1。(C)给出了5个命中化合物在ALDH1B1酶动力学实验中测得的剂量-反应曲线,误差线表示3次独立实验的均值±SEM。(D)利用蛋白热转移(PTS)实验评估5个命中化合物与IGUANA-1对ALDH1B1蛋白热稳定性的影响。(E)汇总了所示化合物的IC50(由酶动力学实验得到)、融解温度差值
2.8 关键氨基酸构象分布的识别
为更深入分析PackDock在侧链构象预测方面的表现,研究给出一系列案例分析,均以apo结构为起点,目标是在配体结合后预测holo结构。图5展示了PackDock预测得到的多种侧链构象,并同时给出对应的apo、holo以及真实配体姿态以便对照。该对接策略能够准确识别apo与holo之间差异显著的氨基酸残基,并揭示其可能的构象分布偏好。例如在图5A所示的apo(5e8s,绿色)-holo(3hmm,青色)体系中,仅D351存在明显的侧链构象差异,PackDock不仅成功采样了该残基的侧链构象分布并找到与holo一致的构象,还捕捉到该位点呈现的双峰构象分布特征,与apo与holo均一致。其余氨基酸仅有轻微差异,PackDock则为其生成较为紧凑的单峰构象分布。类似地,图5B显示在apo(1pdb,绿色)与holo(1boz,青色)中,F31这一关键残基的构象差异显著,PackDock同样能够准确刻画这种构象偏移。其他代表性apo-holo体系中由PackDock预测的侧链构象可视化结果(如2ogv/3krj中的F797,以及4pyi/3bmw中的W193与N220)见附录图S23。
进一步分析PackDock生成的扭转角分布(见图5C与图5D)可见,对于apo与holo状态之间侧链扭转角变化较大的残基,PackDock能够采样到较宽的扭转角分布范围,典型例子包括apo(5e8s)-holo(3hmm)中的D351,以及apo(1pdb)-holo(1boz)中的F31。相反,对于apo与holo之间侧链扭转角变化较小的残基,PackDock采样到的扭转角分布更为集中,例如apo(5e8s)-holo(3hmm)中的Y282与H283,以及apo(1pdb)-holo(1boz)中的F34与Y121。上述结果表明,PackDock生成的侧链构象不仅准确,而且具有代表性。该优势有助于降低柔性对接过程的复杂度,从而提高对接成功率,并支持在apo状态下更精准地识别与配体相关的关键氨基酸残基。对柔性对接复合物构象的进一步分析(附录图S8)还显示,相较基于旋转异构体库的传统侧链预测方法,PackDock能够显著减少apo与holo配体之间的位阻冲突(附录图S8A-C),捕捉潜在的相互作用构象(附录图S8D-F),并在保持柔性的同时保留已有的与相互作用相关的侧链构象(附录图S8G-I)。这些优势为先导化合物优化阶段提供了可行方向,对实现更精确的结构基础药物设计具有重要意义。

图5 | 展示了代表性apo-holo体系展示了PackDock对关键残基构象变化与构象分布趋势的刻画能力。 (A)在apo(5e8s,绿色)-holo(3hmm,青色)体系中,D351表现出显著的构象变化。(B)在apo(1pdb,绿色)-holo(1boz,青色)体系中,F31表现出显著的构象变化,而其他构象差异较小的氨基酸则呈现紧凑的单峰分布。(C)统计了PackDock在apo(5e8s)-holo(3hmm)体系中生成的D351、Y282与H283侧链扭转角分布。(D)统计了PackDock在apo(1pdb)-holo(1boz)体系中生成的F31、F34与Y121侧链扭转角分布。
3 总结
结构生物学与基于AI的蛋白折叠算法快速发展,使更多新颖生物靶点的蛋白结构变得可获得。然而,这些结构多以静态形式呈现,往往难以充分反映蛋白在细胞环境中的动态本质。该研究提出PackDock,以缓解现有静态结构在理解蛋白-配体相互作用方面的局限。其核心思路是利用扩散模型的生成多样性与条件生成能力,分别模拟蛋白口袋在无配体与配体结合两种状态下的构象分布,并将基于物理的对接与由深度学习驱动的受体柔性建模耦合起来,从而支持对不同蛋白-配体结合过程的机制性解释。
围绕蛋白构象状态建模能力,研究设计了多类测试以系统评估PackDock。侧链堆积与重对接实验验证了其对配体结合位点侧链构象的准确预测能力;在apo结构、共折叠预测结构上的对接,以及针对非同源配体诱导holo结构的交叉对接,则体现了该框架在处理蛋白柔性挑战方面的实际价值;在ALDH1B1抑制剂的虚拟筛选中,PackDock识别到对目标蛋白具有纳摩尔亲和力且骨架未被报道的分子,进一步展示了其在基础研究与药物发现中的应用潜力。整体而言,PackDock能够处理多种来源的蛋白结构,并以较高精度预测蛋白-配体复合物结构,从而拓展对生物体系中蛋白-配体相互作用的理解。
生物分子识别机制与蛋白固有动力学紧密相关,如何在分子相互作用中有效纳入蛋白柔性仍是长期挑战。PackDock以数据驱动方式应对这一问题,通过从既有静态结构数据中进行深度生成学习,提炼氨基酸侧链的堆积偏好,从而为理解分子相互作用与蛋白在细胞语境下的动态行为提供关键线索。结合冷冻电镜与蛋白结构预测领域的最新进展,PackDock被认为有望成为生物研究社区的重要工具,为基础生物学与药物设计中的蛋白-配体结合过程提供更贴近真实的视角。