ByteDance Seed 2026 | Protenix-v2: 拓展结构预测与生物分子设计边界

今天介绍的是 ByteDance|Seed 的一项研究工作。该工作聚焦于生物分子结构预测与分子设计中精度与泛化能力不足的问题,尤其是在抗体-抗原相互作用建模和复杂靶点药物发现中的挑战。研究提出了Protenix-v2系统,将高精度结构预测与生成式分子设计进行统一建模,在抗体结构预测任务中实现显著性能提升,同时在零样本抗体设计中取得高命中率。实验结果表明,该模型不仅能够在GPCR等困难靶点上实现有效命中,还在分子可开发性和结构多样性方面表现优异。此外,模型在蛋白-配体合理性建模及跨变体结合设计中也展现出良好能力。整体来看,该工作为加速药物发现与生物分子设计提供了更高效、可靠的计算框架。

获取详情及资源:

0 摘要

随着生物分子建模技术的发展,结构预测与设计模型能够处理的问题范围不断扩大。在此背景下,提出了Protenix-v2系统,其同时覆盖高精度结构预测与生物分子设计两大任务。在结构预测方面,Protenix-v2在抗体-抗原任务中的成功率较Protenix-v1最高提升13个百分点,同时在5-seed设置下的性能已超过此前1000-seed的结果。在设计方面,Protenix-v2在新颖性受控的VHH-Fc设计任务中实现了目标层面100%的成功率,命中率最高达到48%。更为关键的是,在较难处理的GPCR靶点上,该模型在每个靶点仅16–30次测试预算条件下,实现了16%–88%(VHH-Fc)以及最高50%(mAb)的命中率。所得命中分子表现出良好的可开发性与多样性。除抗体相关任务外,还观察到配体相关合理性显著提升,并成功实现了跨变体的SARS-CoV-2刺突蛋白RBD迷你结合蛋白设计。上述结果表明,Protenix-v2在加速药物发现方面具有较强的稳健性与应用潜力。

图1|零样本抗体设计命中率(基于结构预测性能提升,见图2)

1 引言

对生物分子相互作用的刻画是理解作用机制和开展分子发现的核心。在实际应用中,这要求模型不仅能够解析折叠结构,还需能够准确表征分子界面以及在多样分子体系中候选相互作用的质量。近年来,全原子建模系统显著拓展了这一能力边界,使高精度预测从蛋白质扩展至更广泛的生物分子复合体,这些体系在药物发现中具有重要意义。

与此同时,生成式设计系统也从通用蛋白生成逐步发展为更加可控的设计范式,包括基于表位条件约束的设计以及特定抗体形式的结合分子构建。这些进展使零样本命中分子发现逐渐成为可能,近期模型已在靶点新颖性、抗体形式、可开发性以及不同靶点类别等方面展现出良好的泛化能力。

在此基础上,提出了Protenix-v2这一覆盖结构预测与分子设计的生物分子建模系统。在结构预测方面,Protenix-v2在抗体-抗原结构预测任务上表现出显著提升,同时在配体相关合理性方面也得到进一步改进。在分子设计方面,相较于此前PXDesign工作中以蛋白结合分子为核心的研究路径,进一步拓展至零样本抗体设计、可开发性评估,以及针对具有挑战性的靶点(如G蛋白偶联受体GPCR)的命中分子发现。GPCR作为治疗中具有重要价值的一类靶点,其抗体开发面临较大难度,主要由于其可接触的胞外表位通常较小且构象高度柔性。

关键结果如下:

• 抗体-抗原结构预测性能显著提升:在三个以抗体为核心的基准数据集上均实现性能改进,在DockQ>0.23条件下相较Protenix-v1最高提升13个百分点,在更严格的DockQ>0.8条件下同样表现出显著提升。同时,采样效率实现大幅跃升,在仅5-seed设置下的性能已明显超过此前1000-seed结果。

• 零样本抗体设计取得高成功率:在新颖性受控的靶点集合上,实现目标层面100%的成功率,经生物层干涉技术(BLI)验证的命中率范围为2%至48%。所得命中分子在可开发性和多样性方面表现优异,在热稳定性、自相互作用以及多反应性测试中的通过率分别达到100%、98%和93%,同时覆盖多个结构簇。

• 在高难度靶点上的有效命中发现:针对具有小尺寸且构象灵活暴露表位的GPCR靶点,在VHH-Fc与mAb两种抗体形式中均获得经BLI验证的命中分子。在每个靶点仅16–30个设计候选的严格测试预算下,实现了VHH-Fc中16%–88%、mAb中最高50%的命中率。

此外,还报告了两项进一步改进:(1)在近期蛋白-配体基准测试中,配体相关合理性得到提升;(2)成功设计出同时作用于原始株与Omicron变体RBD的双特异性结合分子,其解离常数达到纳摩尔级。上述结果表明,Protenix-v2在加速药物发现方面具有较强的稳健性与应用潜力。

2 方法

Protenix-v2主要在两种模式下运行:(1)用于预测并排序生物分子结构;(2)用于生成候选结合分子并进行优先级筛选,以支持后续实验验证。为确保评估过程的严格性并防止数据泄漏,模型训练过程中未使用2021-09-30及之后发布的wwPDB条目。该训练截止时间与近期相关模型所采用的标准保持一致,从而保证结构预测与零样本设计中报告的结果均基于真实的新颖数据或保留数据进行评估。

相较于早期版本,Protenix-v2在保持输入输出设定不变的前提下,对模型结构与训练策略进行了优化与改进。在分子设计方面,支持基于目标条件的灵活生成策略,既能够实现精确的表位定向设计,也可进行与具体位点无关的设计。其适用范围覆盖多种蛋白结合分子类型,包括迷你蛋白以及多种模块化抗体形式,如重链抗体可变结构域(VHH)和可变片段(Fv),其中包括重链可变区(VH)及与之匹配的轻链可变区(VL)。

在抗体设计场景中,进一步提供了对结合区域的精细控制能力:互补决定区(CDR)环可以在指定长度范围内独立设定,同时可引入预定义的框架或支架结构,以引导生成过程。

3 抗体-抗原结构预测

图2|Protenix-v2(PX-v2)在抗体-抗原界面预测中的基准评估 基于5个随机种子的排名top-1预测,在三个基准数据集上报告成功率。每个子图标题中的括号对表示为(条目数量/簇数量)。柱状图为累积堆叠:总高度表示 DockQ > 0.23 的成功率,较深色层表示达到 DockQ > 0.49(中等质量)和 DockQ > 0.8(高质量)的子集。Boltz-1 和 AF3 FoldBench-AB 的结果来自相关工作,其余模型通过排名分数选择器进行公平比较。AF3-AB 的结果来自 The OpenFold3 Team。

图3|采样效率与推理时扩展性能的提升 DockQ 成功率随随机种子数量变化进行绘制。阴影区域表示自助法(bootstrap)标准差。在 FoldBench-AB 中,AlphaFold3 仅提供 5 个随机种子的结果,因此以单个标记表示。

抗体-抗原复合物为基于结构的分子发现提供了极为严格的测试场景。尽管其建模在治疗应用中具有重要意义,但界面几何结构的准确预测仍然面临极高挑战。相关结果基于三个专门的抗体基准数据集进行评估:PXMeter-AB、FoldBench-AB以及AF3-AB。评估体系同时纳入了已公开结果的AlphaFold3、作为近期全原子模型代表的Boltz-1,以及性能较强的开源模型OpenFold3-preview2(OF3p2)作为对照。

与这些基线模型及早期版本相比,Protenix-v2整体表现出显著的性能提升趋势。在DockQ>0.23阈值下,在三个数据集上相较Protenix-v1实现了9至13个百分点的成功率提升。该优势在高精度区间同样显著,在更严格的DockQ>0.8条件下也取得了幅度相当的提升,体现出相较早期模型的明显跃升。这一进展使更多抗体-抗原体系能够达到可用于后续药物开发的实用精度范围。

在推理阶段规模扩展的情形下,性能优势进一步凸显。基于5-seed结果进行的统计显示,在扩展至最高1000-seed的范围内,成功率曲线始终保持领先。尽管已有研究表明抗体-抗原预测通常受益于更大的推理预算,但Protenix-v2在整个seed范围内均持续优于对比模型。值得注意的是,仅使用5-seed时的性能已超过Protenix-v1在1000-seed下的表现,体现出显著的效率提升。

在直接对比中,模型表现由此前与AlphaFold3大致持平提升至在抗体-抗原建模任务中取得明确领先地位。

4 零样本抗体设计

图4|VHH 零样本评估、结构多样性与动力学表征 a. VHH 面板的统计信息,包括原始设计数量、送至 BLI 测试的子集数量、确认命中的数量以及命中中的结构簇数量。 b. 来自不同结构簇的代表性结合构象,用于展示选定成功任务的结果。 c. VHH 结合体的 BLI 传感图示例。GRPC5D 的 K*D 在抗原天然二聚体状态下于多价条件中测量。

所报告的设计结果在此前PXDesign工作以蛋白结合分子为核心的基础上进一步拓展,实现了稳健的零样本抗体生成。为在兼顾靶点新颖性与结构复杂性的条件下评估Protenix-v2性能,构建了一个覆盖可溶性靶点与具有挑战性的膜蛋白的综合评估体系,以模拟真实的分子发现流程。

• 可溶性靶点:未直接复现既有研究中的完整靶点集合,而是优先选择能够进行即时实验验证的抗原,并在现有样本池中进行筛选,以覆盖多个已报道的新颖性设定与靶点类别。最终评估体系包括:

– 低同源单体靶点(BoltzGen靶点):纳入满足极低同源性条件的单体蛋白,即在30%序列一致性阈值下与PDB中已有蛋白高度不相似的目标。

– 新颖性筛选靶点(Chai-2靶点):基于训练截止时间之前发布于SAbDab中的抗原及其同源物进行排除,构建新颖性筛选后的靶点集合。

– 二聚体靶点案例:引入VEGF-A用于评估模型在非单体复合物中的设计能力,并拓展至超出单体体系的应用场景。

• 具有挑战性的膜蛋白(GPCR):纳入多个GPCR靶点。该类受体在治疗中具有重要价值,但其可接触的胞外表位通常较小且构象灵活,使得从头设计及传统抗体筛选均面临较大难度。

命中率、可开发性及多样性结果已汇总展示,相关实验细节见附录B。

可溶性靶点上的精度与效率表现:在VHH设计任务中,对多种可溶性蛋白进行评估,实现了目标层面100%的成功率,即每个抗原均至少获得一个经实验验证的结合分子。在新颖性筛选的可溶性靶点上,经生物层干涉技术验证的VHH-Fc命中率为2%至48%,在大多数重叠靶点上表现出较高命中率。仅在存在公开VHH基线的情形下进行直接对比,部分Chai-2重叠靶点仅以scFv形式报道。

表位选择对设计难度具有显著影响。在AMBP蛋白上,针对两个不同表位分别得到4%与48%的命中率,表明不同表面区域会显著改变从头设计的难度。因此,在新颖性筛选靶点中,采用与Chai-2一致的策略,优先选择天然配体结合界面作为设计区域。

GPCR靶点上的有效命中发现:GPCR作为高价值但难处理的靶点类别,其受体表面暴露区域有限且构象灵活,传统抗体开发方法难以适用。在零样本设定下,对每个靶点仅测试16–30个设计候选,并在VHH-Fc与全长单克隆抗体(mAb)两种形式下进行评估。尽管实验预算有限,仍在两种形式中获得可观命中率。在四个GPCR靶点上,VHH-Fc命中率分别为16%、62%、40%与88%,对应mAb命中率为0%、17%、50%与44%。结果表明,该模型在复杂膜蛋白靶点上仍具备良好的样本效率,并能够在不同抗体形式间实现有效迁移。针对GPRC5D靶点,所设计VHH-Fc的最低解离常数达到112 pM(在亲和增强条件下测得,源于抗原的天然二聚体状态)。

可开发性与多样性:单纯结合能力不足以支撑实际抗体开发,还需具备良好的药物化特性。因此,对生成分子的可开发性进行了系统评估,包括生物物理性质及结构多样性。结果显示,在热稳定性、自相互作用及多反应性测试中的通过率分别达到100%、98%与93%。此外,基于抗原对齐框架RMSD(4 Å)进行聚类分析,成功结合分子分布于多个结构簇,表明所得解并未集中于单一构象模式。不同结合模式的代表性结构进一步体现了其多样性。这些结果表明,所获得的零样本命中不仅具备实验可验证性,同时在生物物理性质、结合模式多样性及生化活性方面均具有良好潜力。

图5|可开发性相关的实验读数 三个子图分别总结热稳定性、自相互作用和多反应性,对应通过率分别为 100.0%、97.5% 和 93.3%。

超越人工直觉的排序能力:VEGF-A作为二聚体靶点,为排序能力评估提供了典型案例。对约300个设计的VHH候选进行评估,由人工专家与模型内置的两种排序器(Ranker A与Ranker B)分别筛选30个用于实验验证。Ranker A与Ranker B分别识别出9个与10个结合分子,其中5个为重叠命中,同时各自还识别出4个与5个独特命中,显示出互补优势。人工专家筛选得到7个结合分子,且均与模型结果无重叠,表明模型排序器能够捕捉与人类直觉不同的关键特征。结果显示,模型筛选的命中在1000 nM浓度下表现出更高响应,而人工筛选结果在多样性方面更具优势。

图6|VEGF-A 在人工选择与模型排序之间的比较 左:在 1000 nM 条件下,由人工专家选择与 Protenix-v2 中集成的两个模型排序器选择的经实验确认结合体的响应。模型排序器识别出更多高响应结合体,而人工专家更倾向于选择较弱响应的候选。右:所选结合体的结构簇组成。人工选择覆盖更广泛的结构簇,而模型排序器更集中于较少数量的高效簇。

5 扩展能力:化学合理性与多变体设计

除抗体相关任务外,Protenix-v2在小分子建模与多靶点设计方面同样实现了性能提升,从而在化学合理性与治疗应用广度等关键需求上取得进展。

5.1 基于无训练引导的配体合理性提升

在配体结合构象预测中,确保小分子结构的物理合理性至关重要,因为在传统几何指标下与参考结构高度一致,并不必然意味着局部几何结构具有化学合理性。诸如手性反转或键长异常等错误,会直接影响相互作用预测的可信度、配体构象应变的解释,以及模型输出在专家评估中的实用性。

结构合理性通常通过PoseBusters有效性标准进行评估。在该标准下,部分模型通过引入推理阶段的引导策略获得较高通过率。然而,基于案例的人工分析表明,即便在标准有效性检测中表现良好,预测配体仍可能不满足药物化学中同样重要的基本化学合理性要求。例如,即使通过原始有效性筛选,仍可观察到酰胺基团发生扭曲等问题。

表1|PXM-22to25-Ligand 上配体相关合理性评估(623 个测试条目,250 个簇) 以联合成功率进行报告,要求同时满足口袋对齐的配体 RMSD < 2 Å 且通过有效性判定。“PoseBusters”采用原始有效性定义,“Revised”采用正文中描述的更严格定义。

因此,在新版PXMeter(v1.1.0)中,对标准PoseBusters有效性标准进行了扩展,新增对sp2碳中心平面性、酰胺基团平面性以及sp3碳和氮中心非平面性的检测,从而实现对配体构象更全面的评估。

在基础模型之上,构建了Protenix-v1-TFG与Protenix-v2-TFG两种变体,设计思路借鉴了Boltz-1x、无训练引导方法、投影扩散以及分子动力学中的约束施加方法(如SHAKE算法)。这些方法通过对手性、平面性、扭转几何以及原子对间距离施加约束,引导生成过程趋向于满足基本立体化学与几何要求的配体构象。

在PXM-22to25-Ligand测试集上对方法进行评估。该数据集包含2022至2025年发布的蛋白-配体复合物,可用于检验模型在最新结构上的泛化能力。性能采用联合成功指标进行评估,即同时满足口袋对齐的配体RMSD低于2 Å以及有效性检测通过。评估分别基于原始PoseBusters标准与引入新增指标后的修订标准进行。

结果表明,在更严格的有效性标准下,几乎所有模型的绝对成功率均有所下降。在该条件下,Protenix-v2-TFG达到60.46%,显著优于Boltz-1x(53.96%),并接近Boltz-2x的62.86%。Protenix-v1-TFG同样取得61.11%的表现,说明所提出的TFG方法具有稳定有效性。需要指出的是,尽管Protenix-v2-TFG性能已接近Boltz-2x,但后者仅作为参考,因为其训练截止时间为2023年,可能与部分评估数据存在重叠。

图7|配体结构中基于修订有效性标准的成功率在十个具有代表性的 PoseBusters 风格子项上的分解结果

图8|蛋白质–配体结构预测的案例分析 展示修订后的物理合理性评估标准的有效性,其中 TFG 变体通过检测,而 Protenix-v2 或其他基线模型未通过。上:Boltz-2x 预测出现扭曲的酰胺基团。中:Boltz-2x 预测得到畸变的芳香环结构,虽通过原始检测但被 sp2 平面性检测识别。下:Protenix-v2 在 sp3 碳中心周围预测出错误的平面几何结构。

为进一步分析各项有效性检测的贡献,对修订标准中的各项指标进行了单独评估。结果显示,差异主要集中在sp2中心平面性与sp3中心非平面性两项指标上,TFG变体在这些方面均更接近真实结构,而Boltz-1x与Boltz-2x存在明显偏差。真实结构在这些检测中的通过率接近100%,进一步验证了新增指标的合理性。这些结果表明,即使在原始标准下表现良好,现有模型在生成化学合理的小分子几何结构方面仍存在明显不足。

5.2 原始株与Omicron变体SC2RBD的双重结合设计

面向广谱结合能力的设计为Protenix-v2提供了更为严格的测试场景,因为候选分子需要在具有显著序列差异和表位变化的不同变体之间保持稳定结合能力。

此前PXDesign生成的迷你结合蛋白在SARS-CoV-2 Omicron B.1.1.529变体RBD上表现出较弱甚至缺失的结合能力。相比之下,在同时输入原始株与Omicron变体RBD的条件下,Protenix-v2在4个测试设计中成功生成了2个具备双重结合能力的迷你结合蛋白。两者在原始株与Omicron B.1.1.529变体RBD上的解离常数均达到纳摩尔级。

基于预测结构,对其设计机制进行了初步分析。从结构层面来看,该广谱结合分子可能通过补偿性相互作用实现稳定结合。在原始株复合物中,结合分子的R13残基可能与RBD上L492的主链羰基或Q493的侧链酰胺形成极性相互作用。同时,结合分子中N102的侧链酰胺也可能与Q493形成极性相互作用。在Omicron变体的预测复合物结构中,RBD上的Q493R突变引入了空间位阻与电荷变化。此时,结合分子中L103与E101的主链羰基可能参与与R493的极性相互作用。此外,N102侧链发生取向调整,与RBD上S494的主链羰基形成新的特异性相互作用。

这些结果表明,Protenix-v2具备设计跨变体结合分子的能力,对于开发能够抵御病毒进化的治疗策略具有重要意义。此外,在相关靶点之间实现交叉反应性同样是药物开发中的关键特性,有助于动物模型评估并提升临床前研究的效率。

图9|相互作用界面的细节展示 左图为结合体与 Omicron RBD 的复合物,右图为结合体与原型 RBD 的复合物。结合体以灰色表示。两图中界面关键残基以棒状模型表示,并以对应背景颜色标注。黄色虚线表示链间的极性相互作用。

表2|Protenix-v2 设计的 SC2RBD 迷你结合体对原型与 Omicron B.1.1.529 RBD 的亲和力 较低的 KD 表示更强的结合能力。

6 总结

Protenix-v2在直接面向治疗性分子发现的关键任务中,同时强化了结构预测与生物分子设计能力。在结构预测方面,最显著的提升体现在抗体-抗原建模任务上,更新后的系统在三个抗体相关基准数据集上均取得明显性能改进,并在推理预算增加时仍保持良好的扩展性。同时,在近期蛋白-配体基准测试中,配体相关合理性得到提升,在构象精度与有效性两方面均表现出改进。

在分子设计方面,支持在新颖性受控靶点上的零样本VHH发现,经生物层干涉技术验证的命中率为2%至48%,同时在可开发性评估中表现出较高通过率,并呈现出多样化的结合模式。这一能力同样适用于具有挑战性的GPCR靶点,在VHH-Fc与mAb两种形式下的零样本设计均在有限实验预算条件下实现较高命中率。此外,还展示了面向广谱能力的SC2RBD迷你结合蛋白设计结果,在4个候选中有2个在原始株与Omicron B.1.1.529变体RBD上均保持纳摩尔级结合能力。

总体来看,这些结果显著拓展了Protenix系统在抗体相关建模与设计任务中的实际应用范围。