EJMC 2025 | 药物化学中的环系统:药物发现过程中环结构流行度随时间变化的化学信息学分析

今天介绍的是一篇发表于 European Journal of Medicinal Chemistry 的研究工作,作者系统梳理并分析了药物化学中环系统在近五十年里的使用规律与演变趋势.环结构作为小分子药物最核心的结构单元之一,不仅决定分子的空间构型,还深刻影响其理化性质、成药性以及与靶点的相互作用方式.该研究基于大规模ChEMBL数据库和药物化学文献,从化学信息学角度全面统计了不同类型环系统的出现频率、结构特征及其随时间的变化,并进一步结合靶点偏好和合成可及性进行讨论.通过对流行与衰退环结构的对比分析,文章揭示了药物化学设计中保守性与创新性并存的内在规律,为理解环结构选择背后的历史逻辑和未来趋势提供了重要参考,也为新一代药物分子设计和结构优选提供了具有实践意义的指导思路.

Ertl, P.; Altmann, E.; Wilcken, R. Ring Systems in Medicinal Chemistry: A Cheminformatics Analysis of Ring Popularity in Drug Discovery over Time. European Journal of Medicinal Chemistry 2025, 300, 118178. https://doi.org/10.1016/j.ejmech.2025.118178.

0 摘要

环结构是生物活性分子中最重要的结构组成部分。它们决定了分子的整体形状,固定取代基在合适的位置,并对关键的药代动力学和药效学性质产生重要影响。尤其是杂环,在绝大多数小分子药物中普遍存在,既可作为氢键供体或受体,又通过构象限制增强与靶点的活性和选择性。合成方法学的进步极大拓展了可获取的环系统化学空间,使得新颖且具有吸引力的环结构能够被快速构建。该研究系统分析了药物化学文献中所报道分子里不同环系统的出现情况,并展示了它们在不同时期的发展和应用变化趋势。同时讨论了多种影响这些变化模式的因素,包括新合成方法的引入、药物发现过程中采用的新技术与新策略,以及对影响候选药物研发成功的分子性质认识的不断深化。

1 引言

环结构在药物化学中的重要性首先体现在这样一个事实上:绝大多数生物活性分子至少包含一个环系统作为其结构单元.在ChEMBL数据库中,不含任何环结构的生物活性分子仅占0.42%.在过去20年中获得FDA批准的小分子药物里,95.1%的分子至少含有一个环.环结构赋予分子基本的三维形状,决定分子是刚性还是柔性,并使取代基固定在特定位置.分子的整体性质,如疏水性和极性,也在很大程度上受到环组成的影响.此外,环的电子性质决定了分子的反应性,进而影响代谢稳定性和毒性.鉴于环结构在药物化学中的核心地位,计算化学和化学信息学领域已经积累了大量相关研究文献.由于篇幅所限,这里不对相关工作进行全面综述,而是重点讨论与该研究直接相关的一些代表性工作.

对上市药物和临床试验化合物数据库的分析一致表明,大多数新药分子所包含的环系统在已有药物中曾经出现过.Shearer等人的研究指出,约67%的临床试验化合物采用了已知药物中的环系统,而完全引入全新环系统的情况非常罕见,通常每个分子中最多只包含一个新环.其基于网络的分析还显示,即便引入所谓的“新”环系统,这些结构往往也只是现有骨架的近似类似物,仅在少数原子上存在差异.这些结果凸显了药物设计中环系统选择的保守性,这很可能源于合成可行性以及成熟骨架在临床前阶段已获得的大量验证.

在诺华公司,研究人员通过分析大规模药物化学文献中的构效关系数据,系统刻画了生物活性环的化学空间,并筛选出一系列有望提升生物活性的环替换方案.同时,他们在严格遵循从生物活性分子中总结出的类药性和可合成性规则的前提下,通过组合扩展构建了一个包含约400万个环的数据库,其中99.2%的环在公共化学数据库中尚未出现.Jasial等人研究了针对五大主要治疗靶点家族的活性骨架数量随时间的增长趋势,并得出结论认为,新型骨架数量的快速增长及其多样性的提升,显著增强了骨架跃迁策略成功的可能性.Ritchie等人则分析了环结构性质,尤其是芳香性,对化合物可开发性的影响,系统考察了环组成对溶解度、亲脂性、P450抑制以及hERG结合等性质的作用,并提出了若干改善分子可开发性和口服吸收的建议.

除了药物分子中的环结构,其他类别分子中的环系统同样受到关注,例如天然产物或筛选化合物库.近期,Buehler和Reymond对生成分子数据库GDB-13s中的分子骨架进行了分析,并将其与其他大型分子集合中的骨架进行比较.结果显示,现有分子数据库主要由通过连接基相连的五元环和六元环骨架构成,而GDB-13s则包含尺寸各异的环以及不依赖连接基的复杂多环体系.在另一类生成化学数据库SAVI中,研究者同样对环系统进行了分析.SAVI包含超过10亿个被预测为易于合成的分子,其中涉及近4万个环系统,且相当一部分仅在该数据库中独有.

图1 | 药物化学文献中最常见的环结构. 其原子组成以不同颜色表示.

2 数据集与方法

在介绍具体方法之前,首先需要对该研究中使用的术语加以说明.“骨架(scaffold)”“环系统(ring system)”和“环(ring)”这些术语在药物化学中经常被使用,但并没有严格统一的定义.在该研究中,“环系统”(或简称“环”)指的是单个环,或通过稠合方式或螺环连接方式相互连接的多个环.环系统不包含任何非环原子,但通过环外双键连接的原子除外,这类原子最常见的是氧原子.当特指单个环时,无论其是孤立存在还是作为更复杂环系统的一部分,均明确称为“简单环”.

2.1 数据来源

为研究生物活性分子中环结构的出现频率,该研究分析了ChEMBL数据库中的分子数据.ChEMBL是药物化学领域不可或缺的资源,其第35版收录了约250万个分子、16000个靶点以及2100万条生物活性数据,相关信息主要来源于科学期刊及其他多种渠道.在分析药物化学中环结构的使用情况时,仅处理与该主题直接相关的期刊数据,排除了以天然产物、食品化学和农药为研究重点的期刊.数据集的主要来源包括J. Med. Chem.、Bioorg. Med. Chem. Lett.、Eur. J. Med. Chem.和Bioorg. Med. Chem.,文献时间跨度为1976年至2024年.在数据预处理过程中,首先剔除了有机金属化合物,其余分子则通过去除小分子片段和对离子以及电荷中和的方式进行标准化处理.最终得到的分子数据集包含约135万个唯一结构,来源于75000篇文献.

药物化学文献中出现的环系统还与常见合成分子中的环进行了对比,后者来自ZINC数据库中约1300万个具有商业可获得样品的结构.ZINC数据库中的分子采用与ChEMBL分子相同的方式进行了处理和规范化.该研究仅涵盖经同行评议发表的文献数据,未纳入专利中报道的环结构.这是因为专利并未经过同行评议,且常包含大量预测性实例,即实际上从未被合成的分子.因此,若要对专利文献进行有意义的分析,需要开展一项专门且独立的研究.

2.2 环结构的提取

环结构的提取使用了Molinspiration公司提供的mib软件包完成.在这一过程中,互变异构体的规范化尤为关键,因为含有多个氮原子、尤其是带有氢原子的氮原子的环,往往可以以多种互变异构形式存在.ChEMBL数据库在分子注册时并未进行互变异构体的统一处理,而是完全按照原始文献中的形式存储.因此,在分析过程中发现,同一个环在ChEMBL中可能以三种甚至四种不同的互变异构体形式出现.为合并这些情况,首先利用Molinspiration软件为所有环生成规范互变异构体.这种处理能够得到合理的互变异构形式,但并不保证其一定是最低能量构型,其目的仅在于整合同一环的不同互变异构体.随后,将某一环的所有互变异构体统一转换为其在ChEMBL数据库中出现频率最高的形式,其基本假设是该形式最符合药物化学家的偏好.

此外,还计算了所提取环系统的多种性质,例如芳香性、所包含的简单环数量以及最大简单环的尺寸等,以供后续分析使用.电荷中和与互变异构体规范化的处理旨在为统计分析提供统一的环系统表示.需要注意的是,这种规范化表示可能与分子在与靶蛋白结合时的实际形式并不完全一致.在生理pH值约为7.4的条件下,碱性原子通常会质子化,而酸性基团则倾向于去质子化.此外,蛋白质微环境还可能进一步改变配体的互变异构平衡,尤其是在多种互变异构体能量接近的情况下,如咪唑、苯并咪唑及相关杂芳香环体系中.

图2 | 药物化学文献中常见环结构(蓝色区域)与常见合成分子中高频环结构(橙色区域)的分布对比图. 横轴上的相对位置与环的出现频率成正比,最常见的环位于左侧,出现频率较低的环位于右侧.

3 结果与讨论

对来源于药物化学文献的135万个ChEMBL分子进行化学信息学分析后,共识别出29179种唯一的环系统.这些环的出现频率呈现出典型的幂律分布,也被称为“长尾”分布,即少数环极为常见,而大量环仅偶尔出现.共有26种环出现在超过1%的分子中,151种环出现在超过0.1%的分子中,而有13805种环,占总数的47.3%,仅在单个分子中出现.在药物化学分子中,最常见的环是苯环,出现在71.1%的分子中,其次依次为吡啶环9.4%、哌啶环7.0%、哌嗪环6.4%、吲哚环5.1%、吡咯烷环4.8%以及嘧啶环3.6%.图1展示了药物化学文献中最常见的80种环,并根据其元素组成进行了颜色标注.其中大多数环也同样出现在已上市药物以及Shearer等人所列出的Ⅱ期和Ⅲ期临床候选药物中.

在药物化学文献中出现频率超过0.1%的151种常见环系统中,81种,占53.6%,为芳香环或更准确地说是完全共轭环,49种,占32.5%,为脂肪族环,还有21种,占13.9%,同时包含芳香和脂肪族环.其中18种为纯碳环,其余均为杂环.数量最多的是含氮杂环,共有53种,其次是同时含氮和氧的环45种,含氧杂环22种,含氮和硫的环6种,同时含氮、氧和硫的环5种,以及仅含硫的环2种.

3.1 药物化学文献中的环与常见合成环的比较

另一个关注的问题是,药物化学文献中频繁出现的环与常见合成分子中普遍存在的环之间有何差异.相关分析结果如图2所示,该图对比了药物化学文献中最常见的100种环与从ZINC数据库中提取的100种最常见合成环,合计126种唯一环系统.图中横轴表示环的出现频率,左侧为最常见的环,右侧为较少见的环;纵轴表示某一环在药物化学文献中出现的相对倾向性,图的上方蓝色区域代表更偏向药物化学文献,下方橙色区域则代表更偏向常见合成分子.在两个数据集中频率相近的环位于图的中部.该图直观地突出了药物化学项目中常用环与一般合成分子中典型环之间的差异.

最显著的区别在于,药物化学中的环大多由五元或六元稠合芳香体系构成,通常含有多个氮杂原子,有时还带有一到两个通过环外双键连接的氧原子,而非芳香体系所占比例很低.相比之下,常见合成环中脂肪族体系的比例明显更高,且许多共轭环含有三个甚至四个环外双键原子,不仅包括氧,还包括硫和碳.这类环体系,如海因类、巴比妥酸衍生物或噻唑酮类,通常较易合成,也常可通过高效的多组分反应获得.由于合成便利,早期的组合化学库中产生了大量含有此类环结构的分子.然而,具有三个或四个环外双键的环在药物相关化学空间中的拓展潜力有限.其中一些在合成文献中频繁讨论的环体系包含α,β-不饱和酮结构,这些基团使分子易与亲核试剂发生反应,可能与半胱氨酸残基形成不可逆共价加合物,从而带来潜在的安全性风险并引发严重不良反应.尽管如此,共价药物发现近年来发展迅速,并因多种创新药物的成功而受到广泛关注.

常见合成环中还包含更多通过氧原子将脂肪族环与芳香环连接的体系.此外,多种含硫杂环也出现在常见合成环中,但在药物化学期刊的高频环中并不突出.这可能反映了对含硫杂环在代谢稳定性或其他ADME和毒性指标方面潜在问题的担忧,例如其相对于不含硫杂环更高的光毒性风险.

图3 | 具有明确靶点偏好的常见环结构. 母体分子所偏好的靶点类别以颜色区分表示(品红色–G蛋白偶联受体,蓝色–激酶,红色–蛋白酶,绿色–其他酶,棕色–核受体,黄色–离子通道,橙色–转运体,橄榄色–表观遗传靶点).

3.2 环结构的靶点偏好

某一环的靶点偏好是基于ChEMBL中所有包含该环的分子的生物活性数据来确定的.由于大多数环,尤其是常见的小环,往往存在于作用于多种靶点的母体分子中,只有当某一靶点类别中活性分子的数量至少是第二大类别的两倍时,才将该靶点类别认定为该环的“优势”靶点.分析中共考虑了九类靶点:G蛋白偶联受体、激酶、蛋白酶、其他酶、核受体、离子通道、转运体、表观遗传靶点以及其他靶点.在后续分析中,排除了与多种不同靶点相关的简单环,仅关注母体分子表现出明确靶点偏好的环.

这些环中最常见的代表如图3所示,并通过颜色标注其偏好的靶点类别.图中采用蜂窝状布局,通过ScaffoldKeys描述符计算每个环与其六个相邻环之间的相似性,并在布局中加以最大化.这类环体系也常被称为“特权环”.在图3中可以观察到若干明显的环簇,其中尤以具有激酶活性的6,5-稠合含氮杂环最为突出.Ⅰ型和Ⅱ型激酶抑制剂几乎总是包含富含氮的平面五元或六元环,这是因为这些杂环能够很好地匹配激酶铰链区的氢键模式,并以最优的几何构型嵌入ATP结合口袋.另一个显著的环簇对应于作用于G蛋白偶联受体的骨架,这一点并不意外,因为该类受体是人类基因组中数量最多的一类蛋白.这类受体的配体通常带有碱性胺基,以便与天冬氨酸或谷氨酸残基形成盐桥,例如位于跨膜螺旋3中的5-HT(2A)受体.而正构位点核受体配体则更偏好体积较大、多环或稠合芳香结构,以模拟类固醇骨架.这些靶点偏好在图3的可视化结果中表现得十分直观.

3.3. 环系统流行度随时间的变化

在这一部分分析中,考察了不同类型环系统流行度随时间的变化趋势.根据结构特征,将其分为七类:由1个、2个、3个、4个或5个及以上简单环组成的体系,含有中等尺寸环的体系(环原子数为8–11),以及大环体系(至少包含一个由12个及以上环原子构成的环).图4展示了这七类环系统流行度随时间的变化情况.对于仅由一个或两个简单环构成的体系,其增长趋势明显放缓,这很可能是因为此类稳定且易于合成的结构大多已经被发现.数量最多且增长最快的是由三个简单环组成的环系统,在所分析的29179种环中,有7585种属于这一类型.与含有两个环的体系相比,三环体系在多样性和新颖性方面具有更大的潜力.在此前构建类药性虚拟环系统库的研究中,共生成了约389万个此类环系统,而其中仅有20682个,约占0.5%,在公共数据库中已有记录,这充分表明该类环系统在未来药物化学研究中具有巨大的开发潜力.

尽管含有8–11元环的中等尺寸环体系受到的关注相对有限,这主要源于其合成难度较高,但这类衍生物占据了小分子与更大尺寸大环之间一个重要而尚未充分探索的结构空间.天然产物同样是中等尺寸环的重要来源,然而其分离过程劳动强度大且通常只能获得有限数量,使得结构修饰和类似物制备变得十分困难.因此,在药物发现背景下开发高效且可放大的中等尺寸环合成策略仍然是一项具有挑战性但极为重要的研究方向.与此同时,近年来关于大环结构的研究文献数量持续增长,凸显了这类环系统在药物化学中的重要性不断上升,尤其在靶向传统上难以成药的蛋白,如转录因子、表观遗传靶点以及蛋白–蛋白相互作用相关蛋白时.此外,以大环为核心的放射性药物是一个快速发展的新兴领域,在肿瘤治疗方面展现出巨大的治疗潜力,这一点也体现在过去五年FDA批准数量的显著增加上.

在该研究中,还进一步分析了药物化学中常见单个环系统流行度随时间的变化情况,相关结果见图5和图6.为保证统计学意义,分析仅涵盖2000年至2023年间的文献数据,这一时期ChEMBL中收录的文献数量较多.为减少年度间随机波动的影响,对数据进行了轻度平滑处理,即采用三年滑动平均,这些数据点在图中以小圆点表示.为更清晰地展示总体趋势,还对数据进行了多项式函数拟合并可视化.纵轴上的基线值1.0表示该环在整个分析时间段内的平均出现频率,横轴则对应2000–2023年的文献时间跨度.如预期所示,并非所有环系统都呈现出清晰的变化趋势.许多环,尤其是常作为构建模块的小环,在使用频率上要么保持相对稳定,要么随时间呈现出较为随机的分布.该分析重点关注那些能够观察到明显上升或下降趋势的环系统,尤其是在一组结构相关的环中同时呈现一致趋势的情况.这些代表性实例分别展示于图5(流行度上升的环)和图6(流行度下降的环)中.

环系统流行度变化可能受到多种因素的共同影响.其中一个重要驱动因素是化合物供应商引入新的构建模块,这一过程往往源于新型、非经典环在药物研发候选分子中的出现,随后引发合成兴趣的提升、供应商产品的增加,并形成相互强化的“双重循环”.另一个关键因素是新合成方法学的发展,其往往会导致某些环系统在文献中使用频率的迅速上升.此外,对环系统理化性质及ADME特性的深入研究有时会揭示其不利特征,从而导致其使用量急剧下降.对于作为生物活性分子核心的大型环系统而言,其流行度变化往往反映了整个药物类别的探索进程.有前景的新药候选物的出现通常会带动相关核心结构使用频率的上升,而临床失败则可能导致整个化学类型被放弃.同样,当围绕某些“经典”药物核心的研究逐渐趋于饱和时,对其兴趣也会明显下降.这些因素往往相互交织,很难将某一环系统使用频率的升降归因于单一原因.

图4 | 不同类型环系统出现频率随时间的变化趋势.

3.4. 药物化学文献中使用频率上升的环

图5列举了在药物化学文献中提及频率随时间持续上升的一些环结构示例.第一行展示的是一些小尺寸的三元环和四元环,如环丙烷、环丁烷、氮杂丁烷和氧杂丁烷.新合成方法学的发展以及新型构建模块的商业化供应,使药物化学家能够快速获取并修饰含有这些高张力结构单元的化合物,从而显著拓展可用于药物设计的化学空间.这些小环所固有的环张力迫使其采用刚性且明确的三维构象,从而精确限定取代基的空间取向,这对于调控蛋白–配体相互作用、提升效力和选择性至关重要.**从本质上看,这些环系统通过提高分子中sp3碳的比例,有效地帮助分子“逃离平面化”,从而改善溶解度,削弱不利的π–π堆积作用,降低固态下不良晶体堆积以及非特异性蛋白结合的风险.**其中,引入氧杂丁烷往往还能有利地调节关键ADME性质,例如降低整体亲脂性并提高代谢稳定性.

图5第二行展示了若干含氮的五元和六元杂环,如嘧啶、吡嗪、吡唑和三唑.这些环在近年来的药物化学文献中日益常见,主要源于其独特的电子特性和结构特征,使其成为极具价值的药物设计构建模块.杂环中一个或多个氮原子的存在能够调节电子密度,并提供局部氢键作用位点,从而增强其与生物靶点形成高亲和力和高特异性相互作用的能力,包括氢键、偶极–偶极相互作用以及π堆积作用.同时,这些杂环衍生物高效且可持续的合成方法的不断完善,也促进了其在生物活性化合物中应用的稳步增长.

该研究识别出的最重要一类优势环结构是由五元和六元稠合芳香环构成、且含有多个氮杂原子的体系.图5中展示了吲唑、氮杂吲哚、吡唑并嘧啶以及咪唑并吡啶等代表性结构,但实际上还有许多类似的双环杂芳香体系在药物化学中的应用持续增加.这类稠合杂环之所以长期受到关注,一方面是因为它们广泛作为激酶抑制剂的骨架,另一方面也是常见的吲哚等排体,同时在其他新型靶点抑制剂中同样表现为特权骨架.杂环在药物化学中具有悠久的研究历史,因此已经发展出多种成熟而灵活的合成路线,便于构建多样化衍生物及化合物库.这些杂环骨架展现出极为广泛的药理活性谱,包括抗肿瘤、抗菌、抗病毒、抗炎以及神经系统相关活性,使其成为多种治疗应用中极具吸引力的核心结构.其生物活性的关键在于合理分布的氮原子,这些原子可作为有效的氢键供体和受体,促进与蛋白质之间强而选择性的相互作用.此外,氮原子还有助于改善理化性质,如降低亲脂性、提高水溶性并增强代谢稳定性,这些都是获得理想ADME和药代动力学特征所必需的因素.

图5最后一行展示了一些结构更为复杂的环体系,它们构成了近年来受到更多关注的特定药物类别的核心.其中,3,6-去氧二氢去甲吗啡烷骨架是纳洛酮设计的核心,其研究热度源于迫切的临床需求.随着芬太尼等高效合成阿片类药物的滥用,阿片危机日益加剧,对快速且有效的阿片受体拮抗剂提出了迫切需求.基于该骨架的纳洛酮能够在数分钟内将阿片类药物从μ阿片受体上置换下来,迅速逆转致命的呼吸抑制,这一关键临床表现使该骨架在进一步优化以降低戒断反应、肝毒性和心血管副作用方面具有极高吸引力.底行第二个结构为肽类大环,是多黏菌素或黏菌素等由细菌产生的天然产物的核心结构.这些化合物虽在数十年前即被发现,但近年来因其作为多重耐药革兰氏阴性菌感染的最后防线抗生素而重新受到重视,而该大环结构正是其独特作用机制的基础.底行第三个示例为噻吩并三唑并二氮杂卓骨架,即二氮杂卓环与噻吩和三唑稠合的结构,由于其独特构型赋予分子多方面的药理活性而受到越来越多关注.研究表明,在该类分子中,三唑环与经典二氮杂卓核心的稠合能够显著增强受体相互作用.最后一个示例是由五个稠合环构成的复杂骨架,来源于从芸香科植物中提取的生物碱Evodiamine.含有该骨架的结构因其多靶点生物活性而在药物化学文献中受到越来越多关注,在抗肿瘤等多个适应症领域展现出重要潜力.其同时作用于多个靶点的能力使Evodiamine骨架成为一种特权结构,这一特征在治疗癌症等复杂疾病的药物设计中尤为理想.

图5 | 生物医学文献中提及频率随时间增加的常见环系统示例. 第一行展示小尺寸环结构,第二行为小型芳香含氮杂环,第三行为由五元和六元稠合构成的芳香体系,第四行为新兴生物活性分子的核心骨架.

3.5. 药物化学文献中使用频率下降的环

图6展示了一些在药物化学文献中使用频率明显下降的环系统示例.图中第一行说明了若干常见纯碳环体系,如苯、萘、十氢萘和茚的使用下降趋势.其应用减少的主要原因在于较强的疏水性,这会降低溶解度、增强血浆蛋白结合并增加代谢风险.此外,对饱和碳环骨架进行选择性合成和精确修饰本身仍然具有较大挑战性,从而显著限制了其在药物化学中可探索的化学空间.因此,这些纯碳环逐渐被含杂原子的骨架所取代,后者在结构多样性和类药性方面具有明显优势.相对惰性且平面的纯碳环能够提供的相互作用位点有限,而杂环则可以参与多种非共价相互作用.已有研究提出,以多种杂环替代苯环不仅能够提高效力,还可改善ADME相关问题.从代谢角度看,杂环化合物通常具有更高的稳定性,也更不容易形成反应性代谢物,从而降低了纯碳体系常见的毒性风险.

图6第二行展示了另一类使用频率下降的环体系,即由两个稠合的六元芳香环构成且含有2、3或4个氮杂原子的结构,如吡啶并嘧啶、邻苯二嗪、蝶啶和2,6-萘啶.这一趋势与前文讨论的五元和六元稠合含氮杂芳香环体系形成鲜明对比.这类双环杂环面临的一个关键问题是缺乏高效且通用的合成路线,此外其潜在的光毒性风险也限制了在药物发现中的应用.在这一不利类别中,唯一的例外是肉桂嗪,其使用频率呈上升趋势.肉桂嗪骨架兼具结构灵活性、良好的合成可及性以及广泛的生物活性,并表现出优良的类药性.多种成熟的合成方法能够快速高效地制备多样化的肉桂嗪衍生物,这种合成优势使其相较于其他合成难度更高的相关杂环更具竞争力.因此,在近期的一篇综述中,肉桂嗪环甚至被称为“药物化学的分子之心”.

图6最后一行展示了几类经典药物骨架在药物化学文献中关注度下降的实例.其中一个代表是碳青霉烯体系,它是亚胺培南和美罗培南等多种β-内酰胺抗生素的基础结构.近年来对该类药物关注度下降,主要源于多种β-内酰胺酶介导的细菌耐药性迅速出现,使其难以作为单药有效对抗多重耐药的革兰氏阴性病原体.另一个使用频率下降的骨架是地西泮体系.历史上,地西泮及其同系物因起效快、毒性低且疗效广泛而备受推崇,但随后的临床经验揭示了依赖性、戒断反应和滥用等严重问题,从而削弱了其风险收益比并引发监管层面的担忧.此外,近五十年来围绕苯二氮卓类的深入研究已使该化学空间趋于饱和,通过渐进式修饰获得突破性改进的可能性大幅降低,这也使研究重心逐渐转向具有更高选择性和安全性的创新骨架.这些因素共同导致了地西泮类骨架在当前药物化学研究中的地位下降.

基于雌二醇骨架的药物使用频率下降,主要源于该结构固有的代谢缺陷和药代动力学限制.雌二醇骨架中的酚羟基虽然对于模拟天然激素并与雌激素受体结合至关重要,但也极易发生Ⅱ相代谢,从而导致口服生物利用度低和药物迅速失活.与此同时,新型非甾体化学类型的出现提供了在合成可及性和结构可调性方面更具优势的替代平台.图6中的最后一个示例为以加压素和催产素为代表的肽类大环骨架.传统上,该二硫键桥连的大环结构用于将肽链锁定在其生物活性构象中,但同样的二硫键在体内易被还原或酶切,导致快速降解和较差的生物利用度.因此,药物化学家越来越多地探索替代性的环化策略,以提高代谢稳定性并改善细胞通透性和口服生物利用度,这些特征正是传统大环肽类药物所普遍缺乏的.

图6 | 生物医学文献中提及频率随时间下降的常见环系统示例. 第一行为碳环体系,第二行为由两个六元环构成的芳香含氮杂环,第三行为较早期药物及生物活性分子的核心骨架.

4. 结论

该研究对药物化学文献中所涉及环结构的化学空间进行了系统而深入的分析.结果再次确认了环系统在药物化学中的核心地位,并突出了其在生物活性分子设计与开发中的关键作用.尽管新型合成方法不断涌现,可获取的化学空间也在持续扩展,但大多数药物候选分子仍然依赖于已经建立并得到验证的经典环结构.这种相对保守的趋势反映了合成可行性、既有生物学验证基础以及环系统对分子形状、极性和代谢稳定性等关键性质具有可预测影响的重要性.

对药物化学期刊中环结构流行度随时间变化的分析显示,部分环系统的使用频率保持稳定,而另一些则会随着方法学创新、药物化学策略的转变以及构效关系认识的加深而呈现上升或下降趋势.其中,杂环始终是变化最为活跃且功能最为多样的一类,其持续创新源于在调控靶点结合能力和药代动力学行为方面的独特优势.分析还揭示了一些更为宏观的趋势:小尺寸脂肪族环,尤其是氧杂丁烷和氮杂丁烷,受到越来越多的关注;由五元和六元稠合构成的含氮杂环被广泛应用,且其流行度仍在持续上升;相反,由两个六元环稠合而成的体系则呈现出使用频率下降的趋势.总体而言,最多包含两个稠合环的小型环系统已被较为充分地探索,真正具有突破性的新发现空间相对有限.相比之下,由三个稠合环构成的骨架是增长最快的一类,在结构多样性方面具有明显优势,并为创新提供了大量潜在机会.

此外,来源于天然产物的环结构为新型生物活性分子的设计提供了重要灵感.这些发现可为多种需要进行分子优先级判断的应用场景提供总体指导,例如提升化合物库的结构多样性、设计针对性更强的聚焦化合物库、筛选虚拟筛选命中物,或对人工智能生成的候选分子进行优选.展望未来,化学信息学、人工智能驱动的分子设计工具以及合成能力的不断提升相结合,将为新型环系统的发现和理性引入带来广阔前景.然而,这些环结构在药物发现中的成功应用,仍然依赖于在新颖性、类药性特征和合成可及性之间取得合理平衡.对环结构历史使用趋势及当前偏好的理解,将有助于指导未来研究工作,从而在早期药物发现阶段实现更加理性、高效且成功的环结构选择.