第一节 类型衍生化与系列设计
新药开发途径可分为两方面:一是寻求新的模型化合物,确定显效化学结构,获得新结构的化合物,称作类型衍化(Lead generation)。另一则在某一确定模型化合物基础上,寻求系列中最佳化合物,称作最佳化合物设计(Lead optimization)或系列设计(Series design)。系列设计为类型衍化的继续和发展;类型衍化则为系列设计开辟新的设计条件和领域,两者相辅相成,各有其重要作用。
一、类型衍化:
模型化合物,就是可以用来作为进行结构修饰和结构改造的模型,从中可获得预期药理作用的药物。随着多种模型化合物化学结构的剖析,选择可能的显效化学结构,确定合成对象,进行合成与药效筛选,进而确定显效结构及新的模型化合物。模型化合物有多种发掘途径,以代谢过程、生命基础过程研究、受体契合方法及现有药物结构的总结性研究最为瞩目。
以某种或多种模型化合物为对象,从受体模式等药理作用、构效关系(SAR)一般规律及QSAR方法、分子特征分析与三维立体结构选择等方面进行显效的基本结构与三维立体构型和构象的诸种设想,采用计算机进行适当运算,拟定可能具有活性的不同结构类型,并从取代基选择拟定不同类型的有关化合物。在合成对象初步拟定后,由合成设计考查合成的可能性,然后进行合成。同时可拟定这些化合物的化学结构因素并赋值,再进行选择。此外,拟定生物活性测试的有关指标并测得数值。在此基础上,运用统计数学计算方法进行结构类型分类,选出有显著活性的化学结构类型,为系列设计奠定化学结构基础。
二、系列设计:
显著活性的化学结构类型确定后,即可进行最佳化合物的(系列)设计。基本内容有:
(1)合成对象选择。以活性显著的结构类型为基础,结合药理作用,分子特征分析,SAR一般规律及QSAR结果,取代基聚类分析与三维立体结构研究,运用计算机进行恰当选择,确定基本结构、取代基、立体构型及构象,拟定应合成的化学结构与化合物。
(2)由合成设计考查合成的可能性。
(3)拟定生物活性测试指标及方法,并进行测定。
(4)化学结构参数的选择。物化参数、量子化学参数、拓朴参数及化学结构标示符等均可用作参数,通过统计数学方法(聚类分析与因子分析)以选择和确定进入QSAR计算前的诸种参数。
(5)QSAR方程的求得。采用逐步回归分析和逐步判别分析等等统计数学方法进行。
(6)活性预计及新合成对象的确定。选择预计活性较强的化合物进行第二或第三轮的合成与试验。一般循环二至三轮即可获得最佳活性化合物。
类型衍化中活性结构的选择也与QSAR有关。
第二节 模型化合物的发掘
一、随机筛选与意外发现获得模型化合物:
该途径曾是获得模型化合物的最大来源,现仍是一个可靠来源。某些具有某种药理作用的药物与最初设计时的考虑并不相同,只是在研究过程中才发现其具有的独特的药理作用。
二、由天然产物中获得模型化合物:
天然产物仍是发现新药的主要来源,往往发现不平常和意外的化学结构,而用作模型化合物。沿用我国用药经验,采用近代技术,必然会发掘出更多更好的生物活性物质。酶抑制剂的体外生物测定技术已应用于筛选我国植物药。微生物资源的合理开发也是获得新药和模型化合物的主要来源,在天然产物的开发中占有重要地位。应用超敏感与特异“靶”的检测方法来发现新抗生素。对特异性酶抑制剂的探索,已发现具有强心、降低血中胆固醇、消炎、抗高血压和免疫调节能力的微生物代谢产物。
三、生命基础过程研究中发现模型化合物:
这是新的重要来源。随着分子生物学和分子遗传学的研究进展,根据抗生素作用机理和耐药机制,发展出新的筛选方法,从而发现新药和新模型。
抗生素超敏变株的应用是其中之一。通过诱变获得的遗传变异株,由于基因突变使其对某类抗生素的敏感性得以明显提高,从而能发现新抗生素。
重组DNA技术(常称基因拼接)可诱导生物体产生所需物质。DNA分子携带着遗传密码信息,引起特定蛋白质的产生。人胰岛素的遗传密码拼接到大肠杆菌的DNA分子上,大肠杆菌就可得到新的信息,接受命令产生人胰岛素。采用本技术不仅能增加难以大规模制备的产品的来源,还能得到高纯度产品。本技术也用来开发微生物体系,使其产生新抗生素。
免疫学研究的迅速发展,也为新药设计提供了若干新的模型化合物。吞噬刺激肽(Tuftsin,吞噬肽,I)对吞噬细胞的吞噬功能具有激素样的调节作用,具有广泛的生理、药理和免疫学活性,临床主要用于抗菌和抗肿瘤治疗。吞噬肽已证实为人IgG中H链的第289-292氨基酸肽段,其生理作用通过巨噬细胞、单核细胞和粒细胞上特异的吞噬肽受体来介导。由此引起类似肽和抑制剂的研究,发现一些短肽有抑制吞噬肽受体的作用。
在新陈代谢的多种化学反应中,几乎均在酶催化下,以高速度按确定方向进行。每一种酶都有一定的抑制,称此种酶为该抑制的靶酶。抑制剂的专一性有强有弱,对机体代谢的控制显示关键的稳衡调节作用。与酶结合的物质,能将整个酶蛋白或邻近蛋白质激活,称为激动剂。多数酶抑制剂对人体有毒,曾不能作为治疗药;近年加以改进,从而使酶抑制剂可用于医疗实践。有两类酶抑制剂:一是不可逆失活剂,与酶活性中心结合后,产生化学反应,并使酶蛋白上一些残基形成稳定的共价键,引起不可逆失活。另一类为酶的自杀底物,在其结构中不具化学活性基团,但具潜在的化学基团,在催化过程的某一阶段被酶催化,激发产生有反应活性的化学基团,其活性仅在靶酶活性部位出现,引起失活。近年对酶的研究有长足进展,酶抑制剂研究也成为近年设计新药的重要依据。
四、药物代谢中发现模型化合物:
药物代谢时常产生氧化、还原、烃化、去甲基以及结合反应等等反应。代谢物药效有高于未代谢的药物。药物分子中某些基团易受代谢影响而使分子失去活性,所形成的化合物可作为模型化合物。如将某些基团加以保护,常能获得强效药物。
软药是在药物代谢基础上发展的一种发掘新药的新途径。软药本身具有生物活性,按预期方式和可控制的速率经酶催化一步失活或单一代谢成无毒产物而排泄。为了与软药相区别,将不可代谢的药物称为硬药(Harddrug)。
此外,利用代谢过程将无活性的化合物转化为具有特定生理活性的物质,称前者为药物前体(前体药物、前药)。在一些软药的代谢速度过于迅速,以致不能直接作为药用时,可将前药与软药结合,使逐步释放而显药效。
五、由受体结构或模式推测模型化合物:
已分离出的药物受体大多是细胞膜上的糖蛋白大分子。受体图象大多尚未揭示,可由一系列药物结构加以推测。X-射线单晶衍射、核磁共振光谱方法、药物与受体相互作用计算机模式法、计算机图形学以及量子化学计算等等,都可确定药物的三维结构、手性排列、分子间及分子内的氢键、优势构象等等。这些测定结果,都能作为推测模型化合物的化学结构的依据。有时药物不一定都以优势构象与受体结合,而以转变后的构象,即以活性构象与受体结合。此种结合也能用上述方法测定。
六、现有药物总结研究中发现模型化合物:
对现有药物的不同类型与药理作用进行总结研究,可以发现药理活性骨架和基团,从而发现模型化合物。
总之,模型化合物的发掘关键在于设想和策略,在周密设计基础上,采用新的研究方法,有可能获得新的模型化合物。
第三节 类型衍化方法
可分为定性和定量两大类。
一、生物电子等排原理:
生物电子等排体不仅具有相同总数“外层电子”(同价),还应地分子大小、分子形状(包括键角、杂化度)、构象、电子分布(包括极化度、诱导效应、共轭效应、电荷、偶极等等)、脂水分布系数、pKa、化学反应活性(包括代谢相似性)和氢键形成能力等等方面存在相似性。这些参数不尽全部要求相似,仅在某些重要参数上要求相近,并与生物活性存在相关关系。
具有相近脂水分布系数(如p)的生物电子等排体,称等疏水性等排体。
具有相近电性效应参数(如sm)者称等电性等排体。
具有相近立体效应参数(如Es)者称等立体性等排体。
诸种性质相似者可称作等电性-等疏水性-等立体性生物电子等排体。
已知电性效应与疏水性对活性影响较大。构象与生物活性之间存在重要相关关系,具有相近构象的电子等排体或基本结构称作等构象性电子等排体。等构象性可用单晶X-射线衍射数据来表达。b-内酰胺类抗菌活性结构中,环上羧基应在假横键位置;无活性构象中羧基则在假竖键位置。按此构效关系,b-内酰胺环酰胺键上之氧原子与羧基之碳原子或磺酸基上硫原子的距离介于3.0~3.9Å 时,具有抗菌活性;如在4.1Å 以上,则不具活性。此外,下列化学结构存在生物电子等排现象,可相互更换。
羰基:
羧基:—COOH、—SO2NHR、—SO3H、—PO(OH)NH2、—PO(OH)OEt、—CONHCN、
羟基:—OH、—NHCOR、—NHSO2R、—CH2OH、—NHCONH2、—NHCN、—CH(CN)2
邻苯二酚:
卤素:—F、—Cl、—Br、—I、—CF3、—CN、—N(CN)2、—C(CN)3
硫醚:
硫脲:
甲亚胺:-N=、
吡啶:
二、集合论(Set theory):
根据药理要求,某药生物活性谱MA包括五种子集T1、T2、T3、T4、T5,分别表达五种药理要求,其交集Z为同时具有五种药理要求的活性谱。不能与Z相交的任何化学集合,都不考虑。结现有药物的类型(化学集合Mi)而论,有五种类型(子集合M1、M2、M3、M4、M5)。根据药理要求,M1、M2、M3和Z不形成交集,而被排除,只考虑的Mj只由M4、M5组成。第二步,将Mj按化学结构细致分为五种子集Tj1、Tj2、Tj3、Tj4、Tj5。经药理筛选,找出相对理想的化合物如Tj5,作为模型化合物加以改造。在Tj5的基础上进一步加以扩展,形成扩展子集。在此基础上进一步寻找出模型化合物。第三步,进行取代基的效应分析,按聚类分析进行,找到有效子集。再经优选,找到新的药物。
三、统计图象识别(Patten recogition):
又称模式识别。用数学语言来说,模式为具有某种共同性质(特征)的一类现象的集合。是将研究对象根据某些特征进行识别并分类。运用多变量统计方法进行识别和分类的方法,称统计图象识别或统计模式识别。除对图象(模式)进行数值化外,还需通过一些手段将各类图象的重要特性用数字刻划出来,即特征提取。通常以化学结构为特征,选择基本结构(骨架结构)为重要特征,相同部分结构进行迭加,不同部分加以保留。然后对结构进行赋值,加以数量化,或采用理化参数描述符、分子连接性指数代码等。为使原来特征中的信息得以保留,又避免特征提取中可能出现的一些误差,采用聚类分析或因子分析找出某些综合性指标,使特性数目减少。这一过程,称特征选择。通常采用已知类别的一些图象(样本),运用统计数字方法,设计识别方案,使方案对已知类别的图象能正确识别,或在某种意义下错误识别的可能性最小。这一过程称为模式分析及分类。据此对任一未知类别的图象可判定属于何种类别。逐步判别分析为最常采用的一种方法。根据判别函数可进行类型衍化。
采用逐步多类别分析对51种不同化学结构的药物进行分类。此51种化合物的化学结构式可迭加为:
式中A、B、C、D、E、F、G、H表示不同化学结构中各种元素原子所处的部位,并作为指示变量的依据。以相应的a、b、c、d、e、f、g、h为指示变量。已知51种化合物分属5类药物:镇痛药、抗抑郁药、抗组胺药、抗胆碱药、抗帕金森氏病药。采用分子连接性指数1cV、ncV、MR作为指示变量之值。经逐步判别分析,发现以1cV为变量的显著性较好。在上述8种指示变量中,以采用a、b、c、h的变量组合最为显著。正确分类百分率为78.4%。在抗组胺药及抗胆碱药中交叉较多。抗抑郁药及抗帕金森氏病药正确分类率较高。
四、三维空间设计:
是以受体或酶的结构为模型而发展起来的一种类型衍化方法。也可推广到未知结构的受体和酶。
1、已知结构的受体和酶的设计过程:
(1)根据受体和酶的结构模式,探讨其三维结构要求。在此基础上,设计新化合物,并进行X-射线单晶衍射分析,获得分子的最低能量的构象。
(2)进行构象分析,对结构进行优化,得到分子孤立态优势构象及静电势分析。不同构象中各个相互作用的原子或基团间距离不一,使整个分子能量不同。不同能量的构象与相适应的受体和酶相互作用,便可产生不同的药理作用。为了计算不同构象的能量,将测得的晶体结构参数以适当形式输入计算机,经量子化学或分子力学程序计算出不同构象的能量,经优化即得适宜的构象,并可算出静电势分析。
(3)药物与受体和酶结合不一定均以最低能量的构象形式。与受体和酶结合的构象称作活性构象。其能量介于孤立态能量与最低能量之间。经常通过孤立态能量计算,推算出各种低能量的各种构象,并与受体和酶模型结合,其互补最佳者,即为药物分子的活性构象。
(4)根据活性构象,设计新化合物。利用计算机系统精密计算可能的构象及与分子结构相关的结构性质(如能量、电荷密度、分子体积、分子表面积、相互作用常数等等),然后进行生物活性测定,以检验活性构象的现实性和可行性,使三维空间设计发生效果。
2、未知结构的受体和酶的设计过程:
未知结构的受体和酶的三维空间设计则较已知结构的更难一些。采用的策略是活性类似物的活性结构类比法。
(1)选择具有相似生化或生物效应的一系列化合物,进行X-射线单晶衍射,测定结构。从中确知手性排列、分子间及分子内的氢键、电子密度分布、构型与构象等等信息,以及最低能量的构象等等。
(2)药效基团(显效骨架)及活性构象的初步确定。在一系列活性化合物中,根据上述晶体结构分析所得信息(如取向、电荷密度、构象等等),抽引出某些特定的结构(显效骨架),即得共同的药效基团。由此,设想受体和酶的作用模式及其活性构象。
(3)根据设想模式及活性构象,进行新化合物设计,经合成后再行生物活性测定,以检验活性构象与受体和酶模式的合理性。在此基础上,可采用量子化学、分子力学和计算机图形学的有关程序,进行分析与设计,使受体和酶的模式通用化,有更大的预见性。 由于指标变量的采用,将不同化学结构类型相互关联起来。应用逐步判别分析,对不同生理活性化合物加以分类,从而可预计具有相同生理活性的化学结构类型及某些化合物的生理活性,因此可进行类型衍化具有相药理活性,化学类型并不完全都相同。经化学特征提取及模式分析,却属同一模式,可构成衍化类型。 空间近似基:-(CH2)3-、-C5H5-