摘要:
目前,病原菌抗药性的研究在传染病领域的是一个棘手性问题。由于缺乏对抗药机制的深刻认识,人们很难设计出有效的抗病毒药物。然而,随着生物计算技术的迅猛发展,有人提出利用系统地分析基因、蛋白以及他们之间的相互作用去揭开病原菌的抗药机制,进而设计出高效的抗病毒药物。这种系统的分析方法必须要求较全面的蛋白相互作用的数据。例如,假设结核杆菌有较为全面的蛋白相互作用数据,那么就可以推断出哪些蛋白(或蛋白相互作用)对于结核杆菌是重要且必须的;另外,还可以找到药物靶标与各种外排泵相关蛋白以及药物修饰的酶蛋白之间相互作用的路径,这对抗药机制的研究会有很大的启发。
虽然关于人和线虫等的蛋白相互作用的实验数据较为丰富,但关于细菌蛋白相互作用的分析却很少,并且质量也有待提高。有数据表明,在10,000对蛋白相互作用中,只有不到25%的相互作用是多于两个实验检测到的。这说明这些数据存在高假阳性和假阴性率。因此,通过对病原菌蛋白相互作用的分析来寻找抗药通路存在一定的困难。概括的说,利用系统分析蛋白相互作用来鉴定抗药通路存在如下困难:(1)病原菌的蛋白相互作用数据可靠性低。(2)病原菌相互作用的数据较为缺乏。(3)识别病原菌抗药的候选通路。
针对以上困难,本文以结核杆菌为例,探讨其解决方法。
由于病原菌蛋白相互作用数据噪音大,因此,开发新的实验技术或方法以提高蛋白相互作用数据的质量极其重要。由于相互作用的蛋白通常拥有相同的细胞定位或者扮演相同的功能角色,因此,我们可以利用其它额外的信息,比如蛋白的功能注释等信息,以估计每一个蛋白相互作用的可靠指数。但是,像结核杆菌等一些物种往往缺乏这些额外的信息,这种情况下,我们只能依靠不依赖额外信息的方法去估计蛋白相互作用数据的可靠性,比如依靠蛋白相互作用网络的拓扑结构的方法。这种方法基于一个假设:即共享较多“伙伴”的两个蛋白更倾向于共定位或参与共同的细胞生物过程,因而更有可能存在相互作用。共享的“伙伴”的比率可以仅仅考虑蛋白的一级邻接节点,也可以考虑多级节点。用这个比率可以选取可靠性高的酵母蛋白相互作用数据。结果表明,在前3000对可靠性高度相互作用数据中,共细胞定位的占70%以上,相比总的蛋白相互作用数据,增加了15%以上。但是,这种方法不太适用于稀疏的蛋白相互作用网络。因此,寻找新的方法以过滤高质量的蛋白相互作用数据成为当前研究的重点。
对于缺乏纵多病原菌的蛋白相互作用信息,这个问题,主要可以从三个方面去解决:一、利用物种的同源性将其他病原菌的保守蛋白相互作用转化该物种的蛋白相互作用;二、从头预测该物种的蛋白相互作用和蛋白复合物,从头预测蛋白相互作用的方法主要包括利用功能域-功能域的相互作用、相互作用的功能域、旁系同源的相互作用、蛋白功能的相似性以及蛋白的共进化信息等,而对于蛋白复合物,则可以利用蛋白相互作用网络的拓扑结构,比如利用一些算法包括MCL、RNSC等进行网络聚类从而得到连系较为紧密的蛋白团,但是这些算法的敏感性以及精确性较低,主要是因为蛋白相互作用的数据噪音大;三、从已有的文献报道挖掘该物种的蛋白相互作用,这种方法通常设计一些工具挖掘数据库的信息,比如Pubmed的文献摘要、US FDA网站的报道以及类似PharmGKB的数据库。利用这种方法提取蛋白相互作用的敏感性和精确性高于80%,但是还不够满意,特别是关于药物-酶的相互作用数据的挖掘还不够成熟。
如何识别病原菌中抗药的候选通路。这个问题主要归结为两点,一是识别病原菌中抗药的必要通路,主要包括药物特异的外排或药物作用的酶或排毒蛋白,以及药物是通过哪个通路与外排泵或药物作用的酶或排毒蛋白相互作用的;二是寻找这些通路最终共同作用或扰乱的靶标。
目前关于病原菌抗药性的研究并无突破性进展,因此使得该领域的研究变得极其迫切和重要。通过系统地分析病原菌基因调节和蛋白相互作用网络,为揭示病原菌抗药性的机制、开发出高效的抗病毒药物开辟了新的途径。