版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、12.病原菌与环境中重要微生物的功能基因组分析Dorothea K Thompson Jizhong Zhou魏华译;刘妍初校;朱晨光复校介绍病原菌的致病机理,特别是动物宿主与引起它们患病的病原菌之间相互作用 的分子基础与分子调节是非常复杂的,并且涉及多个毒力因子的共同控制。 生理特性与毒力特性的广谱性是多种基因功能表达紧密协调的一种反映。通常,病原菌的感染循环始于黏附并定植于宿主,然后(有时)细菌侵袭宿主组织或细胞, 存在于宿主细胞中并在宿主细胞中繁殖,最后释放出来再感染新的宿主(参见 Finlay与Falkow1997年发表的一篇综述)。微生物感染被复杂的调节网络所调 控,包括种特异性的细
2、胞与细胞之间的交流。20世纪90年代中期,流感嗜血杆菌(Haemophilus influenza全基因组序列的发表(Fleischmann等人发表于1995 年)标志着基因组时代的来临,研究全基因组范围内细菌毒力特征的分子特性的 方案使科学家对细菌致病机理的研究方式发生改变。目前,已经有至少25个亲源关系很远的病原菌全基因组序列得到解析,并 且,其它一些病原微生物的全基因组序列的测定工作也正在进行中(见第二章)。我们已经知道了一些病原菌如幽门螺杆菌(Helicobacter pylori) (Tomb等人,1997; Alm 等人,1999),结核分枝杆菌(Mycobacterium tub
3、erculosis) (Cole 等 人,1998),生殖道支原体(Mycoplasmagenitalium)(Fraser 等人,1995),铜绿假 单胞菌(Pseudomonas aeruginosa (Stover 等人,2000),肺炎链球菌(Streptococcus pneumonia(Hoskin 等人,2001),霍乱弧菌(Vibrio cholerae)(Heidelberg 等人, 2000),单核细胞增生性李斯特菌(Listeria monocytogenes (Glaser等人,2001)的 全基因组序列信息,最近炭疽芽胞杆菌(Bacillus anthracis)(R
4、ead等人,2003)的全 基因组序列也被测出。大量的环境中重要的真菌与古菌,包括金属离子还原菌 Shewanella oneidensis ( Heidekberg, 2002),耐放射异 常球菌 Deinococcus radiodurans (White 等人,1996b),耐高温多型古菌 Pyroccus furiosus(Robb 等人, 2001)的全基因组序列也已经被测定(见第二章)。一个微生物全基因组的生物信息学分析可用来寻找与感染相关的基因,以及潜在的抗生素药物作用的新靶点。比较分析多个种系相差很大的病原微生物和种 系相近的病原微生物,可以揭示天然群落中细菌基因的易变性, 种
5、属多样性的分 子机制,以及细菌致病机理的进化与引起不同发病情况的菌株特异性的基础。由于大量的古菌已被测序,比较基因组可以揭示古菌(特别是crenarchaeal和euryarchaeal分支)、细菌、真菌之间的差异。另外,象 DNA微阵列这类功能基 因组工具对我们理解微生物感染后导致宿主临床病变的一些宿主的基因表达起 了非常重要的作用。最早应用微阵列技术对环境中重要微生物功能基因的研究主 要针对少量的几个使微生物能在恶劣环境中生存的特定基因,如这些基因的功 能、调节网络、基本的表型以及特异的酶系统等。最终,蛋白组学将加深我们对 基因功能的了解,为预测毒力因子和未知基因以及了解病原微生物的转录后
6、与翻 译后调节作用提供新的视角。本章将讨论基因组序列与生物信息学分析在鉴定毒力因子中的作用、比较基 因组在病原微生物的基因多样性与进化中的作用、基于遗传和微阵列的技术在阐述基因功能、宿主与病原菌相互作用及细菌发病机理的蛋白组学。大量的病原菌 序列已被测序,还有一些序列目前正在测定,每一个病原微生物序列的复杂信息 就不在这章讨论了。我们将在本章通过介绍我们选择的研究文献,讨论功能基因组与比较基因组对微生物致病性的理解。最后,我们将讨论基因组数据怎样有利于我们对微生物与环境相关表型(如金属还原细菌的生物修复)的理解,并为研究极端环境(高温、高pH、高盐)中微生物生存的分子机制与特征提供便利。 12
7、.2通过基因组序列与功能注释研究细菌的致病机理病原菌可以感染动物与植物细胞, 逃避宿主免疫防御与抵御抗生素制剂, 在 不同的细胞外与细胞内环境中存活。 由于细菌有如此多样的致病机制,就需要一 个可根据细菌的数目与种类而变化的紧密调节的毒力因子库。 尽管很多毒力因子 是宿主特异性的,但还是有少量机制是多种细菌共同表达一些广谱的毒力表型(参见Finlay与Falkow1997年发表的一篇综述)。这些共同机制表明至少一些 病原菌的基本毒力机制是拥有不同微生物种类中存在保守性的古代进化起源(Rahme 等人,2000)。传统方法对病原菌的研究是耗时的, 线性的,且只针对一个基因或一个蛋白 的研究。基因
8、序列分析与高通量的工具如 DNA微阵列的应用(见第6章)使得对微生物感染相关的多个基因和蛋白可同时平行鉴定并进行功能分析。病原菌的全基因组序列可被用于很多领域,从鉴定新的毒力相关基因与致病岛,到设计新 的抗微生物制剂(见13章)。在本章,将讨论用生物信息学技术在全基因组范围 内寻找多种毒力基因的侯选基因、可重复的DNA元件以及水平获得的如致病岛之类DNA序列。从序列同源性预测毒力基因对一个微生物全基因组序列的认识,使我们可以在公共数据库中基于已知的 毒力因子来预测毒力基因。但要注意,并不是在所有情况中序列相似的基因都具 有相似的功能。在鉴定一个假定的毒力基因的时候,对假定的毒力基因是否具有与已
9、知的同源毒力基因相同的功能,经验性的决定是必不可少的。用大量的基因 组数据来鉴定假定的毒力基因存在着限制,因为生物信息技术只能识别功能已被 阐述清楚的候选基因。对细菌基因组序列的比较分析提示很大部分(通常 30-40%)预测的基因为未知功能或只能假定其功能的基因。基于序列信息本身, 很难简单预测毒力基因的新功能或未鉴定的基序 (Weinstock, 2000)。为了鉴定可 能的毒力相关基因,有必要在数据库中寻找更具普遍特征的蛋白序列如与跨膜或 分泌蛋白相关的那些序列,因为与宿主致病相关的毒力因子常定位于细胞表面或 用于胞外运输(Weinstock, 2000)。如脑膜炎奈瑟氏菌(N. mein
10、gitidis)的一个 毒力血清B株(MC58)的全基因组序列被用于寻找潜在的可开发成基因疫苗的 新毒力基因(Pizza等人,2000)。脑膜炎奈瑟氏菌基因组的开放阅读框(ORF) 已被用于序列分析、结构基序分析和其他典型的与表面或输出相关的蛋白特征分 析,这些蛋白包括跨膜结构域、导肽、已知的表面蛋白同源体、脂蛋白信号、外 膜蛋白锚定基序与宿主细胞结合域。最终,基于基因组序列的全基因表达谱可用于寻找与已知的毒力基因共同调节表达的新毒力基因。目前可以用快速且容易理解的方式,从一个生物体的全基因组序列中获得新 的生物信息(Hood等人,1996a, b ; Pizza等人,2000)。如流感嗜血杆
11、菌 Rd基 因组的1.8Mb序列已很好的用于寻找负责生物合成脂多糖(LPS)的假定毒力基 因与结构成分(Hood等人,1996b)。除了是主要的毒力决定因子外,LPS在维 持革兰氏阴性细菌的外膜完整性和其功能上也具有重要作用(Strauss Falkow 1997)。通过在流感嗜血杆菌的基因序列数据库中搜寻与已知的其它细菌生物合成LPS的基因相似的DNA与氨基酸序列,得到25个LPS基因的候选基因。序列信息保证了可以进行设计合并构建这25个基因上产生靶向中断所必需的克隆。免疫化学技术、聚丙烯酰胺凝胶电泳(PAGE)分离技术和质谱分析(MS)为在大量的候选基因中确定潜在的LPS生物合成基因和估计
12、幼鼠的血管内散播所必须的LPS最小结构提供了可能(Hood等人,1996b)。这样的研究具体说明 了计算机技术可以怎样应用于寻找编码假定的毒力基因序列以及如何应用这样 的数据来加快鉴定实验假设的任务。重复的DNA元件提示潜在的毒力因子根据序列的同源性,重复的 DNA序列提示可能为毒力基因。在许多致病菌 中,如流感嗜血杆菌、奈瑟氏菌的某些种、金黄色葡萄球菌(见表12.1)的重复DNA序列都与毒力因子的表型或相变相关。许多编码细胞表面毒力因子基因的 一个特征是在翻译读码框的5末端存在单核甘酸重复、二核甘酸重复或三核甘酸 重复。一些假说比如滑动链的错配学说(Levinson与Gutman等人,198
13、7)或基 因重组机制(Van Belkum等人,1998)可解释重复核甘酸序列的改变, 而重复核昔 酸序列的改变又通过改变读码框基因从而调节表面暴露蛋白的表型。滑动链的错配学说认为通常高重复DNA的三级结构导致重复序列附近 DNA序列的错配。 根据链的方向与DNA聚合酶介导的DNA合成,DNA重复可被插入或缺失,引 起开放阅读框的移框现象(Coggins O Prey, 1989; Van Belkum等人,1998)。 毒力相关因子的表型变化是病原微生物逃避宿主免疫应答,适应宿主中不同微环境的一个策略(参见 Finlay与Falkow1997年发表的一篇综述)。例如流感嗜血 杆菌的菌毛一一一
14、种细菌黏附到呼吸道上皮细胞的所必须的黏附蛋白,这种蛋白的相变与二核甘酸TA的重复相关(Van A lphen等人,1991)。与之类似,脂多 糖生物合成基因读码框的5末端包含多个串联CAAT或GCAA重复序列,与翻 译的转换相关(Jarosik 与 Hansen, 1994; Weiser等人,1989)。由于重复DNA序列在细菌致病性中的重要作用,可以通过搜寻基因组中串联寡 核甘酸重复序列来鉴定可能的新毒力因子。Hood与coworkers采用这样的方法在流感嗜血杆菌的Rd株的假定ORF中找到9个新的包含多个(6-36)串联的四 核甘酸重复(Hood等人,1996a)。这些基因编码瑟氏菌的血
15、色素受体蛋白或糖 基转移酶(lgtC基因产物)的同源体,或编码耶尔森氏菌的一个黏附蛋白(yadA)。 另外,三个目前已鉴定与LPS生物合成相关的基因也包含多个重复的CAAT,证明可用全基因组序列来寻找毒力因子。进一步研究其中的一个新位点lgtC,表明表12.1病原菌中的短DNA重复序列与其相关功能种重复序列基因基因的功能参考文献流感嗜血杆菌CAATLic1-lic3LPS生物合成Hood 等人(1996a)GCAAYadA黏附素Hood 等人(1996a)GACALgtC糖基转移酶Hood 等人(1996a)TTGGNda离子结合蛋白Hood 等人(1996a)AGTCND限制性修饰甲基转移酶
16、Hood 等人(1996a)IIIAND未知的杆菌类似物Hood 等人(1996a)TAHifA/B菌毛合成Van Ham 等人(1993,1994)脑膜炎奈瑟球菌GIsi2LPS生物合成Burch 等人(1997)CTCTTOpa不透明表面蛋白Meyer 等人(1990)AOpa不透明表面蛋白Meyer 等人(1990)GPorA外膜蛋白Van der Ende 等人(1995)金黄色葡萄球菌93bpFnb*结合蛋白Patti 等人(1994)561bpCan胶原质黏附素Patti 等人(1994)81bpCoa凝固酵素Goh 等人(1992)GAAGAX4AAXAAXCCTXGXAAASp
17、a蛋白AClewell(1993)GAXTCXGAXTCXGAXAGXClf凝集因子,纤维蛋白受体McDevitt 与 Foster(1995)aND,无详细说明这个基因与脂多糖表位的表型转换有关, 并且其在新生鼠模型中与流感嗜血杆菌 的全毒力相关。这个研究清楚说明了如何用全基因组序列信息获得生物学相关的 实验数据并用于病原菌生物学研究(Hood等人,1996a)。病原菌的进化:基因的获得与丢失全基因组序列的获得与它们的序列比较为研究基因转移在病原菌进化中的 作用提供方法(Ochman与Moran, 2001)。基因的水平转移通过从染色体上引 入或删除DNA重构基因来改变基因指令。基因获得与缺
18、失的机制(如转化、转 导、结合)在第四章有详细的介绍。点突变的积累可以通过调节毒力表型与改变 已有基因的表达来增加微生物的多样性,然而逐步的突变则很少形成新的功能或 使细菌适应新的环境(Lawrence, 1997; Lawrence与Ochman, 1998)。相反,基 因横向转移,也就是可移动的遗传因子在细菌中传递,将导致遗传信息的获得或丢失,这对尤其是在新的病原体出现的紧急情况下的基因组进化与细菌物种形成 起着重要作用(Ochman等人,2000; Ochman 与 Moran, 2001)。基因水平或横向转移的发生率可以用 DNA序列分析的方法研究。根据碱基 比对,大部分细菌的种的基因
19、序列(G+C含量),密码子使用的偏好,二核甘酸 与三核甘酸的频率是相对同源的(Muto与Osawa, 1987; Karlin等人,1998)。新 的序列,象通过基因的横向转移获得的外源基因一一致病岛(下面讨论),保持其供体基因的序列特征,因此可以从G+C含量与密码子使用的模式上把它们和亲代的垂直传播区分开来(Ochman等人,2000)。基因横向转移范围的确定目前 通过全基因组序列比对已经实现。在已测序的细菌基因组中,横向获得的外源 DNA的积累量各有差异:如12.8%的大肠杆菌K12基因组,3.3%结核分枝杆菌 基因组,4.5%流感嗜血杆菌基因组,6.2%幽门螺杆菌26695的基因组来自横
20、向 获得的外源DNA(Ochman等人,2000)。基因组DNA的水平转移(流动性)、基 因多样性的意义以及病原菌的进化将在下面讨论。致病岛编码毒素、黏附因子(介导黏附到宿主细胞表面的蛋白)、分泌系统的成 分、干扰血清抗性的蛋白与其它因子的基因和毒力基因一起决定发病的条件。 这 种疾病的决定基因可以存在于可转移的基因兀件上 (转座子,质粒,细菌噬菌体), 或者存在于细菌染色体中的一些不连续的称为致病岛( PAIs)的片段中(Hacker等人 1997 年的一篇综述;Hacker 与 Kaper, 2000; Grousman与 Ochman, 1996)。测序分析PAIs表明,这些致病岛大部分
21、源于基因的水平转移,因此可能在形成新的致病突变种或致病表型中起重要作用(Hacker与Kaper, 2000)。然而这种 可以改变细菌天然种的横向基因转移并不是不加选择的。换句话说,那些特定的细菌在获得致病岛之前已经具有形成病原菌的一些条件:因为它们已经拥有在宿主细胞中生存的能力,如抵御宿主防御的能力与营养缺陷的代谢补偿能力 (Ochman与Moran, 2001)。PAIs区别于其他基因组序列的特征,微生物的PAIs以及PAIs的调节将在本节讨论。从全基因组序列中区分出 PAIs在基因组测序中最常见的主题是 G+C含量与密 码子的使用是否同源(Hacker与 Kaper, 2000, Kar
22、lin, 2001)。如果一个基因 的密码子使用与基因组中其它序列基因的密码子使用有明显差异,这个基因可能来自水平转移(Finlay 与 Falkow, 1997; Hacker与 Kaper, 2000; Ochman等人, 2000),将其归为假定的外源基因(pA) (Karlin, 2000)。细菌中假定的外源基 因与反常的基因簇(有时指基因岛)和致病岛相关。在测序中可以通过5个分析MNA序列的准则来发现已测序基因组中反常的基因区( Karlin, 2000)。(i) G+C含量的差异 标准的辨别象致病岛这样的异常基因区的评估方法是 在变化窗口 W (W在长度上相当于10, 20,或者直
23、到50kb)中与平均 基因组的G+C含量进行比较。比较发现 G+C含量与基因组剩余序列中 G+C含量有很大差异的窗口可能是潜在的基因岛。(ii)基因组标签的比较每一个基因组都有一个区分于其它细菌基因组的标 签(signature) (Campbell 等人,1999 ; Karlin , 1998; Karlin 等人, 1997)。一个基因组标签是一套二核甘酸的相对丰度值,二核甘酸的相 对丰度值是所观察的二核甘酸频率与随机选择的相邻序列中预期二核 甘酸频率的比值(Campbell等人,1999)。与基因组平均标签的差异或 二核甘酸的偏好都提示DNA的外源性。(iii)密码子的偏好统计所有基因
24、的密码子偏好并与基因组中平均基因进行 比较,与经典密码子的应用存在明显差异的一个基因或一组基因可能代 表一个PAI。(iv)氨基酸应用的分歧 比较组成蛋白的氨基酸偏好性与决定蛋白组的平均 氨基酸频率。在翻译阅读框中,氨基酸的使用与平均蛋白氨基酸的使用 存在明显差异的区域可能组成基因岛或PAI。密码子的偏好与氨基酸的偏好都是基因组组成的测定方法。(v)假定外源基因簇 如果一些基因与平均基因、核糖体蛋白基因、翻译与 转录过程中加工因子的基因和伴侣基因的密码子利用率差异很大,那么 这些基因都被标记为假定的外源基因。这些假定的外源基因可能代表包 含致病岛的毒力相关基因。PAIs已经在尿路与肠道分离出的
25、大肠杆菌,鼠伤寒沙门氏菌,幽门螺杆菌, 和特定的革兰氏阳性细菌中(见表12.2, Hacker等人,1997)被鉴定出来,另外多个致病岛也可以在同一株细菌中存在 (Mecsas与Strauss 1996)。因为PAIs 不断的在多组病原菌中发现,特别是作为微生物基因组序列的一部分,它们的共有特征已被发现,这使得 PAIs可以根据一系列标准被定义(Hacker与Kaper, 2000; Hacker等人,1997)。(1) PAIs毒力相关基因,象黏附因子,毒素,III型 分泌系统等。(2) PAIs广泛分布于病原微生物的基因组中,而在无侵袭能力的 相同菌株或密切相关的共生菌株的基因组中不存在。
26、(3) PAIs在微生物基因组中占有相对较大的区域,在长度上10-200kb,它们的G+C含量与密码子的利 用明显区别于核心基因组。(4) PAIs常被短的重复序列(9-135bp)与插入元件 包围。这种特异的边界序列与整合酶编码序列以及其它移动位点的存在,提示 PAIs是由重组介入到染色体中的(Hacker与Kaper, 2000; Mecsas与Strauss 1996)。直接重复与IS可能是重组酶的靶点,导致一些PAIs的遗传不稳定(Hacker 等人,1997)。(5) PAIs经常与转运RNA (tRNA)基因相关,tRNA可能是整合 外源DNA的“基因组路标 (Hacker等人,1
27、997)PAIs对毒力表型的贡献这部分是通过着眼于具有重要致病性的革兰氏阴性杆 菌,来阐述PAI相关毒力决定因子的多样性。肠杆菌家族的成员是肠道与尿路感染的病原菌。肠道与尿路大肠杆菌的染色 体PAIs是第一个被阐述与深入研究的毒力决定区域(Hacker等人,1983, 1997;Blum等人,1994; Swenson等人,1996)。举个例子,尿路大肠杆菌536 (UPEC) 包含两个致病岛,PAI I与PAI II ,它们在大小上分别有70和190kb,并且被直 接重复序列包围(Blum等人,1994; Ritter等人,1995)。PAI I编码一种毒素一 一a溶血素(hly),通过插入
28、细胞膜裂解红细胞与其它真核细胞。PAI II携带与prf决定因子相关的hly毒力基因,prf决定因子编码P相关菌毛,P相关菌毛是尿路 大肠杆菌重要的黏附因子(Hacker与Kaper, 2000)。PAI II编码P菌毛,使尿路表12.2致病岛例子细菌PAI名称大小(kb)G+C含量a相关t RNA功能Uropathogenic E.coli(536)PAI I7051/41selC溶血素产物及P相关菌毛pai n19051/41leuX溶血素产物及P相关菌毛Uropathogenic E.coli(J96)PAI IV17051/41pheV溶血素产物PAI V11051/41pheR溶血素
29、产物Enteropathogenic E.coli (E2348/69)LEEb3551/39selC黏附、抹杀、侵入(翻译皿 型分泌系统)Salmonella typhimuriumSPI4052/40-47-侵入非噬菌细胞(翻译皿型分泌系统)SPI-24052/40-47valV宿主内细菌存活(翻译皿 型分泌系统)SPI-317-selC侵入并在单细胞内存活SPI-425-putative tRNA侵入并在单细胞内存活Helicobacter pylorCag PAI4038-45/35glrc编码完全毒力必需的CagAd和VacA调节因子Vibrio choleraeVPI39.547-
30、49/35ssrA含TCP-ACFe因子和toxFf基因,调节霍乱毒素Yersinia pestisHPI(pgm locus)10246-50/46-50asnT铁的获取,氯化高铁血红素吸收、Yersiniabactin合成Clostridium difficile19.6毒素A和BListeria monocytogenesprf vir Gene cluster10prf vir Gene clustera细菌的宿主的 G+C(%)含量/ PAI的G+C(%)含量bLEE =肠细胞抹除的基因位点cglr =谷氨酸消旋酶dCagA =细胞毒素相关的抗原eTCP=毒素相关的菌毛,ACF =附
31、加定殖因子toxT=转录激活体基因大肠杆菌通过半乳糖-a半乳糖1,4特异性受体分子黏附到尿道上皮。两个UPEC- 特异性PAI都与tRNA基因有关,PAI I定位在selC tRNA基因上,PAI II整合到 一个小的亮氨酸leuX的tRNA上。与之相似,肠道致病大肠杆菌(EPEC)在染 色体selC位置有35kb的致病岛(McDaniel等人,1995),但是与UPEC-特异性 的PAI不同,EPEC特异性致病岛编码高特异性的m型分泌系统,输出可黏附肠上皮并可导致肠上皮细胞损伤(Jarvis等人,1995)的重要蛋白,因此导致不同 的疾病条件。与鞭毛进化相关,革兰氏阴性杆菌的田型分泌系统是高
32、保守性的, 并且是唯一的适应性的毒力机制。出型分泌系统的结构成分是保守的,但是运送到细胞质中的调节宿主细胞功能的效应蛋白对于每一个细菌菌株是唯一的。组成m型分泌机制的蛋白也在耶尔森氏菌,志贺氏菌,沙门氏菌与许多植物病原菌的PAIs 中编码(Hacker 与 Kaper, 2000 ,综述)。另一个符合先前描述的PAIs的定义的致病岛,最近在霍乱弧菌中被发现, 霍乱弧菌是引起被称为霍乱的一种腹泻的条件致病菌。然而有害的水生霍乱弧菌与毒力霍乱弧菌的染色体致病岛只在流行病学中被鉴定。霍乱弧菌致病岛(VPI),其标志为与平均基因组 G+C含量(47-49%)比,含低G+C含量(35%),在染 色体上基
33、因比较稳定,占39.5kb区域。序列分析表明,VPI包含TCP-ACF簇与 toxT基因,toxT具有调节霍乱毒素功能(Karaolis等人,1998)。由tcpA-tcpF基 因编码的TCP或毒素共调节菌毛,是典型的IV型菌毛,在定植肠道上皮细胞中 起重要作用(Cotte与DiRita, 2000; Herrington等人,1998)并且通过ToxR调 节系统,与丝状噬菌体(CTX小)编码的霍乱毒素共同被调节(DiRita, 1992; DiRita等人,1991; Taylor等人,1987)。霍乱弧菌致病岛编码的一个二级基因 簇ACF是附加定植因子。TnphoeA在acf基因的插入产生
34、霍乱弧菌的突变,在鼠 模型中显示出定植能力降低(Peterson与Mekalanos, 1988)。除了对霍乱发病机 理有直接作用的基因外,VPI还带有假定的整合酶与转座酶基因,它们在 VPI 的转移与迁徙中起着重要作用(Karaolis等人,1998)。因此可以用致病岛来发 现新的流行霍乱菌株。幽门螺杆菌,微耗氧的革兰氏阴性细菌,是人类急慢性胃炎与胃溃疡的条件 致病菌。根据引起严重的疾病(I型)或削弱的毒力(R型)、存在或缺失cagA (细胞毒素相关基因A),幽门螺杆菌已被广泛分类(Censini等人,1996; Xiang 等人,1995)。与R型菌株比较,只有与严重的胃与十二指肠疾病相关
35、的幽门螺杆菌(I型)表达cagA编码的免疫优势抗原(Xiang等人,1995)。I型幽门螺 杆菌与人的胃上皮的相互作用是很复杂的,会导致黏附位点的微绒毛丢失、细胞骨架重排、细胞浆间白细胞介素I1-8的产生(Segal等人,1996, 1997)。毒力增加 的幽门螺杆菌菌株含有一个 40kb的外源DNA区,在这段区域内含有cagA基因 与编码其它疾病相关毒力因子的基因。分析包含cagA基因的基因位点,发现这是一个被31bp直接重复序列包围的致病岛,但不是插入到tRNA基因(Censini等人,1996; Hacker等人,1997,综述)而是插入到谷氨酸消旋酶(glr)基因 中。应用上述检测PA
36、Is的方法,cag PAI显示出与基因组其它区域(38-45%)比, 低G+C含量(35%)与高密码子偏好性(Karlin , 2001)等特征。cag PAI编码的 蛋白显示出与特异分泌系统相似的成分,如输出毒力因子的IV型分泌系统(Censini等人,1996)。幽门螺杆菌的cag区域解释了类型特异性毒力因子如何 通过致病岛的染色体插入而获得,并且导致一个种内细菌含有多种毒力类型的不 同菌株(Censini等人,1996)。抗生素抗性的获得现在开发新的疫苗与感染性疾病的干扰治疗比从前变得更为重要,因为具有抗生素抗性的重要人类致病菌的菌株在增多,这些菌株包括肺炎球菌,肠球菌,葡萄球菌,结核杆
37、菌 (Fuci, 2001; Fraser等人,2000 )。基因 转移的一个共识是抗生素抗性基因转移到原本敏感的细菌中,因此,扩展了微生物的生态环境并给微生物提供了一个生存优势。由于抗微生物的抗性选择优势, 基因转移通常与高度移动的基因元件相关,通常是质粒,质粒可以在种间转移并且能保持其外源性而不会被打断。微生物基因组间的抗生素抗性基因的转移也可 通过转座(例如象抗性决定因子的周围序列之类的可移动的元件)而被调节。有时,抗生素抗性基因由整合子传递,整合子是驱动无启动子的组合基因转录的基 因表达元件。整合子有三个序列元件:(1)平行获得的序列整合所需的附着位点(2)编码位点特异性重组酶的基因(
38、3)控制组合基因表达的启动子(Hall ,1997; Rose-Magnus与Mazel, 1999)。整合子的移动需要插入序列,转座子或接合质粒。最近,基因组微阵列技术(第六章讨论),为抗二甲氧苯青霉素的金黄色葡 萄球菌的发病机理及进化提供视角。金黄色葡萄球菌可引起败血症,心内膜炎, 人类毒素休克综合症(Fitzgerald等人,2001)。一个包含大于90%金黄色葡萄球 菌株COL基因的DNA微阵列可用于调查基因多样性与基因进化。36个金黄色葡萄球菌临床菌株,包含11个从不同人类疾病类型和其他哺乳动物感染中分离 来的二甲氧苯青霉素抗性株,被用于该研究。研究结果提示几个克隆的广谱的基 因变化
39、可以代表大部分金黄色葡萄球菌感染(F让zgerald等人,2001)。不同金黄 色葡萄球菌基因组进行比较,不同株之间差异大约有22%,因此组成株特异性序 列,有些编码特异的宿主定植因子以及使得菌株在特定环境中生存的其它因子。DNA微阵列也被用于揭示基因转移在致病金黄色葡萄球菌进化中的重要作用(F计zgerald等人,2001)。比如在抗二甲氧苯青霉素的抗性中,mec基因水平转移到金黄色葡萄球菌中至少五次,这提示二甲氧苯青霉素抗性是进化多样性的, 不依赖次数和单个的祖先系。病原体进化过程中的遗传信息丢失比较致病菌与相关的非致病菌基因组后,发现细菌的毒力多数是获得非致病菌没有的基因后表现出来的(O
40、chman与Moran, 2001)。比如通过被转入单个的致病岛,非致病性大肠杆菌可以转变成毒力菌株(Groisman与Ochman, 1996; Hacker等人,1997)。然而比较基因序 列分析表明,致病菌株的致病机理不单由获得毒力基因造成,而且在某些情况下 是缺失了使毒力基因不表达的基因。 比如,编码OmpT蛋白的基因是一个表面蛋 白酶,也是一个毒力抑制因子,在志贺氏菌中不存在,而在和它有紧密联系的非 致病大肠杆菌中却含有。把OmpT基因转入志贺氏菌后,通过阻止细菌在细胞内 传播的能力,使细菌产生的蛋白毒力下降 (Nakata等人,1993)。与之类似,比 较弗氏志贺氏菌与大肠杆菌 K
41、-12的基因组提示在志贺氏菌的cadA基因中存在很 大区域的缺失,被称为黑洞(Maurelli等人,1998)。功能性的cadA基因编码赖氨 酸脱竣酶,在志贺氏菌的某些种中起抑制肠毒素,减弱毒性的作用。 基因缺失是 毒性基因水平转移的补充,使得细菌发展成病原菌( Maurelli等人,1998)。比较基因组学:研究细菌致病性的线索基于生理、病理、细菌物种的进化的差别,比较分析微生物基因序列为开发 大量的基因突变与基因可塑性提供前所未有的机会。本节阐述微生物总基因组, 从细菌到古细菌到真核生物,全面评估基因水平转移对细菌物种形成的影响。 1995年流感嗜血杆菌Rd基因组测序的完成首次阐述了一个可
42、自主生存的微生物 的基因组(Fleischmann等人,1995),并且开启了微生物基因组学的时代。研究重点已经从研究单个基因转移到基因组研究以及多个单基因是怎样在一起相互作 用产生复杂表型。在流感嗜血杆菌基因组序列公布之后很短时间内公布了完整基 因组的序列报告之后,比较基因组的道路被铺平(Fraser等人,1995; Razin等人,1998)。幽门螺杆菌的基因组(Alm等人,1999)测序代表了比较基因组的 里程碑。因为它展示了一个致病菌不同菌株之间的差异。(Field等人,1999)由于越来越多的基因信息已经从分类多样性与相互关联都很大的物种中获得,比较基因组学在研究基因内容、基因组的组
43、织和基因的获得(细菌物种进化)方面的影响是确实存在的,揭示了单个细菌的基本原理和唯一特征。比如,比较不同细 菌的完整基因组为病原菌与共生菌的基本区别提供视角( Strauss与Falkow, 1997)。多个菌株的比较揭示疾病发生与疾病严重程度的遗传基础(Whittam与Bumbaugh, 2002)。在本节我们将讨论比较基因组对微生物致病性的分子基础, 包括鉴定影响感染的菌株特异性基因以及怎样获得这个基因。结核分枝杆菌的基因组:毒力基因的鉴定和基因组可塑性结核分枝杆菌是引起结核病一一一种不断的在世界范围内严重影响人类健 康的慢性感染性疾病的病原菌。尽管对于革兰氏阳性杆菌的研究已很深入,但我们
44、对于致病性的分子基础还知道的很少, 特别是当毒力并不是毒素蛋白产生的时 候。大量宿主对分枝杆菌抗原反应产生的细胞介导的免疫和炎性反应在很大程度 上是由于感染所致(Brosch等人,2000)。近年来,抗药的结核分枝杆菌的出现 迫切需要新的预防与治疗策略。结核分枝杆菌的全基因组测序可用于比较并功能 性研究这种人类重要的病原菌,加速对分枝杆菌的致病机理、进化与表型差异的 认识。应用微阵列技术与蛋白组学研究(将在下章讨论)将为这种空气传播疾病 提供新的可能更有效的预防与治疗方法。特征清楚的结核分枝杆菌 H37Rv菌株的全基因组测序已经通过选择性的大 片段的插入与鸟枪法制备的全基因组小插入克隆库(粘粒
45、与细菌人工染色体文 库)的系统序列分析方法而获得(Cole等人,1998)。结核分枝杆菌H37Rv 4.4Mb 的环形染色体大约包含4000个蛋白编码基因,展示出高 G+C含量。有趣的是, 高G+C含量存在于整个连续的H37Rv完整基因,提示基因组中没有由多种碱基 组成的通过水平转移获得的致病岛(Cole等人,1998)。基因序列的解读提示预 测蛋白的40%为功能蛋白,同时44%的蛋白编码基因具相似的功能。功能描述 不能解释剩余16%的蛋白的功能,可能为编码特异功能的基因。序列分析还提示 结核分枝杆菌H37Rv基因组中富含重复DNA序列,特别是插入元件(IS)与持 家基因。IS元件是小的DNA
46、片段(2.5kb),在IS编码的转座酶作用下通过转 座反应将其插入到基因的多个位置(Mahillon与Chandler, 1998)。H37Rv基因组 包含56个与IS元件同源的位点,这些IS至少属于9个不同的家族,其中有6 个IS形成一个命名为IS1535的新家族(Gordon等人,1999)。这些IS大多数插 入到基因间或基因组的非编码区,在tRNA基因附近转座的发生频率很高。IS元 件在毒力基因与耐药基因的水平转移中具重要作用,此外 IS介导的染色体的缺 失与结核分枝杆菌基因组的可塑性有关(Brosch等人,1999; Gordon等人,1999)。将结核分枝杆菌与其它细菌区分开来的明显
47、标志之一是其存在二个具有重 复结构的氨基乙酸蛋白新家族(Cole等人,1998)。分析结核分枝杆菌H37Rv的 基因组序列发现了二个大的非相关的酸性氨基乙酸富集蛋白,它们的基因在基因组中成簇排列并且占总编码序列的 7% (Cole等人,1998; Cole等人,1999)。这 些多基因家族因在其高度保守的N末端都存在 Pro-Glu(PE)与Pro-Pro-Glu(PPE)基序故被命名为PE和PPE。PE和PPE蛋白的C末端在大小、序列与重复拷贝 的数目上都有很大变化。PE蛋白的一个大的亚家族是一个多形态的重复序列家 族(PGRS),这个家族以其在C末端有多个串联重复的Gly-Gly-Ala或
48、Gly-Gly-Asn来定性。许多PPE蛋白中主要的多形串联重复(MPRT)的C末端 富含Asn-X-Gly-Asn-X-Gly序列。在结核分枝杆菌的基因组序列被弄清之前,这 些蛋白家族并不为人们所知道。所以,PE与PPE蛋白的生物学功能也不清楚。然而,这些蛋白的重复与变化提示它们可能是分枝杆菌细胞抗原突变的原因并且 可能是一种免疫相关抗原(Cole等人,199; Cole等人,1999)。在全基因组序列被完成之前,只有很少的结核分枝杆菌毒力因子在实验中被 鉴定。这些毒力因子包括巨细胞集落因子(mc, 一个Sigma转录因子(sigA),与 辣根过氧化物酶(Arruda 等人,1993; Co
49、llins, 1996; Collins 等人,1995)。然而 使结核杆菌在巨嗜细胞中存活并引起临床症状的毒力因子还不知道。通过计算机(生物信息学的方法)或基因学方法如特征标记的突变(Brosch等人,2000)可以从基因组角度预测感染相关因子。数据库的同源搜索已经发现了与鼠伤寒沙门 菌基因smpB同源的基因,这个基因与细菌在细胞内存活有关(Baumler等人,1994)。与单核细胞增生性李斯特菌分泌因子p60的同源基因,以及与磷酸酶与酯酶形成有关的毒力侯选基因可能与降解细胞膜相关(Brosch等人,2000; Cole等人,1998)。结核分枝杆菌的基因组序列还提示基因组中存在与氧化保护相
50、关 或可能抵抗硝化的黄血色素蛋白(hmp) (Hu等人,1999)。为了研究天然细菌群落中基因的可变性,基因微阵列技术已用于结核分枝杆菌的基因组比较。一个包含结核分枝杆菌 H37Rv的3924个ORFs与738个基因 问区域的Affymetrix聚核甘酸基因微阵列已用于检测 19个临床分离鉴定的结核 分枝杆菌(Kato-Maeda等人,2001)。与其它病原微生物相比,结核分枝杆菌存在 相对低的基因改变,并且序列分析结核分枝杆菌的高保守区提示单核甘酸多态性 与基因的水平改变和基因的可塑性关系很小。2001年Kato-Maeda及其同事研究表明,经基因微阵列比较基因组方法检测的16个结核分枝杆菌
51、中,以参考菌H37Rv的38个ORFs为研究对象,发现参考菌与16个结核分枝杆菌基因序列无 区别。与H37Rv比较,占平均基因组0.3%的的基因序列(13248bp)发生丢失, 并检测到25个不同的丢失序列(全长 76839 bp) (Kato-Maeda等人,2001)。提 示基因缺失是分枝杆菌病原菌进化中遗传改变的主要原因。另外,Kato-Maeda和其合作者(2001)的工作提示,当基因缺失时(或突变时),结核分枝杆菌的 毒力下降。分析减毒结核分枝杆菌与全毒结核分枝杆菌的基因组,发现变化的位点是IS介导的基因缺失的结果。这样的比较基因组分析为研究分枝杆菌的进化 与毒理提供独特的远景,并与
52、基因微阵列一起,为结核分枝杆菌感染的分类研究 提供合适的基因型分类方法(Brosch等人,2001; Kato-Maeda等人,2001)。基因微阵列技术分析幽门螺杆菌的比较基因组幽门螺杆菌是革兰氏阴性的有鞭毛的细菌,可引起从慢性活动性胃炎到严重的胃肠道疾病比如消化器官与胃溃疡,胃癌,黏膜相关的淋巴组织( MALT)淋 巴瘤(Cover与Blaser, 1996)等疾病。幽门螺杆菌与其它病原微生物的区别是它 能定植在胃黏膜这种酸度很高的环境中。 患者的症状差别至少部分与感染的幽门 螺杆菌的菌株特异性基因的多样性有关 (Atherton等人,1997; Blaser, 1997)。两 个独立的幽
53、门螺杆菌26695与J99的全基因组序列已通过全基因组随机测序法(鸟枪法)获得(Alm等人,1999; Tomb等人,1997)。26695与J99的基因组包 含一个小的单个的环状染色体,分别为 1.67Mb和1.64Mb, G+C含量为39%。 这两株细菌基因组中还包含 40kb的致病岛,编码IV型的分泌系统与向宿主细胞 分泌和转移CagA蛋白有关。另外,基因序列分析提示在幽门螺杆菌的蛋白中, 相对于流感嗜血杆菌与大肠杆菌(Tomb等人,1997),精氨酸与赖氨酸的出现频 率很高。Tomb和其同事认为氨基酸的出现频率可能影响幽门螺杆菌在酸性的胃 中的存在。用生物信息学与基因微阵列技术可比较二
54、个分离出来的幽门螺杆菌的基因组序列。尽管幽门螺杆菌26695与J99的基因序列及预测的编码蛋白是非常接近的,但计算机比较基因组方法还是提示出两者存在种内的差异(Alm等人,1999)。比较基因组分析还提示不同菌株大概有 6-7%的总基因组差异(Alm等人,1999)。 DNA限制性修饰系统的基因占幽门螺杆菌 26695与J99特异基因的15-20%,然 而预测的编码外膜合成、DNA转移系统、DNA复制系统、能量代谢系统、磷脂 代谢系统等功能基因在菌株中变化很小(Alm等人,1999)。比较幽门螺杆菌26695 与J99的序列提示它们都含有不经常出现的蛋白,预测这类蛋白功能为n型限制性修饰系统。
55、在菌株26695中,基于基因顺序以及与已知的核酸内切酶,甲基转移酶,特殊的亚单位等序列相似特性发现了11个限制修饰系统(Tomb等人,1997)。最近,从6个幽门螺杆菌不同的菌株中鉴定出不同功能特征的22个II型限制性核酸内切酶,其中三个是全新的内切酶(Xu等人,2000)。II型限制性修 饰系统被两种分离的酶限定:限制性内切酶识别特异DNA序列并且在特异位点清除未修饰的外源DNA。然而,甲基转移酶在内切酶识别的相同位置修饰DNA ,保护DNA本身免受内切酶的消化(Wilson与Murray, 1991)。幽门螺杆菌的不同 菌株拥有非常多样的限制性修饰酶,这个特征是幽门螺杆菌的独特特征(Lin
56、等人,2001; Xu等人,2000)。尽管限制性内切酶在不同的菌株中是不同的,生化 分析提示所有的酶都能特异性切除识别的4-5个碱基识别序列(Xu等人,2000)。这种不常见的限制性酶切系统的高互补性的生物学意义还不太清楚。然而,幽门螺杆菌的这种天然能力(Suerbaum等人,1998)提示大量的限制性修饰系统阻止了 外源DNA插入到宿主基因组中(Xu等人,2000)。可以用DNA基因微阵列技术调查不同细菌的种内多样性。在另一个比较基 因组研究中,高密度的基因微阵列用于检测15个从临床分离出的毒性不同的幽门螺杆菌(Salama等人,2000)。假设26695与J99包含相同的ORF, 266
57、95株作 为标准菌株被用于制备基因微阵列。91个只存在于J99的ORFs也在微阵列中展 示。在分析的1643个基因中,1281个最小的功能核心被鉴定出来(Salama等人,2000)。这些基因在所有的菌株中均普遍存在,编码基础代谢,生物合成与调节 功能。最值得注意的是在每个菌株中存在12-18%的菌株特异基因,其中大部分为未知功能基因(表12.1)。两个最大的已知功能的特异基因是限制性修饰系统与 转座酶基因,在调节 DNA的改变与促进幽门螺杆菌的多样性上起重要作用 (Salama等人,2000)。其它菌株特异性基因编码各种各样的外膜蛋白,脂多糖合成蛋白,三个virB4类似蛋白与一个traG类似
58、蛋白。它们是与IV型分泌结构的组 装相关的ATP酶。Hierarchical分类方法(第七章)用菌株特异的基因鉴定一组 可能的新的毒力因子。这些新的毒力因子与幽门螺杆菌的发病机理相关,可以调节PAI功能或与PAI共同作用使宿主发病(Salama等人,2000)。菌株特异性DNA 限制性修饰基因与其它的菌株特异性基因和26695与J99中其余基因比较,具有相对低的G+C含量,提示这些基因可能是来自于其它微生物近期基因水平转移 的结果(Alm等人,1999)。比较基因组研究幽门螺杆菌的限制性修饰系统说明, 所有的菌株特异的限制性修饰基因都是有活性的,然而这些在菌株中保守的基因都是功能水平上非活化的
59、,这个结论支持一个观点:菌株特异的限制性修饰基因 通过基因水平转移获得(Lin等人,2001)。对幽门螺杆菌的比较基因组研究将继 续鉴定分离出的不同菌株的菌株特异性基因成分,用菌株特异基因的差别解释菌株进化的差别,适应不同宿主的差别以及疾病产生的差别。 应用幽门螺杆菌26695 与J99的全基因组信息,以序列分析为基础,寻找编码外膜蛋白的基因家族(Alm 等人,2000)。这样的外膜蛋白与幽门螺杆菌适应胃的酸性环境有关,并且这样 的外膜蛋白代表某个细菌最重要的抗原决定族。基于比较基因组,组成菌株编码蛋白4%的五个共生同源基因家族在幽门螺杆菌26695与J99的基因组中被鉴定出来。共生同源基因是
60、在基因组中与复制相关的基因,编码的蛋白似乎具有相似的生化功能却具有不同的生物学作用。 这些家族编码包括被认为是黏附素的Hop外膜蛋白(Odenbreit等人,1999; Peck等人,1999),在N与C末端包含可变 中心区域的新鉴定的Hom外膜蛋白(Alm等人,2000),离子调节外膜蛋白(FecA 类似的蛋白)与泵外膜蛋白。其中的两个家族(编码Hop与Hom外膜蛋白)包含 26695或J99特有的成员。基因序列分析提示许多基因的表达被在同源多聚体区 域或二核甘酸重复处的滑动链修复所调节(见12.2.2),并导致抗原的变化或适应性的进化(Alm等人,1999; Tomb等人,1997)。例如
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版个人短期小额借款合同示范文本
- 2025年度店铺装修施工与室内绿化设计合同范本
- 教育科技融合小学数学游戏化学习的实施策略
- 科技助力下的儿童健康成长路径探索
- 二零二五年度车辆保险理赔设备租赁协议3篇
- 2025年度个人带车库公寓买卖合同书
- 漯河2024年河南漯河市农业农村局招聘高层次人才6人笔试历年参考题库附带答案详解
- 二零二五年度文化产业园区运营承包合同书3篇
- 2025年度外墙保温项目节能减排与施工总承包协议4篇
- 朝阳2024年辽宁朝阳师范学院招聘37人笔试历年参考题库附带答案详解
- 2024届上海市浦东新区高三二模英语卷
- 大连高新区整体发展战略规划(产业及功能布局)
- 2024年智慧工地相关知识考试试题及答案
- 输液室运用PDCA降低静脉输液患者外渗的发生率品管圈(QCC)活动成果
- YY/T 0681.2-2010无菌医疗器械包装试验方法第2部分:软性屏障材料的密封强度
- GB/T 8005.2-2011铝及铝合金术语第2部分:化学分析
- 不动产登记实务培训教程课件
- 不锈钢制作合同范本(3篇)
- 2023年系统性硬化病诊断及诊疗指南
- 烟气管道阻力计算
- 《英语教师职业技能训练简明教程》全册配套优质教学课件
评论
0/150
提交评论