




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、微生物基因组学微生物基因组研究概况微生物基因组的特点微生物基因组研究的意义微生物基因组学微生物基因组研究概况微生物基因组重要纪事年限 事件1994年美国DOE启动MGP1995年Science发表了第一株细菌-流感嗜血杆 菌全基因组1995年发表了集胞藻菌株PCC6803的测序和注释1996年Science发表了第一个完成的古细菌-詹 氏甲烷球菌全基因组序列1996年酵母基因组序列发表1997年大肠杆菌K-12基因组序列发表 截至2011年4月24日,NCBI上记录了1534个细菌基因组, 包括了103个古细菌和1431个真细菌, 其中中国科学家完成了44个 PubMed检索到的有关基因组学和
2、转录组学的文献数The literature number retrieved in PubMed database using “Genomics” and “Transcriptomics” as keywords年份Year基因组学文章Articles about Genomics基因组学综述Reviews about Genomics转录组学文章Articles about Transcriptomics转录组学综述Reviews about Transcriptomics200015433832020012072559422002268982618720033570984231320
3、0448101238562320056109141788522006690515591054920077295161313355200881191603162592009855115792347520108986148729670研究现况及内容细菌 研究内容 代表菌株病原菌 毒力因子、致病岛、耐药基因、耐药机制以及与寄主的关系等 肺炎链球菌、致病性大肠杆菌、沙门氏菌等极端环境生长的细菌 极端环境下的生存机制,如嗜热菌的热稳定性 詹氏甲烷球菌、热自养甲烷杆菌、甲烷嗜热菌、腾冲嗜热菌等工业和环境有影响的细菌 CO2固定、固氮、硫氧化 和氢代谢等 单细胞蓝细菌、丝状蓝细菌、原绿藻等原核生物基因组的大
4、小原核生物基因组的编码序列(CDS/ORF)原核生物染色体结构GC 含量重复序列DNA链组成的非对称性微生物基因组的特点微生物基因组的特点类别特征染色体结构多为一条环状闭合双链DNA基因组大小从0.16-13Mb编码序列占基因组总长度的90%,平均为1Kb左右GC含量16.6%-74.9%DNA链组成的非对称分布GCskew、ATskew、基因方向性偏好、密码子使用偏好Circular representation of the genome of T. tengcongensis MB4原核生物基因组的编码序列 占原核生物基因组总序列的90 基因的平均大小为1kb ORF原核生物基因组的编码
5、序列 不同生物编码序列的比较Organism Genome (kb) ORFs ORF size Coding Sequence(%)Buchnera sp 640 583 988 90Aquifex aeolicus 1,551 1,512 956 93Saccharomyces cerevisiae 12,069 6,294 1,092 57 Schizosaccharomyces pombe 14,000 4,820 2,033 70 Caenorhabditis elegans 97,000 19,099 1,311 27 Arabidopsis thaliana 115,428 25
6、,498 460 29Homo sapiens 3,000,000 30,000 1,340 2 原核生物基因组的编码序列 核生物(高温菌)基因组的内含子Sulfolobus solfataricus P2: 18个tRNA基因含有单个内含子 一个胱氨酸tRNA基因含有2个内含子A.pernix tRNA基因中 发现 14个内含子 Staphylothermus marinus和运动脱硫球菌 23S rRNA基因中也发现内含子 染色体结构大多数原核生物:一条环状闭合双链DNABrucella suis 1330:两条环状闭合双链DNA 2,107,792 bp (Chr I) 1,207,38
7、1bp (Chr II) Vibrio cholerae: 两条环状闭合双链DNA 2,961,146 bp (Chr I) 1,072,314 bp(Chr II) Borrelia burgdorferi B31: 910,725 bp ( linear Chromosome) 21 linear and circular plasmidsTreponema pallidum:一条环状闭合双链DNA 1,138,006 bp GC 含量原核生物基因组GC含量为:16.6-74.9 %嗜温菌基因组GC含量与 rRNA、tRNA的GC含量成正比嗜热菌rRNA、tRNA的GC含量与 基因组GC含
8、量不成正比,但与OGT(最适生长温度)成正比tRNA GC含量总是大于rRNA的GC含量嗜温菌基因组G + C content (%)Organism Genome rRNA tRNA Xfas 52.7 53.1 59.8 Tpal 52.8 53.1 57.2 Mlep 57.8 55.7 61.6 Atum 59.4 54.6 58.4 Smel 62.7 54.5 61.5 Mlot 62.7 56.3 60.5 Mtub 65.6 58.0 62.0 Paer 66.6 53.1 60.1 Drad 67.0 56.5 58.8 Ccre 67.2 55.0 61.2 Hbsp 67
9、.9 58.1 62.4 linear regression 0.88 0.80嗜热菌最适生长温度(OGT)与GC含量的关系OrganismOGT() Genome rRNA tRNA Pabyssi 103 0.45 0.670.70 Pyro 98 0.42 0.63 0.71Aero 95 0.56 0.680.73Mjan 85 0.31 0.61 0.66 Aquae 85 0.43 0.650.68 Aful 83 0.49 0.63 0.68 Ssol 80 0.36 0.62 0.67 Tmar 80 0.46 0.63 0.65Tten 75 0.38 0.590.60 Mt
10、he 65 0.50 0.57 0.62 Tvol 60 0.40 0.53 0.61 Tacid 59 0.46 0.530.61 linear regression 0.01 0.92 0.90基因组非编码序列的注释非编码区的注释 各类重复序列 基因表达的调控序列 信号序列等 DNA链组成的非对称性 GC分布不对称 (GC skew) AT分布不对称(AT skew)前导链含有较多的G(A) 而后随链含有较多的C(T) 计算公式为(nG-nC)/(nG+nC) (nA-nT)/(nA+nT) 累计skew (cumulative skew)用于复制起点和终点的定位GC skew of T.
11、 tengcongensis genomeDNA链组成的非对称性(真细菌) 基因方向性偏好 基因方向性偏好 (gene orientation bias) 先导链上编码的基因总是多于后随链 Jean R.Lobry Microbiology Today Vol 26DNA链组成的非对称性 码子使用偏好(codon usage bias) 先导链和后随链密码子的不同 在先导链,以G或T开头或结尾的密码子显著地多于后随链,常见的有GTG、GCG和GAG 在后随链以C或A开头或结尾的密码子多于先导链,如CTC、GCC、CCC、ATC和ACC DNA链组成的非对称性 基因密度和密码子使用的差别 高度表
12、达基因: 核蛋白体蛋白基因,与翻译和转录有关的因子基因,分子伴侣基因和与主要的能量代谢相关的基因 大多编码于前导链通常都有密码子偏好(核蛋白体蛋白基因密码子的第三位多为G )快速生长的细菌(大肠杆菌、霍乱弧菌、枯草芽孢杆菌和流感嗜血杆菌) 主要的糖酵解和三羧酸循环基因为高度表达基因产甲烷菌,与甲烷代谢有关的基因为高度表达基因 高度表达基因: 那些在密码子使用上与一般基因相差很大,与核蛋白体蛋白基因,翻译和转录相关基因,伴侣-降解蛋白基因等在密码子使用上高度相似的基因为高度表达基因。 微生物测序及分析流程图数据分析软件序列拼接组装: Newbler, AMOScmp, Velvet, Phred
13、/Phrap/Consed, Oligo 6复制起始位点: ori-finder + GC skew基因注释: Glimmer, GenemarkS, Prodigal, BLAST基因起始位点:ZCURVE翻译起始位点:GS-FindertRNA: tRNAscan-SErRNA: RNAmmerSmall RNA: Rfam重复序列: Tandem repeat Finder, IS finderCRISPR序列:CRISPR finder数据分析软件Prophages: Prophage finderVirulence-associated factors: VFDB databaseS
14、ignal peptides: SignalP跨膜结构:TMHMMOperon: OperonDBGenome island: IslandViewer, MobilomeFINDER致病岛:PAIDB膜转运蛋白: TCDB抗菌素抗性基因: ARDB可变遗传因子: ACLAME必需基因:DEG database数据分析软件Overlap基因、假基因: Mciobial Genome Submission Check功能注释 : COG, KEGG进化树: Clustal W, CVTree比较基因组分析: Mauve, MUMmer, ACT, MicrobesOnline, mGenomeS
15、ubtracton, xBASEFinishing阶段Finishing阶段Finishing阶段 多重PCR结果,引自Tettelin H.等文章 Finishing阶段短片段文库构建填补二级结构区示意图,摘自Amanda A等文章 Finishing阶段 基于转座子技术来完成重复序列区的测序,摘自Scott E等文章 微生物基因组测序策略-高通量测序技术454 长reads 测序Solexa Pair-end测序组合长reads和短reads测序Sanger法finish微生物基因组测序策略副血链球菌FW213基因组基本特征 Genome size(bp)2171616G+C conten
16、t(%)41.62Average CDS length(bp) 932Protein coding2059Protein with known or predicted fuction 1496(72.7%)Conserved hypothetical proteins 461(22.4%)Hypothetical proteins 102(4.9%)tRNAs61rRNA operons4副血链球菌FW213基因组基本特征副血链球菌比对结果蛋白质数据库比对最相似基因数分布基因组名称最相似的基因数血链球菌(Streptococcus sanguinis SK36)557肺炎链球菌(Strept
17、ococcus pneumoniae) 552戈登链球菌(Streptococcus gordonii str. Challis substr. CH1)233嗜热链球菌(Streptococcus thermophilus)149猪链球菌(Streptococcus suis) 68变型链球菌(Streptococcus mutans UA159)42无乳链球菌(Streptococcus agalactiae)31化脓链球菌(Streptococcus pyogenes)21COG分类COG分类图,JKL编码信息加工和储存的蛋白质的基因;DVTMNUO代表细胞加工和信息处理基因;CGEFH
18、IPQ是与代谢相关的基因;RS为功能未知的基因代谢途径代谢途径728691bp 735072bp 精氨酸操纵子示意图,精氨酸脱亚氨酶(arginine deiminase,arcA), 鸟氨酸氨基甲酰转移酶(ornithine carbamyltransferase,arcB), 氨甲基酶(carbamate kinase,arcC), 逆向运输蛋白 (arginine-ornithine antiporter,arcD), 二肽酶(dipeptidase,arcT)和调控蛋白(regulator,arcR) 比较基因组分析副血链球菌基因组和血链球菌基因组比对的全部MUM点阵图。横坐标,副血链
19、球菌,2171616bp; 纵坐标, 血链球菌。对角线代表可以对齐区域,斜率-1的对角线代表大规模的染色体倒位比较基因组分析副血链球菌基因组和其他六株细菌全基因组比对结果图。a,和肺炎链球菌CGSP14比对的结果;b,戈登氏链球菌;c,变异链球菌;d,化脓性链球菌;第e,猪链球菌;f,嗜热链球菌 比较基因组分析进化分析毒力基因基因组小岛(fwislet1)基因组岛(fwisland)抗药性二元信号转导系统宏基因组学和宏转录组数据分析流程三 微生物基因组研究的意义基因组研究在医学的应用 基因组研究的生物技术应用 微生物的进化 A 基因组研究在医学的应用 致病相关基因的鉴定 设计特异的实验诊断方法
20、疫苗的研究 新型抗生素的开发 1. 致病相关基因的鉴定 通过基因组比较鉴定病原相关基因流感杆菌: 7种内毒素(脂多糖)基因25种新基因 细胞表面定居的粘附分子重复序列1. 致病相关基因的鉴定 致病相关基因的预测致病物质多为病原体细胞壁成分、 表面蛋白和一些分泌性蛋白质 PHD预测基因组的跨膜蛋白 SIGNALP预测分泌性蛋白质 1. 致病相关基因的鉴定 致病相关基因的预测(续)功能相同的蛋白质往往相邻并受共同的调控序列调控 operon同一菌种的致病菌株与非致病菌株的基因组进行比较 E. coli K12 MG 1655 4.1 + 0.53 M (528genes) E. coli O157
21、:H7 EDL 933 4.1 + 1.34 M (1387genes)2. 设计特异的实验诊断方法寻找高度特异的核酸序列 实验技术 PCR 杂交技术(Microarray,DNA chip) 应用 鉴定病原种类进行临床诊断 病原分型的流行病学研究 预测疾病进展及临床疗效3. 疫苗的研究通过全基因组序列的同源性比较,寻找致病菌的属特异、群特异、种特异、型特异、甚至亚型特异的抗原 Pizza等和Tettelin等对血清型B脑膜炎奈瑟菌近350种抗原的研究Wizemann等对肺炎链球菌的基因组的抗原性蛋白研究 4. 新型抗生素的开发 药靶的特征:药靶应是病原生物必需的,在进化上是保守的可作为药靶的
22、微生物基因或蛋白质: 毒力基因、必需基因、菌种专一基因、独特酶类、膜转运蛋白等 毒力基因作为靶位毒力基因的发现:非致病菌(E.coli K12)与致病菌( E.coli O157, 沙门氏菌,耶尔森氏菌)基因组的比较致病岛(Pathogenicity islands)编码的功能已知蛋白作为药靶必需基因作为药靶寻找必需基因的方法: 比较基因组:在不同进化阶段保守的基因 往往是必需基因 缺失致死或转座子插入 转座子插入PCR寻找流感嗜血杆菌, 肺炎链球菌必需基因 致病菌特殊且必需的蛋白作为靶位 菌种专一基因作为药靶寻找菌种专一基因的方法: 比较基因组方法病原生物基因组中存在但 近缘种属中缺少的基因
23、可能是致病关键基因幽门螺杆菌(与大肠杆菌和流感杆菌比较)找到594个特有基因,73个编码种专一蛋白,如丙酮酸:铁氧还蛋白氧化还原酶,可作为靶位独特酶类作为药靶所有细菌独特酶类均可作为靶位: 如: 参与细胞壁合成的酶类 叶酸合成酶类 核酸合成酶类膜转运蛋白作为靶位衣原体和立克次体的ATP/ADP转位酶是致病菌必需,而只有植物叶绿体、线粒体具有类似酶细菌多药运输蛋白(泵)新型抗生素的开发药靶的种类共有药靶菌种或某菌种的致病菌株的特异性药靶 某一部位常见致病菌的共同药靶 新型抗生素的开发Timothy等的研究:肺炎链球菌,流感嗜血杆菌,脑膜炎奈瑟菌 共有基因32个 其中2个甲硫氨酸亚砜还原酶基因 疑
24、是毒力决定子 B 基因组研究的生物技术应用 生物降解作用酶工业食品生物技术抗生物质生物降解作用Deinococcus radiodurans:抵御放射性物质Thermotoga maritima:降解单体或复合植物 聚合物, 如木聚糖和纤维素Dehalococcoides ethenogenes:降解四氯乙烯Pseudomonas putida:降解多种毒性有机废料, 包括多种芳香族化合物酶工业Thermotoga maritima:耐热Aquifex aeolicus:耐热Methanogenium frigidum:耐寒Halobacterium:耐盐,降解塑料Pseudomonas pu
25、tida:降解塑料食品生物技术Lactococcus latis: 生产发酵食品,微生物营养添加剂抗生物质Streptomyces coelicolor: 生产抗生素,用于人类,兽医和农业Photorhabdus luminescens: Bacillus thuringiensis Xenorhabdus nematophilus 产生杀昆虫毒素蛋白 转基因抗昆虫植物C 微生物的进化 基于16S rDNA的系统进化树: Woese等的生物 三域 真细菌域、古生菌域和真核生物域 单个基因的进化并不等同于物种的进化 基因的水平转移 基因的水平转移 的意义研究微生物的进化史研究菌种新功能的来源研究
26、微生物的生命过程预测基因功能基因水平转移的方式转化接合转导鉴定基因水平转移的方法 鉴定基因组区段的组成 比较不同基因的系统发生 最大相似性分析 基因在生物的分布谱 易被水平转移的基因难被转移的基因:informational genes 进化核心基因易被转移的基因:operational genes 氨酰tRNA合成酶基因 剪切因子 重组酶 DNA聚合酶原核生物转录组学研究The transcriptomes of prokaryotic have been largely overlooked. It is primary advance in prokaryotic transcriptomics through new sequen-cing technologies in combination with mRNA enrichment and tilling array.原核转录组-mRNA en
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 出口维修合同范例
- 个企业转让合同范例
- 低价名宿建造合同范例
- 冷凝器合同范例
- 卖车交易合同范本
- 原油交易合同范例
- 印刷单位材料合同范例
- 劳务合同范例谁是甲方
- 个体与公司劳务合同范本
- 压车合同范例
- 极地通信标准制定-深度研究
- 第十单元课题2 常见的酸和碱第1课时-2024-2025学年九年级化学人教版下册
- ISO17025(2017中文清晰版本)
- DBJ04-T 303-2024 高性能混凝土应用技术规程
- 2024年湖南公务员考试申论试题(省市卷)
- 2024年02月福建2024年中信银行福州分行社会招考(210)笔试历年参考题库附带答案详解
- 影视短剧投资合作合同
- 高考语文专题复习图文转换之徽标类 课件
- 2024-2030年中国医院后勤服务市场运行状况及投资前景趋势分析报告
- 2024年中国汽车出口与投资国别指南-马来西亚篇-中国汽车工业协会
- 骨科延续护理
评论
0/150
提交评论