版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、欢迎各位老师及同学! 香鳞毛蕨的转录组测序香鳞毛蕨的转录组测序 报告人:佟伟霜 2012.01.07 转录组是什么转录组是什么-what 1 转录组的常用方法转录组的常用方法-how 2 RNA-Seq能做什么?能做什么? 3 我们是怎样做的?我们是怎样做的? 4 我们的结果如何?我们的结果如何? 5 Contents 1.转录组是什么?转录组是什么? DNADNA转录的转录的 所有所有RNARNA mRNAmRNA 转录组即特定细胞在某一功能状转录组即特定细胞在某一功能状 态下所能转录出来的所有态下所能转录出来的所有RNA的的 总和,包括总和,包括mRNA和和ncRNA。 n 基因芯片技术基
2、因芯片技术 Microarray n 基因表达序列分析技术基因表达序列分析技术 Serial analysis of gene expression,SAGE n 大规模平行测序技术大规模平行测序技术 Massively parallel signature sequencing,MPSS n RNA 测序技术测序技术 RNA sequencing,RNA-seq 2.转录组是怎样做的转录组是怎样做的-常用方法常用方法 J 优点:优点: J 成本适中,其对较高表达成本适中,其对较高表达 的基因检测比较准确,数的基因检测比较准确,数 据分析软件较多,整个方据分析软件较多,整个方 法较为成熟法较为
3、成熟 L 缺点:缺点: L 对低表达基因检测敏感度对低表达基因检测敏感度 不够,前期工作基础要求不够,前期工作基础要求 较高,而且很难检测出融较高,而且很难检测出融 合基因转录、多顺反子转合基因转录、多顺反子转 录等异常转录产物录等异常转录产物 2.常用方法常用方法-基因芯片技术基因芯片技术 流程流程 RNA cDNA Hydrization with microarrys Transcriptme RNA cDNA Anchoring enzyme cDNA fragment Ligated with linker cDNA fragment with linker Tagging enzy
4、me Tag Ligation and PCR diTag Anchoring enzyme Concatemers Sequecing Transcriptme J 优点:优点: J 不需基因序列的信息,能够不需基因序列的信息,能够 全局性地检测所有基因的表全局性地检测所有基因的表 达水平,可显示基因差异,达水平,可显示基因差异, 可获得未知基因特别是那些可获得未知基因特别是那些 低拷贝基因低拷贝基因 J 缺点:缺点: J 文库构建流程长,技术要求文库构建流程长,技术要求 高,单条短序列标签所含的高,单条短序列标签所含的 基因信息很少,不适于遗传基因信息很少,不适于遗传 信息缺乏的植物信息缺
5、乏的植物 2.常用方法常用方法-基因表达序列分析技术基因表达序列分析技术 流程流程 RNA cDNA Cloned to adaptor vectors cDNA library with adaptors PCR cDNA fragment with adaptors T4 polymerase dGTP ss cDNA fragment with adaptors Load on microbeads and sequncing Transcriptme J 优点:优点: J 获得更长的短标签,因而获得更长的短标签,因而 精度更高;此外,精度更高;此外,MPSS 技术特有的微球荧光测序技术
6、特有的微球荧光测序 可直接高通量读出序列,可直接高通量读出序列, 简化了测序过程简化了测序过程 L 缺点:缺点: L 涉及涉及PCR 扩增、克隆等可扩增、克隆等可 能会产生碱基偏向性的操能会产生碱基偏向性的操 作步骤,从而影响转录本作步骤,从而影响转录本 的正确识别的正确识别 2.常用方法常用方法-大规模平行测序技术大规模平行测序技术 流程流程 转录组测序转录组测序 RNARNA片段化片段化 (200-700(200-700 bp bp) ) 用连有用连有Oligo(dT)Oligo(dT)的的 磁珠富集磁珠富集mRNAmRNA(真)(真) 随机引物引导随机引物引导 cDNAcDNA合成合成
7、去除去除rRNArRNA富集富集mRNAmRNA (原核生物)(原核生物) cDNAcDNA片段片段 (200-700 bp)(200-700 bp) 反转录成反转录成cDNAcDNA 加接头加接头 总总RNARNA2.常用方法常用方法-RNA-Seq流程流程 2.常用方法常用方法-RNA-Seq J 提供更多信息,可以得到用基因芯片难以得到的转提供更多信息,可以得到用基因芯片难以得到的转 录可变剪接序列录可变剪接序列 J 对低表达基因的检测更加准确,并且可以定量确定对低表达基因的检测更加准确,并且可以定量确定 转录水平。转录水平。 J RNA-seq 技术得到的标签长度技术得到的标签长度(由
8、采取的高通量测由采取的高通量测 序技术的读长而定,可达序技术的读长而定,可达400 bp)比比SAGE 和和MPSS 显著增加,提高了识别转录本的特异性和准确性显著增加,提高了识别转录本的特异性和准确性 J 成本更低成本更低 有参考基因组有参考基因组 -转录组重测序转录组重测序 转录组测序转录组测序 2. RNA-Seq -分类分类 无参考基因组无参考基因组 -转录组从头组装转录组从头组装 2. RNA-Seq -数据分析数据分析 n基因表达差异分析基因表达差异分析 n检测基因融合检测基因融合 n基因结构的优化基因结构的优化 n鉴定基因的可变剪接鉴定基因的可变剪接 n新转录本预测新转录本预测
9、nSNPSNP分析分析 nUnigeneUnigene功能注释功能注释 nUnigene Gene Ontology Unigene Gene Ontology 分类结构的优化分类结构的优化 nUnigene Unigene 表达差异分析表达差异分析 n蛋白编码区预测(蛋白编码区预测(CDSCDS) nUnigene Pathway Unigene Pathway 富集分富集分 析析 有参考基因组有参考基因组 -转录组重测序转录组重测序 无参考基因组无参考基因组 -转录组从头组装转录组从头组装 2. RNA-Seq -无参考基因组的数据分析流程无参考基因组的数据分析流程 原始序列数据原始序列数
10、据 UnigenesUnigenes 基因注释基因注释 Unigene Unigene 表达量注释表达量注释预测编码蛋白框(预测编码蛋白框(CDSCDS)Unigene Unigene 功能注释功能注释 UnigeneUnigene表达差异分析表达差异分析UnigeneUnigene的的GOGO和和PathwayPathway分析分析 GOGO功能显著性富集分析功能显著性富集分析 PathwayPathway显著性富集分析显著性富集分析 Clean readsClean reads n SWISS-PROT的网址是:的网址是:http:/www.ebi.ac.uk/swissprot/ SWI
11、SS-PROT是经过注释的蛋白质序列数据库,由欧洲生是经过注释的蛋白质序列数据库,由欧洲生 物信息学研究所物信息学研究所(EBI)维护。维护。 n COG库的网址是:库的网址是:/COG 蛋白质直系同源簇蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生数据库是对细菌、藻类和真核生 物的物的21个完整基因组的编码蛋白,根据系统进化关系分类个完整基因组的编码蛋白,根据系统进化关系分类 构建而成。构建而成。 n KEGG的网址是:的网址是:http:/www.genome.ad.jp/kegg/ 京都基因和基因组百科全书京都基因和基因组百科
12、全书(KEGG)是系统分析基因功能,是系统分析基因功能, 联系基因组信息和功能信息的知识库。联系基因组信息和功能信息的知识库。 n NCBI的的BLUST网址是:网址是: /BLAST/ 2. RNA-Seq -常用数据库常用数据库 3. RNA-Seq能做什么?能做什么? -应用领域应用领域 n单核苷酸突变单核苷酸突变 n选择性剪接选择性剪接 n可选启动子可选启动子 n等位基因的差异等位基因的差异 表达表达 nRNARNA编辑编辑 n融合基因融合基因 n基因(转录本)基因(转录本) 的精确结构的精确结构 n各种器官的基因各种器官的基因 表达
13、模式表达模式 n不同发育阶段的不同发育阶段的 基因表达模式基因表达模式 n动植物疾病动植物疾病 n作物抗逆性、适作物抗逆性、适 应性研究应性研究 n分子育种分子育种 n药用植物代谢途药用植物代谢途 径分析径分析 功能基因组功能基因组癌症及复杂疾病癌症及复杂疾病农业及药用植物农业及药用植物 3. 3. RNA-Seq能做什么能做什么? ? - 实例(有参考基因组)实例(有参考基因组) Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptome. 实验材料实
14、验材料 实验结果实验结果 研究目的研究目的 全面了解水稻全面了解水稻 基因表达情况基因表达情况 愈伤组织愈伤组织 根尖(根尖(14d) 茎尖(茎尖(14d) 叶(叶(2 stages) 稻花稻花/稻穗(稻穗(3 stages) 总测序量总测序量28G,每个样本每个样本 不低于不低于5 M的的SE reads 鉴定了鉴定了28563个基因的个基因的5 和和3UTR 区域区域 发现发现7232个新转录本个新转录本,新新 转录本表达丰度低,且转录本表达丰度低,且 具有组织表达特异性具有组织表达特异性 发现发现23800个可变剪接个可变剪接 发现发现1356个融合基因个融合基因 Genome Res.
15、 2010 May;20(5):646-54. 3. 3. RNA-Seq能做什么能做什么? ? - 实例(有参考基因组)实例(有参考基因组) Characterization of Transcriptional Complexity during Berry Development in Vitis vimifera Using RNA-Seq 实验材料实验材料 实验结果实验结果 选取在成熟季节开花后选取在成熟季节开花后5,10, 5,10, 和和1515个星期葡萄分别代表葡萄个星期葡萄分别代表葡萄 果实成熟的着果期果实成熟的着果期, ,始熟期和成熟期始熟期和成熟期; ;分别选分别选3 3
16、棵向阳树和棵向阳树和3 3棵背棵背 阴树,每棵树相应位置随机摘取阴树,每棵树相应位置随机摘取1010个浆果,该实验设个浆果,该实验设2 2个重复个重复 ,分别作为样本池进行,分别作为样本池进行total RNAtotal RNA提取。提取。 Plant Physiology, April 2010, Vol. 152, pp. 17871795 3 3个个stagesstages共测了共测了2.2G2.2G的数据量,的数据量,82.4%82.4%的的readsreads可以定位到可以定位到1 1 个(个(66.6%66.6%)或多个()或多个(15.8%15.8%)基因组位置)基因组位置 将测
17、序所得将测序所得reads reads 与与referencereference(8.4X8.4X框架图)数据比较,鉴框架图)数据比较,鉴 定出定出85,870 85,870 个个SNPSNP 3. 3. RNA-Seq能做什么能做什么? ? - 实例(有参考基因组)实例(有参考基因组) 实验结果实验结果 发现发现385个基因具有个基因具有AS(alternative splicing),其中只在一),其中只在一 个浆果发育个浆果发育stage发生发生AS有有210个基因,只在两个浆果发育个基因,只在两个浆果发育 stage发生发生AS有有97个基因,只在三个浆果发育个基因,只在三个浆果发育s
18、tages都发生了都发生了 AS有有78个基因个基因 鉴定了新的基因,发现了鉴定了新的基因,发现了glutathione-S-transferase(GST)家族家族 的的53个新基因,个新基因,MYB转录因子家族中转录因子家族中28个新基因,这些基因个新基因,这些基因 因为表达丰度低、缺少探针序列而无法被芯片检测到因为表达丰度低、缺少探针序列而无法被芯片检测到 随机选取随机选取15个基因进行个基因进行qRT-PCR验证,发现验证,发现12个基因个基因qRT- PCR结果与结果与RNA-Seq相一致相一致 3. 3. RNA-Seq能做什么能做什么? ? - 实例(无参考基因组)实例(无参考基
19、因组) The Genetic Map of Artemisia annua L. Identifies Loci Affecting Yield of the Antimalarial Drug Artemisinin 实验材料实验材料 研究目的研究目的 构建与青蒿素构建与青蒿素 产量相关的遗产量相关的遗 传图谱传图谱 浓缩的嫩叶浓缩的嫩叶, , 成熟叶片成熟叶片, ,及及 花芽上的腺毛花芽上的腺毛 细胞细胞 Science 327, 328 (2010) 3 RNA-Seq能做什么能做什么? - 实例(无参考基因组)实例(无参考基因组) 实验结果实验结果 香鳞毛蕨香鳞毛蕨 Dryopter
20、is fragrans(L.)Schott 鳞毛蕨科鳞毛蕨鳞毛蕨科鳞毛蕨 属多年生蕨类植物。该属植物所含有的酚类化合物具有较强属多年生蕨类植物。该属植物所含有的酚类化合物具有较强 的驱虫、抑制肿瘤、抗病毒和杀菌作用。在我国北部地区,的驱虫、抑制肿瘤、抗病毒和杀菌作用。在我国北部地区, 民间流传香鳞毛蕨能治疗各种皮肤病,因此近年来受到国内民间流传香鳞毛蕨能治疗各种皮肤病,因此近年来受到国内 外学者的高度关注。外学者的高度关注。 4.4.我们是怎样做的?我们是怎样做的? 4.4.我们是怎样做的?我们是怎样做的? 组培的香鳞毛蕨无菌苗组培的香鳞毛蕨无菌苗 Ck:25 48h;1:4 48h;2:35
21、 48h 获得与香鳞毛蕨温光处理条件下酚类代获得与香鳞毛蕨温光处理条件下酚类代 谢相关基因谢相关基因 5. 5. 我们的结果如何?我们的结果如何? 结果结果 (6).(6).预测编码预测编码 蛋白框(蛋白框(CDSCDS) (1).产量统计产量统计 (5).Unigene(5).Unigene代代 谢通路分析谢通路分析 (4).Unigene(4).Unigene 的的GOGO分类分类 (2).组装结果组装结果 (3).Unigene 功能注释功能注释 (8).(8).差异差异UnigeneUnigene 的的GOGO分析和分析和 PathwayPathway分析分析 (7).Unigene(
22、7).Unigene表表 达差异分析达差异分析 5. 5. 我们的结果如何?我们的结果如何? - ( (1) 产量统计产量统计 Samples Total Reads Total Nucleotides (nt) Q20 percentage N percentage GC percentage * CK26,775,8742,409,828,66092.36%0.00%49.57% 127,039,8502,433,586,50091.31%0.00%48.68% 227,047,3802,434,264,20092.47%0.00%49.88% 表表1.1.测序产量统计测序产量统计 Tab
23、.1 Yield statistical of RNA-Seq 5.5.我们的结果如何?我们的结果如何? - (2)组装结果组装结果 ContigScaffoldUnigene ck1731377538056095 11894697713052561 21792148832264292 表表2 测序序列统计测序序列统计 Tab. 2 Distribution fragment of RNA-Seq 5. 我们的结果如何?我们的结果如何? - (2)组装结果组装结果 图1 CK 的Unigene的长度分布图 Fig.1Unigene length distribution of sample C
24、K 5.5.我们的结果如何?我们的结果如何? - (2)组装结果组装结果 图2 All-Unigene 的Gap(N)分布图 Fig.2 Gap distribution of All-Unigene 5.5.我们的结果如何?我们的结果如何? - (2)组装结果组装结果 综合所有样品得到的综合所有样品得到的UnigeneUnigene序列:序列: 原始组装结果:原始组装结果:All-UnigeneAll-Unigene共共6671666716 可确定方向的序列(可确定方向的序列(5-35-3):):All-Unigene.5-3.faAll-Unigene.5-3.fa 无法确定方向的序列:无
25、法确定方向的序列:All-Unigene.no_orientation.faAll-Unigene.no_orientation.fa Unigene10_All size 3699 gap 8 0.21% GCAAGGAGCACATGTGTGACTGATGAAGGTAACCT GAAGCAAGCTGCTCA GCTTAATATTTTTGAGACCTCGACTCAACCAACCAA GGAGGGTCCCTCAG ATCCTTCAGATAANNNNNNNNGTTACAATCTTGCTT GCAAATAGAATCTT 5. 5. 我们的结果如何我们的结果如何- (3)Unigene3)Unigen
26、e功能注释功能注释 其中预测只有一般功能的序列最多为其中预测只有一般功能的序列最多为4305条,细胞外结构及核结构相关序列最少分别为条,细胞外结构及核结构相关序列最少分别为4和和3条;其中与次生代谢产物的运条;其中与次生代谢产物的运 输和代谢相关序列有较多为输和代谢相关序列有较多为1051条,与各种氨基酸,糖类,脂类代谢的较多。条,与各种氨基酸,糖类,脂类代谢的较多。 5. 我们的结果如何?我们的结果如何? - (4) Unigene的的GO分类分类 基因的分子功能基因的分子功能 6316 细胞组分相关细胞组分相关 27529 参与的生物过程参与的生物过程 21417 5101 5. 5. 我
27、们的结果如何?我们的结果如何? - (5) 代谢通路分析代谢通路分析 Pathway All genes with pathway annotation (18989) Pathway ID Metabolic pathways 代谢途径代谢途径5012 (26.39%)ko01100 Biosynthesis of secondary metabolites次生代谢产次生代谢产 物合成途径物合成途径 2788 (14.68%)ko01110 Spliceosome 剪接体剪接体1384 (7.29%)ko03040 Plant-pathogen interaction 植物病原体交互作用植物病原体交互作用1128 (5.94%)ko04626 Protein processing in endoplasmic reticulum内质内质 网中蛋白质加工网中蛋白质加工 573 (3.02%)ko0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中频治疗脑卒中尿潴留
- 2024年度加工承揽合同书
- 2024年度医疗设备维护保养合同
- 2024年度特许经营合同:经营范围与区域划分
- 2024年度圆通快递货品损坏索赔合同
- 2024年度商业保理合同的保理业务
- 2024年度学校水电装修承包合同
- 2024年度专利许可使用合同(生物医药领域)
- 2024年度学校标识标牌定制合同
- 2024年度城市供水工程设计及施工合同
- 计算机专业生涯发展报告
- 如果国宝会说话中国历史文物介绍
- 打击飙车方案
- 矿山生态修复工程验收规范
- 质量管理工程生涯规划
- 几类特种玻璃简介课件
- 医院培训课件:《ECMO概述及其护理》
- 蜡烛香薰知识讲座
- 《欧洲的启蒙运动》课件
- 《变压器原理与应用》课件
- 2024年陕西陕煤铜川矿业有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论