版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
欢迎各位老师及同学!香鳞毛蕨的转录组测序报告人:佟伟霜2012.01.07转录组是什么---what1转录组的常用方法----how2RNA-Seq能做什么?3我们是怎样做的?4我们的结果如何?5Contents1.转录组是什么?DNA转录的所有RNAmRNA转录组即特定细胞在某一功能状态下所能转录出来的所有RNA的总和,包括mRNA和ncRNA。基因芯片技术——Microarray基因表达序列分析技术——Serialanalysisofgeneexpression,SAGE大规模平行测序技术——Massivelyparallelsignaturesequencing,MPSSRNA测序技术——RNAsequencing,RNA-seq2.转录组是怎样做的------常用方法优点:成本适中,其对较高表达的基因检测比较准确,数据分析软件较多,整个方法较为成熟缺点:对低表达基因检测敏感度不够,前期工作基础要求较高,而且很难检测出融合基因转录、多顺反子转录等异常转录产物2.常用方法------基因芯片技术流程
RNAcDNAHydrizationwithmicroarrysTranscriptmeRNAcDNAAnchoringenzymecDNAfragmentLigatedwithlinkercDNAfragmentwithlinkerTaggingenzymeTagLigationandPCRdiTagAnchoringenzymeConcatemersSequecing
Transcriptme优点:不需基因序列的信息,能够全局性地检测所有基因的表达水平,可显示基因差异,可获得未知基因特别是那些低拷贝基因缺点:文库构建流程长,技术要求高,单条短序列标签所含的基因信息很少,不适于遗传信息缺乏的植物2.常用方法------基因表达序列分析技术流程RNAcDNAClonedtoadaptorvectorscDNAlibrarywithadaptors
PCRcDNAfragmentwithadaptorsT4polymerasedGTPsscDNAfragmentwithadaptorsLoadonmicrobeadsandsequncing
Transcriptme优点:获得更长的短标签,因而精度更高;此外,MPSS技术特有的微球荧光测序可直接高通量读出序列,简化了测序过程缺点:涉及PCR扩增、克隆等可能会产生碱基偏向性的操作步骤,从而影响转录本的正确识别2.常用方法------大规模平行测序技术流程转录组测序RNA片段化(200-700bp)用连有Oligo(dT)的磁珠富集mRNA(真)随机引物引导cDNA合成去除rRNA富集mRNA(原核生物)cDNA片段(200-700bp)反转录成cDNA加接头总RNA2.常用方法------RNA-Seq流程2.常用方法------RNA-Seq提供更多信息,可以得到用基因芯片难以得到的转录可变剪接序列对低表达基因的检测更加准确,并且可以定量确定转录水平。RNA-seq技术得到的标签长度(由采取的高通量测序技术的读长而定,可达400bp)比SAGE和MPSS显著增加,提高了识别转录本的特异性和准确性成本更低有参考基因组---转录组重测序转录组测序2.RNA-Seq
------分类无参考基因组---转录组从头组装2.RNA-Seq
------数据分析基因表达差异分析检测基因融合基因结构的优化鉴定基因的可变剪接新转录本预测SNP分析Unigene功能注释UnigeneGeneOntology分类结构的优化Unigene表达差异分析蛋白编码区预测(CDS)UnigenePathway富集分析有参考基因组---转录组重测序无参考基因组---转录组从头组装2.RNA-Seq
------无参考基因组的数据分析流程原始序列数据Unigenes基因注释Unigene表达量注释预测编码蛋白框(CDS)Unigene功能注释Unigene表达差异分析Unigene的GO和Pathway分析GO功能显著性富集分析Pathway显著性富集分析CleanreadsSWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。COG库的网址是::/COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。KEGG的网址是::http://www.genome.ad.jp/kegg/
京都基因和基因组百科全书(KEGG)是系统分析基因功能,联系基因组信息和功能信息的知识库。NCBI的BLUST网址是:/BLAST/
2.RNA-Seq
------常用数据库3.RNA-Seq能做什么?-----应用领域单核苷酸突变选择性剪接可选启动子等位基因的差异表达RNA编辑融合基因基因(转录本)的精确结构各种器官的基因表达模式不同发育阶段的基因表达模式动植物疾病作物抗逆性、适应性研究分子育种药用植物代谢途径分析功能基因组癌症及复杂疾病农业及药用植物3.RNA-Seq能做什么?-----实例(有参考基因组)DeepRNAsequencingatsinglebase-pairresolutionrevealshighcomplexityofthericetranscriptome.实验材料实验结果研究目的全面了解水稻基因表达情况愈伤组织根尖(14d)茎尖(14d)叶(2stages)稻花/稻穗(3stages)总测序量28G,每个样本不低于5M的SEreads鉴定了28563个基因的5’和3’UTR区域发现7232个新转录本,新转录本表达丰度低,且具有组织表达特异性发现23800个可变剪接发现1356个融合基因GenomeRes.2010May;20(5):646-54.3.RNA-Seq能做什么?-----实例(有参考基因组)CharacterizationofTranscriptionalComplexityduringBerryDevelopmentinVitisvimiferaUsingRNA-Seq实验材料实验结果选取在成熟季节开花后5,10,和15个星期葡萄分别代表葡萄果实成熟的着果期,始熟期和成熟期;分别选3棵向阳树和3棵背阴树,每棵树相应位置随机摘取10个浆果,该实验设2个重复,分别作为样本池进行totalRNA提取。PlantPhysiology,April2010,Vol.152,pp.1787–17953个stages共测了2.2G的数据量,82.4%的reads可以定位到1个(66.6%)或多个(15.8%)基因组位置将测序所得reads与reference(8.4X框架图)数据比较,鉴定出85,870个SNP3.RNA-Seq能做什么?-----实例(有参考基因组)实验结果发现385个基因具有AS(alternative
splicing),其中只在一个浆果发育stage发生AS有210个基因,只在两个浆果发育stage发生AS有97个基因,只在三个浆果发育stages都发生了AS有78个基因鉴定了新的基因,发现了glutathione-S-transferase(GST)家族的53个新基因,MYB转录因子家族中28个新基因,这些基因因为表达丰度低、缺少探针序列而无法被芯片检测到随机选取15个基因进行qRT-PCR验证,发现12个基因qRT-PCR结果与RNA-Seq相一致3.RNA-Seq能做什么?-----实例(无参考基因组)TheGeneticMapofArtemisiaannuaL.IdentifiesLociAffectingYieldoftheAntimalarialDrugArtemisinin实验材料研究目的构建与青蒿素产量相关的遗传图谱浓缩的嫩叶,成熟叶片,及花芽上的腺毛细胞Science327,328(2010)3RNA-Seq能做什么?-----实例(无参考基因组)实验结果香鳞毛蕨Dryopteris
fragrans(L.)Schott
鳞毛蕨科鳞毛蕨属多年生蕨类植物。该属植物所含有的酚类化合物具有较强的驱虫、抑制肿瘤、抗病毒和杀菌作用。在我国北部地区,民间流传香鳞毛蕨能治疗各种皮肤病,因此近年来受到国内外学者的高度关注。4.我们是怎样做的?4.我们是怎样做的?实验材料组培的香鳞毛蕨无菌苗实验处理Ck:25℃48h;1:4℃48h;2:35℃48h预期结果获得与香鳞毛蕨温光处理条件下酚类代谢相关基因5.我们的结果如何?结果(6).预测编码蛋白框(CDS)(1).产量统计(5).Unigene代谢通路分析(4).Unigene的GO分类(2).组装结果(3).Unigene功能注释(8).差异Unigene的GO分析和Pathway分析(7).Unigene表达差异分析5.我们的结果如何?-----(1)产量统计SamplesTotalReadsTotalNucleotides(nt)Q20percentageNpercentageGCpercentage*CK26,775,8742,409,828,66092.36%0.00%49.57%127,039,8502,433,586,50091.31%0.00%48.68%227,047,3802,434,264,20092.47%0.00%49.88%表1.测序产量统计Tab.1YieldstatisticalofRNA-Seq5.我们的结果如何?-----(2)组装结果ContigScaffoldUnigeneck17313775380560951189469771305256121792148832264292表2测序序列统计Tab.2DistributionfragmentofRNA-Seq5.我们的结果如何?-----(2)组装结果图1CK的Unigene的长度分布图Fig.1UnigenelengthdistributionofsampleCK5.我们的结果如何?-----(2)组装结果图2All-Unigene的Gap(N)分布图Fig.2GapdistributionofAll-Unigene5.我们的结果如何?-----(2)组装结果综合所有样品得到的Unigene序列:原始组装结果:All-Unigene共66716可确定方向的序列(5'->3'):All-Unigene.5-3.fa无法确定方向的序列:All-Unigene.no_orientation.faUnigene10_Allsize3699gap80.21%GCAAGGAGCACATGTGTGACTGATGAAGGTAACCTGAAGCAAGCTGCTCAGCTTAATATTTTTGAGACCTCGACTCAACCAACCAAGGAGGGTCCCTCAGATCCTTCAGATAANNNNNNNNGTTACAATCTTGCTTGCAAATAGAATCTT5.我们的结果如何-----(3)Unigene功能注释其中预测只有一般功能的序列最多为4305条,细胞外结构及核结构相关序列最少分别为4和3条;其中与次生代谢产物的运输和代谢相关序列有较多为1051条,与各种氨基酸,糖类,脂类代谢的较多。5.我们的结果如何?-----(4)Unigene的GO分类基因的分子功能6316
细胞组分相关27529参与的生物过程21417
51015.我们的结果如何?-----(5)代谢通路分析PathwayAllgeneswithpathwayannotation(18989)PathwayIDMetabolicpathways代谢途径5012(26.39%)ko01100Biosynthesisofsecondarymetabolites次生代谢产物合成途径2788(14.68%)ko01110Spliceosome剪接体1384(7.29%)ko03040Plant-pathogeninteraction植物病原体交互作用1128(5.94%)ko04626Proteinprocessinginendoplasmicreticulum内
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2020-2025年中国一线城市餐饮行业竞争格局分析及投资规划研究报告
- 书店内部设计服务协议
- 教育用地转让居间合同
- 湖北医药学院药护学院《机器人驱动与控制》2023-2024学年第一学期期末试卷
- 2025年度鞋类品牌跨界合作开发合同3篇
- 城市交通拥堵治理解决方案合同
- 聊城2025年山东聊城江北水城旅游度假区教育事业单位选聘教师6人笔试历年参考题库附带答案详解
- 2025年度网络安全软件采购合同范本3篇
- 泉州2025年福建南安市卫生事业单位招聘编制内卫生类工作人员51人笔试历年参考题库附带答案详解
- 威海2025年山东威海市教育局直属学校引进急需紧缺人才73人笔试历年参考题库附带答案详解
- 【译林版】六年级英语(下册)单词默写单
- 高中英语名词性从句讲解
- 计算机二级wps题库及答案
- 整套课件:工业催化
- 爆破安全管理知识培训
- 旅游地理学教案
- 煤矸石综合利用途径课件
- 企业信息公示联络员备案申请表
- 卫生部关于发布《综合医院组织编制原则试行草案》的通知((78)卫医字第1689号)
- 挑战杯生命科学获奖作品范例
- 医院岗位设置与人员编制标准
评论
0/150
提交评论