表达谱及小RNA_第1页
表达谱及小RNA_第2页
表达谱及小RNA_第3页
表达谱及小RNA_第4页
表达谱及小RNA_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数字基因表达谱升级版RNA-Seq(Quantification)或称为 Tag-seq实验流程实验流程Total RNAEnrich mRNA by Oligo (dT)Remove rRNARandom hexamer primed cDNA synthesisSize selection and PCR amplificationIllumina sequencingRNA fragment( 200 nt)EukaryotesProkaryotes分析内容差异表达基因筛选差异表达基因筛选PathwayPathway显著性富集分析显著性富集分析Clean TagClean Tag数据数据

2、GOGO功能显著性富集分析功能显著性富集分析测序饱和度分析测序饱和度分析表达模式聚类分析表达模式聚类分析基因注释、标准化基因注释、标准化反义链的转录分析反义链的转录分析原始序列数据原始序列数据共有、特有共有、特有TagTag分析分析表达量及分布分析表达量及分布分析实验重复性分析实验重复性分析新转录本检测新转录本检测蛋白互作网络分析蛋白互作网络分析Tag-Seq与基因芯片优缺点比较与基因芯片优缺点比较技术优点缺点RNA-seq1)检测基因数比基因芯片多检测基因数比基因芯片多2)定量准,可重复性高(重复相关系定量准,可重复性高(重复相关系数数0.99)3)数字化信号,背景噪音数字化信号,背景噪音低

3、低,无交叉,无交叉杂交杂交4)高、低丰度基因高、低丰度基因均均可检测可检测5)不受研究物种限制,模式生物和非不受研究物种限制,模式生物和非模式生物均可检测模式生物均可检测6)数据可与时俱进,即随数据库更新数据可与时俱进,即随数据库更新而更新而更新7)具有较好的分析兼容性,数据格式具有较好的分析兼容性,数据格式与芯片相同,可与芯片的分析软件兼与芯片相同,可与芯片的分析软件兼容容1)样本要求量比基因芯片多)样本要求量比基因芯片多2)数据量大,需要具备一定的生物信息分)数据量大,需要具备一定的生物信息分析基础,才能更好的挖掘数据蕴含的丰富析基础,才能更好的挖掘数据蕴含的丰富信息信息基因基因芯片芯片1

4、)平台应用较早)平台应用较早2)信息分析软件较多)信息分析软件较多3)有些平台要求样品量少)有些平台要求样品量少1)检测灵敏度较低、重复性差、检测阈值)检测灵敏度较低、重复性差、检测阈值较狭窄较狭窄2)有背景噪音,假阳性率)有背景噪音,假阳性率1%3)受物种限制,只能检测部分模式生物)受物种限制,只能检测部分模式生物4)受基因拷贝数限制,无法检测出低丰度)受基因拷贝数限制,无法检测出低丰度基因基因5)只能检测已知转录本,无法检测出新转)只能检测已知转录本,无法检测出新转录本录本6)受数据库数据所限,因探针依靠现有数)受数据库数据所限,因探针依靠现有数据库或比较旧的版本的数据库来设计的,据库或比

5、较旧的版本的数据库来设计的,可能出现注释不准确的情况可能出现注释不准确的情况BGI 实验p实验材料 (MAQC标准品) Universal Human Reference RNA (UHRR) from Stratagene. Human Brain Reference RNA (HBRR) from Ambion.p比对数据 RNA-Seq for UHRR and HBRR by BGI. Microarray for UHRR and HBRR by a major company Affimetrix (GEO: GSM122774GSM122783). qPCR quantifica

6、tion for UHRR and HBRR (GEO 数据库中有这两个样品约1000 个基因的qPCR 定量结果)* The purpose of the MAQC project is to provide quality control tools to the microarray community in order to avoid procedural failures and to develop guidelines for microarray data analysis by providing the public with large reference datase

7、ts along with readily accessible reference RNA samples. See at FDA /ScienceResearch/BioinformaticsTools/MicroarrayQualityControlProject/default.htm Tag-Seq和 qPCR的相关性n=903 genesn=903 genesPearson r=0.9117Pearson r=0.9117Spearman rank r=0.8603Spearman rank r=0.8603Pearson r=0.8575Pear

8、son r=0.8575Spearman rank r=0.8321Spearman rank r=0.8321n=851 genesn=851 genes0 200 400 600 800 1000 1200 Tag-Seq_gene expression (RPKM)3020100403020100qPCR_gene expression 0 200 400 600 800 1000 1200 1400Tag-Seq_gene expression (RPKM)n=872 genesn=872 genes两种样品两种样品的的Tag-Seq 和和qPCR 都具有较好的相关性都具有较好的相关性

9、qPCR_gene expression qPCR: Log2(HBRR/UHRR)50-5-10-10-10 -5 0 5Tag-Seq: Log2(HBRR/UHRR)Affymetrix: Log2(HBRR/UHRR)n=474 genesn=767 genes50-5-10-6 -4 -2 0 2 4 6 Pearson r=0.9176Spearman rank r=0.8966Pearson r=0.891Spearman rank r=0.868Tag-Seq比比Affymetrix芯片具有更高的相关性芯片具有更高的相关性Tag-Seq、Affymetrix 芯片分别与qPCR

10、的相关性比较(HBRR/UHRR)Tag-Seq & qPCRAffy & qPCR东北农大Tag-seq文章l研究对象:黄瓜的雄雌同株材料,和它的突变体材料(全雌研究对象:黄瓜的雄雌同株材料,和它的突变体材料(全雌株)。株)。l平行培养两类材料,在平行培养两类材料,在 2 2叶叶1 1心期,取茎尖组织提前心期,取茎尖组织提前RNARNA,进,进行行Tag-seqTag-seq分析分析, ,每个材料取了每个材料取了1515株进行混合抽提株进行混合抽提RNA.RNA.l文章的内容是文章的内容是DEGDEG的结果与分析。的结果与分析。l用用RT-PCRRT-PCR和和qRT-PCRqRT-PCR对

11、对Tag-seqTag-seq得到的差异表达基因做了验证得到的差异表达基因做了验证分析。分析。 本文的亮点是,针对一些通过Tag-seq找出来的差异基因,且是以前有过报道参与花发育进程的基因,利用RT-PCR方法分别对它们在子房和花上部做了不同发育时期的表达模式分析。 该部分实验结果成为了他们讨论部分的主要内容。 这一个思路值得借鉴,有了Tag-seq数据后,找自己关注的而且有些研究背景的基因进行RT-PCR分析,以便于撰写文章的讨论部分。10猪繁殖与呼吸综合征(PRRS)是一种全世界范围内影响家猪生产的重要疾病,每年都会造成很多的经济损失。PRRS病毒感染分子机制目前了解甚少。本研究第一次应

12、用了illumina的数字基因表达谱技术在全基因组水平研究了宿主在感染N-PRRSV(经典北美型PRRSV)CH1a株病毒后的转录水平作出的响应。中山大学Tag-seqTag-seq文章文章11研究思路如下:共取9头6周大的健康小猪:3头猪为对照;在感染实验前一天,牺牲掉取肺;6头猪感染病毒,分别在感染后第3天和第7天,各牺牲3头猪取肺。每3头猪混合提取RNA,进行Tag-seq 实验,对比数据库为 sus scrofa UniGene (/UniGene/UGOrg.cgi?TAXID=9823, UniGene Build #35 Sus

13、 scrofa, Nov, 7th, 2008)共做3个Tag-seqTag-seq 。qPCR对Tag-seqTag-seq结果进行验证:选取了6个上调基因和2个下调表达基因进行验证Tag-seqTag-seq结果,两种技术的相关系数 r 值为:0.781-0.997。12 利用高通量测序为基础的数字基因表达谱技术系统地分析了N-PRRSV感染后的肺和感染引发病理发生的肺中基因表达谱之间的关系。 研究发现N-PRRSV在被感染的家猪中呈现出多种复制策略,包括破坏宿主的先天免疫反应、抗凋亡和抗发炎状态、并发展为ADE。受病毒诱导而上调表达的早期炎性相关细胞因子、趋化因子、粘附分子、发炎相关酶蛋

14、白、发炎细胞、抗体以及补体激活等等很可能导致了N-PRRSV感染过程中发炎响应的发展发生。而N-PRRSV诱导的免疫抑制则可能媒介了感染细胞的凋亡,这是导致了免疫细胞的损耗,也诱导了抗炎细胞因子反应从而不能有效消除初期病毒感染。 本研究可有益于很好地去理解N-PRRSV感染的分子机制,发展新的抗病毒疗法和鉴定出家猪对PRRS病毒resistance/ susceptibility 的遗传基础。13南京农大Tag-seq文章高地棉栽培种 Xuzhou 142 和它的突变体 fl M (fuzzless/lintless),在江苏农科院种植。在开花期当天对花做标记,收获-2 到8 DPA(开花期后

15、天数)的棉花胚珠,剥离的棉花胚珠液氮速冻后-80C保存。从-2、-1、0、1、2、3、5 和8 DPA的野生型和突变体的棉花胚珠中提取总RNA。-2、-1、0和1 DPA的总RNA混合作为stageI(纤维启始)的样品,野生型和突变体的分别标记为 WT1 和 M1;2、3、5和8 DPA的总RNA混合作为stageII(纤维伸长)的样品,野生型和突变体分别标记为 WT2 和 M2。14 对每个文库(WT1、WT2、M1和M2)测得3.5-3.8M的tags可以代表0.7-1.0M的一致转录本(unique transcripts)。 去除低质量的tags后,我们分别从WT1、WT2、M1和M2

16、的文库测得2973104、3139306、2943654和3392103条clean序列,分别相对应了这4个文库的357852、280787、372954和382503种不同的标签(distinct tags)。 所有的clean tags对比棉花公共的转录本数据库 TIGR,。约15%的distinct tags具有唯一的参考基因对比结果,而公共数据库中有34.4%的基因被tags对比上。 Tag对比参考数据库的结果为WT1、WT2、M1和M2这4个文库分别找出了23854、24442、23497和19957个注释基因。 对差异表达基因的分析显示野生型和突

17、变体棉花文库之间基因的类型和表达丰度有了根本的或说有了质的变化。 在WT1/M1和WT2/M2之间表达差异水平最大的20个基因是纤维素合成酶基因、磷酸(脂)酶基因和脱氢酶基因,这些基因都参与了纤维细胞的发育进程。15总的来说,本研究的深度测序分析证实了纤维早期发育中基因转录的高度复杂性,同时结果也表明与利用基因芯片技术分析转录组相比,深度测序技术可以在一个更大更广的范围去探测基因表达谱。Fig. Quantitative RTPCR validation of tag-mapped genes from cotton ovules and developing fibers. (A)(E),

18、genes have been identified or reported before, including FDH (TA21337) (A), SCP (TA22298) (B), CesA-5 (TA21774) (C), ACT (TA20417) (D), and WBC1 (TA24519) (E). The other tag-mapped genes included DT046968 (F, predicted flavonoid 3,5-hydroxylase), TA20379 (G, predicted peroxidase), and TA21004 (H, st

19、erol-Cmethyltransferase).TPM, transcripts per million mapped reads.qRT-PCR验证实验验证实验:选取了9个基因,其中8个基因的qPCR结果与Tag-seq结果相一致。16Small RNA 测序Small RNA 的作用 21-24 nt miRNAs and siRNAsLin He and Gregory J.Hannon. MicroRNAs: Small RNAs with a big role in gene regulation. Nature Reviews Genetics 5, 522531 (2004)S

20、mall RNA 测序实验流程测序实验流程生物信息分析生物信息分析分析内容 sRNA 与参考序列比对; sRNA 与rRNA etc 的比对 包括rRNA,tRNA,snRNA,snoRNA 等non-coding RNA; sRNA 与repeat 的比较 ; sRNA 与mRNA/exon/intron 的比较; 与miRNA数据库比对,鉴定miRNA; 预测新的miRNA; miRNA差异表达分析 ; 靶基因预测。Genome Biology 2009案例案例1 1散居型飞蝗散居型飞蝗群居型飞蝗群居型飞蝗飞蝗small RNA测序Small RNA长度分布长度分布Small RNA类型类

21、型预测185个特有的miRNAs保守的保守的 miRNA特有的特有的miRNA两类飞蝗的miRNA表达差异miRNA靶基因预测南京农大 miRNA 文章采用采用solexa深度测序方法研究了棉花纤维发生和发育过程中深度测序方法研究了棉花纤维发生和发育过程中small RNAs 的全局表达情况。的全局表达情况。 分别构建野生和fl突变体的棉花胚珠的小RNA文库,每个文库单独测序分析。22多个保守的候选miRNA家族(含有111个成员)被鉴定出来,此外,还在棉花胚珠中鉴定了2个新的细胞特异性的候选miRNAs。该研究证实了野生与突变体中miRNAs的表达丰度存在显示差异,暗示这些差异表达的miRN

22、As在棉花纤维发育过程中发挥调节转录的作用。第一次将深度测序的方法用于分析棉花纤维发生和发育的胚珠中miRNAs群体。For the first time we discovered, through high throughput Solexa sequencing, 14 novel miRNA families and 75 conserved miRNAs, belonging to 22 families, in peanut.山东农科院花生micRNA文章 Cell Research 2010通过通过SolexaSolexa测序,确定牛乳中含有大量测序,确定牛乳中含有大量miRNA

23、miRNA取样取样40只产后9个月的乳牛共收集100 ml 成乳(2.5ml/只)40只产后7天的乳牛共收集100 ml 初乳(2.5ml/只)40只乳牛共收集约200ml血清(5ml/只)Trizol LS Reagent (Invitrogen, Carlsbad, CA, USA)别提total RNA 测序测序数据量:数据量: 每个样本不低于2.4M clean reads,reads长18-30 nt 南京大学miRNA文章Q PCR 相关系数相关系数(R-square) = 0.99 高度准确高度准确7种乳特异性种乳特异性miRNA作为牛乳作为牛乳的质控标记的质控标记7 7种乳特异

24、性种乳特异性miRNA的表达作为辨别天然乳和不合格的表达作为辨别天然乳和不合格或造假乳的理想生物标记!或造假乳的理想生物标记!32BMC Genomics. 2010 Jul 13;11:431.Deep sequencing discovery of novel and conserved microRNAs in trifoliate orange (Citrus trifoliata). Song C, Wang C, Zhang C, Korir NK, Yu H, Ma Z, Fang J.Nanjing Agricultural University, Nanjing 210095

25、, China.BMC Plant Biol. 2010 Jun 24;10:123.Diverse set of microRNAs are responsive to powdery mildew infection and heat stress in wheat (Triticum aestivum L.). Xin M, Wang Y, Yao Y, Xie C, Peng H, Ni Z, Sun Q.China Agricultural University, Beijing, 100094, China.Cell Res. 2010 Jun 15. Epub ahead of

26、printIdentification and characterisation of microRNAs in raw milk during different periods of lactation, commercial fluid, and powdered milk products.Chen X, Gao C, Li H, Huang L, Sun Q, Dong Y, Tian C, Gao S, Dong H, GuaZhao S, Li L, Zhu L, Yan Q, Zhang J, Zen K, Zhang CY.Nanjing University, Nanjing, Jiangsu 210093, China.n D, Hu X, PLoS One. 2010 May 19;5(5):e10698.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论