华大结题报告1.21转录组denovo帮助_第1页
华大结题报告1.21转录组denovo帮助_第2页
华大结题报告1.21转录组denovo帮助_第3页
华大结题报告1.21转录组denovo帮助_第4页
华大结题报告1.21转录组denovo帮助_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华 转录 denovo项目帮助文产量得到的原始图像数据经basecalling转化为序列数据,我们称之为rawdata或rawreads,结果以fastq文件格式 reads的序列以及reads的 质量。在fastq格式文件中每个read由四行描述:+每个序列共有4行,第1行和第3行是序列名称(有的fq文件为了节省 仪产生;第2行是序列;第4行是序列的 对应第2行每个碱基,第四行每个字符对应的ASCII值减去64,即为该碱基的 质量值,比如c对应的ASCII值为99,那么其对应的碱基质量值是35。从IlluminaGAPipelinev1.3开始(目前为v1.6),碱基质量值范围为2到41。表2 错误率 错误率用E表示,碱基质量值用sQ表示,则有下列关系sQ=-错误质量对应字MT^h华 转录 denovo项目帮助文得到的reads,并不都是有效的。里面含有带接头的,重复的, 质量很低的reads,这些reads会影响组装和后续分析,我们对下机的reads过滤,得到clean reads。去除N的比例大于5%的获得Cean软 版 相 参数设f内f内部软--Clean后续的分析都基于由原始数据过滤后得到的cleanreads华 转录 denovo项目帮助文组装结果分我们使用短reads组装软件Trinity。Trinty组装步骤如下Inchworm 构建k-mer库,K=25。过滤低频k-mer选择最高频度的k-mer作为 (不包括复杂度和单一的k-mers,一次用完即从k-mer库中剔除),用来Contig组装。以k-mer间overlap长度等于k-1对 进行延伸,直到不能再延伸,形成线性Contig。Chrysalis把可能存在可变剪切及其他平行 ponent,对每个Component构建deBruijngraphs。拿reads验证,看每个Component的reads支持情况。Butterfly合并在deBruijn图中有连续节点的线性路径,以形成更长的序列。剔除可能由于 错误(只有极少reads支持)的分叉,使边均匀。用动态规划算法打分,鉴定被reads和readpairs支持的路径,剔除reads支持少的路径。Trinty组装结果我们称之称为Unigene。组装得到的Unigene,首先使用Tgicl将其去冗余和进一步拼接,然后再对这些序列进行同源转录本聚类,得到最终的Unigene。如果同一种做了多个样 ,不同样品组装得到的Unigene也需要通过序列聚类软件做进一步序列拼接,去冗余处理,以及同源转录本聚类,得到尽可能长的非冗余Unigene在进行同源转录本聚类以后,Unigene分为两部分。一部分是clusters,同一个cluster里面有若干条相似度高(大于70%)的Unigene(以CL开头,CL后面接 其余的是singletons(以Unigene开头),代表单独的Unigene。最后,将Unigene序列与蛋白数据库NR、Swiss-Prot、KEGG和COG做blastx比对(evalue<0.00001),取比对结果最好的蛋白确定Unigene的序列方向。如果不同库之间的比对结果有,则按NR、Swiss-Prot、KEGG和COG的优先级确定Unigene的序列方向,跟以上四个库皆比不上的Unigene我们用软件ESTScan确定序列的方向。对于能确定序列方向的Unigene我们给出其从5'到3'方向的序列,对于无法确定序列方向的Unigene我们给出组装软件得到的序列。华 转录

denovo项目帮助文*组装步骤软软 版 相 参数设Trn

re

n/fes/tgc

--minglue3--grouppairs -40-c10-v-repeat_strngency0.95-mnmatch35-mnscore参考文献GrabherrMG,HaasBJ,etal.Full-lengthtranscriptomeassemblyfromRNA-Seqdatawithoutareferencegenome.NatureBiotechnology.2011,29(7):644-华 转录 denovo项目帮助文IseliC,JongeneelCV,etal.ESTScan:aprogramfordetecting,evaluating,andreconstructingpotentialcodingregionsinESTsequences.ProcIntConfIn SystMolBiol.1999:138-48.华 转录 denovo项目帮助文Unigene功能注释及COG分NRSwissProt是两个著名的蛋白数据库,其中SwissProt是经COG是对 产物进行直系同源分类的数据库,每个COG蛋白都被假定来自祖先蛋白,COG数据库是基于细菌、藻类、真核生物具有完整 KEGG是系统分 产物的功能的数据库,用KEGG可以进一步研 NT是NCBI非冗余核酸软版相软版相数据版参数设reReease63.0reease-reSwss-Prothttp://breReease63.0reease-reSwss-Prothttp://bast.ncb.nm.n /B

v2.2.26+x64-

-FF-e1e-5-pb华 转录 denovo项目帮助文Unigene功能注释及COG分描述生物体 产物的属性。GO总共有三个ontology,分别描 的分子功能(molecularfunction)、细胞组分(cellularcomponent)、参与的生物 process)。我们根据NR注释信息,使用Blast2GO软件[1]得到Unigene的GO注释信息。Blast2GO已被其它文献 超过150次,是 广泛认可的GO注释软件。得到每个Unigene的GO注释后,我们用WEGO软件[2]对所有Unigene做GO功能分类统计,从宏观上认识该物种的 软 版 相 数据 版 参数设B

reease2012-08-

默认参参考文献ConesaA,GötzS,etal.Blast2GO:auniversaltoolforannotation,visualizationand ysisinfunctionalgenomicsresearch.Bioinformatics.2005,21(18):3674-6.YeJ,FangL,etal.WEGO:awebtoolforplottingGOannotations.NucleicAcidsRes.2006,34(WebServerissue):W293-华 转录 denovo项目帮助文Unigene代谢通路分KEGG是系统分 产物在细胞中的代谢途径以及这 产物的功能的数据库,利用KEGG可以进一步研 在生物学上的复杂行为。根据KEGG注释信息我们能进一步到Unigene的Pathway软 版 相 数据 版 参数设Path_f

内部版

默认参考文献[1]KanehisaM,ArakiM,etal.KEGGforlinkinggenomestolifeandtheenvironment.NucleicAcidsRes.2008,36(Databaseissue):D480-华 转录 denovo项目帮助文预测编码蛋白框首先,我们NRSwiss-Prot、KEGGCOG的优先顺将Unigene序列以蛋库做blastx比(evalue<0.00001),如果某Unigene序比对上优级据库中的蛋白,则不进入下一轮比对,否则自动跟下一个库做比对,如此循环直到跟所有蛋白 对完。我们blast比对结果中rank最高的蛋白确定该Unigene的编码区序列,然后根据标准密码子表将编码区序列翻译成氨基酸序列,从而得到该Unigene编码区的核酸序列(序列方向5'->3')和氨基酸序列。最后,跟以上蛋白库皆比对不上的Unigene我们用软ESTScan预测其编码区,得到其编码区的核酸序列(序列方向5'->3')和氨基酸序列。32位版:ftp://ftp.ncb.nm.n 64位版:ftp://ftp.ncb.nm.n 根据机器选择相应版 ,我们提供了32位的版本blast-2.2.23-ia32-以32位版双击bast-2.2.23-a32-wn32.exe即可解压,会在当前路径(假设当前路径为“C:\bast”)生成bn、data、doc三 将bn路径加入系统右击“我的电脑属性——高级——环境变量——双击“Path”修改——在最后加入第1步中bin的路径,用“;”与之前的值隔开,即“;C:\blast\bin”,重启系统使之生效如果不做第2步,使用时要输入完整的路径参考 格式化数据核酸序列,如All-formatdb-iAll-Unigene.blast.cds.fa-p用鼠标将-Unigene.blast.cds.faformatN.batifaformatdb-iAll-Utein.fa-p执行b待分析序列为核酸序列数据库为核酸序列,如All-Unigene.blast.cds.fablastall-pblastn-iseq.fa-dAll-Unigene.blast.cds.fa-e1e-5-m8-o该命令的意思是,对seq.fa文件中的核酸序列对-Unigene.blast.cds.fa数据库执行blastn搜索,e值限制是1e-5,输出的结果以m8格式保存到文件seq.blastn.m8中。用鼠标将seq.fa拖到runBlastn.bat上后,会自动给出当前下可用的数据库用于选择,选择一个数据库(或输入其它数据库的路径)后将会自动运行blastn进行比对。数据库为蛋白序列,如-Utein.fa。华 转录 denovo项目帮助文blastall-pblastx-iseq.fa-dAll-Utein.fa-e1e-5-m8-o该命令的意思是,对seq.fa文件中的核酸序列对All-Utein.fa数据库执行blastx搜索,e值限制是1e-5,输出的结果以m8格式保存到文件seq.blastx.m8◦用鼠标将seq.fa拖到runBlastx.bat上后,会自动给出当 下可用的数据库用于选择,选择一个数据库(或输入其它数据库的路径)后将会自动运行blastx进行比对作为数据库使用的序列文件,路径中可以含有空格,但文件名中不能含有空格(因为BLAST不支持)软 版 相 参数设

默认参参考文献[1]IseliC,JongeneelCV,etal.ESTScan:aprogramfordetecting,evaluating,andreconstructingpotentialcodingregionsinESTsequences.ProcIntConfIn SystMolBiol.1999,138-48.华 转录 denovo项目帮助文Unigene表达差异分差异表达分析找出在不同样本间表达量不同 做GO功能分析和KEGG Pathway分析Unigene表达量的计算使用FPKM法(FragmentsPerkbperMillionfragments)。其计 设FPKM(A)为UnigeneA的表达量,则C为唯一比对到UnigeneA的fragments数,N为唯一比对到所有Unigene的总fragments数,L为UnigeneA的碱基数。FPKM因长度 FPKM和RPKM算法 reads两端比对上gene时,FPKM算法将该reads当做1条fragment来计算,而RPKM则当做2条reads来计算差异表 的筛参照AudicS.等 在GenomeResearch上的基 筛选差异表 H1:某一 假设观测 A对应的fragments数为x,已知在一个大文库中,每 表达量的一小部分,在这种情况下,p(x)的分布服从泊松分布已知,样本一能比对到所有Unigene的总fragments数为N1,样本二能比对到所有Unigene的总fragments数为N2,样本一中唯一比对到 A的fragments数为x,样本二中唯一 A的fragments数为y,则该假设检验的p-value可由以下 或其华 转录 denovo项目帮助文当我们做多重假设检验时,能够保证单次假设检验有比较小的错误发生率的p-value已经不再能够保证足够小的整体错误发生率。因此我们要做多重假设检验校正,将整体的错误发生率控制在一定的水平.FDR(FalseDiscoveryRate)就是多重检验校正中一种校正p-value的统计学方法。在实际中,FDR是错误发现率的期望。假设挑选了R个差异表达 ,其中S个是真正有差异表达的 ,另外V个是其实没有差异表达的 ,为假阳性结果,FDR=E(V/R).假设我们希望平均错误比例FDR 过1%时,就在进行假设检验时预先设定FDR能超过0.01。在得到差异检验的FDR值同时,我们也根据 的表达量(FPKM值)计算该 在不同样本间的差异表达倍数。FDR值越小,差异倍数越大,则表明表达差异越显著。在我们的分 定义为FDR≤0.001且倍数差异在2倍以上的 软 版 相 参数设内部版内部版-默认参

/soapa

-m0-x500-s40-35-v5-r参考文献MortazaviA,WilliamsBA,etal.Map and fying liantranscriptomesbyRNA-Seq.NatureMethods.2008,(5):621-AudicS,ClaverieJM.Claverie.Thesignificanceofdigitalgeneexpressionprofiles.GenomeRes.1997,7(10):986-华 转录 denovo项目帮助文差异Unigene的GO和Pathway分GO功能分析一方面给出差异表 的GO功能分类注释;另一方面给出差异表 的GO功能显著性富集分析 向GO数据库( 数,从而得到具有某个GO功能的 中显著富集的GO条目,该假设检验的p-value计算 其中,N为所有Unigene中具有GO注释的 数目;n为N中差异表达 的数目;M为所有Unigene中注释为某特定GO 数目;m为注释为某特定GO 数目。计算得到的pvalue通过Bonferroni校正之后,以corrected-pvalue≤0.05为阈值,满足此条件的GO term定义为在差异表 term。通过GO功能显性富集分析能确定差异表 我们的GO功能分析同时整合了表达模式聚类分析,研究人员能方便地看到具有 response为在差异表 个GO term。表达模式聚类图显示了参与immuneresponse的差 的表达模式(其中Ratio表 在两个样本中表达量FPKM的比值)华 转录 denovo项目帮助文在差异表 中显著富集的GO华 转录 denovo项目帮助文KEGGPathway

参与immuneresponse的差 表达模式聚类在生物体内,不 相互协调行使其生物学,基于Pathway的分析有助于更进一步了 的生物学功能。KEGG是有关Pathway的主要公共数据库Pathway显著性富集分析以KEGG Pathway为单位,应用超几何检验,找出与整 中显著性富集的Pathway。该假设检验的p-value计同GO功能显著性富集分析的相似,在这里N为所有Unigene中具有Pathway注释 数目;n为N中差异表 的数目;M为所有Unigene中注释为某特定Pathway 数目为注释为某特定Pathway的差异表 数目。计 如下经过多重检验校正后,选择Qvalue≤0.05的Pathway定义为在差异表 中显著富集的Pathway。Q-value和FDR类似,都是对p-value的一种校正。某一个假设检验的Q-华 转录 denovo项目帮助文就是FDR的最小值,在这些FDR下该假设检验可以被认为是显著的通过Pathway显著性富集能确定差异表 pathway华 转录 denovo项目帮助文各列意义如下 序通路DEGswthpathwayannotaton注释到该通路的差异表达的数AgeneswthpathwayannotatonPva注释到该通路的所有的数超几何检验的PQvaQ值(Q≤0.05为在差异表达中显著富集的KEGG数据库中的Pathway注:Qvalue≤0.05的Pathway在差异表 差异表 的Pathway显著性富集分析不但得到最有意义的Pathway列表,点击其中的 还将得到KEGG数据库中Pathway的详细信息,如点击表8第一列第三行的cellreceptorsignalingpathway,可以看到如下图所示的详细信息,上 华 转录 denovo项目帮助文KEGG数据库中Bcellreceptorsignalingpathway华 转录 denovo项目帮助文软 版

数据 版 参数设GO-TermFnderPath_fnder

内部软

st/GO-TermF-

reease2012-08-

默认参参考文献[1]KanehisaM,ArakiM,etal.KEGGforlinkinggenomestolifeandtheenvironment.NucleicAcidsRes.2008,36(Databaseissue):D480-484.华 转录 denovo项目帮助文UnigeneSSR分简单重复序列(SimpleSequenceRepeat,SSR)又称 DNA,指的 组中由1-6个核苷酸组成的基本单位重复多次构成的一段DNA,广泛分布 长度一般在200 bp以下,其两端的序列高度保守,可设计引物进行PCR扩增,揭示其多态性基于转录组的SSR检测是以组装出来Unigene作为参考序列,使用SSR软件MicroSA lite(MISA),来找出所有的SSR。对所有SSR重复单元在Unigene上前后序列的长度进行筛选。只保留前后序列均不小于150bp的SSR,用其设计引物。基于SSR重复单元前后的序列设计引物,每条SSR产生5条引物。使用软件primer3-2.3.4,具体参数请见配置文件primerin 引物不能存在SSR将获得的引物比对到Ungene序列,引物的5端允许有3个碱基的错配,3端允许有1个碱基去掉那些比对到不同Ungene上的引物,筛选那些唯一匹配的引物使用 软版软版 相参数设McroSAtete(MISA)Prmer3

1-12,2-6,3-5,4-5,5-4,6-eben.de/msa/meben.de/msa/m 华 转录 denovo项目帮助文SNP分我们使用SOAPsnp(Li,Zhuetal.2009)测样品的单核苷酸多态性(SingleNucleotidePolymorphism,SNP),或称之为杂合位点SOAPsnp是SOAP 中的一员。它也是一种 工具,可以为基于原 片段在已知序列上的比对而组装出 在参考序列上的共有序列。这样我们就可以通过比较 SNP华 转录 denovo项目帮助文对于多个样品,使用-Unigene.faSNP。然后对每个样品SNP结果合并到一起,并进行比较,找出它们相同和不同的地方。根据不同的条件,将SP位点归到以下的几种类型:所有样品在该位点具有相同型式的SNP所有的SNP位点软软 版 相 参数设

-ut-Q-L参考文献[1]LiR,YuC,etal.SOAP2:animprovedultrafasttoolforshortreadalignment.Bioinformatics.2009,25(15):1966–1967.华 转录 denovo项目帮助文主成分分主成分分析(principalcomponents ysis,PCA)是一种简化数据集的技术,它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析减少数据集的维数,同时保持数据集的对方差贡献最大的特征。R语言中的 p函数可以进行软 版 相 参数设Rpr 参考文献 VenablesWN,RipleyBD.ModernAppliedStatisticswithS,Springer-Verlag.2YuLJ,LuoYF,LiaoB,etal.Comparative ysisoftransporters,phytohormoneandlipidmetabolismpathwaysinresponsetoarsenicstressin(Oryzasativa).NewPhytol.2012,195(1):97-华 转录 denovo项目帮助文条件特异表达分令ei(g)为 g在样品i中的reads数,则 g在所有样品中的reads数为E(g)=∑iei(g)。令si为样品i中所有reads数,则期望的每个 在样品i中的reads数与pi=si/∑isi成 g,如果它在所有组织中均匀地表达,则期望的它在组织i中reads数为fi=E(g)pi。定义expression ent(EE)EEi(g)=ei(g)/fi(g), g在样品i中的reads数观测值对期望值的比例。更大的EEi(g)代表 评估一个较大的EEi(g)值是由于偶然因素而不是真实的偏向性表达情况,为expression ent值定义一个P-value,它由如

P(g)=∑ )px(1-pi x=e我们通常定义满足:EEi(g5和Pi<10

.5 为条件特异表 软版相参数设内部软件--rato3-pvaue参考文献[1]YuX,LinJ,ZackDJ,Qian putational ysisoftissue-specificcombinatorialgeneregulation:predictingin ctionbetweentranscriptionfactorsinhumantissues.NucleicAcidsRes.2006,34(17):4925-4936.华 转录 denovo项目帮助文 工作流程概 上图描述的转录 的实验步骤:提取样品总RNA并使用DNase I消化DNA后,用带有Oligo(dT)的磁珠富集真核生物mRNA(若为原核生物,则用试剂盒去除rRNA后进入一步);加入打断试剂在Thermomixer中适温将mRNA打断成短片段,以打断后的mRNA为模板合成一链cDNA,然后配制二链合成反应体系合成二链cDNA,并使用试剂盒纯化回收华 转录 denovo项目帮助文粘性末端修复、cDNA的3'末端加上碱基"A"并连接接头,然后进行片段大小选择,最后进行PCR扩增;构建好的文库用Agilent2100Bio yzer和ABIStepOnePlusReal-TimePCRSystem质检合格后,使用IlluminaHiSeq™2000或其他 4.1.2信息分析流程简对原始数据进行去除接头序列及低质量reads的处理:获得Cean数据产出统计 组装结果分析:用短reads组装软件Trnty组装,对组装出来的Contg和Ungene做一个长度分布统Ungene功能注释及COG分类:分别将Ungene注释到NR,NT,Swss-Prot,KEGG,COG,GO库,并分别对注释到每个库以及所有注释上的Ungene数目进行统计,给出NR分类图和COG分类图;Ungene的GO分类:根据NR注释信息得到GO功能注释,得到每个Ungene的GO注释后,我们用WEGO软件对所有Ungene做GO功能分Ungene代谢通路分析:根据KEGG数据库的注释信息我们能进一步得到Ungene的Pathway预测编码蛋白框(CDS):按NR、Swss-Prot、KEGG和COG的优先级顺序将Ungene序列与以上蛋白库做bastx比对,翻译后得到该Ungene编码区的核酸序列(序列方向5)和氨基酸序列。皆比对不上的Ungene我用软件ESTScan预测其编码区Ungene表达差异分析、样品间的差异GO分类和Pathway富集性分析:差异表达分析找出在不同样本间表达量不同 做GO功能分析和KEGGPathway分;SNP分析:使用SOAPsnp检测样品的单核苷酸多态性(SngeNuceotdePoymorphSSR开发及引物设计:以组装出来Ungene作为参考序列,使用SSR软件M 华 转录 denovo项目帮助文条件特异表 分析主成分分析(PCA)华 转录 denovo项目帮助文Q1:转录组研究A1:基于的有cDNA文库、EST文库、SAGEcDNA;表达聚类。Q2: 相比,转录组高通量有什么优势 是用已知序列的探针和样本mRNA进行杂交来获得mRNA的序列信息的,如果样本mRNA以前从来没有过,那么 新的mRNA;另外,核酸杂交的背景噪音很高,存在交叉杂交现象。转录组是直接对样本mRNA进序,能够发现很多新的mRNA;转录组对表达上调或下降的检测范围能够 的百倍左右要灵敏。而且在有参考组的情况下,通过转录组您还可以分析可变剪切、结构变异、全组水平表达丰度等情况。Q3:华大与竞争对手的价格比较如何,有何优势A3:华大一直致力于为客户提供高性价比 :转A4:均可以Q5:是否需要生A5:是的,至少需要两次生物学重复,3次以上的生物学重复更好。2011年7月Hansen[1] 。如果不设生物学重复,高影响因子 Q6酸平台是否会对客户样品进行DNase处理A6:华大建议客户送样前自行对样品进行DNase处理,建库前的DNase处理只能处理痕量DNA模板残Q7SMARTA7:普通反转录是直接反转录,然后对cDNA打断,但是对全长mRNA进行反转录,片段太长,反转录酶的效果会变差,导致末端的片段丢失;而SMART技术能够完整保留全长mRNA的信息。Q8:SMART技术的A8SMART技术原理:在合成cDNA的反应中事先加入的3'末端带Oligo(dG的SMART引物,由于逆转录酶以mRNA为模板合成cDNA,在到达mRNA的5'末端时碰到真核mRNA特有的帽子结构",即甲基化的G时会连续在合成的cDNA末端加上几个dC,SMART引物的Oligo(dG与合成cDNA末端突出的几个C配对后形成cDNA的延伸模板,逆转录酶会自动转模板,以SMART引物作为延伸模板继续延伸cDNA单链直到引物的末端,这样得到的所有cDNA单链的一端有含Oligo(dT)的起始引物序列,另一端有已知的SMART引物序列,合成第二链后可以利用通用引物进行扩增。由于有5'mRNA才能利用这个反应得到能扩增的cDNA,因此扩增得到的cDNA就是全长cDNA。Q9:转录 A9:转录组 后可通过实时荧光定量PCR(qRT-PCR)技术来验证 [1]HansenMB,VerdurmenWP,etal.Amodularandnoncovalenttransductionsystemforleucine-zipper-taggedproteins.Chembiochem.2011,12(15):2294-华 转录 denovo项目帮助文专GO(GeneOntoogy):是 (GeneOntoogyConsortum)所建立的数据库,旨在建立一个适用于各种物种的,堆积因何蛋白质功能进行限定和描述的,并能随着研 COG:CusterofOrthoogousGroupsofprotens(蛋白相邻类的聚簇)的缩写。COG数据库是基于细菌、藻类、真核生物具有完整 COG是对 产物进行直系同源分类构的数据库,每个COG的蛋白都是被假定为来自于一个祖先蛋白,为orthoogs或是paraogs。Orthoogs是指来自于不同物种的由垂直家系(物种形成)进化而来的蛋白,并且典型的保留与原始蛋白有相同的功能。Paraogs是那些在一定物种中的来源于 数据库进行比对,预测Ungene可能的功能并对其做功能分类统计。Nr:著名的蛋白数据库,根据nr注释信息我们能得到GO功能注释。Gene 表(controedvocabuary)来全面描述生物体中 产物的属性。GO总共有三个ontoogy,分别描述 的分子功能(moecuarfuncton)、所处的细胞位置(ceuarcomponent)、参与的生物过程(boogcaprocess)。KEGG:系统分 产物在细胞中的代谢途径以及这 产物的功能的数据库,用KEGG可以进一步研 在生物学上的复杂行为,根据KEGG注释信息我们能进一步华 转录 denovo项目帮助文转录组参考文我们精心收集了近 的转录组denovo文章,供合作伙 LiangC,LiuX,YiuS,etal.DenovoassemblyandcharacterizationofCamelinasativatranscriptomebypaired-endsequencing.BMCGenomics.2013,14:146.2WangH,JiangJ,ChenS,etal.Next-generationsequencingoftheChrysanthemumnankingense(As ceae)transcriptomepermitslarge-scaleunigeneassemblyandSSRmarkerdiscovery.PLoSOne.2013,8(4):e62293.3ChenX,ZhuW,AzamS,etal.Deepsequencing ysisofthetranscriptomesofpeanutaerialandsubterraneanyoungpodsidentifiescandidategenesrelatedtoearlyembryoabortion. ntBiotechnolJ.2013,11(1):115-27.4FengC,ChenM,XuCJ,etal.Transcriptomic ysisof bayberry(Myricarubra)fruitdevelopmentandripeningusingRNA-Seq.BMCGenomics.2012,5DuH,BaoZ,HouR,etal.TranscriptomesequencingandcharacterizationfortheseacucumberApostichopusjaponicus(Selenka,1867).PLoSOne.2012,6ZhangJ,LiangS,DuanJ,etal.Denovoassemblyandcharacterisationofthetranscriptomeduringseeddevelopment,andgenerationofgenic-SSRmarkersinpeanut(ArachishypogaeaL.).BMCGenomics.2012,13:90.7LiD,DengZ,QinB,etal.DenovoassemblyandcharacterizationofbarktranscriptomeusingIlluminasequencinganddevelopmentofEST-SSRmarkersinrubbertree(HeveabrasiliensisMuell.Arg.).BMCGenomics.2012,13:192.8LiuG,LiW,ZhengP,etal.Transcriptomic ysisof'Suli'pear(Pyruspyrifoliawhitepeargroup)budsduringthedormancybyRNA-Seq.BMCGenomics.2012,13:700.9LiuB,JiangG,etal. ysisoftranscriptomedifferencesbetweenresistantandsusceptiblestrainsofthecitrusredmitePanonychuscitri(Acari:Tetranychidae).PLoSONE.2011,6(12):e28516.10WeiW,QiX,WangL,ZhangY,etal.Characterizationofthesesame(SesamumindicumL.)globaltranscriptomeusingIlluminapaired-endsequencinganddevelopmentofEST-SSRmarkers.BMCGenomics.2011,12:451.11 ShenGM,DouW,NiuJZ,etal. ysisoftheorientalfruitfly(Bactroceradorsalis).PLoSOne.2011,6(12):e29127.12WangZY,ChenJY,ZhangXJ,etal.DenovoassemblyandcharacterizationofroottranscriptomeusingIlluminapaired-endsequencinganddevelopmentofcSSRmarkersinsweetpotato(Ipomoeabatatas).BMCGenomics.2010,11:726.13ChenS,YangP,JiangF,etal.Denovo ysisoftranscriptomedynamicsinthemigratorylocustduringthedevelopmentofphasetraits.PLoSONE.2010,5(12):14XiangLX,HeD,etal.Deepsequencing-basedtranscriptomeprofiling ysisofbacteria-challengedLateolabraxjaponicasrevealsinsightintotheimmune-relevantgenesinmarinefish.BMCGenomics.2010,11:472-480.15GrahamIA,BesserK,BlumerS,etal.ThegeneticmapofArtemisiaannuaL.identifieslociaffectingyieldoftheantimalarialdrugartemisinin.Science.2010,327(5963):328-华 转录 denovo项目帮助文信息挖掘推 挖掘多样品间差异表 及功 novo ,组装出unigene,筛选出多样品间的差异表达 进行聚类、GO和Pathway显著性富集分析。华大参与完成的转录组denovo文章:LiuB,JiangG,et ysisoftranscriptomedifferencesbetweenresistantandsusceptiblestrainsofthecitrusredmitePanonychuscitriTetranychidae).PLoSONE.2011,6(12):e28516. 单位中国农业 影响因子案例描*转录组denovo挖掘多样品间差异表 华 转录 denovo项目帮助文 组序列的物种,通过转录组denovo 表达情况,深入研究目标性状形成的分子机制,并可开发cDNASSRs(cSSRs)标记,可广泛用华大参与完成的转录组denovoWangZ,FangB,ChenJ,etal.DenovoassemblyandcharacterizationofroottranscriptomeusingIlluminapaired-endsequencinganddevelopmentofcSSRmarkersinsweetpotato(Ipomoeabatatas).BMCGenomics. ,建立了第一个甘薯转录组数据库,开发了cSSRs标记,用于甘薯育种。(华大参与完成) 影响因子案例描*转录组denovo开发SSR标记研究流华 转录 denovo项目帮助文对于无参 组,通常比对率很低,而使用转录组denovounigene组装结果则能提供良好结 多篇运用转录组denovo技术的文章。华大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论