《二代测序分析》_第1页
《二代测序分析》_第2页
《二代测序分析》_第3页
《二代测序分析》_第4页
《二代测序分析》_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

工作进展1整理课件RNA-sequences分析方法

hisat+stringtie+ballgown2整理课件HISAT1:index算法基于BWT和以BWT为根底的FM

index:

FM算法是以BWT为根底,在计算的过程中加了两个参数,一个是OCC,Occ[c,r]表示在BWT〔T〕中第r行之前出现字符c的个数,因为如果把整个基因组存进去,每次都要重头数一遍,消耗量太大,所以是以几百行为一组为一个checkpoint,这样内存就小了,也方便检索;另外一个是SA,

记录第r行在参考基因组中是什么位置,这个过程是在BWT操作中实现的。2:建立index的方式:全基因组FMindex和局部index〔特色,新的建索引库策略〕核心算法会用到tophat3上HISAT在基因组范围内有48000个局部FMindex每个长度64k,通过测试数据和真实数据的比较,发现这是一个最快的软件。HISAT的根本设计原理:HISAT利用bowtie2来建立很多低水平结果的FMindex,这些index包含两种类型:1:全基因组index;2:大量的小FMindex,每个代表64k,也因为建了很多小的index,所以总的内存使用情况也较低3:100bp的reads至少跨越两个exon的占34.5%,分为三类:1:每个外显子至少16bp〔25.1〕;每个外显子8-15bp〔5.1〕,每个外显子1-7bp〔4.2〕;另外跨越三个的3.1%。针对每种reads都有相应的比对策略根本的比对策略的思想是先在众多index中找,如果比对上多个地方,就往两边延伸;4:根本的性能比照速度:110,193条reads/s,tophat1,954;利用模拟数据正确比对率〔99.2%〕,tophat2(97.4);在跨越2个exon,只有1-7bp的reads来说;

uniq比对率HISAT〔94.4〕tophat2(77.8)另外敏感度和准确性HISAT〔97.3,94.8〕Tophat2〔90.6,82.6〕100bp,20M的reads用时26.7min,tophat21170分钟3整理课件stringtieStringTie和Cufflinks算法比照cufflinksparsimony算法

(简约算法):生成最少的亚型,这种算法没有考虑转录丰度,在isoforms方面算的不准。其在算表达量的时候,按照图上的说法是用了最大似然冗余算法。stringTie先将reads分为不同的类,然后再针对每个类的reads生成一个拼接图来确定转录本,之后每个转录本产生一个流神经网络的最大流算法来评估表达水平这个算法的意思对应过来就是在一个基因处的假设干个转录本,如何分配reads的数目才能让每个转录本的数目都处在最多的状态。这个算法是求解最优化的。在RNA组装方面优劣势比照在组装方面StringTie具有一些优势,在低表达的局部,阈值过滤5%的StringTie比阈值过滤10%的准确度和敏感度还要高〔这里的准确度和敏感度是把原始数据随机抽取出来一局部数据,看看这两组随机抽出来的数据的重合度如何和ROC是一个事情〕关于组装效果,StringTie要好于cufflinks,StringTie可以正确组装10990长的转录本,cunfflinks组装长度为7187,同时他们又远远好于其他软件。性能比照时间上来说:StringTie30min,cufflink81min,比其他软件快3倍,内存比cufflink少一半,找出来的基因中,cufflink找出来的70%在StringTie中有重合,相比于cufflink,StringTie在基因重构方面对三种类型的基因更有效,分别是:低冗余,高exon数目和多重转录本。StringTie之所以能取得好的效果,是因为模型中有个求最有的过程;其可以通过转录组的每个组装平衡覆盖度,算法自己可以通过合并覆盖到的深度来限制组装。4整理课件Ballgown

ballgown是一个R脚本,用来分析差异结果的,差异分布的结果是基于F-test来检测的,和我们以前用的有些不同就测试内存而言,cu

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论