核酸序列分析课件_第1页
核酸序列分析课件_第2页
核酸序列分析课件_第3页
核酸序列分析课件_第4页
核酸序列分析课件_第5页
已阅读5页,还剩133页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

核酸序列分析

核酸序列分析是生物信息学应用中的一个重要方面,一般包括:DNA碱基组成、密码子的偏向、内部重复序列、特殊位点(限制性位点及转录、翻译和表达调控相关信号)、编码区分析、一二级结构等。第一节核酸序列的检索第二节核酸序列的基本分析第三节核酸序列的电子延伸第四节基因的电子表达、定位分析第五节基因识别第六节核酸序列的提交

通过软件,如BioEdit()、DNAMAN()等获得。第二节核酸序列的基本分析一、分子质量、碱基组成、碱基分布二、序列变换三、限制性内切酶分析

REBASE(RestrictionEnzymeDatabase)限制酶数据库

()1.测序峰图的查看澳大利亚ConorMcCarthy开发的Chromas.exe程序,且BioEdit软件和DNAMAN软件都可以查看。四、克隆测序的分析2.核酸测序载体序列的识别与去除RepBase重复序列数据库五、重复序列分析cDNA文库EST较长cDNA全长cDNA第三节核酸序列的电子延伸1.5Kb500bp500bp500bp500bp基本过程:1.通过Blast搜索GenBank的EST数据库,选择与待分析的序列具有较高同源性的EST匹配序列;2.将匹配序列和待分析的序列装配产生新序列;3.以新序列作为待分析的序列重复上述过程,直至没有新的匹配序列,从而生成最后的新序列。第四节基因的表达、定位分析原理:将待分析序列与EST数据库进行序列对库检索,然后用与待分析核酸序列具有高同源性的EST序列所对应的组织来源进行推断而得到该基因的组织表达谱。一、基因的电子表达图谱分析基本步骤:1.通过Blast搜索GenBank的EST数据库,选择与待分析的序列具有最高同源性比分的EST序列;2.从NCBI的UniGene数据库进行检索,得到相应的UniGene号;3.可通过参与形成UniGeneCluster的序列的组织/细胞来源间接反映待分析序列在哪种组织中表达。二、基因的电子定位分析通过序列标签位点(STS)定位通过UniGene/RH技术定位利用基因组序列定位利用NCBI的电子PCR资源()1.利用STS数据库进行定位进入NCBI的电子PCR资源()输入待分析的序列根据提供的STS信息进行定位步骤:

获得待分析序列对应的UniGene编号,而大部分UniGene序列已经具有明确的定位信息,可以得到待分析序列的基因定位。2.利用UniGene数据库进行定位

将待分析序列输入基因组数据库进行同源性检索;得到确定的基因组序列后点击“Genomeview”观察基因组结构;点击红色标记所指示的染色体列表中选择对应的染色体及区域;浏览器中将显示详细的基因定位结果。3.利用基因组序列进行定位BLAST搜索数据库进行基因定位通过基因组数据库定位---NCBI基因组数据库基因定位拟南芥基因组数据库---基因定位酵母基因组数据库---基因定位步骤:获取目的序列;预测可能的编码区和非编码区;通过相关的数据以提高基因识别的准确性(数据库搜索);利用生物信息学资源分析序列的功能。第五节基因识别策略:先寻找并去掉重复的和复杂性较性较低的序列,再寻找基因及相关调控区域。exonintroexonexon5’3’增强子非翻译区非翻译区GC(-100)CAAT(-70)ATGTATA(-30)TAA/TAG/TGA帽位点(+1)终止位点polyA真核基因结构模式图基因组外显子识别从基因组DNA序别中识别出完整的蛋白质编码序列,即外显子部分。外显子与内含子之间无绝对区分;同一基因不同发育时空,外显子组成不相同;假基因的存在降低预测的准确率。EST策略的基因鉴定电子克隆最主要的途径是从EST直接寻找新基因。确定目的EST,构建包含EST的重叠群,再进行ORF的判定及蛋白结构域等功能域的识别。一、生物信息学识别基因的两种途径编码区是由核糖体翻译成蛋白质的DNA序列原核基因:编码区是一段不包含终止子的连续序列。真核基因:编码区是由内含子隔开的若干个可读框架。二、编码区的分析终止密码子(TGA、TAA或TAG)数量较少;ORF达到一定的长度;密码子使用的偏好性,第3个碱基G/C出现的频率较高;与已知基因比较有序列相似性;与模板序列的模式相匹配可能指示功能性位点的位置。编码区的统计特征:

转录起始点、核糖体结合位点、起始密码子、RNA剪接位点、终止密码子、poly(A)位点等。编码区的一些信号:

分析与基因表达调控相关的信息、各种功能位点及基因转录调控元件。DNA序列上特殊的片段,是蛋白质因子作用的位点,是与基因转录、翻译有关的信号序列。通过模式识别及生物信息软件分析。

三、非编码区的分析启动子启动子转录区终止子外显子内含子基因的一般结构TATAbox起始序列(TATAT/AAT/A)(C/TC/TCAA/GA/G)转录因子结合区CCAATGC真核生物启动子-30bp,TATAbox-80bp,CAATbox-80bp110bp,GCCACACCC或GGGCCGGGTATA盒使转录精确地起始CAAT盒和GC盒控制转录的起始频率

信号肽AuthorsSequinBankItSequencedataGenBankAccessionnumber7daysDraftrecord第六节核酸序列的提交BankItBankIt是NCBI提供的一个在线提交序列的工具。由一系列表单,包括联络信息、发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。用户提交序列后,会从电子邮件收到自动生成的数据条目,Genbank的新序列编号,以及完成注释后的完整的数据记录。用户还可以在BankIt页面下修改已经发布序列的信息。BankIt适合于独立测序工作者提交少量序列,而不适合大量序列的提交,也不适合提交很长的序列,EST序列和GSS序列也不用BankIt提交。sequin

1.大量的序列提交可以由Sequin程序完成。

2.能方便的编辑和处理复杂注释。

3.提交来自系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论