实验七 核酸序列分析_第1页
实验七 核酸序列分析_第2页
实验七 核酸序列分析_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验七、核酸序列二级数据库及核酸序列的预测分析(3学时)目的:了解常用的核酸序列二级数据库的内容及其用途,熟悉分子生物学实验室常规的序列分析内容及方法。内容:基因调控转录因子数据库TransFac、真核生物启动子数据库EPD的数据内容的了解,分子生物学实验室序列分析在线工具的了解,利用这些工具进行载体去除、鉴定序列中的酶切位点、引物设计、分析DNA组成、发现蛋白质编码区域、序列片段的组装等。一、 核酸序列的二级数据库。1、 TransFac(http:/www.gene- )基因调控转录因子数据库阅读TransFac的Documentation(另, 处为国内TransFac 4.0 版的do

2、cumantation),了解数据库的大致内容与结构。进入TESS (/tess/ ),这是一个利用TRANSFAC等几个数据库内容构建的转录因子检索系统,在左侧的Search TRANSFAC栏中键入ABRE或者CREF,回答问题:1、 What is ABRE/CREF?2、 Which species does ABRE/CREF belongs to?3、 For ABRE, 1)give its (binding) factor AC number in wheat. 2) Describe ABREs comment.4、 For C

3、REF, 1)give it Functional Features. 2、 了解真核生物启动子数据库EPD (http:/www.epd.isb-sib.ch/index.html )的大致内容与结构。回答问题:5、如何知道还有哪些与转录因子或转录调控位点相关的数据库?二、 利用网上分析工具进行单条核酸序列分析DNA序列分析大体上可分为两大类:面向测序的DNA序列分析;指定DNA序列的分析。1、 去除载体序列。一般的序列测序目的有两种:1)了解未知序列的具体内容; 2)对已知序列的验证。不论哪一种测序数据,在进一步分析之前必须去除目的片段以外的污染序列。如果要对一个DNA片段进行测序,过程包

4、括DNA片段的纯化,将其克隆进入载体,将载体转化进宿主(如E.coli)进行扩增,提取扩增后的克隆并利用不同的测序方案进行测序。在这一过程中,经常会发生一些未曾料想到的问题使得所获得的序列并不能真实地反应你想研究的遗传信息。比如,测序的序列中至少有一端包含了构建克隆的部分载体序列。对于这部分序列我们可以简单地通过与载体序列数据库的相似性搜索而发现并去除它们。但是,如果你的序列可能被其它载体序列所污染的话(即存在非实验构建所使用的载体序列),则最好在做其它工作之前发现并考虑是否要重新获得相应的DNA片段。点击/VecScreen/VecScre

5、en_docs.html 进入NCBI的VecScreen documentation页面 ,它包含了一个很好的序列污染方面的指南(点击页面中的contamination 链接)以及对VecScreen 是如何进行工作的解释。当你确信你可以利用VecScreen进行分析时,点击页面中的VecScreen Web Site 链接,或者直接在浏览器中输入/VecScreen/VecScreen.html 。对GenBank 中一条AC号为U87251.1的序列进行载体污染分析。VecScreen分析可能会产生两种结果,1、Non-signific

6、ant similarity found。这对你来说是个好消息。2、An output listing matches of some kinds。这可是个坏消息,说明你的序列确实包含了某种载体序列。回答问题:6、Does this sequence be contaminated? 7、If it is contaminated, which vector sequence may be evolved? 2、 进行序列中限制性内切酶图谱分析。Restriction map analysis是分子生物学实验中日常工作之一, 是实验室进行各种质粒构建的基础。限制性内切酶是结合在DNA分子的特异

7、序列上,并在识别序列或其附近将双链DNA切开的酶。限制性内切酶有三类。I类和III类的切割位点和识别序列不存在严格的关系,而II类限制性内切酶则在识别序列或非常接近的位置进行切割。现在有300多种II类限制性内切酶已在实验室使用。许多酶的识别靶序列为6核苷酸,另外一些则识别更长或更短的序列。限制酶以两种不同的方式切割DNA。一些酶在DNA两条链的同一位置切开,产生平端(blunt end),另一些则在两条链的不同位置切开,通常间隔2个或4个核苷酸,结果产生的DNA片段在每一端都有短的单链突出,这被称为突出或黏性末端(sticky or cohesive end)。在质粒构建中,插入片段与载体之

8、间相同内切酶产生的粘性末端要比两者间的平末端更容易被DNA连接酶连接在一起。如果使用了产生不同粘末端的内切酶对载体及目的插入片段进行了双酶切,则插入片段在载体中的方向也是固定的。但是,因为某些条件的限制,有时必须使用平端内切酶进行构建,尽管这样可能效率很低或会产生插入片段的多拷贝。不同平端内切酶产生的片段之间均可进行连接,但连接后在连接处相应的酶切位点消失。点击 进入最常用的限制性酶切分析网上工具Webcutter。页面提供了三种可用来输入要分析的序列的方法。同时提供了很多选项,如输入序列是线性还是环型(后者通常指原始的或已构建好的质粒或克隆),结果输出的格式(图谱、列表),根据不同的条件对结

9、果进行过滤(如那些在你提交序列中可进行切割或不能进行切割的酶,或者那些在你的序列中切割超过了一定次数的酶),根据不同的情况所特定的限制酶子集等。利用所学的任何方法找到拟南芥At5g10930基因的genomic DNA ,在Webcutter上进行所有限制酶的酶切分析。/tacg/WWWtacg.php 是另一个类似的酶切分析服务器,但界面与Webcutter有些不同。回答问题:8、At5g10930基因组序列的长度是?9、At5g10930的CDS在此序列的什么位置?10、在结果中,哪些酶切位点在此基因中没有酶切位点?11、有没有酶切位点

10、位于此基因CDS区域以外?是哪些?(如果网上分析工具不可用,则可以安装实验数据-实验五目录中的DNAMANdemo5.0或实验六目录中的BioEdit.zip软件进行分析。)3、 引物设计。引物设计是PCR技术中至关重要的一环。为了获得最佳的扩增效率及扩增产物的特异性,一般在可能的条件下都需要进行引物的设计。而PCR引物的设计需要遵循一定的原则。主要有三点:1、引物要跟模板紧密结合;2、引物与引物之间不能有稳定的二聚体或发夹结构存在;3、引物不能在别的非目的位点引起DNA聚合反应(即错配)。围绕这几条原则,设计引物需要考虑诸多因素,如引物长度(Primer Length)、产物长度(Produ

11、ct Length)、序列Tm值(Melting Temperature)、G值(Internal Stability)、引物及产物GC含量(Composition),有时还要对引物进行修饰,如为了扩增产物的回收而要在引物两侧增加限制性酶切位点、为了某些特殊位点的分析而在引物中引进突变等。各种模板的引物设计难度不一,有的模板本身条件较差,如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;有时PCR的产物要作为克隆对象插入到载体中表达,致使PCR引物设计的可选择度很低,此时也只能退而求其次。一般来说,引物要尽量满足以下要求:1)引物长度一般为1821bp,且上下游引物的长度差别不要大于3

12、bp.过长或过短都不合适。但在进行长片段PCR时,为避免非特异性的扩增的影响,往往需要增加引物的长度,一般要在30bp 以上。2)由于进行PCR扩增时,在DNA聚合酶作用下,将沿着引物3端进行延伸,所以3端的几个碱基对PCR反应的成功与否具有重要意义,它们应当与模板严格配对。引物3最末端的碱基一般不用A,因为A在错误引发位点的引发效率相对比较高,而另外三种碱基的错误引发效率相对小一些;而且这一碱基最好不要落在密码子的第三位碱基上,因为这一碱基位点较其它位点具有更高的变异性。3)引物的GC含量一般为45%-55%,过高或过低都不利于引发反应,上下游引物的GC含量不能相差太大。4)引物所对应的模板

13、序列的Tm值最好在720左右,当然由于模板序列本身的组成决定其Tm值可能偏低或偏高,可根据具体情况灵活运用。两个引物的Tm值相差不能大于5oC 5)G值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标。一般情况下,最好不要超过9(G为负值,这里取绝对值),以利用正确引发反应。尽量避免非特异性结合位点的存在,以避免非特异性扩增条带的出现。6)注意引物序列内部的重复和自身互补序列,不能有大于3bp的反向重复序列或自身互补序列存在。否则会形成发夹结构。避免上下游引物的互补性,以免形成引物二聚体,在结果中产生引物二聚体条带。甚至降低引物的浓度,导致PCR不能正常进行反应。引物二聚体及发夹结构

14、的能量一般不要超过4.5。7)对引物的修饰是在各引物的5端增加酶切位点,应参考载体的限制酶识别序列确定,且在增加酶切位点的5端增加保护核苷酸,保护核苷酸数量见具体酶而定。并且,上下游引物采用不同的限制酶识别序列,以利于后续操作。在浏览器中输入/ ,点击Primer Selection Tool链接,进入Primer3 页面(不要被复杂的页面吓到,你完全可以先使用默认值进行分析)。将上题中的序列粘入序列框中,点击Pick Primers.回答问题:12、左引物的位置及长度。13、What are the “3” and “any” in the result mean? 注意:在得到引物后,你应该检查它们是否是特异性引物,即不会在基因组的其它地方发生非特异性反应。将引物序列对在TAIR 的BLAST SEVER(/Blast/ )上进行序列比较,选择的数据库为AGI Whole genome (BAC clones)。回答问题:15、Why we choose whole genome sequence database instead of Gene databas

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论