




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、NCBI常用功能与引物设计常用功能与引物设计2010 导师:邹晓庭Your site here为何要接触为何要接触NCBI?如何使用如何使用NCBI?如何设计引物?如何设计引物?Your site hereNCBI简介NCBI:National Center for Biotechnology Information 美国国家信息技术中心美国国家信息技术中心 ()()1992年年10月,月,NCBI承担起对承担起对GenBank DNA序列数据库的责任。序列数据库的责任。NCBI工作人员通过来工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(自各个实验室递交的序列和同国际核酸序列数据
2、库(EMBL和和DDBJ)交换数据建立起)交换数据建立起数据库数据库. Genebank是遗传序列数据库,一个所有可以公开获得的是遗传序列数据库,一个所有可以公开获得的DNA序列的注释过的收集。序列的注释过的收集。 GenBank以指数形式增长,核酸碱基数目大概每以指数形式增长,核酸碱基数目大概每14个月就翻一个倍。最近,个月就翻一个倍。最近,GenBank拥有来自拥有来自47,000个物种的个物种的30亿个碱基。亿个碱基。 Sub titleNCBI常用功能查找核酸/氨基酸序列序列相似性分析引物验证Your site here一、查找核酸、氨基酸序列一、查找核酸、氨基酸序列1.以鸡以鸡FAT
3、/CD36为例,为例,search:2.调整右侧检索目录,调整右侧检索目录,tree-list:Your site here3.浏览信息,下载序列,并以浏览信息,下载序列,并以Genebank、FASTA格式保存格式保存点击点击Genebank:氨基酸序列:氨基酸序列:Genebank核酸序列:核酸序列: FASTA格式的核酸序列:格式的核酸序列: Your site here二、序列相似性分析二、序列相似性分析序列相似性分析:序列相似性分析: 就是将待研究序列与就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找
4、出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比也就是找出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有较算法。常用的程序包有BLAST、FASTA等等序列同源性分析:序列同源性分析: 是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有完成这一工作必须使
5、用多序列比较算法。常用的程序包有DNAMAN、CLUSTAL等等Blast简介简介 BLAST : “局部相似性基本查询工具”(Basic Local Alignment Search Tool)的 缩写,是由NCBI开发的一个基于序列相似性的数据库搜索程序。程序名程序名查询序列查询序列数据库数据库搜索方法搜索方法Blastn核酸核酸核酸核酸核酸序列搜索逐一核酸数据库中的序列核酸序列搜索逐一核酸数据库中的序列Blastp蛋白质蛋白质蛋白质蛋白质蛋白质序列搜索逐一蛋白质数据库中的序列蛋白质序列搜索逐一蛋白质数据库中的序列Blastx核酸核酸蛋白质蛋白质核酸序列核酸序列6框翻译成蛋白质序列后和蛋白
6、质数据框翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。库中的序列逐一搜索。Tblastn蛋白质蛋白质核酸核酸蛋白质序列和核酸数据库中的核酸序列蛋白质序列和核酸数据库中的核酸序列6框翻译框翻译后的蛋白质序列逐一比对。后的蛋白质序列逐一比对。TBlastx核酸核酸核酸核酸核酸序列核酸序列6框翻译成蛋白质序列,再和核酸数据框翻译成蛋白质序列,再和核酸数据库中的核酸序列库中的核酸序列6框翻译成的蛋白质序列逐框翻译成的蛋白质序列逐一进行比对。一进行比对。主要的Blast程序:Blast 序列相似性分析序列相似性分析1.修改测序结果,剔除克隆载体序列修改测序结果,剔除克隆载体序列在测序结果中找到上下游
7、引物对应位置,剔除引物外的多余部分以鸽子的I-FABP片段为例:GCAAGCTTGCATGCCTGCAGGTCGACGATTAGGAAGTTAGGAGCCCACGATAATCTGAAGATCACTATTCAACAAGATGGAAACAAATTTACGGTCAAAGAATCAAGCAACTTCCGTACTATAGATATTGAATTCACTCTGGGAGTCAATTTTGACTACAGTCTCGCTGACGGAACGGAAATCTCTAGAGGATCCCCGGGTACCGAGCTCGAATTCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATT
8、CCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAAC
9、ATGT 上游引物:5-AGRAARYTDGSAGCYCAC-3下游引物: 5- TCHGTYCCRTCWGCBAGA-3TAGGAAGTTAGGAGCCCACGATAATCTGAAGATCACTATTCAACAAGATGGAAACAAATTTACGGTCAAAGAATCAAGCAACTTCCGTACTATAGATATTGAATTCACTCTGGGAGTCAATTTTGACTACAGTCTCGCTGACGGAACGGAYour site here2.进入进入NCBI3.点击点击Basic BLAST中的中的nucleotide blast选项选项Your site hereYour site
10、here4.寻找相近物种,比较相似性寻找相近物种,比较相似性Your site here点击点击score,获得相似性比较具体信息,获得相似性比较具体信息NCBI官方说明:官方说明:Your site here引物设计与简并引物设计与简并PCR RTPCR原理与技术简介 引物设计过程 简并PCR技术 后续研究Your site hereDNA mRNA 蛋白质酶活力Western blotNorthern blot半定量RTPCR定量RTPCRYour site here12Your site here引物设计原则Primer5和Oligo6进行引物分析Your site here引物的长度一
11、般为引物的长度一般为15-30bp,常用的是,常用的是18-27bp,但不能大于,但不能大于38,因为过长会导致,因为过长会导致其延伸温度大于其延伸温度大于74,即,即Taq 酶的最适温度。酶的最适温度。引物引物3端的序列要比端的序列要比5端重要。引物端重要。引物3端的碱基一般不用端的碱基一般不用A,因为,因为A在错误引发位点的在错误引发位点的引发效率相对比较高。另外引物间引发效率相对比较高。另外引物间3端的互补、二聚体或发夹结构也可能导致端的互补、二聚体或发夹结构也可能导致PCR反应反应失败。失败。5端序列对端序列对PCR 影响不大。影响不大。引物的引物的GC含量一般为含量一般为40-60%
12、,以,以45-55为宜,过高或过低都不利于引发反应。为宜,过高或过低都不利于引发反应。PCR引物的引物的GC/AT比率应当等于或高于所要放大的模板的比率应当等于或高于所要放大的模板的GC/AT比。比。G值值(自由能自由能)反映引物与模板结合的强弱程度。一般情况下,引物的反映引物与模板结合的强弱程度。一般情况下,引物的G值最好呈正弦值最好呈正弦曲线形状,即曲线形状,即5端和中间端和中间G值较高,而值较高,而3端端G值相对较低,且不要超过值相对较低,且不要超过9(G值为值为负值,这里取绝对值)。负值,这里取绝对值)。 引物二聚体及发夹结构的能量一般不要超过引物二聚体及发夹结构的能量一般不要超过4.
13、5,否则容易产,否则容易产生引物二聚体带。生引物二聚体带。 Your site here以鸡的以鸡的I-FABP为例,设计常规引物:为例,设计常规引物:1.输入I-FABP的已知序列,点击primer:Your site here2.点击点击search进行引物条件设置:进行引物条件设置:3.Search criteria 筛选筛选Your site here4.选择最优引物选择最优引物5.手动修改,调手动修改,调整引物整引物Your site here最为重要的环节:对自己设计的引物或文献报道的引物进行测试1.登陆NCBIBlastPrimer-BLAST: Your site here以文
14、献报道鸡的以文献报道鸡的MUC2的引物为例:的引物为例:Your site hereYour site hereYour site hereMore of an art than a science降低简并度(500以下)例如:上游 D Y N L F D L L 下游 P V N G N G K Q 根据密码子表建立引物系列谨慎使用次黄嘌呤Symbol DefinitionB not AD not CH not GI InosineK G or T/UM A or CN A,C,G or T/UR A or GS C or GV not T/UW A or TY C or T/U简并引物:在
15、常规引物的某些位点上以简并核苷酸代替。Your site here简并引物设计过程简并引物设计过程l 传统方法(适用于保守度高序列)应用BLAST进行同源序列搜索应用DNAMAN选择保守区域(氨基酸或核苷酸)简并引物设计原则Primer5和Oligo6进行引物分析l CODEHOP法(适用于保守度低序列)Your site here剪切然后粘贴DNA或蛋白序列;使用FASTA格式的序列; FASTA格式的序列以一个单行的说明开始,说明行以其开始处的一个大于号()与序列数据区分开。说明行以下是序列数据。简单使用访问编号:RefSeq或Genebank序号。 Your site hereYour site hereDNAMAN分析序列保守区分析序列保守区对Gallus、Taeniopygia、Mus、Ruttus的I-FABP的CDS进行分析得到保守区序列Your site here 原理原理 方法方法:Your site hereRNAcDNAcDNA反转录反转录合并产物合并产物分装产物分装产物-actin样样 品品PC
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年gmp判断试题及答案
- 2025年sql 实训试题及答案
- 2025年调酒专业考试题及答案
- 2025年中医方剂学 试题及答案
- 2025年vb大学考试试题及答案
- 2025年ai测试题及答案经典
- 2025年中医学书籍考试题及答案
- 机油真假协议书
- 杂志销售协议书
- 村民就业协议书
- 管理客户资源管理办法
- 三类人员b证考试题库
- 钱江三桥改建提升工程报告表
- 认知思维升级培训课件
- 产品型式试验管理制度
- 私人年度工资收入证明模板(5篇)
- 特殊岗位工时管理制度
- 装机时控件管理程序
- 城投笔试考试题库及答案
- 2024年安徽省金寨县事业单位公开招聘辅警考试题带答案分析
- 2025年河北省专技人员继续教育公需课(新课程答案七)
评论
0/150
提交评论