生物学信息分析_第1页
生物学信息分析_第2页
生物学信息分析_第3页
生物学信息分析_第4页
生物学信息分析_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关生物信息学分析及软件的使用基因工程下游技术实习实验目的了解相关的生物信息学数据库(NCBI数据库等)和掌握数据库检索方法,学会相关软件的使用,并利用生物信息学软件根据研究目的和对象设计引物。方法根据酶或基因的名称(GenBank登录号)找到需要的基因的核苷酸序列,根据序列和PCR的目的设计获得该基因的CDS的引物(注意引物设计时引物酶切位点)。

目的基因序列的检索主要数据库介绍GenebankEMBLDDBJ

Genebank

Genebank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。NCBI的网址是:http://EMBL核酸序列数据库

由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。数据库网址是:http://www.ebi.ac.uk/embl/

DDBJ数据库

日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。DDBJ的网址是:http://www.ddbj.nig.ac.jp/NCBI介绍:NCBI建立在1988年,作为一种公共分子生物学信息资源,而创建的公开数据库。NCBI的计划:1.基本研究;2.数据库;3.软件的开发;4.教育和训练现在我们以查找甘薯异戊烯氯喹异构酶(Ipomoeabatatas

isopentenyl

diphosphate

isomerase

,ipi)的编码序列为例,介绍如何从NCBI中在线获取所需要的核酸序列.应用举例1.进入2.选择数据库3.查询关键词4.开始查询显示格式符合条件的记录数每页显示数目相关记录点击进入Genbank格式的序列记录FASTA格式的序列记录基因表达的

ORF分析

aagcaagacg

ccaagggcca

aggctggctg

caagaagcaa

agaggaacga

acactgtgaa61tatcccaatg

tcgatgatgg

cttctgttca

aatctgtcgg

agattctctc

ccctagtcgc121ccggccggcg

atttactctg

ccaattcttc

attcctctca

ccagtctctt

tcgcctcttc181ttctctttca

attatgccga

tccgcctccg

ctgcagagct

tcagtacact

ctgtccgcgc241cgcctccacc

atgggggaca

ccatcactga

tgccaacatg

gatgctgtcc

agcgccgcct301catgtttgac

gacgagtgta

ttttggtgga

tgagaatgac

cgtgttgttg

gtcatgatac361caagtataat

tgtcatctta

tggagaagat

tgaatctgag

aatctgcttc

acagagcttt421cagtgttttc

ttatttaatt

caaactatga

gttgcttctt

cagcaacgat

ctgcgacaaa481ggtcaccttc

cctttggtgt

ggactaacac

ctgctgcagc

catcctctgt

accgggagtc541tgagttgatt

gaagagaatg

ctcttggtgt

gaggaatgct

gcacaaagaa

agcttcttga601tgaactgggg

attcctgcag

aggatgtccc

agttgatgaa

ttcacaacat

tgggccgtat661cctgtataaa

gcaccttctg

atgggagatg

gggagagcat

gaacttgatt

atcttctctt721cattgtgagg

gatgttggca

tgcacccaaa

cccggatgag

gttgcagatg

ttaaatatgt781gaatagggaa

cagctgaaag

agatcttgag

gaaagcaaat

gctggagagg

atggtataaa841gctttcccct

tggttcagat

tagtcgtcga

aaatttcttg

ttcaaatggt

gggatcatgt901cgagaaaggc

accctaatgg

aagctgcaga

tatgaaaacc

attcacaagt

tggcctaaac961agccattggc

tgagcttttg

ttaaaccctt

acatctacca

ttcacttaac

tgagcaaaaa1021tatattctat

ggtcttctgc

ttagtttcat

gcttcatgct

tgaactttca

agttttatgt1081tacttttggc

tgttaggaac

tagtaatata

tgtgaacttg

ctatcaaaaa

aaaaaaaaaa1141aaaaaaaaaa

aaaaa//基因表达的ORF分析利用计算机和互联网,对核酸序列的所有相位进行搜索可以很快地获得ORF结果。国际互联网上的ORF分析资源有:http:///gorf/查找);http://expasy.hcuge.ch/www/dna.html(将DNA翻译为蛋白质)。核酸序列的

比对分析对核酸序列的首要分析是联网进行序列的同源性分析,以便能够利用最新的数据库反映该序列是否是已知序列以及与已知序列同源性的高低。典型的分析是采用NCBI的BLAST软件对GENBANK中的非冗余数据库(non-redundantdatabase,nr)进行查询。该数据库是对GENBANK、EMBL和DDBJ中去除所有相同核酸序列进行整合后所得到的最为全面的已知基因数据库,其中还包括了部分基因组的序列。运行时联网至:/BLAST按照提示进行查询。ggggtcgagtccgcgtccac

ccgcgagtac

aaccttcttg

cagctcctcc

gtcgccggtc61cacacccgcc

accagttcgc

catggatgac

gatatcgctg

cgctcgtcgt

cgacaacggc121tccggcatgt

gcaaggccgg

cttcgcgggc

gacgatgctc

cccgggccgt

cttcccctcc181atcgtgggcc

gccctaggca

ccagggtgtg

atggtgggta

tgggtcagaa

ggactcctac241gtgggcgacg

aggcccagag

caagagaggc

atcctgaccc

tgaagtaccc

cattgaacac301ggcattgtca

ccaactggga

cgatatggag

aagatttggc

accacacttt

ctacaatgag361ctgcgtgtgg

cccctgagga

gcaccctgtg

ctgctcaccg

aggcccctct

gaaccctaag421gccaaccgtg

aaaagatgac

ccagatcatg

tttgagacct

tcaacacccc

agccatgtac481gtagccatcc

aggctgtgtt

gtccctgtat

gcctctggtc

gtaccactgg

cattgtgatg541gactccggag

acggggtcac

ccacactgtg

cccatctatg

agggttacgc

gctccctcat601gccatcctgc

gtctggacct

ggctggccgg

gacctgacag

actacctcat

gaagatcctg661accgagcgtg

gctacagctt

caccaccaca

gctgagaggg

aaatcgtgcg

tgacattaaa721gagaagctgt

gctatgttgc

cctagacttc

gagcaagaga

tggccactgc

cgcatcctct781tcctccctgg

agaagagcta

tgagctgcct

gacggtcagg

tcatcactat

cggcaatgag841cggttccgat

gccccgaggc

tctcttccag

ccttccttcc

tgggtatgga

atcctgtggc901atccatgaaa

ctacattcaa

ttccatcatg

aagtgtgacg

ttgacatccg

taaagacctc961tatgccaaca

cagtgctgtc

tggtggcacc

accatgtacc

caggcattgc

tgacaggatg1021cagaaggaga

ttactgccct

ggctcctagc

accatgaaga

tcaagatcat

tgctcctcct1081gagcgcaagt

actctgtgtg

gattggtggc

tctatcctgg

cctcactgtc

caccttccag1141cagatgtgga

tcagcaagca

ggagtacgat

gagtccggcc

cctccatcgt

gcaccgcaaa1201tgcttctagg

cggactgtta

ctgagctgcg

ttttacaccc

tttctttgac

aaaacctaac1261ttgcgcaaaa

aaaaaaaaaa

aaaaaaaaaa

aaaaaa//点击点击PCR引物设计PCR基本原理Mg2+AGGCTTAAGGGCATAGTAGGC-5’3’-TAATCCCGATTATCCCGT-3’AGGCCCCGTTTAACCCGTTTAATA5’--3’3’--5’AGGCTTAAGGGCATAGTAGGC5’-3’--5’CCCGTTTAACCCGTTTAACCGTA-3’TAATTA-3’5’-3’-TTAAGGGCATTAAGGGCATAGGC-5’80℃60℃40℃30℃50℃72℃90℃94℃TTAAGGGCATAGTACCCGATTATCCCGT5’-因此,引物设计是整个工作的基础和关键。引物设计的原则1.引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38bp2.引物3’端出现3个以上的连续碱基,特别是GGG

或CCC引物设计的原则3.引物3’端的末位碱基对Taq

酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基。4.5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。

5.引物二聚体或发夹结构也可能导致PCR反应失败。引物二聚体Mg2+CGTATTAAGGGCATTAAGGGCATAGGCGAATMg2+-3’-3’3’-5’--5’TAATDNA聚合酶TAATCATT80℃60℃40℃30℃50℃72℃90℃94℃CATT引物二聚体Mg2+CGTATTAAGGGCATTAAGGGCATAGGCGAATMg2+-3’-3’3’-5’--5’TAATDNA聚合酶TAATCATT80℃60℃40℃30℃50℃72℃90℃94℃CATT引物二聚体Mg2+CGTATTAAGGGCATTAAGGGCATAGGCGAATMg2+-3’-3’3’-5’--5’TAATDNA聚合酶TAATCATT80℃60℃40℃30℃50℃72℃90℃94℃CATT发夹结构5’3’5’3’引物设计的原则

引物二聚体及发夹结构的能值过高:∆G≧4.5kcal/mol产生引物二聚体带,并且降低引物有效浓度而使PCR反应效率降低。

引物设计的原则6.引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。7.引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。

Tm值的计算公式:

Tm=4(G+C)+2(A+T)引物设计的原则引物设计的原则8.∆G值是指DNA双链形成(或者打开)所需的自由能,该值反映双链结构内部碱基对的相对稳定性。应当选用3’端∆G值较低(绝对值不超过9),而5’端和中间∆G值相对较高的引物。引物的3’端的∆G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。这么多要求烦死人了,我抗议!除非……常用的引物设计软件Oligo6(引物评价)*PremierPrimer(自动搜索)*VectorNTISuitDnasisOmigaDnastarPrimer3(在线服务)*常用的引物设计软件PrimerPrimer5.0

的使用技巧简介1、软件安装与主要功能介绍2、引物设计应用举例常用的引物设计软件我们可以通过网上下载或其它方式获得安装软件1、软件安装与主要功能介绍2、引物设计应用举例引物分类:按PCR目的不同可分为检测引物和克隆引物两大类.常用的引物设计软件检测性引物特点:反应灵敏性、扩增特异性克隆性引物特点:产物完整性和保真性PCR引物设计应用举例

1ctgcaggcca

ctggttaccg

ggaattgttc

cggtcaacgc

ggtattaggt

ggcgcgctga61gctatctgat

ccttaacccg

attttgaatc

gtaaaacgac

agcagcaatg

acgcatgtgg121aggctaacag

tgtcgaataa

cgctttacaa

acaattatta

acgcccggtt

accaggcgaa181gaggggctgt

ggcagattca

tctgcaggac

ggaaaaatca

gcgccattga

tgcgcaatcc241ggcgtgatgc

ccataactga

aaacagcctg

gatgccgaac

aaggtttagt

tataccgccg301tttgtggagc

cacatattca

cctggacacc

acgcaaaccg

ccggacaacc

gaactggaat361cagtccggca

cgctgtttga

aggcattgaa

cgctgggccg

agcgcaaagc

gttattaacc421catgacgatg

tgaaacaacg

cgcatggcaa

acgctgaaat

ggcagattgc

caacggcatt481cagcatgtgc

gtacccatgt

cgatgtttcg

gatgcaacgc

taactgcgct

gaaagcaatg541ctggaagtga

agcaggaagt

cgcgccgtgg

attgatctgc

aaatcgtcgc

cttccctcag601gaagggattt

tgtcgtatcc

caacggtgaa

gcgttgctgg

aagaggcgtt

acgcttaggg661gcagatgtag

tgggggcgat

tccgcatttt

gaatttaccc

gtgaatacgg

cgtggagtcg721ctgcataaaa

ccttcgccct

ggcgcaaaaa

tacgaccgtc

tcatcgacgt

tcactgtgat781gagatcgatg

acgagcagtc

gcgctttgtc

gaaaccgttg

ctgccctggc

gcaccatgaa841ggcatgggcg

cgcgagtcac

cgccagccac

accacggcaa

tgcactccta

taacggggcg901tatacctcac

gcctgttccg

cttgctgaaa

atgtccggta

ttaactttgt

cgccaacccg961ctggtcaata

ttcatctgca

aggacgtttc

gatacgtatc

caaaacgtcg

cggcatcacg1021cgcgttaaag

agatgctgga

gtccggcatt

aacgtctgct

ttggtcacga

tgatgtcttc1081gatccgtggt

atccgctggg

aacggcgaat

atgctgcaag

tgctgcatat

ggggctgcat1141gtttgccagt

tgatgggcta

cgggcagatt

aacgatggcc

tgaatttaat

cacccaccac1201agcgcaagga

cgttgaattt

gcaggattac

ggcattgccg

ccggaaacag

cgccaacctg1261attatcctgc

cggctgaaaa

tgggtttgat

gcgctgcgcc

gtcaggttcc

ggtacgttat1321tcggtacgtg

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论