生物细胞增殖听课记录及生物信息学复习总结_第1页
生物细胞增殖听课记录及生物信息学复习总结_第2页
生物细胞增殖听课记录及生物信息学复习总结_第3页
生物细胞增殖听课记录及生物信息学复习总结_第4页
生物细胞增殖听课记录及生物信息学复习总结_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

细胞增殖听课记录教学内容教学环节教学活动听课点评教师活动学生活动旧知识导入新课2

分钟提问:从细胞变化的角度分析,生物体为什么能由小长大?

与鼠相比较,大象的个体很大,是不是组成大象的细胞体积特别大?

评价学生回答后引导学生思考:

事实上,不同动植物的同类器官或组织的细胞大小一般无明显差异,并且生物体内的细胞都是很微小的。为什么细胞不能够无限长大呢?学生回答:是细胞分裂和细胞生长的结果。

不是,主要是因为大象体内的细胞数量多联系学生已有的知识。

创设问题情景,激发学生的探究欲望,主动地参与学习过程。细胞不能够无限长大讲授新课14分钟引导学生分析制定实验方案,组织学生进行模拟探究实验“细胞大小与物质运输的关系”。

在学生实验过程中,指导好学生进行观察:①应该如何切琼脂块才能减少实验误差?②如何判断NaOH的扩散深度并准确测量?

根据实验结果,引导学生思考如何计算NaOH的扩散体积与整个琼脂块体积之比?

通过讨论,让学生主动获得知识,使学生学会用联想的方法将模拟实验的结果迁移到细胞。

倾听学生的讨论结果后继续引导学生思考,既然细胞越小,细胞的物质运输的效率就越高,那么,细胞体积是不是越小越好?按确定方案,学生两人一组进行实验操作,并观察、记录、分析实验结果。通过模拟实验和讨论,学生充分理解了细胞体积越大,其相对表面积越小,细胞的物质运输的效率就越低,细胞表面积和体积的关系限制了细胞的长大。使学生亲身参与探究过程,激发学生的求知欲,有利于学生对知识的建构和科学研究方法的领悟。通过讨论使学生深入思考,并且会用联想的方法将模拟实验的结果迁移到细胞。通过对“细胞体积是不是越小越好?”的讨论还有利于培养学生批判性思维的能力。细胞通过分裂进行增殖讲授

新课5分钟既然细胞体积不能无限长大,那么,生物体积的增大必然要靠细胞增殖来增加细胞数量。细胞是如何增殖呢?

组织学生阅读教材并讨论:

①细胞增殖有什么重要意义?②真核细胞增殖的方式有哪些?③什么是细胞周期?细胞周期包括哪几个阶段?它们在时间分配上有什么特点?

关于细胞周期的概念,教师要引导学生准确理解,只有“连续分裂的细胞”才具有细胞周期,例如皮肤的生发层细胞、根的分生区细胞等。学生自主阅读、思考,并回答有关问题。让学生自主学习,主动建构新知识。高等植物细胞的有丝分裂讲授

新课15分钟教师通过模拟动画逐步展示高等植物有丝分裂各时期的动态过程,与此同时,教师还在黑板上进行有关板图。

在间期,教师要让学生明白染色体复制后可形成姐妹染色单体,由于染色体呈细丝状,在光学显微镜下还看不清楚。染色体复制后,染色体本身的数量并没有发生改变,但是DNA数量加倍,每条染色单体各含有一个DNA。

在前期,教师要引导学生分析出“细胞核中出现了什么、什么消失了”,并且要学生知道是从细胞两极发出的纺锤丝形成纺锤体,染色体散乱分布在纺锤体中央。

在中期,教师要引导学生分析出在纺锤丝的牵引下,染色体的着丝点排列在赤道板上,染色体形态稳定,数目清晰,是观察染色体的最好时期。关于赤道板,要让学生明白是由于它与纺锤体的中轴相垂直而得名,实际上并不存在这个结构。

在后期,教师要引导学生分析出着丝点一分为二,姐妹染色单体分开,成为两条子染色体,在纺锤丝牵引下染色体向两极移动,形成两套数目和形态完全相同的染色体。

在末期,教师要引导学生分析出细胞核中什么消失了?什么重新出现了?植物细胞在赤道板位置上出现了细胞板,进而形成新的细胞壁,最后一个细胞分裂成两个子细胞。最后,教师再一次利用3D动画整体演示有丝分裂过程,使学生更好地理解各时期的特征。学生在教师的引导下观察有关动画、板图,思考并学会概述各个时期的主要特点。让学生通过观察图片、板图来观察细胞内所发生的现象,引起思考,加深理解。课件中的模拟动画可将微观、抽象的生命现象形象生动地呈现在学生眼前,有助于学生更好地理解各时期的特征,也可使学生理解有丝分裂的各个时期是为了研究方便人为划分的,它们实际上是一个动态的连续过程。总结提升

(2分钟)为了及时了解学生对知识的掌握情况,帮助学生梳理知识,突出重难点。我在讲完有丝分裂的特点后还进行了如下的小结:1、染色单体的形成和消失分别发生在什么时期?

2、DNA数量加倍发生在什么时期?

3、染色体数量加倍发生在什么时期?4、与高等植物细胞有丝分裂有关的细胞器有哪些?应用

反馈

(2分钟)课本P114的基础题第1、2、3题,拓展题的第2题学生独立思考后回答(答案参见课件)知识内化、迁移【教学反思】

本堂课的教学内容比较多,时间十分紧凑,教师一定要合理安排好各个环节的教学内容,做到重点突出。为此,我充分运用了“问题探究教学法”,尽力挖掘学生原有的知识、经验,注重学生的学习过程,体现学生主体性学习,使学生由知识的接受者转变为知识的探索者和研究者,最大限度地培养了学生实验操作能力、处理问题能力、获取信息能力以及逻辑推理等能力。

本节课教学内容十分抽象、微观,学生学起来觉得比较困难。为此,我很注重课程资源的选择、整合和优化。通过课件逐步演示有丝分裂各时期的特点,很好地让学生感受了细胞分裂过程的动态性和连续性。黑板板图的应用又克服了多媒体手段转瞬即逝的弊端,较好地化难为易,化抽象为形象,取得了良好的教学效果。

此外,我还将模拟实验引入课堂,通过探究学习、自主学习和合作学习,发挥了学生的主体作用,使学生感知知识的形成,领悟科学的研究方法──模拟方法,更有助于知识的建构,取得了很好的教学效果。这种亲身探究、生生互动的教学场景和开放式的教学模式、学习方式正是新课程改革所倡导的。但是,在探究性学习过程中,教师如何做好引导、指导工作,如何调动每一位同学的积极性,还有待于进一步研究。生物信息期末总结生物信息学(Bioinformatics)定义:(第一章)★生物信息学是一门交叉科学,它包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具来阐明和理解大量数据所包含的生物学意义。(或:)生物信息学是运用计算机技术和信息技术开发新的算法和统计方法,对生物实验数据进行分析,确定数据所含的生物学意义,并开发新的数据分析工具以实现对各种信息的获取和管理的学科。(NSFC)2.科研机构及网络资源中心:NCBI:美国国立卫生研究院NIH下属国立生物技术信息中心;EMBnet:欧洲分子生物学网络;EMBL-EBI:欧洲分子生物学实验室下属欧洲生物信息学研究所;ExPASy:瑞士生物信息研究所SIB下属的蛋白质分析专家系统;(ExpertProteinAnalysisSystem)BioinformaticsLinksDirectory;PDB(ProteinDataBank);UniProt数据库3.生物信息学的主要应用:1.生物信息学数据库;2.序列分析;3.比较基因组学;4.表达分析;5.蛋白质结构预测;6.系统生物学;7.计算进化生物学与生物多样性。4.什么是数据库:★1、定义:数据库是存储与管理数据的计算机文档、结构化记录形式的数据集合。(记录record、字段field、值value)2、生物信息数据库应满足5个方面的主要需求:(1)时间性;(2)注释;(3)支撑数据;(4)数据质量;(5)集成性。3、生物学数据库的类型:一级数据库和二级数据库。(国际著名的一级核酸数据库有Genbank数据库、EMBL核酸库和DDBJ库等;蛋白质序列数据库有SWISS-PROT等;蛋白质结构库有PDB等。)4、一级数据库与二级数据库的区别:★1)一级数据库:包括:a.基因组数据库----来自基因组作图;b.核酸和蛋白质一级结构序列数据库;c.生物大分子(主要是蛋白质)的三维空间结构数据库,(来自X-衍射和核磁共振结构测定);2)二级数据库:是对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。一般说来,一次数据库的数据量大,更新速度快,用户面广,通常需要高性能的计算机服务器、大容量的磁盘空间和专门的数据库管理系统支撑。二次数据库的容量则小得多,更新速度也不像一次数据库那样快,也可以不用大型商业数据库软件支持,这类针对不同问题开发的二次数据库的最大特点是使用方便,特别适用于计算机使用经验不太丰富的生物学家。5、一个数据库记录(entry)一般由两部分组成:1)原始序列数据(sequencedata);2)描述这些数据生物学信息的注释(annotation):注释中包含的信息与相应的序列数据同样重要和有应用价值。6、数据的完整性和注释工作量:1)序列数据广,序列注释不够完整;2)库数据面窄,序列注释全面.7、数据库的动态更新:1)不断增加;2)不断修正.5、几个大型数据库简介:NCBI、EBI、SIB(共点:拥有庞大的一级数椐库、大量工具软件和广泛的外联。)1、NCBI():NCBI是指美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI),成立于1988年,其主要工作是开发以GenBank为代表的数据库,进行计算生物学研究,开发用于分析基因组数据的软件工具,发布生物医学信息。1)Entrez(集成化的数据库)(/gquery/)Entrez是NCBI著名的用于提取序列信息的工具,它将科学文献、DNA和蛋白质序列数据库、蛋白质三维结构数据、种群研究数据以及全基因组组装数据整合成一个高度集成的系统。类似于EBI的SRS(见下文),是一个查询、提取和显示系统。Theoriginalversion(原始版本)(1991)ofEntrezhadjust3nods。2)可查Protein、PubMed(生物医学文献数据库)、Nucleotide、Genome、Gene、Pathway等相关信息。2、EMBL-EBI(www.ebi.ac.uk)EMBLNucleotideSequenceDataLibrary(nowknownasEMBL-Bank)为世界上第一个核酸序列数据库(1980)。欧洲分子生物学实验室下属欧洲生物信息学研究所(EuropeanBioinformaticsInstitute,EBI,1992,英国)EMBL-EBI核酸数据库提供了序列搜索的服务。通过它的序列提取系统—SRS6(搜索引擎),我们可以用十几种不同的方法(如用关键字)搜索我们想要的序列。EBI还资助了Ensembl项目,Ensembl是一个用于对各类物种基因组进行生物信息学分析的非常完备的网站。欧洲分子生物学实验室EMBL(TheEuropeanMolecularBiologyLaboratory)。Services、UniProt、ArrayExpress、Ensembl、InterPro、PDBe等界面。3、SIB()瑞士生物信息研究所(SwissInstitueofBioinformatics,SIB,30March1998

)。用于获取蛋白质序列和相关数据的最有用的资源之一就SIB提供的蛋白质专家分析系统:SWISS-PROT,ExPASy(ExpertProteinAnalysisSystem瑞士日内瓦大学专家蛋白质分析系统(http://www.expasy.ch/))。6、核酸序列数据库:1、国际上权威的核酸序列数据库:(1)欧洲分子生物学实验室的EMBL;(2)美国生物技术信息中心的GenBank;(3)日本遗传研究所的DDBJ,(http://www.ddbj.nig.ac.jp/);这三个数据库是综合性的DNA和RNA序列数据库,每条记录代表一个单独、连续、附有注释的DNA或RNA片段。三个数据库中的数据基本一致,仅在数据格式上有所差别,对于特定的查询,三个数据库的响应结果一样。2、INSDC国际核酸序列数据库协会:1998年,GenBank、EMBL和DDBJ共同成立了国际核酸序列数据库协会(InternationalNucleotideSequenceDatabaseCollaboration,INSDC),三大核酸数据库之间每天将新测定或更新的数据进行交换共享,保证数据信息的完整与同步,每两个月更新一次版本。(/)7、蛋白质序列数据库:1)PIR(ProteinInformationResource);(/)2)SWISS-PROT;(http://www.expasy.ch/sprot/sprot-top.html)3)TrEMBL;(http://www.ebi.ac.uk/trembl/index.html)是与SWISS-PROT相关的一个数据库。包含从EMBL核酸数据库中根据编码序列(CDS)翻译而得到的蛋白质序列,并且这些序列尚未集成到SWISS-PROT数据库中;4)NCBI美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI);5)UniProt;通用蛋白质数据库(/)包括:(Swiss-Prot、TrEMBL、PIR)用户可以通过文本查询数据库,可以利用BLAST程序搜索数据库,也可以直接通过FTP下载数据。8、生物大分子结构数据库:1)PDB(ProteinDataBank);(/)2)MMDB(MolecularModelingDatabase);(/Structure/)9、其它生物分子数据库:1)单碱基多态性数据库dbSNP;2)基因组数据库(GDB);3)人类基因组数据库Ensembl;4)表达序列标记数据库dbEST;5)序列标记位点数据库dbSTS;6)面向基因聚类数据库UniGene;7)蛋白质结构分类数据库SCOP;8)蛋白质二级结构数据库DSSP;9)蛋白质同源序列比对数据库HSSP;10)OMIM(OnlineMendelianInheritanceinMan),是关于人类基因和遗传疾病的分类数据库。。。》》》NucleicAcidResearch《《《附:1、NCBI和EBI使用的搜索引擎分别是什么?答:NCBI使用的是Entrez,EBI使用的是SRS。2、FASTA格式有哪些部分组成,以什么字符开始?答:包含ginumber,Databaseidentifiers,Accessionnumber,Locusname等部分,以>字符开始。3、NCBI的WEB和离线序列提交软件是什么?答:WEB提交工具:Bankit;离线提交:Sequin4、系统生物学:答:确定、分析和整合生物系统在遗传或环境扰动下所有内部元件间相互作用关系的一门学科。10、序列数据的文件格式:(第二章)格式主要有三种:DNA/RNA/氨基酸代码的标识(B、Z);GenBank数据格式;FASTA数据格式。一、GBFF(GenBankflatfile)—GenBank平面文件格式:GenBank、EMBL、DDBJ每天都相互同步更新各自的数据库,那么它们是怎样交换数据的呢?这里引入GBFF(GenBankflatfile即GenBank平面文件)格式。GBFF是GenBank数据库的基本信息单位,是最为广泛使用的生物信息学序列格式之一。GBFF文件分为三部分:a.头部包含整个记录的信息(描述符);b.第二部分包含了注释这一记录的特性;c.第三部分是核苷酸序列本身。(注:所有序列数据库记录都在最后一行以“//”结尾。)GBFF:LOCUS行(LOCUS,SCU49845,5028bp,DNAlinear,PLN,21-JUN-1999)所有GBFF都起始于LOCUS行:第一项:是LOCUS名称(SCU49845):现在唯一的作用是它在数据库中是独一无二的,已不再具有任何实际意义。大多数情况下,它仅使用检索号码(accesessionnumber)以满足对LOCUS名称的要求;第二项是序列长度(5028bp):规定单条数据库记录的长度不能超过350kb。除历史原因外,GenBank已经很少接受长度低于50bp的序列了;第三项表明分子类型(DNA):其序列必须是一种单一的分子类型;第四项是GenBank分类码(PLN):由3个字母组成。现在其作用仅限于在下载数据库时对数据库作简单的分类。最后一项是其最后修订日期(21-JUN-1999):有时也仅表示数据首次公开日期。GBFF:DEFINITION行(definition)(DEFINITIONSaccharomycescerevisiaeTCP1-betagene,partialcds;andAxl2p(AXL2)andRev7p(REV7)genes,completecds.)LOCUS行的下一行为DEFINITION行:主要对GenBank记录中所含的生物学意义做出总结。它的说明内容包括了来源物种、基因/蛋白质名称。若序列是非编码区,则包含对序列功能的简单描述;若是一段编码区,则标明该序列是部分序列(partialcds)还是全序列(completecds)。GBFF:ACCESSION行(accession)检索号行(ACCESSIONU49845)检索号(accession)是序列记录的惟一指针。通常由1个字母加5个数字(U12345)或由2个字母加6个数字(AF123456)组成。它在数据库中是惟一而且不变的。有时ACCESSION行中可能会出现多个检索号,可能是由于数据提交者提交了一条与原记录相关的新记录或新提交的记录覆盖了原有的旧记录。我们称第一个检索号为主检索号,其余的统称为二级检索号。GBFF:VERSION行(version)版本号行(VERSIONU49845.1GI:1293613)VERSION行是版本号,格式为:检索号.版本号。版本号用于识别数据库中一条单一的特定核苷酸序列。在数据库中,如某条序列数据发生了变化,即使是单碱基的改变它的版本号也将增加,而其检索号保持不变。版本号系统与其后的GI(geninfoidentifier)号系统是平行运行的。即当一条序列改变后,它将被赋予一个新的GI号,其版本号也将增加。蛋白质的翻译发生任何变换,核酸序列都将被赋予一个新的GI号。5)GBFF:KEYWORDS行(keywords)关键词行(KEYWORDS.)关键词行是用来描述序列的。如果该行没有任何内容,那么就只包含一个“.由于没有对照词汇表,故NCBI/GenBank拒绝接受关键词,它只存在于旧的记录中。6)GBFF:OURCE行(source)来源行(SOURCESaccharomycescerevisiae(baker'syeast)ORGANISMSaccharomycescerevisiaeEukaryota;Fungi;Ascomycota;Saccharomycotina;Saccharomycetes;Saccharomycetales;Saccharomycetaceae;Saccharomyces.)对来源行(SOURCE)没做特殊的规定,它通常包含序列来源生物的简称,有时也包含分子类型。在下面以NCBI的分类数据库为依据,指明物种的正式科学名称。7)GBFF:REFERENCE行reference参考文献行(REFERENCE1(bases1to5028)AUTHORSTorpey,L.E.,Gibbs,P.E.,Nelson,J.andLawrence,C.W.TITLECloningandsequenceofREV7,agenewhosefunctionisrequiredforDNAdamage-inducedmutagenesisinSaccharomycescerevisiaeJOURNALYeast10(11),1503-1509(1994)PUBMED7871890)参考文献行将与该数据有关的参考文献均收录在内。将最先发表的文献列于第一位。如果序列数据没有被相关文献报道,该行将出现“unpublished”或“inpress”。最后将有一个可能的PUBMED指针。8)GBFF:FEATURES行(features)特性表行(FEATURESLocation/QualifiersCDS<1..206/codon_start=3/product="TCP1-beta"/protein_id="AAA98665.1"/db_xref="GI:1293614"/translation="SSIYNGISTSGLDLNNGTIADMRQLGIVESYKLKRAVVSSASEAAEVLLRVDNIIRARPRTANRQHM"gene687..3158/gene="AXL2"......)特性表(features)描述基因和基因的产物以及与序列相关的生物学特性。特性表提供一个参考词汇表以对合法的特性进行注释。这些特性包括:1、该序列是否执行一个生物学功能;2、它是否与一个生物学功能的表达相关;3、它是否与其它分子相互作用;4、它是否影响一条序列的复制;5、它是否与其他序列的重组相关;6、它是否是一条已识别的重复序列;7、它是否有二级或三级结构;8、它是否存在变异或者它是否被修订过。特性表格式是按表单的方式设计的,分三个主要部分:1)特性表关键词(feature),简要说明功能组;2)特性位置(location),指明在特性表中的什么地方可以找到相关特性,在此可以包含操作符(operator)和功能性描述符(descriptor)以指明序列需经过怎样的处理才能得到相应的特性;3)限定词(qualifier),相关特性的辅助信息,限定词组使用一组标准化的对照词汇表以利于计算机从中提取信息。(这段序列可以解读为:该编码序列(CDS)起始于第1碱基,终止于第206碱基,它的产物是TCP1-beta,基因名为“AXL2”。)9)GBFF:ORIGIN(origin)(ORIGIN1gatcctccatatacaacggtatctccacctcaggtttagatctcaacaacggaaccattg61ccgacatgagacagttaggtatcgtcgagagttacaagctaaaacgagcagtagtcagct......4981tgccatgactcagattctaattttaagctattcaatttctctttgatc)在GBFF文件的最后,以类似于FASTA格式的方式给出了所记录的序列。二、FASTA数据格式(FASTAformat):Accessionnumbersarelabelsforsequences(检索号)11、RefSeq资料库:(NCBIReferenceSequenceDatabase参考序列数据库)RefSeq资料库是NCBI将GenBank的序列再做详细整理的non-redundent序列资料库,它的序列格式和GenBank几乎完全相同,但因为是完全不同的独立资料库,为与GenBank区别,RefSeq的AccessionNumber(检索号)格式和GenBank的不同。该数据库所收集的参考序列一直在不断地被修改中,尽管如此,NCBIRefSeq仍是目前最可信赖的序列数据库。GenBank中一个基因的索引号可能有上百个,但对应一个基因的RefSeq只有一个。(/RefSeq/)NCBI参考序列数据库(RefSeq)旨在提供一个全面的、集成的、冗余,好的注释组序列,包括基因组DNA、转录和蛋白质。RefSeq是医学、功能和多样性研究的基础;它们提供一个稳定的参考基因组注释、基因识别和表征,突变和多态性分析(特别是RefSeqGene记录),表达研究和比较分析。e.g.>数据库检索实例<:搜索Genbankno.FJ798090,获得序列相关信息进入NCBI网站,选择nucleotide:FJ798090搜索,得到相关信息;从CDS行可看到有关Aa的信息,从ORIDIN行可看到DNA相关信息;在原网页上选择右边相关信息选择框的PubMed,查看关联文章;主页进入DNA&RNA,选择tools,点第二个BatchEntrez,批量下载序列;提交结果,显示参数与序列下载(Send选项、选File、然后选FASTA格式),下载序列,提交序列。12、提交序列:1、提交方式主要有三种:1)、Bankit逐条提交、需要注册;2)、Sequin10000条以下;3)、Tbl2asn超过1万条、命令行。2、Bankit提交:先注册,后点NewSubmission(创建一个新提交),SequencingTechnology(测序技术),nucleotide(核酸),Organism(生物体),SubmissionCategory(提交类别),SourceModifiers(源寄存器修改),Primers(引物),Features(特性),ReviewandCorrect(检查和纠正,3处)。3、SequinDNA分析软件:(ADNASequenceSubmissionandUpdateTool)序列提交:研究产生的新序列,需要递交到公共数据库保存;需要撰写论文发表新序列时,需要数据库接受号。4、WEB在线提交工具:1、NCBI的Bankit;2、EBI的WEBIN;3、DDBJ的SAKURA;5、离线提交:NCBI的Sequin。6、提交比较:Bankit提交:使用简单,每个步骤有详细说明。但一次只能提交一个序列,长度不能太长;Sequin:安装在用户自己的计算机上,可同时递交若干序列和较长序列,而且整合了许多有用的序列注释工具。13、引物设计及测序结果分析:(第三章)1、引物设计流程:1)序列查找与下载(GenBank);2)序列同源性比较(Blast/alignment);3)引物设计与筛选(primer3/其他);4)引物加工与修饰(酶切、保护、标签、启动子等);5)引物评价分析(Oligo6);6)引物二次筛选(blast);7)引物最终评估(band);2、引物设计原则:基本原则:1)引物与模板的序列要紧密互补;2)引物与引物之间避免形成稳定的二聚体或发夹结构;3)引物不能在非靶点引发DNA聚合反应。注意点:1、引物长度在15-30bp之间;2、GC含量为40-60%之间;3、引物的特异性(3’端不能有连续的GGG或CCC);4、3’△G的绝对值不超过9,双链形成所需自由能;5、密码子的兼并:3’不要位于密码子的第3位。3、引物设计软件:1)在线工具Primer3、Primer-Blast;2)本地软件PrimerPremier5;3)引物评估软件Oligo6。e.g.在线设计引物:在Primer3界面上将需要设计的序列粘贴复制进入大方框,确定基本参数和结果参数后,点击pick键后出现output页面,将所需的序列即一定要PCR出的序列用中括号括上,再复制进大方框。这两者的差别是第一个是随机的引物,而第二个选出的引物必然包含你所需的那一段。KEYS(inorderofprecedence)优选引物:(******target,>>>>>>leftprimer,<<<<<<rightprimer)4、Oligo7手工设计引物:上游ATGGGAAAAGACTATTACAAAATC下游TCAATTCGGCAGCGTATCGTAGAG选择引物长度→选定上下游引物→3’△G绝对值不能超过9→DuplexFormation二聚体分析、Hairpinformation发夹分析(△G不能超过4.5)→成分和Tm→错误引发位点分析:一般在100以下,若正确引发效率达到400,可承受超过100多点→PCR最终分析评价→引物二次筛选(上下游引物在ncbi中进行blast分析(搜索primerncbi)并输入设计的引物,选择nr数据库)→引物最终评估(大小、特异性、效率)→保护碱基与酶切位点(BamHⅠ,NotⅠ)。5、测序结果分析:(一、Sanger法测序;二、测序图查看;三、序列拼接。)Sanger法测序:流程:(1.PCR扩增;2.产物纯化;3.测序反应;4.电泳分离);DNA测序的实验方法:(末端终止法);测序图查看软件:Chromas、Seqman…;不好的结果:杂峰、套峰。e.g.序列拼接实例:1.SeqMan软件启动界面;2.原始测序文件导入软件;3.Assemble(装配);4.StrategyofContig(重叠群策略)Contig→Strategyview和Contig→Alignmentview→去除矛盾碱基和缺口(手动删除、修改可疑碱基)→导出拼接序列。14、核酸序列分析:(第四章)(常规分析、比对分析、基因结构识别)1、常规分析:(序列的检索、序列组分分析、序列变换、限制性酶切分析)1、核酸序列检索:(Entrez、SRS)2、核酸序列组分分析:(Bioedit→分子量;DNAMAN→碱基组成;EditSeq→碱基分布)EditSeq(碱基组成:Goodies→DNAStatistic);Bioedit(碱基组成Sequence-àNucleicAcidàNucleotidecomposition);Bioedit:一种对基因序列进行分析加工或序列拼接的软件。3、序列变换:(反向互补序列EditSeq→Goodies→Reversecomplement;反向序列EditSeq→Goodies→ReverseSequence)4、限制性酶切分析:(BioEdit→Sequence→NucleicAcid→RestrictMap在线:NEBcutter、WebCutter、Rebase)2、比对分析:意义:推测基因和蛋白质的进化演变规律;推测基因和蛋白质的结构和功能;基本假设:序列的保守性→功能的保守性;工具:Blast和ClustalX;BLAST比对(BasicLocalAlignmentSearchTool,基本局部比对搜索工具)BLAST程序的中心思想是将序列切割成一段一段来比较。这两段序列长度为W(分别来自提交序列,与数据库),比对分值>T。主要分三步进行:(第一步:由查询序列生成的长度固定(W=3)的字段编译列表(Score>T);第二步:在数据库中扫描获得与编译列表中的字段匹配的序列记录,作为后续延伸的种子seed;第三步:对于每一对选择出来的种子,将其向两边延伸,使其在尽可能长的距离得到尽可能多的分数。)比对结果的判读:比对结果的显著性以E值(Expectvalue)来衡量,E值趋向于0时,说明比对结果越显著。E值的意义就是概率;比对得分(bitscore):表明序列比对的得分,数值越高,两序列越相似。【作业:以纤维素酶基因序列为靶标,进行核酸组分分析,NCBI中比对你的序列,至少使用blastn,blastx并下载不少于十个比对出来的序列。】回头来看NCBI参数选择:(blastp、blastn)①LimitbyEntrezQuery:任何NCBIBLAST搜索的范围都可以用在Entrez搜索中使用的任何一种范围限定词来限定;②Maxtargetsequences:比对之后显示的最大的比对序列的数目;③期望expect:期望值E是得分大于或等于某个分值S的不同的比对的数目在随机的数据库搜索中发生的可能性。这个数值表示你仅仅因为随机性造成获得这一联配结果的可能次数。对于blastn、blastp、blastxt和blastn期望值的默认设置是10。在这个E值下,随机出现得分等于或高于比对得分S的期望数为10个(这里是假设用与实际的查询序列长度相等的随机的查询序列搜索数据库)。当将期望选项值调小时,返回的数据库搜索结果将变少,匹配被搜索到的概率也会变小。增大E值将返回更多的结果;④字段长度wordsize:对于蛋白质搜索,窗口大小可以被设定为3(默认值)或者2。当用一个查询序列来进行数据库搜索时,BLAST算法首先将查询序列分割成一系列具有特定长度(字段长度)的小的序列段(字段)。实际应用中对于蛋白质搜索很少需要改变字段的长度;对于核酸序列,默认的字段长度是28,BLAST的字长缺省值为28,即BLASTN将扫描数据库,直到发现那些与未知序列的28个连续碱基完全匹配的28个连续碱基长度片段为止。然后这些片段(即字)被扩展。降低字段长度将会使搜索变得更准确同时也会变得更慢;⑤矩阵matrix:对于blastp的蛋白质-蛋白质搜索有5种氨基酸替代矩阵:PAM30、PAM70、BLOSUM45、BLOSUM62(默认值)以及BLOSUM80。一些其他的BLAST服务器还提供了很多其他的替代矩阵,如PAM250。通常情况下明智的选择是在一次BLAST搜索中使用几种不同的打分矩阵;⑥Compositionaladjustments:这个选项是默认选择的,一般来说可改善E值的统计计算和提高灵敏度(减少返回的假阳性结果的数目);2)blast2双序列比对:Blast比对后,当数据库中搜索到多个显著相似的序列时,检测目的序列是否与之有真正关联,可进行双序列比对PairwiseAligment。Ncleotide:Hsp40ORFVSbm40(改变参数)点阵图Dotmatrixview:连续线表示序列匹配指出,缺口表明量序列不匹配之处。比对结果:3、基因结构识别:包括:(ORF识别;启动子与转录因子结合位点分析;重复序列分析;CpGisland)ORF识别:Kozak原则:1、第四位的偏好碱基为G;2、ATG的5‘端约15bp范围内的侧翼序列内不含碱基T;3、在第3、6、9位,G为偏好碱基;4、除第3、6、9位,在整个侧翼序列中,c为偏好碱基。常见ORF在线预测工具:(ORFFinder;GeneMark,hmm;Glimmer原核生物;GlimmerHMM真核生物)(ORF的验证:Blast)。2)启动子及转录因子结合分析:PromoterScan;3)重复序列分析:repeatmasker;4)CpGisland:CpGPlot;(CpGisland通常位于启动子附近)CpG双核苷酸在人类基因组中的分布很不均一,而在基因组的某些区段,CpG保持或高于正常概率,这些区段被称作CpG岛。在哺乳动物基因组中的1~2kb的DNA片段,它富含非甲基化的CpG双倍体。CpG岛主要位于基因的启动子(promotor)和第一外显子区域,约有60%以上基因的启动子含有CpG岛。GC含量大于50%,长度超过200bp。15、DNA双序列比对PairwiseSequenceAlignment原理:(第五章)1、比什么?给定两条序列(DNAorprotein)Seq1:CATATTGCAGTGGTCCCGCGTCAGGCTSeq2:TAAATTGCGTGGTCGCACTGCACGCT它们存在多大程度的相似?CATATTGCAGTGGTCCCGCGTCAGGCTTAAATTGCGT-GGTCGCACTGCACGCT2、为什么比?(发现功能、研究进化、某条序列的关键特征、疾病的鉴定)3、序列变化:三种类型的变化包括:Substitution(点突变)、Insertion(插入)、Deletion(删除),后两个统称为Indel(插入缺失)。4、为达到比对两序列的目的,我们需要一个定量模型来评估两序列,如何定量两序列间的相似性?全局比对(Globalalignment):是对给定序列全长进行比较的方式。在待比较的两个序列中引入空位(gap),使得对序列的全长都得到比较,Needleman-Wunsch算法。全局序列比对,比对的是全部序列。建立一个得分矩阵,A序列在上方,B序列在左侧,方格(i,j)的数值是A(0-i)到B(0-j)的最佳比对。全部比对的得分在最下角。局部比对:获得两序列最佳匹配的区域,有时与全局

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论