




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因与基因组及相关技术一、基因的概念:基因(gene)
是一段携带功能产物(多肽,蛋白质,tRNA和rRNA和某些小分子RNA)信息的DNA片段,是控制某种性状的的遗传单位。估计,人类约有2.6万个基因不同生物,基因的数量、结构及组合方式不同第一节基因与基因组在早期,Morgan等把遗传性状与特定的染色体区段联系起来,并提出“一个基因,一个酶”和“一个基因,一条多肽链”的概念。真正转录终止点GCGC-CAAT-TATA..ATGAATAAA修饰点外显子内含子翻译起始转录起始TATA盒(Hognessbox)CAAT盒GC盒增强子切离加尾真核生物RNApolⅡ转录的基因翻译终止基因的特点和鉴别方法编码tRNA和rRNA和某些小分子RNA的基因:
我们较易通过核酸序列加以判断。蛋白质编码基因:
目前可根据其特点使用五项标准来鉴别但这些标准使用起来却并不得心应手。1.开放阅读框(openreadingframe,ORF)*是始于起始密码子并终于终止密码子的一串密码子。*从mRNA中找出大的ORF来确定编码蛋白质的基因;*适合于从DNA序列中鉴别原核生物基因和含少量内含子的真核基因。*但对于一些短少的基因及一些内含子丰富的基因则很难鉴别。基因基因组DNA启动子等5’非编码区3’非编码区ATG编码区TAAORFmRNA2.序列特征——密码子偏爱和剪接点*密码子偏爱(codonbias)指在不同物种的基因中经常为某种氨基酸编码的只是其中的一个密码子。当鉴别到一个ORF时,密码子偏爱常常用来确定这个ORF是否是一个基因。*基因的剪接位点(splicesites)一般有特定的序列特征,计算机程序利用这种序列特征可预测将近50%的外显子及20%的完整基因。3.序列保守性*一个功能在不同物种内是保守的基因,大都表现出外显子的保守性和内含子的多变性。*最好是对适当进化距离的物种间序列进行比较。*但保守性序列也可能是非转录的调控单元。*寻找基因的表达产物——RNA或蛋白质,是鉴定一个基因的有效方法。*但有些OFR似乎并不转录,因为检测不到它们的RNA或蛋白质产物。4.转录产物
除以上鉴定基因的五项标准之外,在实施过程中还有些麻烦的问题,如重叠基因、变通性断裂基因、假基因等。*使基因失活也是确认基因功能的一个方法。*但许多编码序列的失活并不导致一个明显的表型,因而很难找到鉴定的标准。5.基因失活二、基因组的概念:基因组(genome)是指一个细胞或生物体的一套完整的单倍体遗传物质。
对二倍体高等生物来说,维持配子正常功能最低数目的一套染色体遗传物质,构成一套基因组。
原核生物和真核生物基因组又分染色体基因组与染色体外基因组,后者如原核生物的质粒DNA,真核生物的线粒体DNA及叶绿体DNA。人类基因组24个染色体(22+X+Y)约3.0×109bp1.基因组大小与C值佯谬基因组大小在不同生物之间差异很大;如HBV仅3200bp,而某些显花植物和两栖类动物可达1011bp。基因组大小用C值(Cvalue)表示;C值大小基本上反映生物进化程度的差异;但这种相关性并不很精确;这种生物体的进化程度与基因组大小之间不完全成比例的现象称为C值佯谬(Cvalue
paradox
);C值矛盾主要是由于各种生物基因组的结构特征的差异造成的,低等和高等生物差别明显。2.基因总数与N值佯谬
基因总数(N表示)人类不足3万个,仅比大肠杆菌大7倍,比低等动物秀丽线虫大1.6倍,而水稻高达5万。果蝇在进化上比秀丽线虫高等,基因总数只有后者的0.6倍。基因组中基因数目与生物进化程度或复杂程度的不对称性,称为N值佯谬(Nvalueparadox)。问题与可能的解释问题:既然一切生物性状都是由基因决定的,那么生物体的DNA含量(C值)和质量(N值)就应该与生物进化阶梯及复杂性成正相关。
可能的解释生物体结构与功能的复杂程度不仅取决于一定的基因数量,更重要的是在于基因功能及其相互作用网络的复杂性和精确性。三、真核生物基因组特点(一)分子量很大的DNA与蛋白质形成染色体存在于核内。人类染色体约30亿bp(二)转录与翻译不同步,转录产物为单顺反子,功能相关基因分散排布,无操纵子结构(三)基因组存在高比例的非编码顺序(noncodingsepuence,NCS),NCS可作进化标尺?(四)大量重复序列(repeatsequence)存在。高度重复顺序(f>105)中度重复顺序(f:10~104)单拷贝顺序——编码蛋白质重复顺序基因顺序重复顺序的功能:1)编码某些重要的功能性蛋白、rRNA、tRNA等2)与染色体构象、着丝粒形成有关3)参与基因的表达调控重复顺序1.倒位(转)重复顺序指两互补顺序呈反向排列,形成回文结构或发夹状结构2.串连重复顺序由相同的核心顺序(2~70bp)成串(头尾相接)排列而成的高度重复顺序。约占整个基因组的10%卫星DNA(satelliteDNA)分3类:——大卫星DNA(macrosatelliteDNA),即经典的卫星DNA,由数十个核苷酸的重复单位构成,主要存在于异染色区和着丝粒。又分I、II、III、IV和α、ß卫星DNA。——小卫星DNA(minisatelliteDNA),由6~12个核酸的重复顺序组成,位于染色体端粒及其附近,长度数十~数千bp——微卫星DNA(microsatelliteDNA),或称简短串连重复,由2~6个核苷酸的重复顺序组成,如(CA)n、(GA)n、(TA)n,n为15~30具有多态性,卫星长度常小于100bp,大量分布每条染色体。且卫星两侧的顺序是特异的,故可以PCR检测,可作为遗传连锁分析的标志。微卫星DNA顺序可能还与癌基因或抑癌基因的表达调控有关,亦可作为散发性肿瘤的研究标志3.散在重复顺序为中度重复顺序,约占染色体组的20%,散在分布于基因组内。——如Alu家簇或称Alu顺序,由300bp短序列构成,其中有一个Alu酶切位点(AG/CT),被切成130bp和170bp二个片段。Alu顺序分散于整个基因组中,平均5kb就有一个。是人类基因组所特异的,可作为鉴别人类基因的天然标志。(只存在于灵长类)Alu家簇称短的散在重复顺序(长度小于500bp),Kpn家簇则称长的重复顺序(长度大于500bp)散在重复顺序可能是转座子170bp130bpAluI酶切位点(AGCT)外部重复序列富含CpG的重复序列插入序列(五)基因多为不连续的,被插入序列(IS)所分隔
断裂基因由内含子(intron)(非编码序列)和外显子(exon)(编码序列)交替组成。这种现象称为断裂基因(splitgene)
内含子和外显子在编码不同蛋白的时可转换角色
除少数蛋白(a,ß-interferon和组蛋白)外几乎所有基因都有内含子。内含子功能未知!GT/AG规则:GT---intron---AG三、真核生物基因组特点
2AAA--AAAGpppG5GpppG
AAA--AAA
4AAA--AAAGpppG
3转录断裂基因及其转录、转录后修饰
7.7kb12
3
4
5678ABCDEFG
1
卵清蛋白基因intronexon(六)功能相关基因构成各种基因家族
基因家族的各个基因可以相距很远(甚至在不同染色体上),亦可以串连地成簇排列,但都各自转录。1)核苷酸序列相同:成簇或成串排列,如rRNA基因家族、tRNA基因家族和组蛋白基因家族2)核酸序列高度同源:如生长激素基因家族、α-珠蛋白基因家族3)编码产物的功能或功能区同源:基因全长序列相似性较低,但产物具有保守的功能区。如src癌基因家族都有同源的蛋白激酶结构域基因家族(genefamily)概念:指核苷酸序列或编码产物的结构具有一定同源性的一些基因。5)假基因(Ψ):在多基因家簇中,有的成员并不表达基因产物,称~假基因可能与有功能基因同源,可能由于基因突变而失活假基因普遍存在,可能为进化的痕迹4)基因超家族(
genesuperfamily):结构上具有一定的相似性,但功能不一定相似,且进化上的亲缘关系较远。如免疫球蛋白基因超家族、丝氨酸蛋白酶基因超家族等ξ2Ψξ1Ψα2Ψα1α2α1θα珠蛋白基因
εGγ
Aγ
Ψβ
δ
ββ珠蛋白基因胚胎基因胎儿基因成人基因假基因一、基因组学概念及范畴基因组学(genomics)发展和应用基因作图、DNA测序、基因定位等新技术以及计算机程序,分析生命体(包括人类)全部基因组结构及功能。第二节基因组学基因组学的亚领域和研究内容二、人类基因定位的基本方法家系分析法——发现感兴趣的基因
通过分析统计家系中有关遗传性状的连锁情况和重组率而进行基因定位的方法。连锁分析法(linkageanalysis)摩尔根1910年提出连锁定律,发表了“基因论”:(1)相引是两个基因位于同一染色体上,相斥则反之(2)同源染色体在减数分裂时发生交换(3)位置相近的因子相互连锁。(二个性状)交换值=新组合数/(亲本组合数+新组合数);交换值从0~50%;同一条染色体上二个基因间的距离越远交换值越大;交换值为0时为完全连锁(二个性状总是同时出现);二个基因间的遗传学距离(图距)用单位cM表示(厘摩)表示(1%交换值为1cM
)这是HGP遗传连锁图的制作原理减数分裂过程中的同源染色体交换1)性连锁分析——最常用的家系分析法如果其性状只出现于男性,则基因位于Y染色体;如果其性状是隔代交叉遗传,亦即外祖父的某些性状不出现于其母亲,却出现在其外孙子身上;由于男性的X染色体总是传给女儿,一般不直接从父到子遗传,所以这个基因应位于X染色体上。如果二个性状都表现出隔代遗传,则这二基因都位于X染色体上;外祖父法——确定二个X染色体连锁基因的遗传学距离。如X染色体连锁的色盲基因和蚕豆病基因。2)染色体标记连锁分析法当已知染色体上的某种标记与某个基因间的连锁关系后,亦可通过家系分析法将基因定于染色体上,并计算出重组率确定遗传学距离。
如Donahue发现自己家系的1号染色体长臂近着丝粒区变长,是一个可遗传标记;随后又发现这一标记与Duffy血型具有平行性(连锁关系),从而将Duffy血型基因定位。3)多态性DNA标记串连重复序列(VNTR)——第二代遗传标记其核心顺序重复的次数具多态性,现已定位了300余个均匀分布于各个染色体上的VNTR;由于VNTR的核心顺序两侧的序列是没有个体差异且长度各不相同,因此,以此两侧序列为PCR引物,能获得个体特异的指纹图谱(亦称全基因扫描)。进行家系全基因扫描时,如发现某些性状总是与某VNTR相连锁,就可以将该基因定位于某一染色体,精度10cM左右。VNTR多态性亦符合孟德尔遗传,故指纹分析还可应用于遗传病诊断、法医个体鉴定、亲子鉴定等2.体细胞杂交——初步的基因定位
应用体细胞杂交技术,离体条件下把基因定位到染色体上。如人/鼠杂交细胞,经传代相对稳定后,一般含整套鼠染色体及丢失部分人染色体(常保留1~7条不等的人染色体);这种杂交细胞是进行基因定位和连锁分析的极好材料,通过分析某基因产物是否与人的某个染色体同时存在,即可将基因定位到染色体上;其后再进行区域定位——常利用染色体的结构的异常,如缺失、易位等标记进行连锁分析;新发展起来的辐射杂交细胞基因定位法——人/鼠杂交细胞染色体经射线处理后,只含带着丝粒的部分片段。比较含长、短染色体片段的杂交细胞的基因表达差异,可更精确定位。3.核酸杂交技术——精确的基因定位
基因原理:以克隆基因的cDNA为探针,与保留在杂交细胞的人染色体DNA顺序进行分子杂交,获得染色体定位;大致步骤(以人白蛋白基因定位为例):分别提取人细胞、CHO细胞和各种人/CHO杂交细胞的染色体组DNA;分别用HindIII酶切、电泳、转膜;用人白蛋白cDNA为探针杂交、显带;结果分析--定位于4号染色体1)克隆基因定位法电泳带正常人CHO人/CHO杂交细胞人/CHO杂交细胞
(含人4号染色体)(不含人4号染色体)3.5kb★★★
6.8kb★★2)原位杂交法(insituhybridization)原理:以标记的目的基因特异DNA序列或RNA为探针,直接与细胞中期染色体进行分子杂交,显影后即可确定探针杂交的染色体位置(定位)。荧光原位杂交(fluorescenceinsituhybridization,FISH)
:探针以荧光标记(生物素、地高辛等)的原位杂交FISH能直接完成基因的染色体定位。具中期染色体的分裂细胞甲酰胺变性探针杂交探针信号FISH程序示图端粒序列定位于染色体的每个末端(FISH)3)原位PCR(insituPCR)原理:在单细胞或组织切片上,对目的基因用PCR进行原位扩增,(或再进行分子杂交),从而获得基因的染色体定位信息。间接法:先对基因进行原位扩增,再进行DNA原位杂交,间接示踪;直接法:将标记的核苷酸直接掺入PCR产物中,直接示踪。基本步骤:①固定细胞,蛋白酶部分消化;②原位PCR扩增;③直接法直接显影(如放射身显影、荧光、化学显影等),间接法通过标记探针进行杂交显影。当然需要与染色分带技术相结合!4)定位克隆技术原理:对通过疾病表型观察到的致病基因,进行基因定位和进一步分离、克隆该基因的策略。基本策略:①通过家系分析等确定致病基因与多态性标记间的连锁关系或染色体定位;②通过染色体步移进行更精确定位,或以标志性序列探针,从克隆重迭群(contigs)筛选出特异的(contig);③再通过DNA测序等确定目的基因的序列,获得基因克隆。第三节人类基因组计划
(Humangenomeproject,HGP)Dolbecco(1986)首次提出HGP的概念;1990美国国会批准正式启动HGP;法、英、意、德、日跟进;成为国际人类基因组计划中国负责1%的序列测定,并于2001年完成‘完整图’后来提前到2003年完成‘完整图’预计2005年完成,目前HGP已经完成1993美国对HGP进行了修正。2000年公布了人类基因组工作草图
一、修正后的HGP主要内容人类基因组作图及序列分析(22+X+Y,30亿bp);基因的鉴定与定位(约5万个基因);基因组研究技术的建立和创新;模式生物基因组作图及序列分析;信息系统的建立、储存及相应软件的开发;相关产业的开发。HGP的主要成果——四张图被誉为人类“分子水平的解剖图”、人类“生命的元素周期表”1.遗传图(geneticmap)又称连锁图(linkagemap)以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因)的遗传标记为路标,以遗传学距离(
cM)为图距的基因图谱。第三代遗传标记是SNP(restrictionfragmentlengthpolymorphism,单核苷酸多态性),不再是分析长度,而是直接测序第二代遗传标记是STR(shorttandemrepeat,简短串连重复序列),6000个标记,96年已全部完成第一代遗传标记是RFLP(restrictionfragmentlengthpolymorphism,限制性酶切片段多态性)2.物理图(physicalmap)以一段已知序列的DNA片段(STS,sequencetaggedsite,序列标记位置)并有染色体定位为路标,以Mb或Kb为图距的基因组图。首先建立相互重迭的相连片段克隆群(contigs)(每个克隆都含有一个STS),借助YAC已建立总体覆盖率达近100%contigs测序分析,计算实际距离(Mb或Kb)3.转录图又称表达序列图或cDNA图是以部分5’端或3’端cDNA序列(即表达标志,EST)为路标,根据表达顺序的位置和距离作图已注册的EST达300万条,正每天以千多条的速度增加实际上cDNA图就是人类“基因图”的雏形另一个优点是:直接编码蛋白质的序列只占整个基因组的的1~5%,在成人中每一特定组织中只有不到10%的基因表达,即不足1万种mRNA。抓住这1~5%,就抓紧了大多数基因。并且可通过cDNA→全长转录本→基因及邻近序列生物性状(包括疾病),都是由结构或功能蛋白质决定的,而蛋白质又是由mRN编码的。转录图的另一层意义:cDNA具有组织(空间)、发育阶段(时间)和病理(病态)特异性。因此,了正常的转录图就可以进而绘制生理、病理、受控条件下的转录图。可以作为筛选基因的探针亦可以作为基因诊断的探针因此,世界各国、各大公司在转录图、EST的构建方面竟争激烈。免费共享?美国专利?4.序列图
测定总长约30亿个核苷酸组成的全染色体序列,是HGP最明确、最准确(定质定量)、最艰巨(定时,2005年)的硬任务。由于测序技术的限制(一次测序在1000个核苷酸左右,还不能直接利用全基因组或YAC、BAC或大片段克隆的contig作模板测序。必须在些大片段基础上构建小的(~1kb)的亚文库。1999年完成22号染色体的全序列测定!2003年全部完成,准确率达99.99%!大规模基因组(HGP)测序
大规模基因组计划(HGP),常使用一个或多个测序策略。首先把基因组变成较小片段并克隆到合适的载体上,获得覆盖全基因组的部分重叠的克隆集合(contigs)。酵母人工染色体(YAC)可容纳百万个bp,HGP的大部分工作草图绘制工作是通过该载体完成的。细菌人工染色体(BAC)的容量平均为15万bp,克服了YAC那样不易分离操作、容易被剪切和不稳定等缺点,HGP的大部分测序工作是利用该载体实现的。在得到大片段的克隆重叠群后,再采用不同的测序策略(鸟枪法和步移等)分别测序。最后,通过重叠区连接成完整的全基因组序列。2003年人类基因组计划国际联盟宣布测序工作已经完成,并于2004年发表了工作结果,但仍然有341个缺口(主要位于异染色区)无法填充——推测是无法克隆的DNA区。DNA序列分析最初的DNA序列分析,采用双脱氧链终止法和化学降解法之一来进行手工测序。20世纪80年代末出现的基于双脱氧链终止法原理和荧光标记的荧光自动测序技术,将DNA测序带入自动化测序的时代。最近几年发展起来的新一代测序技术则使得DNA测序进入了高通量、大规模并行、低成本时代。目前,基于单分子读取技术的第三代测序技术已经出现,该技术测定DNA序列更快,并有望进一步降低测序成本,改变个人医疗的前景。二、我国HGP的发展战略和研究现状发展战略:根据我国人群资源丰富的特点(56个民族和丰富的病种;山区封闭的民族群和遗传隔离群;多世代多个体的大家族具有典型的遗传性状或遗传疾病),突出基因组多样性研究和重大疾病的疾病基因组研究。现状:-1993年自然基金批准了“中华民族若干位点基因结构研究”重大项目,标志中国的HGP正式启动-1996年“重大疾病相关基因定位、克隆、结构与功能研究”获“863”资助。-1999年参与HGP大规模测序,承担1%任务,2000年完成工作框架图,2001.8提前2年完成‘完整图’-已完成南北2个汉族人群、东北地区12个小数民族共733个细胞系的建立,应用多种标志进行基因组多样性的比较性研究。-克隆了遗传性神经性耳聋基因(湖医大夏家辉)-我国正进行多种疾病相关基因组计划,如肝病、肾病等,已获得数百个疾病相关基因(克隆)总之,有机遇又有差距2002.4我国科学家在Science上发表水稻(籼稻)工作框架图三、后基因组计划21世纪生物学的发展方向——功能基因组学对整个基因组所包含的基因、非基因序列的功能进行大规模分析;认识基因在发育、分化和病理状态下的功能变化及其调节机制。后基因组时代的主角——蛋白质组学蛋白质组(proteome)是指细胞或组织表达的全部蛋白质。人类2.4万个基因,几十万种蛋白质;重点分析生命不同时期、不同组织、不同(疾病)状态蛋白质的变化蛋白质组学(proteomics):是从整体上采取高通量/大规模手段研究所有蛋白组成及其活动规律.基因组学的延伸——模式生物基因组学五大模式生物:E.coli、酿酒酵母、黑腹果蝇、秀丽线虫和小鼠,其序列分析被列为HGP的内容;不同物种间功能基因有相当大保守性,如99%鼠基因与人对应;最终目的:比较基因组学——比较不同物种的全基因组,增强对各基因功能的认识。从分子水平上升到细胞水平——细胞计划在阐明以基因为核心的生命物质的本质后,以信号传导为主线阐明在细胞内一切生命现象的本质。1950年代生物学从细胞水平深入到分子水平是一次飞跃,但现在似乎又正返回到细胞水平!新型学科与产业的发展——生物信息学和生物芯片基因组与蛋白质组知识库
基因组科学与医学的关系药物基因组学疾病分子机制药物研制产业化基因治疗遗传背景对环境和疾病的易感性个体化预防医学个体化治疗分子诊断基因组学研究推动了生物产业发展人类基因组计划的实施带动了基因组学的发展。基因组学的重要性就在于它是整个生命科学产业的上游部分,掌握了基因的知识产权,就等于控制了基因工程产业的核心。
世界上一些最大的制药集团投巨资进军生命科学工业。Ciba-Geigy和Sandoz2.5亿美元、Glaxo-Wellcome0.47亿、SmithKline1.25亿。对HGP的预测,将药物开发项目的25%建立在HGP基础上。大型化学工业公司向生命科学工业转轨的规模和力度更大。美国孟山公司于1997年转向生物技术和基因组研究,共投资66亿美元。四、生物信息学——HGP数据的利用生物信息学(Bioinformatics)是将计算机和信息科学技术运用到生命科学,尤其是分子生物学研究中的重大交叉学科。它通过对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示这些数据所蕴含的生物学意义的目的。它已广泛地渗透到医学的各个研究领域中,成为生物医学发展不可缺少的重要工具。人类基因组计划(HGP)和生物医药工业催生其发展的的两个主要力量1.国内外发展现状各国投入大量资金,相继成立了生物信息中心。美国的国家生物技术信息中心(NationalCenterforBiotechnologyInformatics,NCBI)欧洲生物信息学研究所(EuropeanBioinformaticInstitute,EBI)日本信息生物学中心(CenterforInformationBiology,CIB)等。NCBI、EBI和CIB相互合作,共同维护着GenBank、EMBL、DDBJ三大基因序列数据库,它们每天通过计算机网络互相交换、更新数据。他们每年召开两个年会讨论合作事宜。中国国家级生物医学信息学中心筹建运行。2.主要应用方向——功能基因组学将已知基因序列与功能相联系;以常规克隆为主基因的分离转向以序列和功能分析为基础的基因分离;从单个致病基因机制的研究转向多个致病基因机制的研究比较正常/疾病、疾病/治疗、发育/分化各组织来研究功能基因组和蛋白质组;通过比较不同物种的基因组中各种结构的异同,进行分子进化的研究;构建生物分子的结构模型进行药物设计——药物基因组成学3.主要任务之一——建立和管理各种数据库
Genbank:美国国家生物技术信息中心的数据库()。
EMBL:建立在欧洲分子生物实验室的数据库
(http://www.embl-heidelberg.de)。DDBJ:日本的DNA数据库银行(http://www.nig.ac.jp)。其他:酵母基因组数据库(SGD)、酵母蛋白质数据库(YPD)、拟南芥数据库(AtDB)、医学数据库(OMIM)、线虫数据库(ACEDB)(1)核酸序列数据库——三大数据库(2)蛋白质数据库SwissPDB(ProteinDataBank,)/pdb/cgi/queryForm.cgiProsite(expasy.hcuge.ch)Pfam(www.sanger.ac.uk/Pfam)(3)三维结构数据库PDB(/npdb
)等。与蛋白质结构有关的数据库还有:
SCOP(/scop/
)等。与基因组有关的数据库:
OMIM(/omim/)4.最重要的任务——从数据中提取新知识生物信息学最重要的任务,是从海量数据中提取新知识。这首先是从DNA序列中识别编码蛋白质的基因,以及调控基因表达的各种信号。其次,从基因组编码序列翻译出的蛋白质序列;数目急剧增加,根本不可能用实验方法一一确定它们的结构和功能。从已经积累的数据和知识出发,预测蛋白质的结构和功能,成为常规的研究任务。核酸序列搜索软件Genbank()
Entrez
BLASTEMBL(EuropeanMolecularBiologyLaboratory,www.ebi.ac.uk)SRS:srs.ebi.ac.uk,www.sanger.ac.uk/srs6/(1)序列比较和数据库搜索软件之一
BLAST(BasicLocalAlignmentSearchingTool)该工具利用了retrievalsystem可以搜索世界上最大的核酸数据库EMBL+Genbank+DDBJ,最大的蛋白质数据库等。我们可以输入一段DNA、RNA、蛋白序列,一段插入序列、tRNA序列、与HIV相关的序列等,从而分析这段序列的同源性,再根据同源性推论出它所具有的功能。还可以通过输入一段DNA序列,而知道它所编码的蛋白质的功能,以及它来源与是什么生物。(2)序列比较和数据库搜索软件之二
FASTA96年推出的FASTA3实现了高度的并行化,能够在多CPU的计算机上将搜索速度提高数倍,还支持并行虚拟机器技术(ParallelVirtualMachine),增加了并行网络计算机制。多序列比较软件(MulitpleAlignment)(用户可以同时输入多个序列)第四节DNA多态性及其意义DNA多态性:除同卵双生的两个体外,没有两个人的DNA组成是完全相同的,即人类DNA组成具有多态性。如果比较随机的十个人的常染色体的非编码区,就会发现约200~400bp就有一个核苷酸不同,这些可变区域即称为DNA多态性(DNApolymorphism)位点DNA多态性标记的价值作为路标,构建HGP的遗传连锁图谱;使遗传图谱从直接可见的表型多样性标记进步到DNA分子本身多态性标记1.DNA位点多态性(DNAsitepolymorphism)这种多态性是由控制某些性状的DNA碱基差异造成的。如人的白细胞抗原(HLA)仅其HLA-DR抗原就有6个位点、构成60多个等位基因(等位基因多态性)。DNA位点的多态性导致限制性内切酶切割位点的差异,即限制性片段长度多态性(restrictionfragmentlengthpolymorphism,RFLP)RFLP是第一代DNA遗传学标记由此发展成了RFLP技术(酶切、电泳、转膜、探针杂交,探针为基因序列或cDNA)一、DNA多态性的种类2.串连重复顺序多态性串连重复顺序的核心顺序重复的次数差异,即可变数串连重复(variablenumbertandomrepeats,VNTR)VNTR及重复顺序中的插入小片段导致了串连重复顺序多态性。DNA指纹分析(DNAfingerprint)亦是RFLP技术的特殊型,由于串连重复顺序的核心顺序两侧的序列是没有个体差异的,因此使用限制性内切可切下重复顺序,选用特定的探针(高拷贝的小卫星、微卫星或人工合成的简短重复顺序等),能获得个体特异的指纹图谱。VNTR和位点多态性亦符合孟德尔遗传规则,故指纹分析可作为遗传病诊断、法医个体鉴定、亲子鉴定微卫星标记——第二代DNA标记微卫星DNA(microsatelliteDNA)或称简短串连重复(shorttandemrepeat,STR),由2~6个核苷酸的重复顺序组成,如(CA)n、(GA)n、(TA)n,n为15~30具有多态性,卫星长度常小于100bp,大量分布每条染色体。由于STR的核心顺序两侧的序列是没有个体差异且长度各不相同
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程中介合同协议书
- 教育行业教务管理操作手册
- 机械设备融资租赁协议书6篇
- 危险货物运输合同标准
- 《初高中英语语法讲解与练习课教案》
- 2025年湖北怎么考货运从业资格证
- 2025年临汾货运从业资格证考试内容
- 2025年商铺转让合同8篇
- 双方付款合同范本
- 厂地合作合同范本
- 2025年湖南水利水电职业技术学院单招职业技能测试题库参考答案
- 廉政从业培训课件
- 2024年潍坊工程职业学院高职单招语文历年参考题库含答案解析
- 殡仪服务员职业技能鉴定考试题(附答案)
- 电动葫芦吊装方案计划
- 2025年山东电工电气集团招聘笔试参考题库含答案解析
- 《建立特种设备“日管控、周排查、月调度”工作机制》专题培训
- 《自然语言处理》课件
- 压裂设备专用件项目评价分析报告
- 2025上半年重庆万州区事业单位招聘拟聘用人员历年管理单位笔试遴选500模拟题附带答案详解
- 公路养护工安全操作规程模版(2篇)
评论
0/150
提交评论