分子生物学课件_第1页
分子生物学课件_第2页
分子生物学课件_第3页
分子生物学课件_第4页
分子生物学课件_第5页
已阅读5页,还剩406页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、引言基因組結構與功能

基因組是指細胞內攜帶遺傳資訊的DNA的總體。基因組中不同的區域具有不同的功能,有些是編碼蛋白質的結構基因,有些是複製及轉錄的調控信號,有些區域的功能尚不清楚。

基因組結構是指不同功能區域在整個DNA分子中的分佈情況。

不同的生物體,其基因組的大小和複雜程度各不相同,進化程度越高的生物體其基因組越複雜。本章主要介紹病毒、細菌及真核細胞染色體基因組結構和功能。另外,對質粒和線粒體DNA的結構和功能也分別作一介紹。不同生物體中DNA的大小生物種類千堿基對/

染色体長度

(cm)染色體數

(單倍體)形狀病毒SV405.20.000171環狀噬菌體φX1745.40.000181線狀單鏈噬菌體λ460.00151線狀細菌大腸桿菌40000.131環狀酵母10000.03317

果蠅410001.44

人1250004.123

二、病毒基因組的結構和功能

病毒是最簡單的原核生物,完整的病毒顆粒包括外殼蛋白和內部的基因組DNA或RNA,有些病毒的外殼蛋白外面有一層由宿主細胞構成的被膜(envelope),被膜含有病毒基因編碼的糖蛋白。TMV煙草花葉病毒TYMV番茄黃化花葉病毒Phage噬菌體二、病毒基因組的結構和功能

病毒不能獨立地複製,必需進入宿主細胞中借助細胞內的一些酶類和細胞器才能使病毒得以複製。外殼蛋白(或被膜)的功能是識別和侵襲特定的宿主細胞並保護病毒基因組不受核酸酶的破壞。1.病毒基因組的結構特點1)與細菌或真核細胞相比,病毒的基因組很小,且不同的病毒之間基因組大小相差甚大。

如:乙肝病毒DNA只有3kb大小,所含資訊量也較小,只能編碼4種蛋白質;痘病毒的基因組有300kb之大,可以編碼幾百種蛋白質,不但為病毒複製所涉及的酶類編碼,甚至為核苷酸代謝的酶類編碼,因此,痘病毒對宿主的依賴性較乙肝病毒小得多。2)病毒基因組可以由DNA或RNA組成,每種病毒顆粒中只含有一種核酸,DNA或RNA,兩者一般不共存於同一病毒顆粒中。病毒基因組的DNA和RNA可以是單鏈,也可以是雙鏈;可以是閉環分子,也可以是線性分子。如:乳頭瘤病毒是一種閉環的雙鏈DNA病毒,腺病毒的基因組則是線性的雙鏈DNA,脊髓灰質炎病毒是一種單鏈的RNA病毒,呼腸孤病毒的基因組是雙鏈的RNA分子。大多數DNA病毒的基因組是雙鏈DNA分子,而大多數RNA病毒的基因組是單鏈RNA分子。3)多數RNA病毒的基因組是由連續的核糖核酸鏈組成,但也有些病毒的基因組RNA由不連續的幾條核酸鏈組成。

如:流感病毒的基因組RNA分子是節段性的,由八條RNA分子構成,每條RNA分子都含有編碼蛋白質分子的資訊;呼腸孤病毒的基因組由雙鏈的節段性的RNA分子構成,共有10個雙鏈RNA片段,同樣每段RNA分子都編碼一種蛋白質。目前,還沒有發現有節段性的DNA分子構成的病毒基因組。4)基因重疊即同一段DNA片段能夠編碼兩種甚至三種蛋白質分子。

重疊基因是1977年Sanger在研究ΦX174噬菌體時發現的。ΦX174是一種單鏈DNA病毒,宿主為大腸桿菌。它感染大腸桿菌後共合成11個蛋白質分子,總分子量為25萬左右,相當於6078個核苷酸所容納的資訊量。而該病毒DNA本身只有5375個核苷酸,最多能編碼總分子量為20萬的蛋白質分子。這種結構使較小的基因組能夠攜帶較多的遺傳資訊。

線粒體和質粒DNA中也有重疊基因現象。

重疊基因有以下幾種情況:(1)一個基因完全在另一個基因裏面。如基因A和B是兩個不同基因,而B包含在基因A內。同樣,基因E在基因D內。

重疊基因有以下幾種情況:(2)部分重疊。基因K和基因A及C的一部分重疊。(3)兩個基因只有一個堿基重疊。如基因D的終止密碼子的最後一個堿基是J基因起始密碼子的第一個堿基(如TAATG)。

這些重疊基因儘管它們的DNA大部分相同,但是由於將mRNA翻譯成蛋白質時的閱讀框不一樣,產生的蛋白質分子往往並不相同。

有些重疊基因閱讀框相同,只是起始部位不同,如SV40DNA基因組中,編碼三個外殼蛋白VP1、VP2、VP3基因之間有122個堿基的重疊,但密碼子的閱讀框不一樣。而小t抗原完全在大T抗原基因裏面,它們有共同的起始密碼子。5)病毒基因組的大部分是用來編碼蛋白質的,只有非常小的部分不被翻譯。如:在ΦX174中不翻譯的部份只占217/5375,G4DNA中占282/5577,都不到5%。不翻譯的DNA順序通常是基因表達的控制序列。如ΦX174的H基因和A基因之間的序列(3906-3973),共67個堿基,包括RNA聚合酶結合位,轉錄的終止信號及核糖體結合位點等基因表達的控制區。乳頭瘤病毒是一類感染人和動物的病毒,基因組約8.0Kb,其中不翻譯的部份約為1.0kb,該區同樣也是其他基因表達的調控區。6)病毒基因組DNA中功能上相關的蛋白基因或rRNA的基因往往叢集在基因組的一個或幾個特定的部位,形成一個功能單位或轉錄單元。它們可被一起轉錄為多順反子mRNA(polycistroniemRNA),然後再加工成各種蛋白質的範本mRNA。如:腺病毒晚期基因編碼的12種功能相關的外殼蛋白,轉錄時是在一個啟動子的作用下生成多順反子mRNA,然後再加工成各種mRNA,編碼病毒的各種外殼蛋白;ΦX174基因組中的D-E-J-F-G-H基因也轉錄在同一mRNA中,然後再翻譯成各種蛋白質,其中J、F、G及H都是編碼外殼蛋白的,D蛋白與病毒的裝配有關,E蛋白負責細菌的裂解,它們在功能上也是相關的。7)除了反轉錄病毒以外,一切病毒基因組都是單倍體,每個基因在病毒顆粒中只出現一次。反轉錄病毒基因組有兩個拷貝。8)噬菌體(細菌病毒)的基因是連續的;除了正鏈RNA病毒之外,真核細胞病毒的基因含有內含子。

有些真核病毒的內含子或其中的一部分,對某一個基因來說是內含子,而對另一個基因卻是外顯子。

如:SV40和多瘤病毒(polyomavirus)的早期基因就是這樣。SV40的早期基因即大T和小t抗原的基因都是從5146開始反時針方向進行,大T抗原基因到2676位終止,而小t抗原到4624位即終止了,但是,從4900到4555之間一段346bp的片段是大T抗原基因的內含子,而該內含子中從4900-4624之間的DNA序列則是小t抗原的編碼基因。同樣,在多瘤病毒中,大T抗原基因中的內含子則是中T和t抗原的編碼基因。

目前研究最清楚的大腸桿菌RNA噬菌體是MS2,R17,f2和Qβ。它們的基因組小,只有3600到4200個核苷酸,包含四個基因。

MS2.R17和f2具有幾乎一樣的基因組結構。2.RNA噬菌體的基因組結構和功能RNA噬菌體的基因組結構和功能在4個基因中有2個基因編碼噬菌體的結構蛋白:A蛋白基因:長1178個核苷酸。A蛋白(稱為成熟蛋白)的功能是使噬菌體能識別宿主,並使其RNA基因組能進入宿主菌,每個噬菌體一般只存在一個分子的A蛋白。另一個結構蛋白基因長399個核苷酸,編碼外殼蛋白以構成病毒顆粒,每個噬菌體有180個分子。基因組的其他部分編碼RNA複製酶和一個溶解蛋白,編碼溶解蛋白的基因與外殼蛋白和複製酶的基因有部分重疊,但閱讀框與外殼蛋白的閱讀框不一樣。

在MS2、R17、f2基因組內有許多二級結構,RNA分子內堿基的自我配對,可能對防止RNase降解有一定的作用。另外,在編碼基因的5'和3'端各有一段非翻譯序列,該序列對穩定RNA分子也有一定作用。

另一種RNA噬菌體Qβ的基因組略大,與上述RNA噬菌體的基因組有以下不同;[1]沒有獨立的溶解蛋白基因,但結構蛋白A2(或稱成熟蛋白,MaturaitonProtein)即具有溶解蛋白的功能,[2]還編碼另一種外殼蛋白A1。

細菌和病毒一樣同屬原核生物,因而細菌基因組的結構特點在許多方面與病毒的基因組特點相似,而在另一些方面又有其獨特的結構和功能。本節首先介紹細菌染色體基因組的一般結構特點,然後再具體介紹大腸桿菌染色體基因組的結構和功能。

三、細菌基因組的結構和功能(1)細菌的染色體基因組通常僅由一條環狀雙鏈DNA分子組成,細菌的染色體相對聚集在一起,形成一個較為緻密的區域,稱為類核(nucleoid)。1.細菌染色體基因組結構的一般特點

類核無核膜與胞漿分開,類核的中央部分由RNA和支架蛋白組成,週邊是雙鏈閉環的DNA超螺旋。

染色體DNA通常與細胞膜相連,連接點的數量隨細菌生長狀況和不同的生活週期而異。在DNA鏈上與DNA複製、轉錄有關的信號區域與細胞膜優先結合,如大腸桿菌染色體DNA的複製起點(OriC)、複製終點(TerC)等。細胞膜在這裏的作用可能是對染色體起固定作用,另外,在細胞分裂時將複製後的染色體均勻地分配到兩個子代細菌中去。有關類核結構的詳細情況目前尚不清楚。(2)具有操縱子結構,其中功能相關的結構基因串聯在一起構成多順反子,受同一個調節區的調節。數個操縱子還可以由一個共同的調節基因(regulatorygene)即調節子(regulon)所調控。(3)在大多數情況下,結構基因在細菌染色體基因組中都是單拷貝,但編碼rRNA的基因往往是多拷貝的,這可能有利於核糖體的快速組裝,便於在急需蛋白質合成時,在短時間內有大量核糖體生成。(4)和病毒的基因組相似,不編碼的DNA部分所占比例比真核細胞基因組少得多。(5)具有編碼同工酶的同基因(isogene)。例如,在大腸桿菌基因組中有兩個編碼分支酸(chorismicacid)變位酶的基因,兩個編碼乙醯乳酸(acetolactate)合成酶的基因。(6)和病毒基因組不同的是,在細菌基因組中編碼順序一般不會重疊,即不會出現基因重疊現。(7)在DNA分子中具有各種功能的識別區域如複製起始區OriC,複製終止區TerC,轉錄啟動區和終止區等。這些區域往往具有特殊的順序,並且含有反向重複順序。(8)在基因或操縱子的終末往往具有特殊的終止順序,它可使轉錄終止和RNA聚合酶從DNA鏈上脫落。例如大腸桿菌色氨酸操縱子後尾含有40bp的GC豐富區,其後緊跟AT豐富區,這就是轉錄終止子的結構。

終止子有強、弱之分,強終止子含有反向重複順序,可形成莖環結構,其後面為polyT結構,這樣的終止子無需終止蛋白參與即可以使轉錄終止。而弱終止子儘管也有反向重複序列,但無polyT結構,需要有終止蛋白參與才能使轉錄終止。

E.coli染色體基因組是研究最清楚的基因組。估計含有3500個基因,已被定位的900個基因中有260個已查明具有操縱子結構,定位於75個操縱子中。在已知的基因中8%的序列具有調控作用。2.大腸桿菌染色體基因組的結構和功能

E.coli染色體基因組中已知的基因多是編碼一些酶類的基因,如氨基酸、嘌呤、嘧啶、脂肪酸和維生素合成代謝的一些酶類的基因,以及大多數碳、氮化合物分解代謝的酶類的基因。另外,核糖體的50多種蛋白質的基因也已經鑒定了。

除了有些具有相關功能的基因在一個操縱子內由一個啟動子轉錄外,大多數基因的相對位置可以說是隨機分佈的。如:控制小分子合成和分解代謝的基因,大分子合成和組裝的基因分佈在大腸桿菌基因組的許多部位,而不是集中在一起。再如,有關糖酵解的酶類的基因分佈在染色體基因組的各個部位。

E.coli和與其分類關係上相近的其他腸道菌如志賀氏桿菌屬(Shigella)、沙門氏菌屬(Salmonella)等具有相似的基因組結構。傷寒沙門氏桿菌(Salmonellatyphimurium)幾乎與E.coli的基因組結構相同,雖然有10%的基因組序列和E.coli相比發生顛倒,但是其基因的功能仍正常。這更進一步說明染色體上的基因似乎沒有固定的格局,相對位置的改變不會影響其功能。

在已知轉錄方向的50個操縱子中,27個操縱子按順時針方向轉錄,23個操縱子按反時針方向轉錄,即DNA兩條鏈作為範本指導mRNA合成的機率差不多相等。

在E.coli染色體基因組中,差不多所有的基因都是單拷貝基因,因為多拷貝基因在同一條染色體上很不穩定,極易通過同源重組的方式丟失重複的基因序列。

另外,由於E.coli細胞分裂快,20min內完成1次分裂,因此,攜帶多拷貝基因的E.coli並不比單拷貝基因的E.coli更為有利;相反,由於多拷貝基因的存在,使E.coli的整個基因組增大,複製時間延長,因而更為不利。

除非在某種環境下,需要有多拷貝基因用來編碼大量的基因產物,例如,在有極少量乳糖或乳糖衍生物的培養基上,乳糖操縱子的多拷貝化可以使E.coli充分利用的乳糖。但是,一旦這種選擇壓力消失,如將E.coli移到有豐富的乳糖培養基上,多拷貝的乳糖操縱子便沒有存在的必要,相反,由於需要較長的複製時間,這種重複的多拷貝基因會重新丟失。

E.coli染色體基因組中,大多數rRNA基因集中於基因組的複製起點oriC的位置附近。這種位置有利於rRNA基因在早期複製後馬上作為範本進行rRNA的合成以便進行核糖體組裝和蛋白質的合成。從這一點上看,E.coli基因組上的各個基因的位置與其功能的重要性可能有一定的聯繫。

線粒體是真核細胞內重要的細胞器,能量生成的場所,還參與脂肪酸的合成及某些蛋白質的合成。多年來的研究發現線粒體有其自己的一套遺傳控制系統,同時也受到細胞染色體DNA的控制。下麵闡述線粒體DNA的結構特點和功能,以及線粒體DNA遺傳學上的特點。

四、線粒體DNA的結構和功能mtDNA與質粒DNA一樣,也是雙鏈的超螺旋環狀分子(原生動物草履蟲及四膜蟲的mtDNA是雙鏈線性分子)。1.線粒體DNA(mtDNA)的性質mtDNA的MW多在1×106-2×108之間,動物mtDNA約為10×106,植物的mtDNA約為70-200×106。mtDNA複製屬於半保留複製,可以是θ型或滾環複製,或者D環複製,即二條DNA鏈不同時開始複製,而是一條在前,一條在後,因而在複製中生成D環。

線粒體基因組含有自己的基因,呼吸鏈中的某些蛋白質或酶的編碼基因就在mtDNA上。線粒體還能獨立合成一些蛋白質,因為線粒體有自己的rRNA,tRNA,核糖體等。2.線粒體基因組

已知線粒體的基因組至少含有如下基因:tRNA基因:在啤酒酵母mtDNA中有24個tRNA基因,粗鏈孢黴菌的mtDNA中有40個tRNA基因,而人類mtDNA中有22個tRNA基因。rRNA基因:在人類mtDNA中有一個拷貝的16S及12SrRNA基因。細胞色素氧化酶基因:細胞色素氧化酶有七個亞基,其中三個亞基mtDNA編碼,四個亞基由細胞核DNA編碼。ATP酶基因:ATP酶分子量為340KD,含有十個亞基,其中四個由mtDNA編碼。細胞色素還原酶(b,c複合物)基因:此酶有七個亞基,其中一個由mtDNA編碼。另外,還有一些抗藥性基因也在mtDNA上。哺乳動物mtDNA的利用率較高(與酵母mtDNA相比較)mtDNA整個基因組上基因之間無間隔區(spacer),基因中亦無內含子,甚至有基因重疊現象。(與DNA複製起始有關的D環,D-loop除外)另外,人mtDNA只有1個啟動子位於不編碼的D環上,轉錄從此開始,順時針合成一條多基因的RNA分子。這條前體RNA分子含有rRNA、tRNA和各種蛋白質的編碼順序。tRNA分散在rRNA和編碼蛋白質的順序之間。據認為,這些tRNA序列可作為核酸酶切割RNA前體的識別資訊,使其在tRNA兩端把RNA前體切開。這樣,附近的tRNA、rRNA和mRNA即自然分開,經進一步加工成為成熟的rRNA、tRNA和mRNA分子。mRNA上的polyA尾是在其前體與tRNA分開時加上去的。mRNA上的密碼和tRNA上的反密碼是對應的。已知20種氨基酸有61種對應的密碼子,按照擺動學說(wobblehypothesis),最少需要32種tRNA才能完全識別mRNA中的61個密碼子。3.線粒體的密碼系統但線上粒體中,tRNA的種類顯然小於此數(如人的mt-tRNA只有22種),而且,已有實驗證明,無細胞質tRNA進入線粒體參與其蛋白質的過程。這些事實表明線上粒體基因表達過程中的密碼系統與通用的密碼系統不一樣。

哺乳動物mtDNA遺傳密碼與通用遺傳密碼的區別:1).UGA不是終止信號,而是Trp的密碼。因此,線粒體tRNAtrp可以識別UGG和UGA。2).多肽內部的Met由AUG和AUA兩個密碼子編碼;而起始Met由AUG,AUA,AUU和AUC四個密碼子編碼。3).AGA,AGG不是Arg的密碼子,而是終止密碼子,因而,線上粒體密碼系統中的4個終止密碼子(UAA,UAG,AGA,AGG)。線上粒體的tRNA的反密碼子方面,也有其獨特的地方。

由於密碼子簡並性(degeneracy),若密碼子前兩位堿基一樣,則3'位的堿基無論是嘌呤或嘧啶,這樣組成的密碼子都編碼同一樣氨基酸。對於這樣的密碼子,mt-tRNA的反密碼子5'擺動位上的核苷酸如果為U,則可以與上述密碼子3'位的4種核苷酸配對,因而,一個tRNA可以識別4種密碼子。但是,如果3'位由嘌呤堿基組成的密碼子與由嘧啶堿基組成的密碼子編碼不同的氨基酸時,mt-tRNA反密碼子上5'位的U經過修飾識別3'位由嘌呤堿基組成的密碼子,而不再識別3'位由嘧啶堿基組成的密碼子,這樣,便可以防止錯誤翻譯的發生。mt-tRNA在結構上與細胞質tRNA也有區別:如GTφCRA(R代表嘌呤)序列在大多數mt-tRNA中不存在。D環和TφC環中一些保守的核苷酸也發生了變化。最突出的是tRNASer的結構,該tRNA缺乏D臂。這些結構上的差異表明mt-tRNA三維結構以及與mt核糖體的作用方式與細胞質tRNA不一樣。線粒體具有DNA,還有自己的蛋白質合成系統。並且與細胞質的不同,而與細菌的比較相似。4.線粒體DNA的雙重遺傳控制線粒體具有自己的DNA聚合酶和RNA聚合酶。mtRNA聚合酶只是一條簡單的多肽鏈,而且對原核細胞轉錄抑制劑利福平敏感。線粒體核糖體上的蛋白質合成也受細菌蛋白質合成抑制劑如氯黴素,鏈黴素的抑制。以上情況說明線粒體的許多組份是自主的,不受細胞核的控制,而且在許多方面與原核生物相似。另一方面,線粒體又是受雙重遺傳控制的,如參與呼吸鏈的一些酶,其部分亞基為細胞核基因所編碼,部分則是mtDNA編碼的。根據線粒體的這些特點Margulis提出了線粒形成的內共生學說(endosymbio-nttheory)。在進化過程中原始的厭氣細菌吞噬了原核生物(如細菌,藍綠澡等)形成共生關係。寄主為共生者提供營養和保護,共生者為寄主提供能量生成系統。最終,共生者演化成細胞的組成成份──線粒體。五、真核細胞核染色體的結構1.染色體研究的歷史背景

一個多世紀前,Mendel在歷時八年完成的豌豆雜交試驗基礎上總結出的二個著名遺傳學定律—分離定律和獨立分配定律中,就已經提出了基因的概念。Mendel規律的基本設想是:每一植株的各種相對性狀都來源兩個相同的“遺傳因數”(geneticfactor),它們有顯性和隱性之分。這裏的“遺傳因數”就是基因的最早用語,其含義是指決定遺傳性狀的基本遺傳單位。

遺傳學上這一偉大的發現,由於當時沒有任何支持它的物質證據,於1865年發表後,幾乎沒引起注意。直到35年後的1900年,另外三位植物學家(Correns,deVries和Tschermak)再次獨立證明Mendel規律的正確性後,這一著名規律才被重新發現。

在19世紀的最後二十多年裏,生物學家在細胞遺傳學領域取得了重要進展,染色體的發現就是成果之一。染色體存在於細胞核中,經適當染色後可見的由細絲狀顆粒物質所組成,一般在細胞分裂時才能看到。在不同物種的細胞中,它們的數目不一樣,但總是以二條成對的同源(homologous)染色體的形式存在,且數目恒定。如人體細胞染色體總數為46條,分為23對(其中22對為常染色體,1對為性染色體)。

在分裂期間,染色體對的每一成員可自身複製成含2個拷貝的姐妹染色體(sisterchromatid)。

通過觀察染色體在細胞分裂中的行為變化全過程發現:

體細胞增殖時,以有絲分裂(mitosis)的方式,使姐妹染色體一分為二進入子代細胞,保證了染色體數目的恒定;

生殖細胞則通過減數分裂(meiosis)使同源染色體分別進入新的子代細胞而產生。生殖細胞─配子(精子或卵子)只含有體細胞一半的染色體數,配子結合成合子後又恢復到體細胞的染色體數,這樣,合子及其後代細胞的染色體數對中的成員,一個來自父本,一個來自母本。

這些觀察結果認為染色體是遺傳的物質基礎的觀點在19世紀末被廣泛接受。

比較染色體在細胞分裂中的行為與Mendel規律可以發現,染色體與“遺傳因數”極其相似:首先,二者均成對存在,且其中的每個成員分別來自父、母親代;其次,產生配子時,配子只含“遺傳因數”(等位基因)中的一個,或染色體對中的一條;另外,非等位基因及非同源染色體均可自由組合到配子中。1902-03年Sutton和Boveri提出了染色體遺傳學(theoryofchromosomalinheritance),認為染色體是“遺傳因數”的攜帶者。1905年,Johannsen首先使用“基因”代替“遺傳因數”,並提出了基因型(gentoype)和表型(phenotype)的概念。1909年起,Morgan等以果蠅為材料研究生物遺傳規律,觀察到一種白眼突變體與性染色體的聯繫,1910年首先提出基因定位於染色體上的論點。此後二年中,又發現了多個伴性基因,並以此為據總結出了遺傳學上著名的基因連鎖(linkage)和交換(crossing-over)規律。他們還通過測定連鎖的回交試驗,證實了基因在染色體上呈線性排列。所謂連鎖是指控制不同性狀的基因位於同一條染色體上,相互緊密排列在一起。如果連鎖是不完全的(即基因間排列不夠緊密),連鎖基因仍有可能自由分配,但它們在減數分裂階段的同源染色體交換片段時,被分離的機會明顯減少。Morgan的基因連鎖和交換的測定方法還用來確定不同基因在染色體上的位置,由此而產生了遺傳學上最早的基因定位線性遺傳圖。

在20世紀上葉,雖然已明確了基因與染色體的關係,並且1944年Avery明確了DNA是遺傳物質,但人們對基因的認識也僅知道它是遺傳的基本單位。對於基因是怎樣通過控制表型來實現其功能的尚不清楚。1945年Beedle和Ephrussi最早提出基因作用原理,即“一個基因一種酶”的假說。這一假說建立在所發現的代謝途徑中某種酶的缺失是由於某種基因突變所致的事實上。換言之,一種代謝酶的生成由其相應的一個基因所控制,酶所催化的生化反應就是基因功能的表現形式。後來,這一假說在許多蛋白質中得到了驗證,並被修正為“一個基因一條多肽鏈”的學說。DNA雙螺旋結構提出以後,基因結構及功能的研究進入了一個新的階段。現代分子生物學技術不僅使染色體的基因定位及物理圖譜製作變得輕而易舉,而且能詳盡的知道定位於染色體DNA上的基因核苷酸順序。若將人的所有染色體(雙倍體細胞)相連並充分伸展的話,其長度可達2米左右。如此巨大的DNA鏈要全部貯存在小小的細胞核染色體中,必然存在著適宜的包裝形式。此外,染色體中還含有大量的蛋白質和有限的RNA,它們與DNA共同構成十分緊密的複雜結構。這種結構不僅能滿足貯存DNA的數量要求,而且還應該有利於其功能的實現。那麼,染色體DNA是如何包裝的?它是否也存在著有規律的基本結構?它在基因功能表達中起何作用?直到1974年Kornberg發現核小體(nucleosomes)是所有真核生物染色體的基本結構單位後,這一領域的研究才進入一個新的水準。DNA:是染色體的主要化學成分,也是遺傳資訊的載體。2.染色體的化學組成RNA:RNA含量很少,還不到DNA量的10%。蛋白質:蛋白質含量約為DNA的2倍,根據組成蛋白質的氨基酸特點分為組蛋白和非組蛋白兩類。組蛋白(histones)是鹼性蛋白質,其特點是富含二種鹼性氨基酸(Lys和Arg),根據這兩種氨基酸在蛋白質分子中的相對比例又將組蛋白分為五種小類型。所有真核生物染色體中均含有這五種組蛋白。染色體中的五種蛋白組蛋白類別鹼性氨基酸%Lys,Arg酸性氨基酸%堿/酸氨基酸殘基數分子量(dallton)H1極富Lys29155.421523000H2A

稍富Lys119151.412913960H2B稍富Lys166131.712513774H3

富Arg1013131.813515342H4富Arg1114102.510211282真核生物染色體中組蛋白的含量與DNA含量之比約為1:1。組蛋白中也含有較多的酸性氨基酸,但其含量均低於鹼性氨基酸,堿/酸比在1.4-2.5之間。組蛋白的等電點在7.5-10.5之間,這些強極性氨基酸使蛋白質帶上大量電荷,成為組蛋白與DNA結合及蛋白質之間的相互作用的主要化學力之一。五種組蛋白的氨基酸順序均已確定。在各種物種,H3和H4的序列極少有差異,這種生物進行上的高度保守性預示著其功能的重要性。其他三種組蛋白在不同種屬之間存在著較大的差異。組蛋白對染色體中DNA的包裝有十分重要的作用。非組蛋白(non-histoneprotein,NHP)是指染色體中組蛋白以外的其他蛋白質,它是一大類種類繁雜的各種蛋白質的總稱。估計總數在300-600之間,分子量範圍為7000-80000D,等電點為3.9-9.2。對於其中許多單個成分的結構和功能,目前還瞭解甚少。已經知道,一些非組蛋白與基因表達及染色體高級結構的維持有關。已知的非組蛋白:參與基因複製、轉錄及核酸修飾的酶類(如各種DNA和RNA聚合酶等)。HMG蛋白質:一類高遷移率組(highmobilitygroup),此類蛋白質因在凝膠電泳上泳動速度快而得名。已經明確其中的一些蛋白質(如HMG14和HMG17)在轉錄活性區含量豐富,可以認為是參與轉錄調控的蛋白質。核基質蛋白:對於維持染色體的高級結構是必不可少的。(1)核小體的發現:通過電子顯微鏡觀察破裂的間期細胞流出的染色質,可以看到染色質纖維呈非連續性顆粒狀小珠,這些小珠狀顆粒被稱之為核小體。3.核小體的結構用小球菌核酸酶(micrococcalnuclease)處理提取的染色質,可以得到單個的核小體顆粒。在一定酶切條件下,顆粒中所包含的DNA長度總是穩定在200bp左右。DNA片段大小通過凝膠電泳很容易鑒定出來。以密度梯度離心法制備核小體單體,分析蛋白質組成得知:每1個單體含有H2A、H2B、H3和H4各二分子(構成八聚體),H1一分子。相鄰多聚體之間的DNA長度等於核小體單體中的DNA長度(200bp左右),且多聚體分子量總是單體分子量的整倍數。(1)核小體的發現核小體是染色體的基本結構單位。核小體重複單位是在所有真核生物中具有普遍意義的染色體基本結構,不同生物(或同種生物的不同細胞)的核小體,其DNA片段長度的有所差別,一種細胞通常有特定的平均值,一般為180--200bp。每一核小體所含的DNA與組蛋白的量大致相等。核小體由核心顆粒(coreparticie)和連接區DNA(linkerDNA)二部分組成。(2)核小體的結構核心顆粒由146bp的DNA片段和H2A、H2B、H3和H4各二分子組成。用小球菌核酸酶處理核小體單體後,隨著時間延長,其降解產物(DNA片段)會逐漸縮短,從200bp降至146bp變為很難進一步降解的穩定狀態。連接區DNA為核心顆粒外"裸露"的DNA,長度為60bp左右。連接區DNA的長度在不同物種差異較大,其範圍在10--140bp。H1位於連接區DNA與核心顆粒的毗鄰區。H1總是隨著核心顆粒的形成而消失,通常是在DNA被降解至160bp以後,提取物中H1丟失。DNA盤繞在組蛋白八聚體的周圍,呈很有規律的螺旋狀。雖然DNA雙鏈分子位於核心顆粒的週邊,但DNA與組蛋白八聚體的這種相互作用,對保護DNA鏈免受細胞核中核酸酶的消化十分重要。核小體的結構:染色質中的DNA雙螺旋鏈,等距離纏繞組蛋白八聚體形成眾多核心顆粒,各顆粒之間為帶有H1組蛋白的連接區DNA。這種組成染色質的重複結構單位就是核小體。[1]核心顆粒外觀呈橢圓形,軸比為0.5,顆粒直徑11nm,高5.5nm。繞顆粒的DNA長度為50nm(146bp),連接區DNA長度為20nm(約60bp)。[2](H2A.H2B.H3.H4)2構成的八聚體位於顆粒中央,外繞1.75圈左走向的DNA鏈,每圈約85bpDNA,螺旋間距為2.8nm。組蛋白主要為α-螺旋,處於DNA雙螺旋的大溝中。靠靜電引力與DNA保持穩定結合。由於空間構象的關係,纏繞在蛋白八聚體上的DNA鏈並非所有部分都與組蛋白結合。[3]相鄰核心顆粒由連接區DNA連接,其伸展長度約20nm,據認為天然狀況下由於核小體是緊挨著的,此一空間距離可能並不存在。H1組蛋白結合在靠核心顆粒的連接區DNA上。

染色體的包裝實際上是指細胞核DNA在雙螺旋基礎上的經多層次的進一步結構變化,需結構變化才能實現。這些結構變化總的看是更高層次的超螺旋形成。(3)染色體的包裝─超螺旋結構核小體可視為染色體DNA的一級包裝,即由直徑2nm的DNA雙螺旋鏈繞組蛋白形成直徑11nm的核小體結構。若以每堿基對沿螺旋中軸上升距離為0.34nm計,200bpDNA的伸展長度為68nm,形成核小體後僅為10nm(直徑),其長度壓縮了6-7倍。

螺線管纖維是二級包裝結構模型。在高離子強度和H1存在下,10nm核小體纖維會盤繞形成外徑為30nm的中空螺線管,每圈含6個核小體,即染色體DNA的二級包裝。因此,螺線管的形成使DNA一級包裝又壓縮小6倍。故染色體的二級包裝相當於將DNA長度壓縮了近40倍。H1組蛋白在維持毗鄰核小體的緊密度及核小體纖維折轉形成螺線管中起了重要作用。DNA雙鏈螺旋經三級包裝環狀螺線管的過程環狀螺線管是在螺線管纖維基礎上的更高一級包裝。這種結構是30nm纖維纏繞在一個由某些非組蛋白構成的中心軸骨架上形成的。這顯然使螺線管纖維得到了較大程度的壓縮。經三級包裝完成後,DNA鏈被壓縮的程度仍遠不足以形成能被細胞核容納的染色體。具環形區的螺線管纖維需進一步以某種方式盤繞、折疊,最終完成細胞生長和繁殖的不同時期的染色體包裝。從螺線管纖維環到包裝形成染色體,應該是DNA壓縮程度最高的階段,估計在200-240倍。經各級包裝後染色體DNA總共被壓縮了數千倍,這樣,才能使每個染色體中幾釐米長(如人染色體的DNA分子平均長度為4cm)的DNA分子容納在直徑數微米(如人細胞核的直徑為6-7μm)的細胞核中。

真核生物基因組一般比較龐大,如人的基因組由3×109bp組成,按1000個堿基編碼一種蛋白質計,理論上可有300萬個基因,但實際基因總數不會超過4萬個。這說明在人細胞基因組中有許多DNA序列並不轉錄成mRNA。六、真核生物染色體基因組的結構和功能

DNA的複性動力學研究發現這些非編碼區往往都是一些重複序列,這些重複序列或集中成簇,或分散在基因之間。在基因內部也有許多能轉錄但不翻譯的內含子。因此,在人細胞的整個基因組當中只有很少一部份的DNA序列用以編碼蛋白質。

真核生物基因組DNA與蛋白質結合形成染色體,儲存於細胞核內,除配子細胞外,體細胞內的基因組是雙份的,即有兩份同源的基因組。1.真核生物基因組特點2)真核基因轉錄產物為單順反子。1個結構基因轉錄和翻譯生成1個mRNA分子和1條多肽鏈。3)存在重複序列,重複次數可達百萬次以上。4)基因組中不編碼的區域多於編碼區域。5)大部分基因含有內含子,基因是不連續的。6)基因組遠遠大於原核生物的基因組,具有許多複製起點,而每個複製子的長度較小。

高度重複序列在基因組中重複頻率高,可達百萬(106)以上,因此複性速度很快。在基因組中所占比例隨種屬而異,約占10-60%,在人基因組中約占20%。高度重複順序又按其結構特點分為三種。

2.

高度重複序列

複性速度極快,即使在極稀的DNA濃度下,也能很快複性,又稱零時複性部分,約占人基因組的5%。(1)反向重複序列

反向重複(即兩個互補拷貝)間可有一到幾個核苷酸的間隔,也可以沒有間隔。沒有間隔的又稱回文結構,這種結構約占所有反向重複的1/3。衛星DNA(satelliteDNA)是另一類高度重複序列,其重複單位一般由2-10bp組成,成串排列。由於堿基組成(富含AT)不同於其他部份,用等密度梯度離心法將其與主體DNA分開,因而稱為衛星DNA或隨體DNA。(2)衛星DNA在人細胞中衛星DNA約占5-6%。按照它們的浮力密度不同,人的衛星DNA可分為Ⅰ、Ⅱ、Ⅲ、Ⅳ四種。(2)衛星DNA而蟹的衛星DNA只有AT兩個堿基的重複順序組成。果蠅的衛星DNA順序已經搞清楚,可分為三類,都是由7bp組成的高度重複順序:這種重複順序為靈長類所獨有。用限制性內切酶HindⅢ消化非洲綠猴DNA,可以得到重複單位為172bp的高度重複順序,這種順序大部份由交替變化的嘌呤和嘧啶組成。有人把這類稱為α衛星DNA。而人的α衛星DNA更為複雜,含有多順序家族。(3)較複雜的重複單位組成的重複順序a.參與複製水準的調節。反向重複序列常存在於DNA複製起點區的附近,另外,許多反向重複序列是一些蛋白質(包括酶)和DNA的結合位點。b.參與基因表達的調控。重複順序可以轉錄到hnRNA分子中,有些反向重複順序可以形成髮夾結構,這對穩定RNA分子,免遭分解有重要作用。高度重複順序的功能c.參與轉位作用。幾乎所有轉位因數的末端都包括反向重複順序,長度由幾個bp到1400bp。由於這種順序可以形成回文結構,因此在轉位作用中即能連接非同源的基因,又可以被參與轉位的特異酶所識別。d.與進化有關。不同種屬的高度重複順序的核苷酸序列不同,具有種屬特異性,但相近種屬又有相似性。在進化中某些特殊區段保守,而其他區域的堿基序列則累積著變化。e.同一種屬中不同個體的高度重複順序的重複次數不一樣,這可以作為每一個體的特徵,即DNA指紋f.α衛星DNA成簇的分佈在染色體著絲粒附近,可能與染色體減數分裂時染色體配對有關,即同源染色體之間的聯會可能依賴於具有染色體專一性的特定衛星DNA順序。

中度重複序列大致指在真核基因組中重複數十至數萬(<105)次的重複順序。其複性速度快於單拷貝順序,但慢於高度重複順序。少數在基因組中成串排列在一個區域,大多數與單拷貝基因間隔排列。依據重複順序的長度,中度重複順序可分為兩種類型。3.

中度重複順序

短分散片段(shortinterspersedrepeatedsegments,SINES)這類重複順序的平均長度約為300bp(<500bp),它們與平均長度約為1000bp的單拷貝順序間隔排列。拷貝數可達10萬左右。如Alu家族,Hinf家族等屬於這種類型的中度重複序列。(1)短分散片段

長分散片段(Longinterspersedrepeatedsegments,LINES)這類重複順序的長度大於1000bp,平均長度為3500-5000bp,它們與平均長度為13000bp(個別長幾萬bp)的單拷貝順序間隔排列。也有的實驗顯示人基因組中所有LINES之間的平均距離為2.2kb,拷貝數一般在1萬左右,如KpnⅠ家族等。中度重複順序在基因組中所占比例在不同種屬之間差異很大,一般約占10-40%,在人約為12%。這些順序大多不編碼蛋白質。(2)長分散片段這些非編碼的中度重複順序的功能可能類似於高度重複順序。在結構基因之間,基因簇中,以及內含子內都可以見到這些短的和長的中度重複順序。按本文的分類原則有些中度重複順序則是編碼蛋白質或rRNA的結構基因,如HLA基因,rRNA基因,tRNA基因,組蛋白基因,免疫球蛋白基因等。中度重複順序一般具有種特異性;在適當的情況下,可以應用它們作為探針區分不同種哺乳動物細胞的DNA。下麵介紹幾種典型的中度重複順序。(2)長分散片段Alu家族是哺乳動物包括人基因組中含量最豐富的一種中度重複順序家族,在單倍體人基因組中重複達30萬-50萬次,約占人基因組的3-6%。Alu家族每個成員的長度約300bp,由於每個單位長度中有一個限制性內切酶Alu的切點(AG↓CT)從而將其切成長130和170bp的兩段,因而定名為Alu序列(或Alu家族)。Alu序列分散在整個人體或其他哺乳動物基因組中,在間隔DNA內含子中都發現有Alu序列,平均每5kbDNA就有一個Alu順序。已建立的基因組中無例外地含有Alu順序。Alu家族:Alu順序具有種的特異性,人的Alu順序製備的探針只能用於檢測人的基因組中的Alu序列。大多數人的DNA克隆中都含有Alu順序,用人的Alu序列製備的探針與要篩選的克隆雜交,陽性者即為含有人DNA克隆,陰性者不含有人DNA。人類Alu順序是由兩個約130bp的正向重複構成的二聚體,而在第二個單體中有一個31bp的插入序列,該插入序列在Alu家族的不同成員之間核苷酸順序相似但不相同。每個Alu順序兩側為6-20bp的正向重複順序,不同的Alu成員的側翼重複順序也各不相同。Alu序列的5'端比較保守,但富含A殘基的3'端在不同的Alu成員中是有變化的。

相近的生物體中Alu家族在結構上存在相似性,靈長類基因組中的Alu順序多為由兩個130bp的正向重複組成的二聚體,而齧類動物則為由一個130bp左右的DNA片段組成的單體。

Alu序列在不同的哺乳動物之間存在一定的相似性,但其序列相差較大,不會產生交叉雜交。

Alu順序在整個基因組中含量豐富,散佈廣泛的可能原因:①Alu順序可由RNA聚合酶轉錄成RNA分子,再經反轉錄酶的作用形成cDNA,然後重新插入基因組所致。②Alu序列兩側存在著短的重複順序,使得Alu順序很象轉座子,因此推測Alu順序可能也是能夠移動的。Alu家族的功能:①Alu順序可能參與hnRNA的加工與成熟許多hnRNA中含有大量的Alu順序,且Alu順序含有與某些真核基因內含子剪接接頭相似的序列。②Alu序列與遺傳重組及染色體不穩定性有關Alu序列在人基因組中不尋常地大量存在。最近發現在人的細胞中存在自然發生的染色體外雙鏈環狀DAN,被稱為人類質粒(humanplasmid),這些質粒又毫無例外地含有Alu順序。還有研究表明,Alu順序中的某些區段有形成Z-DNA的能力。③Alu順序可能具有轉錄調節作用。KpnⅠ家族是中度重複順序中僅次於Alu家族的第二大家族。用限制性內切酶KpnⅠ消化人類及其它靈長類動物的DNA,在電泳譜上可以看到4個不同長度的片段,分別為1.2,1.5,1.8和1.9kb,這就是所謂的KpnⅠ家族。KpnⅠ家族成員順序比Alu家族更長(如人KpnⅠ順序長6.4kb),而且更加不均一,呈散在分佈,屬於中度重複順序的長分散片段型。儘管不同長度類型的KpnⅠ家族(稱為亞類,subfamily)之間同源性比較小,不能互相雜交,但它們的3’端有廣泛的同源性。KpnⅠ家族的拷貝數約為3000-4800個,占人體基因組的1%,與散在分佈的Alu家族相似,KpnⅠ家族中至少有一部份也是通過KpnⅠ順序的RNA轉錄產物的cDNA拷貝的重新插入到人基因組DNA中而產生的。KpnⅠ家族:Hinf家族以319bp長度的串聯重複存在於人體基因組中。用限制性內切酶HinfⅠ消化人體DNA,可以分離到這一片段。Hinf家族在單位基因組內約有50

100個拷貝,分散在不同的區域。319bp單位可以再分成兩個亞單位,分別為172bp和147bp,它們之間有70%的同源性。Hinf家族:

多聚dTdG家族的基本單位是dTdG,多個dTdG串聯重複在一起,分散於基因組中。已經發現,這個家族的一個成員位於人類δ和β珠蛋白基因之間,含有17個dTdG組成的串聯重複順序。在人基因組中,dTdG交替順序達106拷貝,平均長度為40bp。dTdG串聯重複順序可能是基因轉變(geneconversion)或不等交換(unequalcrossing-over)的識別信號。另外,這些嘌呤和嘧啶的交替順序有助於Z-DNA的形成,在基因調節中可能起著重要的作用。多聚dTdG家族:

原核生物如E.coli基因組中,rRNA基因一共是7套;真核生物中rRNA基因的重複次數更多。低等真核生物如酵母:5S,18S,28SrRNA在同一轉錄單位中;高等生物:5SrRNA是單獨轉錄的,18S和28SrRNA基因構成一個轉錄單位。5S基因的重複次數高於18S和28S基因。和一般的中度重複順序不同,rRNA基因各重複單位相同。rRNA基因常成簇存在,不分散於基因組中,稱為rDNA區域,如染色體的核仁組織區(nucleolusorganizerregion)即為rDNA區。rRNA基因:

在哺乳動物和兩棲動物中,18S和28SrRNA之間的間隔區經轉錄加工成為5.8SrRNA(在大腸桿菌中該區為tRNA序列)。rRNA前體的其他部份被降解成核苷酸。真核生物中每個轉錄單位約長7-8kb(哺乳動物為13kb),其中編碼rRNA的部分占70-80%(哺乳動物50%左右)。一個rRNA基因簇含有許多轉錄單位,轉錄單位之間為21-100bp間隔區,類似衛星DNA的串聯重複順序。轉錄單位和間隔區構成一個rDNA重複單位。不同生物及同種生物的不同rDNA重複單位之間間隔區的長短相差甚大。rDNA的重複單位在許多動物的卵子形成過程中進行大量複製擴增,如爪蟾在擴增前有rDNA重複單位500個,在從卵母細胞前身發展到卵母細胞過程中,rDNA的重複單位可擴增400倍,每個細胞核的核仁數增加到幾百個。擴增rDNA的過程是採用滾環式複製方式在核仁區進行的,擴增的DNA不納入到染色體中,而是包含在核區。卵母細胞成熟後,大量的rDNA由於失去了存在的意義而逐漸降解。在卵子形成的過程中rDNA大量擴增的目的,就是為了產生大量的rRNA,組裝成核糖體,用於合成大量的蛋白質,以滿足受精後發育的需要。

大多數真核細胞5SrRNA基因在基因組中亦呈串聯重複排列成基因簇。爪蟾5SrRNA基因在體細胞中約500拷貝,卵細胞中可重複2萬多次。在爪蟾中發現有幾種5SrRNA基因。最主要的一種與18S、28S基因相似,即5S基因與間隔區相間排列,組成一個重複單位。每個重複單位的5'端是含一段49bp長的GC豐富區;在卵細胞中還有一個次要的5SrRNA基因,與主要的5S基因在序列上有一定的差異,在結構上與主要的5S基因相似,但整個重複單位長只有350bp,而且間隔區與主要的5S基因完全不一樣。人類的rRNA基因位於13,14,15,21和22號染色體的核仁組織區,每個核仁組織區平均含有50個rRNA基因的重複單位。5SrRNA基因似乎全部位於1號染色體上,每單倍體基因組約有1000個5SrRNA基因。

tRNA基因的精確重複次數比較難以估計。在非洲爪蟾中約有300個拷貝由tRNAmet,tRNAphe,tRNAtrp及其它tRNA基因組成的3.18kb的串聯重複單位。而在人體單倍基因組中約有1000-2000個tRNA基因,為50-60種rRNA編碼,每種平均重複20-30次。tRNA基因:

組蛋白基因在各種生物體內重複的次數不一樣,但都在中度重複的範圍內。通常每種組蛋白的基因在同一種生物中拷貝數是相同的。雞的基因組中組蛋白基因有10個拷貝,在哺乳動物中為20拷貝,非洲爪蟾為40拷貝,而海膽的每種組蛋白的基因達300-600拷貝。組蛋白基因沒有一定的排列方式,而在拷貝數高的基因組中(>100拷貝),大部份組蛋白基因串聯重複形成基因簇。組蛋白基因:在果蠅和非洲爪蟾中,5種組蛋白也排成一個重複單位,也存在間隔區,而且組蛋白基因的轉錄方向不一樣。多個重複單位也形成串聯重複排列。哺乳動物:組蛋白基因一般不再形成重複單位,而呈散在分佈或集成一小群。儘管組蛋白基因在基因組中的排列和分佈在不同生物之間相差甚大,但是所有組蛋白基因都不含內含子,而且在序列上相應的組蛋白基因都很相似,從而編碼的組蛋白在結構上和功能上也極為相似。基因組中存在大量重複序列用以編碼組蛋白的重要意義:DNA複製時,組蛋白也要成倍增加,而且往往在DNA合成一小段後,組蛋白馬上就要與其相結合,這要求在較短的時間內合成大量的組蛋白,因而需要有大量的組蛋白基因存在。單拷貝順序在單倍體基因組中只出現一次或數次,因而複性速度很慢。單拷貝順序在基因組中占50-80%,如人基因組中,大約有60-65%的順序屬於這一類。單拷貝順序中儲存了巨大的遺傳資訊,編碼各種不同功能的蛋白質。目前尚不清楚單拷貝基因的確切數字,但是在單拷貝順序中只有一小部分用來編碼各種蛋白質,其他部分的功能尚不清楚。單拷貝順序的兩側往往為散在分佈的重複順序。4.

單拷貝順序(低度重複順序)

由於某些單拷貝順序編碼蛋白質,體現了生物的各種功能,因此對這些序列的研究對醫學實踐有特別重要的意義。但由於其拷貝數少,在DNA重組技術出現以前,要分離和分析其結構和順序幾乎是不可能的,現在人們通過基因重組技術可以獲得大量欲研究的基因,並對許多結構基因進行了較為細緻的研究。

多基因家族(multigenefamily)是指由某一祖先基因經過重複和變異所產生的一組基因。大致可分為兩類:一類是基因家族成簇地分佈在某一條染色體上,它們可同時發揮作用,合成某些蛋白質,如組蛋白基因家族就成簇地集中在第7號染色體長臂3區2帶到3區6帶區域內;另一類是一個基因家族的不同成員成簇地分佈不同染色體上,這些不同成員編碼一組功能上緊密相關的蛋白質,如珠蛋白基因家族。5.

多基因家族與假基因假基因(pseudogene)是指在多基因家族中,某些並不產生有功能產物的基因。假基因與有功能的基因同源。可能是有功能的基因,由於缺失,倒位或點突變等,使這一基因失去活性,成為無功能基因。與相應的正常基因相比,假基因往往缺少正常基因的內含子,兩側有順向重複序列。推測,假基因的來源之一,可能是細胞內mRNA反轉錄成cDNA,再整合到染色體DNA中去,再成為假基因,因此該假基因是沒有內含子的,在這個過程中,可能同時會發生缺失,倒位或點突變等變化,從而使假基因不能表達。在哺乳動物包括人體基因組中,存在著大量的非編碼順序,如高度重複順序、內含子、間隔DNA等。這些順序中,只有很小一部分具有重要的調節功能,絕大部分都沒有什麼特殊功用。在這些DNA序列中雖然積累了大量缺失,重複或其他突變,但對生物並沒有什麼影響,它們的功能似乎只是自身複製,所以人們稱這類DNA為自私DNA或寄生DNA(parasiteDNA)。自私DNA也許有重要的功能,但目前我們還不了解。6.

自私DNA(selfishDNA)七、限制性片段長度多態性

不同生物體內DNA結構存在相當大的差異。同種生物不同個體之間,儘管其蛋白質結構和功能完全相同或僅存在細微的差異,但在DNA水準卻存在著差異,尤其在不編碼的區域以及沒有重要調節功能的區域表現更為突出。

DNA上的大多數突變是中性突變,不影響生物體的表型,過去對這些突變不太重視,也無法用傳統的遺傳學方法來研究。隨著分子生物學技術的不斷發展,從DNA水準上直接分析生物體的突變成為可能。

假如DNA順序中的某個堿基發生了突變,使突變所在部位的DNA序列產生(或缺失)某種限制性內切酶的位點。這樣,利用該限制性內切酶消化此DNA時,便會產生與正常不同的限制性片段。這樣,在同種生物的不同個體中會出現不同長度的限制性片段類型,即限制性片段多態性(RestrictionFragmentLengthPolymorphism,RFLP)。RFLP分為兩類型:一類是由於限制性內切酶位點上發生了單個堿基突變而使這一限制性位點發生丟失或獲得而產生的多態性,故稱之為點多態性(pointpolymorphism)。這類多態性實際上是雙態的,即有(+)或無(-)。另一類是由於DNA

分子內部發生較大的順序變化所致。這一類多態性又可以分成兩類:

第一類是由於DNA

順序上發生突變如缺失、重複、插入所致。第二類是所謂“高變區”。高變區(highlyvariableregion)是由多個串聯重複順序組成的,不同的個體,高變區內所串聯重複的拷貝數相差懸殊,因而高變區的長度變化很大,從而使高變區兩側限制性內切酶識別位點的固定位置隨高變區的大小而發生相對位移。所以這一類型的RFLP是由於高變區內串聯重複順序的拷貝數不同所產生的,其突出特徵是限制性內切酶識別位點本身的堿基沒有發生改變,改變的只是它在基因組中的相對位置。實際上,在DNA順序中,存在著大量的單個堿基的替換,但用通常的技術只能檢測出影響到限制性內切酶識別位點上的突變。人的衛星DNA或稱隨體DNA是由一些短的DNA片段(10bp左右)多次重複所構成的。重複片段的組成和拷貝數在不同的個體及基因組的不同位置上不一樣。提取不同個體的基因組DNA後,用其切點能識別序列為4個堿基而又不切割該重複片段的限制性內切酶在重複片段的兩側切割基因組DNA,然後將樣品進行凝膠電泳。不同長度的重複片段(主要是由於重複單位的拷貝數不同所致)就會分開,再與含有這些重複序列的特異性探針雜交,便形成有個體特異性的放射性自顯影圖,亦稱為DNA指紋。

DNA指紋圖譜取決於所用探針的核心序列(即重複序列中的重複單位)。目前所用的探針有兩種:33.15,核心序列為AGAGGTGGGCAGGTGG;33.6,即AGGGCTGGAGG。這兩種序列在人體基因組中不同的位置上分別重複不同的次數,而在不同個體的基因組中,對應位置上這兩種核心序列的重複次數也不相同。這樣用這兩種探針之一與合適的酶切割的人體基因組DNA

片段雜交,在不同的個體將得到不同的DNA指紋,而且探針33.6的DNA指紋圖也不相同。DNA

指紋具有細胞穩定性和種系穩定性,是按孟德爾規律遺傳的,而且雜合性高。由於DNA指紋是按孟德爾規律遺傳的,子代的DNA指紋圖可以追溯到其父母DNA指紋圖上,而在不是其父母的DNA指紋圖上則很難找到與其一樣的小隨體DNA片段。在父親的5條可分辨的小隨體DNA片段中,有4條處於雜合狀態,即這4條DNA片段有不同的個體長度。因此,因高變區核心序列重複次數不同引起的RLFP才是真正的多態性。在不同個體,這種RLFP即DNA

指紋可以說不存在相同的。即使使用一種探針產生的DNA指紋圖無法鑒定這兩個個體,如再用另一種探針便有可能將這兩個個體區分開。DNA指紋技術已被應用於親子鑒定和法醫學上對罪犯的確認等領域。基因、基因組與基因組學第一章基因的結構第二章基因組的結構與功能第三章基因組學簡介第一章基因的結構基因分類:1.編碼基因:最終產物是蛋白質。編碼基因是分子生物學研究的主要對象。2.非編碼基因:最終產物是RNA。由於RNA長期被認為是結構單位,而非功能單位,非編碼基因沒有受到重視。自1982年發現RNA具有自我催化功能,非編碼基因的研究受到重視。第一章基因的結構非編碼基因功能:1.rRNA和tRNA參與蛋白質的合成。2.生物界起源於RNA

。3.RNA具有自我催化功能。4.參與生物發育及基因表達的調控。5.無所不能的RNA。第一章基因的結構RNA參與基因的轉錄調控、染色體複製、RNA處理及修飾、mRNA的翻譯和穩定性、蛋白質的降解及轉移等生物過程。

基因的結構即指DNA序列,也包括基因產物的結構。第一章基因的結構第一節、非編碼RNA基因的結構一、非編碼RNA的名稱和種類ncRNA:Non-codingRNA,除mRNA以外的所有RNA。fRNA:FunctionalRNA,除mRNA、rRNA、tRNA

之外的所有RNA。miRNA*:MicroRNA,參與翻譯的調控、mRNA

的特異性降解。siRNA:SmallinterferingRNA,參與RNA沉默過程,多數是mRNA的降解片斷。第一章基因的結構第一節、非編碼RNA基因的結構一、非編碼RNA的名稱和種類snRNA*:SmallnuclearRNA,包括拼接小體

RNA(spliceosomalRNA)。snmRNA:Smallnon-mRNA,即小非編碼RNAsnoRNA*:SmallnucleolarRNA,參與rRNA和

tRNA的修飾。stRNA:SmalltemporalRNA,參與RNA沉默過程,多數是mRNA的降解片斷。第一章基因的結構第一節、非編碼RNA基因的結構二、核酶ribozyme的發現和結構1979,Cech通過電鏡發現原生動物Tetrahymena

thermophila

的rRNA基因含有內含子。

1982,又發現rRNA前體能自我剪接。[Cell,31,147~157,(1982)]1983,通過重組技術證明RNA具有催化功能,提出ribozyme概念。[Nature,301,578~583,(1983)]ThomasR.Cech第一章基因的結構第一節、非編碼RNA基因的結構二、核酶ribozyme的發現和結構1971,Altman發現大腸桿菌的RNaseP含有RNA。除去RNA後RNaseP失去活性。

1983,證明M1RNA是RNaseP的催化組分,在較高[Mg2+]下,能切割tRNA前體。[Cell,35,849~857,(1983)]SidneyAltman,Ph.D.PressRelease:The1989NobelPrizeinChemistry12October1989

TheRoyalSwedishAcademyofScienceshasdecidedtoawardthe1989NobelPrizeinchemistryjointlyto

ProfessorSidneyAltman,YaleUniversity,NewHaven,Connecticut,USA

ProfessorThomasCech,UniversityofColorado,Boulder,USA

fortheirdiscoveryofcatalyticpropertiesofRNA.Ⅰ類內含子:存在於rRNA和質體tRNA基因中。利用pG為輔助因數,通過堿基互補形成特定的高級結構。具有核酶性質的RNA主要有三類:1.內含子核酶Ⅱ類內含子:存在於線粒體和質體mRNA基因中。剪接點序列高度保守,5’端為GUGCG,3’端為YNAU,中間序列形成保守的二級結構。Ⅲ類內含子:存在於細胞核的mRNA基因中。需要snRNA。Ⅳ類內含子:存在於細胞核的tRNA基因中。需要核酸內切酶。Aschematicpictureoftheself-splittingofRNA-molecules.Previouslyitwasthoughtthatthisprocess,whichiscrucialforthetranscriptionofthegeneticmessage,requiredthecatalyticactivityofproteins(fromAnn.Rev.Biochem.198655:606).

TetrahymenaGroupIRibozymeX-rayCrystalStructureScience282,259-264(1998)最早發現的核酶,為I類內含子。

類病毒:是基因組只有幾百個核苷酸的單鏈環狀RNA。不編碼任何蛋白質,卻能在植物細胞內自主複製(滾環複製),再通過切割成單個的環狀單鏈RNA。完成切割和連接任務的就是類病毒RNA本身。具有核酶性質的RNA主要有三類:2.類病毒、衛星病毒、衛星RNA核酶

病毒衛星RNA:一種依賴其他病毒在寄主細胞中的RNA,其基因組也有核酶的結構

擬病毒:結構類似類病毒的衛星RNA,其基因組也有核酶的結構。錘頭型:含有50個堿基,其中14個核心堿基序列是絕對必需的。其二級結構含有3個雙鏈螺旋結構和5個單鏈區。類病毒、衛星病毒、衛星RNA核酶的種類髮夾型:含有50個堿基,其二級結構含有4個雙鏈螺旋結構和2個單鏈的環組成。具有內切酶和連接酶活性,是自身複製所必需的。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论