地球自形成以来已经历了46亿多年地球上有生命的历史至少可追溯到_第1页
地球自形成以来已经历了46亿多年地球上有生命的历史至少可追溯到_第2页
地球自形成以来已经历了46亿多年地球上有生命的历史至少可追溯到_第3页
地球自形成以来已经历了46亿多年地球上有生命的历史至少可追溯到_第4页
地球自形成以来已经历了46亿多年地球上有生命的历史至少可追溯到_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生命进化对称性的数理模型(南京大学生物技术系2004级210093南京)摘要:首先通过物理系统分析了结构对称与能量最小之间的关系,在此基础上解释了动物体形结构的对称性,并认为动物体形结构的对称性是在进化过程由“最小能量原理”决定的。通过核苷酸的二进制数字编码,并根据对称变换分析4种核苷酸的二进制数字编码与对称性之间密切关系。根据氨基酸遗传密码子的简并程度并以分子量(Mw)及等电点(pI)作为氨基酸的化学特性坐标,作出其二维集合MP分类图,根据氨基酸的分类分析,可以认为:高简并度(对称性高)氨基酸多数是脂烃类和羟脂烃类的氨基酸,分子量比较小,分子结构比较简单,大部分为疏水性,主要组成跨膜结构或蛋

2、白质的结构域,可能是出现较早的氨基酸;而低简并度(对称性低)的氨基酸,分子结构比较复杂,分子量比较大,多数是和蛋白质功能有密切联系的基团,可能是进化出现较晚的结构。最后对数字生物学的意义进行了简要分析和讨论。关键词:对称性;最小能量原理;对称变换;遗传密码简并度;分子对称;数字生物学MathematicalandPhysicalModelonSymmetryofTheCreatureEvolutionLiSiwei(DepartmentofBiochemistry,NanjingUniversity,Nanjing210093)Abstract:Twoactuallyphysicalsyste

3、msarefirstlyanalyzedinthispaper.Therelationbetweenthestructuresymmetryandtheminimumenergyisthenshown.Onthebasis,weanalyzeandexplainthesymmetryofbodystructureofanimals,andthinkthatthesymmetryofbodystructureofanimalsisdeterminedbytheprincipleofminimumenergy.The4nucleotidesofDNAsequencescanbefurtherenc

4、odedwithtwo-bitdigitsinwhichthefirstbitisthebasebittoencodepurinesandpyrimidinesandthesecondbitisthefunctionalgroupbittoencodetheketogroupandaminogroup.Accordingtothedegreeofdegeneracyofgeneticcodesandthetwodimensiondistributionofmolecularweights(Mw)andisoelectricpoints(pI)ofaminoacids,asetofclassif

5、icationgraph(Vennsdiagram)ofaminoacidscanbeobtained.Itissuggestedthattheaminoacidsofhighdegenerategrouparemostlysmallandsimple,andconstitutethetransmembranicstructureorthestructuraldomainsofproteinmolecules.Soaminoacidsofhighdegenerategroupmightappearintheearlyevolutionstage.Ontheotherhand,theaminoa

6、cidsoflowdegenerategroupareratherlargeandcomplex,andultimatelycorrelatetothefunctionaldomainsofproteinmolecules,then,theaminoacidsoflowdegenerategroupmightappearmorelatelyduringevolution.Keywords:Symmetry;Principleofminimumenergy;Symmetrytransform;Degeneracyofgeneticcodes;Symmetryofmolecules;Digital

7、biology地球上有生命的历史至少可追溯到38亿年前。我国学者陈均远等在贵州瓮安发现的518亿年前的贵州小春虫(Vernanimalculaguizhouena)化石,显示了古老的两侧对称和真体腔特征,将两侧对称动物可靠的化石记录前推到了寒武纪之前4000万年。古生物学证据表明,无论已灭绝的动物(如三叶虫等)还是现存的动物,其体型结构大多采取对称或大致对称的形式。形态结构对称性动物体型为什么要采取对称结构?生命体中熵的产生率p满足dp/dtWO(熵产生极小定理),即生命系统将在一个熵产生极小或近似极小的状态下运转。Lehninger所指出的“生命这台化学引擎是按照最经济原理工作的”与熵产生极

8、小定理联系在一起,并认为“最经济原理”就是熵产生的极小性。熵产生极小定理仅能说明生命系统具有结构,但无法说明具有对称结构。首先对两个具体的物理系统进行分析,揭示了结构对称与能量最小之间的关系,在此基础上分析和解释了动物体形结构的对称性,并认为动物体形结构的对称性是由“最小能量原理”决定的。1.1物理系统的对称结构与最小能量原理:在解释动物体形结构的对称性之前,让我们先分析和讨论下面2个物理系统。例1:考察由两个电阻构成的并联电路(图1),图中I、R为常数,且R=R+R。12现在问RJ和R各取什么值时,整个电路系统消耗的总能量最小。图2带两个臂的旋转陀螺112图1两电阻并联电路该问题可转化为如下

9、非线性规划问题:mini2R+i2R1122iiRR1,2,1,2i+i=IS.t.12R+R=R12(1)式中,ji表示电路系统消耗的总能量。式的解为叮r2=2r,即当两个电阻的阻值相等(对称)时,系统所消耗的总能量最小。例2:考察带两个臂的旋转陀螺系统(图2),图中3为角速度,m与m为质量,L121与L为长度,3、m、L为常数且m二m+m,L=L+L。现在问,在不考虑两臂和转轴21212的质量的情况下,m、m、L与L各取何值时,旋转陀螺系统的动能达到最小。1212上述问题同样可转化为非线性规划问题:min11(L3)22(2)m1,2,L1,L2m+m=mS.t.i2L+L=L121式中,

10、J表示陀螺系统的动能。式(2)的解为m=m=1m,L=L=L,即当陀螺系212212统的结构轴对称时,系统的动能达到最小。1.2动物体形结构的对称性按照动物分类学,动物可分为原生动物和后生动物。原生动物是单细胞或多细胞的,除肉足纲(能随时变形的动物,如大变形虫等)外,体形具有或近似具有某种对称方式;后生动物是多细胞的,体形有多种对称方式,进化趋势是由辐射对称到左右对称6。动物多样性主要是由动物物种在其产生、特别是在进化过程中所经历的环境改变和选择压所致。是什么使它们在体形结构上具有高度的共性对称性?动物体形结构的对称性与“最小能量原理”之间是否存在着某种联系。动物在空间尺度上的分布大约在几十微

11、米到几十米之间,其运动速度大约在每小时几百千米之内。在这样的空间尺度和速度范围内,动物体内的物理化学过程和体形结构可以用经典的物理化学理论来近似描述。动物(除变形虫外)的身体一般具有相对固定的结构,从物理学的角度讲,运动中的动物可以看作运动中的物理系统。由于重力、阻力和其它方面的影响,动物在其生存环境(水、空气和土壤等)中运动时,总是要消耗能量的。前面对物理系统的分析表明,动物采用对称的体形结构有利于动物在其运动过程中减少能量消耗。从复杂性科学的观点看,动物是一类高度的复杂系统。他们在长期进化和与外界环境相互作用过程中,具有自主学习、自主适应和自主调节的功能。动物作为物理系统要受到“最小能量原

12、理”的制约,作为复杂适应系统具有自主调节功能,因此动物具有对称的体形结构也就可以理解了。无论物理系统还是生命系统,结构对称不仅有利于平衡、稳定,而且有利于使系统处于最小能量状态;另外,若运动能量保持不变,系统采取对称结构方式较采取不对称结构方式运动时速度会更快,比如:将一个煮熟了的鸡蛋平放在一个光滑的桌面上,然后用力旋转它,当转速大于某一值时,鸡蛋会由平放时的不对称旋转自动地变到直立时的对称旋转,而且转速加快)。上述现象不仅在科学实验中,而且在人们的大量生活实践中都可以观测到。动物进化是一个缓慢(一般需要几十万年到几千万年)的累积过程。已知的考古发现表明,不论自然环境发生什么样的变化,动物在进

13、化过程中总保持其体形结构的对称性。现代生物进化学认为,蛇是由蜥蜴进化(蛇的头部后两则现在仍有腿的痕迹存在)来的。设想蛇的进化分两步完成,在前一半进化期内退掉左(右)侧的腿,后一半进化期内退掉右(左)侧的腿。从运动学上讲,这种不对称结构在生存竞争上会处于劣势,也许蛇的某一侧腿还没有退完就被自然界淘汰了。任何一个动物的外部环境不仅包括自然环境,还包括正在进化的同种动物和异种动物,因此选择性压力不仅包括自然环境变化的压力,同时还包括同种和异种动物之间的竞争(食物竞争、空间竞争、交配竞争以生死竞争等)与协作(共利协作、寄生协作与互利协作等)。动物体形结构的对称有利于对付选择性压力,这主要是因为:完成同

14、一种生存活动,对称结构较不对称结构会节省能量;反之,用相同的能量,对称结构较不对称结构会获得更大的生存收益。宏观上,可以通过经典物理化学的理论来解释形态在进化朝对称性是有利的。然而,生物体内呢?体里内的基因又是如何进化的呢?也是朝对称性方向吗?对称性在自然界及生命现象中普遍存在,大至宇宙的起源,小至微观基本粒子的反应过程,都离不开对称和对称破缺法则。应用对称性的概念来研究遗传密码的编码法则,对深入了解生命活动的规律,具有重要意义。对称是指由于均衡比例产生的匀称美。通常用对称变换的多少来描述系统的对称程度的高低。例如在天平的两侧各放物体A和B,如果A和B的质量相等,则天平处于对称稳定(平衡)状态

15、,此时,如将A和B互换,并不改变天平的状态。但如果A和B的质量不相等,则天平处于不对称(不稳定、不平衡)状态。此时如果将A和B互换,天平的状态就要发生变化。同理,对于遗传密码而言,甘氨酸的密码子为GGC,GGT,GGA,GGG,当第三位碱基互相变换时,其编码对象不变,即具有4种对称变换,所以其对称性较高。反之,色氨酸只有单一的密码子TGG,其中任一碱基的变化,都会引起编码对象的变化。故色氨酸的密码子只有一种对称变换(即单位变换E),其对称性最低。物质对称性越高,其平衡性、稳定性越高;反之,物质对称性越低,其平衡性、稳定性越低。因此,对称性较高的基因所对应的氨基酸在进化就更易保留下来。核苷酸的二

16、进制数字编码与对称性编码是针对编码对象的一种符号表示。目前遗传密码和DNA序列的编码仍然采用T、C、A、G4个字符对胸腺嘧啶、胞嘧啶、腺嘌吟和鸟嘌吟4种碱基进行编码,因而还不是最基本意义上的数字编码。通过计算,用0(00)、1(01)、2(10)、3(11)4个数码对4种碱基(C、T、A、G)进行二进制数字编码,共有24种可能的编码组合,其中只有8种满足碱基互补法则。在二进制数字中,0与1互补,即(0)=1,以及(1)=0,因此,在这4个数字中0(00)与3(11)互补,1(01)与2(10)互补,而在4个碱基中C与G互补,T与A互补。4种碱基的分子量按大小顺序排列是C=111.10,T=12

17、6.12,A=135.13,G=151.13。故我们提出按分子量大小顺序进行核苷酸的编码格式是0123/CTAG1。按数码计算,两对互补数字之和相等,即0+3=1+2而CTAG两对互补碱基对的分子量之和亦几乎相等,即C+G=262.23,T+A=261.25。表明DNA的互补碱基对具有质量对称性。故DNA形成的双螺旋结构比较稳定。相反,在RNA中,U虽然与A互补,但U的分子量较小(112.0),U+A=247.23与C+G=262.23相差较大。可以认为,可能由于RNA的互补碱基对中不具有质量对称性,故不能如DNA那样形成对称稳定的双螺旋结构,因此RNA的结构不如DNA稳定,这些与RNA是遗传

18、信息的传递载体而DNA是遗传信息的存储载体的功能相一致。C0(00)和G3(11)的数字编码,其首位与末位数字互换,其编码不变,即具有码位变换的对称性。共有3条氢键,属于强氢键结合,结合力较强,比较稳定。而T1(01)和A2(10)的数字编码,其首位和末位不同,故其对称性较低,只有2条氢键,属于弱氢键结合,结合力较弱,与实际情况完全一致。氨基酸、遗传密码与对称性3.1氨基酸的简并度分类。根据遗传密码简并度的大小,遗传密码子可分为6,4,3,2,1五种简并组。在简并组合中不出现5或7简并度的密码组,表明遗传密码的简并,符合取值为6,4,3,2,1的对称操作法则。20个氨基酸和终止码共有3个六合密

19、码组(L,S,R),5个四合密码组(A,P,T,V,G),2个三合密码组(I及终止码X),9个双合密码组(F,H,Y,K,C,D,N,E,Q)和2个单密码子(M,W)。3.2.遗传密码的简并度与对称性根据Crick的摆动学说(Wobbletheory),在翻译过程中,遗传密码子的第1位和第2位碱基必须十分精确,而第3位碱基的特异性较小。从遗传密码字典(表1)可以看出,当第1位碱基为C时,共有3组四合简并密码组:P,L,R。当第1位碱基为G时,共有3组四合简并密码组:V,A,G。但当第1位碱基为A时,只有1组四合简并密码组T,当第1位碱基为T时,亦只有1组四合简并密码组S。第二位碱基情况亦与此类

20、似。故可由此推论,在简并过程中,碱基C和G简并度较高,即C与G的对称程度较高,与编码C(00)和G(11)相一致。相反,碱基T和A在简并中,简并度较低,故其对称性亦较低,符合编码T(01)和A10)的情况。3.320种常见氨基酸的二维化学坐标分布集合分类图20种常见氨基酸的化学特性见表一。Table1ChemicalpropertiesofaminoacidsAminoacidNotationMolecularweightpvalueMaingroupof尺亡yduesglycineG75.075.97hydrogenalanineA89.096.02methylserineS105.095.

21、6ShydroxvaliphaticprolineP115.136.30aliphaticvalineV117.155.97aliphatictlireonineT119.126.53hydroxvaliphaticcvteineC121.125.02thialleucineL131.175.9SaliphaticicleuciueI131.176.02aliphaticasparagineN132.105.42amideasparticacidD133.102.97carboxylglutamineQ146.155.65amidelvineK146.199.74e-aminoglutamic

22、acidE147.133.22carboxylmerhiouineM149.215.75methyltliiolhistidineH1?5.167.59imidazolylphenylalanineF165.105.43phenylarginineR174.2010.76guanidyl根据表一提出以氨基酸分子量Mw为横轴,等电点pI为纵轴,作出20种氨基酸分子量(M)和等电点(P)的二维MP分布图。在此匕基础之上,每个氨基酸都有其确定的化学性质坐标,其中氨基酸分子量的大小顺序,在横轴上即可清楚显示,而非极性氨基酸和疏水氨基酸,在pI轴上主要集中分布于中部,而带电荷的氨基酸,其pI值则分别分布

23、在上面(带正电荷)和下面(带负电荷)。所以氨基酸的MP二维分布图能清楚反映氨基酸的化学性质,在MP图上可以对氨基酸的化学特性,如:大分子与小分子,极性与非极性,亲水和疏水,带正电荷和带负电荷,残基的各种主要功能基团,如:烃基,脂烃基,羟脂烃基,羧基,酰胺基,芳香基包括苯基等基团的集合分类图,都能清楚地加以显示。图3是在MP二维分布基础上的氨基酸集合分类图。在氨基酸MP二维分布集合分类图上,可以区分出以下分类集合:极小(Verysmall)分子量氨基酸组:即分子量W105.06的3种氨基酸:G,A,S。小(Small)分子量氨基酸组:即分子量小于平均分子量136.89的11种氨基酸,包括极小分子

24、量的3种氨基酸在内,它们是:G,A,S,P,V,T,C,L,I,N,D。Fig.3.ClassificationgraphofaminoacidsinMPtwodimensiondistribution.1.Verysmall2.Small3.Non-polar4.Hydrophobic5.Alkyl6.Aliphatic7.Hydroxylaliphatic8.Sulfur9.Amide10.Dicarboxylic11.Positivecharged12.Aromatic13.PhenylG,A,S,P,V,T,L,I,R(Highdegeneracy)C,N,D,Q,K,E,M,H,F,

25、Y,W(Lowdegeneracy)非极性(Non-polar)氨基酸组:非极性氨基酸组共有A,P,V,L,I,M,F,W8种氨基酸,主要集中于pI轴的中部。疏水性(Hydrophobic)氨基酸组:共有13种氨基酸,除包括8种非极性氨基酸之外,还包括G,T,C,K,H5种氨基酸。烃基(Alkyl)氨基酸组:其侧链主要为烃基,包括A,P,V,L,I5种氨基酸。脂烃基(Aliphatic)氨基酸组:包含于烃基氨基酸组内,共有P,V,L,I4种氨基酸。羟脂烃基(Hydroxylaliphatic)氨基酸组:共有S,T2种氨基酸。含硫(Sulfur)氨基酸组:有C和M2种氨基酸。9)酰胺基(Amid

26、e)氨基酸组:有N,Q2种氨基酸。10)双羧基(Dicarboxylic)氨基酸组:有D和E2种氨基酸,带负电荷。11)带正电荷(Positivecharged)氨基酸组:共有K,H,R3种氨基酸。12)环状芳香族(Aromatic)氨基酸组:共有H,F,Y,W4种氨基酸。13)带苯环(Phenyl)氨基酸组:共有苯丙氨酸F及酪氨酸Y(羟苯丙氨酸)2种氨基酸,是芳香族氨基酸的子集合。在MP图中,主要位于图左侧的G,A,S,P,V,T,L,I,R的9种氨基酸属于高简并度类氨基酸,而其余位于右下侧的11种氨基酸:C,N,D,Q,K,E,M,H,F,Y,W,则属于低简并度类氨基酸。3.4讨论:氨基酸

27、分子结构与遗传密码简并度分类的关系可以认为,除精氨酸R的残基是带正电荷的胍基之外,其余全部8种高简并度类的氨基酸,G,A,S,P,V,T,L,都是烃基,脂烃基及羟脂烃基类氨基酸,大部分属于疏水性氨基酸,结构相对简单,都不含带环的芳香族残基,不含硫原子,不含双羧基,不含酰胺基,不含-氨基,而低简并度类的氨基酸,其结构都比较复杂,如含有带环的残基(H,F,Y,W),或含有硫原子的残基(C,M),或含有双羧基(D,E),或含有酰胺基(N,Q),或含有-基(K)等。除甘氨酸外,其余所有的氨基酸都是手性分子。即以a碳原子为中心,组成左旋构型的四面体结构,而氨基酸残基则位于四面体的一角7。由于高简并度类氨

28、基酸残基的结构比较简单,残基的质量比较小,与四面体其他部分的质量比较接近,故其分子的对称度比较大8,pl分布亦比较集中;而低简并度类氨基酸的残基,由于其结构复杂,残基的质量较大,与四面体其他部分的质量差别比较大,故其分子的对称度比较小。根据以上分析,认为:最先出现的氨基酸,应是最简单的没有手性的氨基酸G,从G开始,先出现最简单的手性氨基酸A,随即出现烃基及脂烃基残基的结构相对简单的氨基酸,这类氨基酸由于分子结构的对称度比较高,故其遗传密码的简并度(对称性)亦比较高。这些氨基酸主要组成跨膜结构或蛋白质的结构域。而结构比较复杂的氨基酸,不少是和蛋白质功能有密切联系的基团,其分子结构的对称度比较低,其遗传密码的简并度(对称性)亦比较低,可能是进化出现比较晚的结构。数字生物学的意义的讨论数字化是当前信息革命的主要趋势。在信息论中,信息的最基本的编码方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论