版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、蛋白质氨基酸的组合问题一.问题的提出生命蛋白质是由若干种氨基酸的不同组合构成的. 18种氨基酸的已知分子量ai (i=1,2,3,4,5.)分别如下:57,71,87,97,99,101,103,113,114,115,128,129,131,137,147,156,163,186.给定某一蛋白质的分子量下X(X1000且为正整数)设计出数学模型给出该蛋白质的所有可能的组成。即确定该蛋白质是哪几种氨基酸组成及每种氨基酸的数目.1二.问题的分析 根据给定的分子量X及ai 测定蛋白质的组成,实际是求多元线性方程: ai xi =X的所有整数解的问题.一般采用枚举法求解, 组合共有 (X/ ai +
2、1) 种.计算量大,耗费时间长给出的解的个数过多反而失去了解的意义.模型的设计和改进:围绕着减少运算和缩小解的范围的思路展开2 三.模型假设. 1.给定的蛋白质分子量 -和氨基酸已知分子量-是准确的,没有测试误差; 2.假设所有被测定的蛋白质均由给定分子量的这几种氨基酸构成,而不含有其他种类的氨基酸.实际中,构成生命蛋白质的主要氨基酸有20种-,其中两对氨基酸的分子量相等; 3.假设蛋白质分子是构成过程中,各个氨基酸分子之间相互结合的方式不影响蛋白质的分子量.34.假设被测定的蛋白质所含氨基酸的个数=2,即x=114. 5.假设氨基酸分子结合构成过程中是任意排列组合的,不存在互斥和互补现象,即
3、任何两种氨基酸都可以同时纯在同一个蛋白质中,没有任何一种氨基酸的存在是以其他氨基酸的纯在为前提的. 6.假设在蛋白质中,每种氨基酸存在的概率是相等的,不存在某种必须存在的氨基酸. 7.假设该试验拥有测定化学性质的仪器.4 四.最一般的模型 在没有任何其他补充信息和约束条件的情况下,最一般的模型可以表示为 ai x i =X ; x i为非负整数,i =1,2,3n;采用了深度优先算法,遍历了整个解空间,由于采用了分支限定界法,其实际最坏的时间效率也是远小于(X/ai+1)的.5在化学中,我们知道,生命蛋白质氮的含量约占总量的16%左右(其波动范围15%-17%).蛋白质测定的凯式定氮法-就是利
4、用了这个性质.我们考虑了含氮量的模型 6模型A7对该模型有两点说明: 1.常见20的种氨基酸中:有两对的分子量相等.其中亮氨酸与异亮氨酸为同分异构,分质量与分子式均相同,因而不会影响该模型的计算.而另一对谷酰氨酸与赖氨酸仅仅是分子量相同而分子式不同.因此在模型中,把含硫的两种氨基酸作特殊处理后,还剩下16种分子量不同,然后加入一个变量,用以区分谷酰氨酸与赖氨酸.最后将结果合并.8模型B 已知蛋白质中某些氨基酸是存在的. 在实际的蛋白质的一级结构测定-中,通常可以对蛋白质经过充分水解后所得到的氨基酸混合液作离子交换层析.纸层析或薄层层析,定性研究的结果可以确定该蛋白质所含的全部或部分氨基酸种类.
5、9假设b 已知被测定的蛋白质中肯定含有其中的k种氨基酸,其分子量为a j(j=1,2,3k). 可假设 X=X-a j已经存在的氨基酸,其对应的个数 x j= xj-1则模型表为 aix i=X ; xi为非负正整数(i=1,2,.18).10模型C: 已知蛋白质中只含有某几种氨基酸. 在比较成功的氨基酸定性分析中,可以得到被测定的蛋白质完全水解生成的氨基酸的全部种类假设c 假设某蛋白质由且仅由k种已知的氨基酸构成.对应的xi=1,这样我们可以令X=X-ai .11模型可表示为 ki=1 aixi=X ; xi为非负正整数(i =1,2,.k).12模型D18种已知氨基酸分子量的平均值为118
6、.5,因而平均来看对于X1000的蛋白质来说其所含氨基酸的分子数在8-9之间.不妨设:每种氨基酸分之的数目仅为0或1,因而模型表示为 aixi=X xi= 0或 1; 13模型E 如实验室不拥有微机, 但可能拥有较为先进的化学分析设备,设实验室对完全水解后的氨基酸混合液作定性的分析,并可以通过质谱仪侧得蛋白质的分子式.设构成被测氨基酸的构成分别为第=种,则模型可以进一步简化为: aijxij=X ; cijxij=dj ; xij为正整数,i =1,2,3n;当k的值不大的情况下,可先求出现行方程组的解,然后在找出其整数解.然而当=的值较大时,对手工计算来说,该模型就不太可行了.14模型F进一
7、步假设实验室拥有先进的设备,可对完全水解后的氨基酸混合液作定性和定量分析,得出被测蛋白质所含氨基酸的种类几各种氨基酸之间的比例关系为:bI:bjbik1,因而模型可表述为 X= aIlxij = raIlbij 其中xij = rIlbI ,(l=1,.,k);所以 r = X/aIlbij经过上述简单的运算便嫩的出问题的解,并且解是唯一的,可见氨基酸自动分析仪对解决上述问题是比较方便的.15模型的改进方向从上述各模型可以看出:变量众多是解决问题的困难所在,因而寻求有效的减少变量的个数的方法是模型进一步改进的重要方向,除了上述的一些改进外,我们还可以总所给氨基酸分子量的内部联系出发,得到他们之
8、间的一些关系,如 71=57+14 99=57+42=57+3*14 113 = 57+56=57+4*14类似的分解可以使变量的个数大大减少,从而也大大减少计算量,当然,如此求出解后在进行组合的原问题的解是较复杂的.16模型的误差分析1.x的测定误差是影响结果正确的一个重要因素,如果x的测量与真实值相差1,其结果将会有很大的改进.2. aI的测定误差对模型的结果也会有一定的影响.3.在生命蛋白质含氮量的约束条件中,关于含氮量的范围在不同的资料中有点不同,有为15%-17%,亦有为15%-17.6%,但确实说明有些规律性存在,我们取了15%-17%可能会引起误差.17模型的特点我们给出的一系列
9、模型,特别是”最一般的模型”使用范围较广,这主要表现在:1无论 X增大或者氨基酸的种类增多模型总是有效的,并可以给出所有可能的解,同时由于组成生命蛋白质的氨基酸只有20种,分质量只有18种,因而我们的模型对于分析蛋白质组成这一问题更有实际意义.2.考虑到不同实验室的设备条件和获取以上信息的能力不同,我们给出了模型A-C.E.F以满足不同的实际情况的需要.3.我们建立这些模型的方法和思想对其他类似的问题也适用,象多糖等类似高分子化合物的分析,我们只需改变模型中的某些参数就可作类似分析.18模型的特点1.我们模型的缺点仍然在于如何解决模型给出的解数目太多的问题.例如当X=1000时,最一般的模型给出了28268个解,改进的模型中最多可以将其减少到几个,然而一般来说蛋白质的分子量都在5000以上,那么解的个数建仍然是很可观的.2.在改进的模型中,由于约束条件对实验数据的要求严格,因而我构
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Grid Coffee品牌介绍模版
- 二年级品德与社会下册 向人民英雄敬礼教案1 未来版
- 2024年高中生物 第2章 动物和人体生命活动的调节 第2节 通过激素的调节(Ⅱ)教案 新人教版必修3
- 2023七年级生物下册 第四单元 生物圈中的人 第11章 人体代谢废物的排出11.1 人体产生的代谢废物教案 (新版)北师大版
- 2024-2025学年高中化学 第1章 第3节 原子结构与元素性质 第1课时 电离能及其变化规律教案 鲁科版选修3
- 2024-2025学年高中语文 3 柳子厚墓志铭教案 语文版选修《唐宋八大家散文鉴赏》
- 告别母校 课件
- 亡羊补牢图片 课件
- 应急预案备案管理制度
- 第一单元(复习)-三年级语文上册单元复习(统编版)
- 部编 统编 人教版九年级上册初中语文 期末总复习课件 全册专题课件
- 《大数据分析与应用》教学大纲
- 三维激光扫描原理及应用课件
- 民事诉讼法概述《民事诉讼法学》马工程课件
- (完整版)环境保护考核表
- 箱变安装施工方案66375
- (通风工)三级安全教育试卷及答案
- 供应室pdca质量提高腔镜器械包装合格率品管圈ppt模板课件
- 塔设备的机械设计
- 工程建设廉政风险防控手册(试行)20151111
- 大猫英语分级阅读 十一级TIG in the DUMPS 课件
评论
0/150
提交评论