下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
A题细胞体内代谢物浓度预测随着基因组、转录组、蛋白质组等各种“组学”研究计划的蓬勃开展,生命科学进入了“组学”时代。代谢组学作为系统生物学的重要分支,其研究的重点是细胞内代谢物种类与浓度的定性和定量分析以及代谢网络的构建和模拟。对代谢物的检测及浓度测定主要采用实验方法,包括核磁共振、气相色谱-质谱联用和液相色谱-质谱联用等技术。但由于代谢物种类繁多,且大部分浓度较低(μM数量级),尤其是胞内代谢物提取难度非常大,精确测定其浓度异常困难,而且实验测定需要消耗大量财力物力和人力,因此通过计算机方法对代谢物浓度预测和分析变得越来越重要。活细胞的代谢物浓度由什么决定?除了一些特定的代谢和酶的作用以外,有没有那种能全局影响浓度值的性质?试根据附件中的数据完成如下问题:1根据不同类型的数据,分析代谢物浓度与其物理化学性质之间的关系。2筛选合适的物理化学性质,建立预测代谢物浓度的预测模型,并对此模型进行评价;1.线性插补法处理缺失数据原理:用该列数据缺失值前一个数据和后一个数据建立线性插值,然后用缺失点在线性插值函数的函数值填充该缺失值,即:2.excel对大肠杆菌代谢物浓度及代谢物理化性质去量纲标准化,标准化的目的在于消除不同变量的量纲的影响,而且标准化转化不会改变变量的相关系数。代谢物浓度:取对数代谢物理化性质:标准差标准化法式中:3.SAS软件建立多元线性回归方程回归模型一般形式:上式表示数据中应变量Y可以近似地表示为自变量,…的线性函数。为常数项,…为偏回归系数,表示在其它自变量保持不变时,增加或减少一个单位时Y的平均变化量,u是去除k个自变量对Y影响后的随机误差(残差)。适用条件:1、解释变量Xi是确定性变量,不是随机变量;2、解释变量之间互不相关,即无多重共线性。3、随机误差项不存在序列相关关系4、随机误差项与解释变量之间不相关5、随机误差项服从0均值、同方差的正态分布检验的目的:检验Y与解释变量,,……之间的线性关系是否显著。检验的步骤:第一步,提出假设:原假设:H0:b1=b2=……bk=0备择假设:H1:bi不全为0(i=1,2,…,k)第二步,计算统计量:第三步,查表,得:第四步,做检验:对大肠杆菌(E.coli)的建模首先对各个大肠杆菌代谢物浓度进行数据整理,取各大肠杆菌代谢物浓度的平均值作为大肠杆菌真实代谢物浓度。用SAS软件建立回归方程并进行显著性检验,可以得到以下结果:表1大肠杆菌代谢物浓度与理化性质回归分析来源自由度平方和均方和F值Pr>F样本1729.605661.741516.76<0.0001误差19550.237270.25763总和21279.84294由方差分析表可知,其Fvalue=6.76,pr>F的值小于0.0001,远小于0.05,故拒绝原假设,接受备择假设,认为y1与x1-x17之间具有显著性的线性关系,即大肠杆菌代谢物浓度与其物理化学性质之间有非常显著的线性关系的关系。参数估计公式:大肠杆菌(E.coli)代谢物浓度的预测模型回归方程显著性检验:Variablex6Entered:R-Square=0.5534andC(p)=7.0551由方差分析表可知,其Fvalue=494.06,pr>F的值<0.0001,远小于0.05,故拒绝原假设,接受备择假设,认为y1与筛选后的理化性质之间具有极显著性的线性关系。参数显著性检验:由参数估计表可知,在置信水平为85%情况下,对常数检验F值为F=4.16578
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论