数据分析方法相关问题补充_第1页
数据分析方法相关问题补充_第2页
数据分析方法相关问题补充_第3页
数据分析方法相关问题补充_第4页
数据分析方法相关问题补充_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1上午4时36分数据分析方法相关问题补充数据分析方法相关问题补充史加荣史加荣 (整理)(整理)西安建筑科技大学理学院西安建筑科技大学理学院 禁止在网上传播禁止在网上传播聚类聚类引例例例 RA Fisher在在1936年发表的年发表的Iris数据中,研究某植物的萼数据中,研究某植物的萼片长、宽及花瓣长、宽片长、宽及花瓣长、宽. x1: 萼片长,萼片长,x2:萼片宽,:萼片宽,x3:花瓣长,花瓣长,x4: 花瓣宽花瓣宽.试对试对Iris数据进行聚类数据进行聚类 5.1000 3.5000 1.4000 0.2000 4.9000 3.0000 1.4000 0.2000 5.9000 3.0000

2、 5.1000 1.8000 (共(共150行,分为行,分为3类)类)load fisheriris用meas命名了取自三个总类G1,G2和G3,每一类取50个样本。K-均值聚类均值聚类模糊均值聚类模糊均值聚类模糊C均值聚类(fuzzy c-mean cluster)是硬均值聚类的推广,硬划分是指一个样品要么属于指定的类,要么不属于该类,二者必居其一. 而模糊聚类则放松此要求,即以一定的概率属于某个指定类.load fisheriris %导入iris数据center u=fcm(meas,3); % meas为150行4列的3个总体的观测数据index1 = find(u(1,:) = ma

3、x(u)%寻找属于第一类的样品index2 = find(u(2,:) = max(u)%寻找属于第二类的样品index3 = find(u(3,:) = max(u)%寻找属于第三类的样品center u=fcm(meas,3,3) %m=3;模糊减法聚类模糊减法聚类MATLAB中模糊减法聚类的命令是SUBCLUST,调用格式:C=SUBCLUST(X,RADII)输入:X为原始观测数据,行为个体,列为指标。RADII为介于0,1之间的数,通常为0.2-0.5之间,值越小,聚类中心的容量就越大.输出:运用模糊减法聚类方法的聚类中心的估计谱系聚类谱系聚类系数最大系数最大)的的样品聚为小类,再将

4、已聚合的小类按样品聚为小类,再将已聚合的小类按各类之间的相似性各类之间的相似性(用类间距离度量用类间距离度量)进行再聚合,随着相似性的减弱,进行再聚合,随着相似性的减弱,最后将一切子类都聚为一大类,最后将一切子类都聚为一大类,从而得到一个按相似性大小聚结起来的一个谱系图从而得到一个按相似性大小聚结起来的一个谱系图.24 30 3 15 11 2 4 12 25 8 19 22 28 7 5 9 23 20 17 18 21 1 16 10 14 6 13 26 27 20.8 X = rand(100,2);Y = pdist(X,cityblock);Z

5、 = linkage(Y,average);H,T = dendrogram(Z,colorthreshold,default);set(H,LineWidth,2)谱系聚类命令linkage。调用格式: Z = linkage (Y,method)输入Y是一个距离矩阵,例如Y是由pdist命令生成的欧氏距离向量。Method 是一个可选项,如最长距离,最短距离等。 single - 最短距离(缺省状态) complete - 最长距离 average - 类平均距离 weighted - 加权平均距离 centroid - 重心距离 ward - 离差平方和距离输出Z是一个矩阵(N-1行,3

6、列),Z的第一列和第二列均为正整数,第3列表示聚类的水平,每一行表示在相同的聚类水平上将个体合并成新的一类,每生成一个新的类,其编号将在现有基础上增加1。作谱系聚类图命令dendrogram,其调用格式 H=dendrogram(z,N)输入Z是一个(N-1)行3列的矩阵,由linkage命令生成, N是样本容量。输出产生一个树谱系聚类图,每两类通过线段连接,高度表示类间的距离。% 此命令作出m个样本的图形,缺省时默认为30。输出聚类结果命令cluster,调用格式 T=cluster(z,k)输入Z是一个(N-1)行3列的矩阵,由linkage命令生成, N是样本容量。k是分类数目.输出T是

7、一个列向量(N行1列),每一个元素均为正整数,且最大的数字不超过k,第i行的数字l表示第i个个体属于第l类。如果遇到大样本数据,为了便于得到每一类样本的编号,可以利用如下命令: find(T=l) % 找出属于第l类的样品编号判别分析判别分析引例某医院利用心电图检测来对人群进行划分,数据见表某医院利用心电图检测来对人群进行划分,数据见表. “g=1”表示健康人,表示健康人,“g=2”表示主动脉硬化患者,表示主动脉硬化患者,“g=3”表示冠心病患者,表示冠心病患者,X1 , X2表示测得表示测得的心电图中表明心脏功能的两项不相关的指标的心电图中表明心脏功能的两项不相关的指标. 某受试者心电图该两

8、项指某受试者心电图该两项指标的数据分别为标的数据分别为380.20,9.08. 设先验概率按比例分配,进行设先验概率按比例分配,进行bayes判别,判定其归属判别,判定其归属.编号编号X1X2编号编号X1X2123456789101112261.01185.39249.58137.13231.34231.38260.25259.51273.84303.59231.03308.907.365.996.114.358.798.5310.029.798.798.536.158.49111111111112131415161718192021222324258.69355.54476.69316.12

9、274.57409.42330.34331.47352.50347.31189.593311.328.179.6710.499.6113.7211.0011.195.469.0822222233333待判待判多个总体的多个总体的Bayes判别判别11/2/211( )exp()()2(2 )Tdf xxxA=261.017.36 185.39 5.99 189.595.46x=380.209.08;G1=A(1:11,:);G2=A(12:18,:);G3=A(19:23,:); %三类总体数据三类总体数据n=23;k=3;p=2;n1=11;n2=7;n3=5;f=p

10、*(p+1)*(k-1)/2;d=(2*p2+3*p-1)*(1/(n1-1)+1/(n2-1)+1/(n3-1)-1/(n-k)/(6*(p+1)*(k-1);p1=n1/n;p2=n2/n;p3=n3/n;m1=mean(G1);m2=mean(G2);m3=mean(G3);s1=cov(G1);s2=cov(G2);s3=cov(G3); %计算协方差阵计算协方差阵s=(n1-1)*s1+(n2-1)*s2+(n3-1)*s3)/(n-k);M=(n-k)*log(det(s)-(n1-1)*log(det(s1)+(n2-1)*log(det(s2)+(n3-1)*log(det(s

11、3);T=(1-d)*M %计算统计量观测值计算统计量观测值C=chi2inv(0.95,f) if T 0 0如何估计如何估计 如何消除自相关如何消除自相关性性D-W统计量统计量ut 对对t相互相互独立的零均值正态随机变量独立的零均值正态随机变量存在负存在负自相关性自相关性存在正存在正自相关性自相关性广义差分法广义差分法 自回归性的定量诊断自回归性的定量诊断:D-W检验检验 D-W统计量与统计量与D-W检验检验 nttnttteeeDW22221)(检验水平检验水平, ,样本容量,样本容量,回归变量数目回归变量数目D-W分布分布表表nttnttteee222112)(12n较大较大nttnt

12、tteee2221/4011DWDW4-dU44-dLdUdL20正正自自相相关关负负自自相相关关不不能能确确定定不不能能确确定定无无自自相相关关20DW01DW41DW检验检验临界值临界值dL和和dU由由DW值的大小确定值的大小确定自相关性自相关性Durbin-Watson表样本 v/clint/bench/dwcrit.htmCritical Values for the Durbin-Watson Test5% Significance Level, K=2 to 21 T=6 to 100 T=100 to 200 T=200,210,220

13、,.,500 T=500,550,600,.,2000 graph of dL,dU for K=2,4 K includes intercept. 2.5% Significance Level, K=2 to 21 added by request T=6 to 100 T=100 to 200 T=200,210,220,.,500 T=500,550,600,.,2000 K includes intercept. 1% Significance Level, K=2 to 21 added by request T=6 to 100 reproduces Biometrika tab

14、le T=100 to 200 T=200,210,220,.,500 T=500,550,600,.,2000 The first 2 tables reproduce the results of N.E. Savin and K.J. White, The Durbin-Watson Test for Serial Correlation with Extreme Sample Sizes or Many Regressors, Econometrica 45, 1977, p.1989-1996. 广义差分变换广义差分变换 )1 (0*0以以 *0, 1 , 2 为为回归系数的普通回归

15、模型回归系数的普通回归模型原模型原模型 DW值值 D-W检验检验无自相关无自相关 有自相关有自相关 广义广义差分差分继续此继续此过程过程原模型原模型 新模型新模型 新模型新模型 ttttuxxy*22*11*0*步骤步骤 原模型原模型tttttttuxxy122110,1*tttyyy2, 1,1,*ixxxtiitit变换变换)(12DW21DW不能确定不能确定增加数据量;增加数据量;选用其它方法选用其它方法 01 122101 1122111,tttttttttttyxxyxxuDWold dL 作变换作变换 原模型原模型残差残差et样本容量样本容量n=20,回归变回归变量数目量数目k=3

16、, =0.05 查表查表临界值临界值dL=1.10, dU=1.54DWold=0.8754原模型有原模型有正自相关正自相关1*5623. 0tttyyy2 , 1,5623. 01,*ixxxtiititnttnttteeeDW22221)(5623. 02/1DWDW4-dU44-dLdUdL20正正自自相相关关负负自自相相关关不不能能确确定定不不能能确确定定无无自自相相关关投资额新模型的建立投资额新模型的建立参数参数参数估计值参数估计值置信区间置信区间 *0163.49051265.4592 2005.2178 10.69900.5751 0.8247 2-1009.0333-1235.

17、9392 -782.1274R2= 0.9772 F=342.8988 p=0.0000ttttuxxy*22*11*0*21*0*2*1*,,估计系数由数据tttxxy总体效果良好总体效果良好 剩余标准差剩余标准差 snew= 9.8277 sold=12.71641*5623. 0tttyyy2 , 1,5623. 01,*ixxxtiitit投资额新模型的建立投资额新模型的建立dU DWnew 4-dU 新模型新模型残差残差et样本容量样本容量n=19,回归回归变量数目变量数目k=3, =0.05 查表查表临界值临界值dL=1.08, dU=1.53DWnew=1.5751新模型无自相关

18、性新模型无自相关性DW4-dU44-dLdUdL20正正自自相相关关负负自自相相关关不不能能确确定定不不能能确确定定无无自自相相关关1,2,21, 1, 113794.5670333.10093930. 0699. 05623. 04905.163ttttttxxxxyy*2*1*033.1009699.04905.163tttxxy新模型新模型还原为还原为原始变量原始变量一阶自回归模型一阶自回归模型新模型的自相关性检验新模型的自相关性检验一阶自回归一阶自回归模型残差模型残差et比比基本回归基本回归模型要小模型要小05101520-30-20-1001020新模型新模型 et *,原模型原模型

19、 et +残差图比较残差图比较051015200100200300400500新模型新模型 t *,原模型原模型 t +拟合图比较拟合图比较tttxxy21479.8596185. 0725.322基本回归模型基本回归模型一阶自回归模型一阶自回归模型1, 2, 21, 1, 113794.5670333.10093930. 0699. 05623. 04905.163ttttttxxxxyy模型结果比较模型结果比较对未来投资额对未来投资额yt 作预测,需先作预测,需先估计出未来的国民生产总值估计出未来的国民生产总值x1t 和物价指数和物价指数 x2t设已知设已知 t=21时,时, x1t =3

20、312,x2t=2.19387638.469 ty一阶自回归模型一阶自回归模型2.06883073.0424.5201.95142954.7474.9191.78422631.7401.9180.7436 691.1113.530.7277 637.7 97.420.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投资额投资额年份年份序号序号物价物价指数指数国民生产国民生产总值总值投资额投资额年份年份序号序号一阶自回归模型一阶自回归模型7638.469 ty基本回归模型基本回归模型6720.485 tyt 较小是由于较小是由于yt-1=424.5过小所致过小所致投资额预

21、测投资额预测资历资历 从事专业工作的年数;管理从事专业工作的年数;管理 1= =管理人员,管理人员,0= =非管理人员;教育非管理人员;教育 1= =中学,中学,2= =大学,大学,3= =更高程度更高程度建立模型研究薪金与资历、管理责任、教育程度的关系建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性,作为新聘用人员薪金的参考分析人事策略的合理性,作为新聘用人员薪金的参考 编编号号薪金薪金资资历历管管理理教教育育0113876111021160810303187011130411283102编编号号薪金薪金资资历历管管理理教教育育4227837161243188381602

22、44174831601451920717024619346200146名软件开发人员的档案资料名软件开发人员的档案资料 软件开发人员的薪金软件开发人员的薪金编号编号薪金薪金资历资历管理管理教育教育编号编号薪金薪金资历资历管理管理教育教育01138761112422884612021160810325169787110318701113261480380204112831022717404811051176710328221848130620872212291354880107117722023014467100108105352013115942100209121952033223174101

23、3101231330233237801012111497531134254101112122137131235148611101131980031336168821202141141740137241701213152026341338159901301161323140339263301312171288440240179491402181324550241256851513191367750342278371612201596551143188381602211236660144174831601222135261345192071702231383960246193642001分析与假设

24、分析与假设: x2 = = 1 管理人员,管理人员,x2 = = 0 非管理人员非管理人员1= =中学中学2= =大学大学3= =更高更高其它中学,x013其它大学,x014资历每加一年薪金的增长是常数;资历每加一年薪金的增长是常数;管理、教育、资历管理、教育、资历之间无交互作用之间无交互作用 教教育育443322110 xaxaxaxaay线性回归模型线性回归模型 a0, a1, , a4是待估计的回归系数,是待估计的回归系数, 是随机误差是随机误差 中学:中学:x3=1, x4=0 ;大大学:学:x3=0, x4=1; 更高:更高:x3=0, x4=0 分析与假设分析与假设Y=13876

25、11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 13245 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 27837 18838 17483 19207 19364;X1=1 1 1 1 1 2 2 2 2 3 3 3 3 4

26、 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20;X2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0;Ed=1 3 3 2 3 2 2 1 3 2 1 2 3 1 3 3 2 2 3 1 1 3 2 2 1 2 1 3 1 1 2 3 2 2 1 2 3 1 2 2 3 2 2 1 2 1;X3=zeros(46,1);X3(Ed=1)=1;X4

27、=zeros(46,1);X4(Ed=2)=1;b,bint,r,rint,stats= regress(Y,ones(46,1) X1 X2 X3 X4)分析与假设分析与假设443322110 xaxaxaxaay参数参数参数估计值参数估计值置信区间置信区间a011032 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994 -3826 -2162 a4148 -636 931 R2=0.957 F=226 p=0.000R2,F, p 模型整体上可用模型整体上可用资历增加资历增加1年年薪金增长薪金增长546 管理人员薪金管理人员薪金多多688

28、3 中学程度薪金中学程度薪金比更高的少比更高的少2994 大学程度薪金比大学程度薪金比更高的多更高的多148 a4置信区间包含零置信区间包含零点,解释不可靠点,解释不可靠! !中学:中学:x3=1, x4=0;大大学:学:x3=0, x4=1; 更高:更高:x3=0, x4=0. x2 = = 1 管理,管理,x2 = = 0 非管理非管理x1资历资历( (年年) )模型求解模型求解结果分析结果分析:残差分析方法残差分析方法 443322110 xaxaxaxaay残差残差yyee 与资历与资历x1的关系的关系 plot(X1,r)05101520-2000-1000010002000e与管理

29、与管理教育组合的关系教育组合的关系 123456-2000-1000010002000残差全为正,或全为负,管理残差全为正,或全为负,管理教教育组合处理不当育组合处理不当, ,应在模型中增加应在模型中增加管理管理x2与教育与教育x3, x4的交互项的交互项 残差大概分成残差大概分成3个水平,个水平, 6种管理种管理教育组合混在一起,未正确反映教育组合混在一起,未正确反映 。组合组合123456管理管理010101教育教育112233管理与教育的组合管理与教育的组合plot(1,r(X2=0&X3=1),+,2,r(X2=1&X3=1),+,3,r(X2=0&X4=1),

30、+,.4,r(X2=1&X4=1),+,5,r(X2=0&X3=0&X4=0),+,6,r(X2=1&X3=0&X4=0),+)axis(0 7 -2000 2000 )426325443322110 xxaxxaxaxaxaxaay增加管理增加管理x2与教育与教育x3, x4的交互项的交互项参数参数参数估计值参数估计值置信区间置信区间a01120411044 11363a1497486 508a270486841 7255a3-1727-1939 -1514a4-348-545 152a5-3071-3372 -2769a618361571 2101R

31、2=0.999 F=554 p=0.000R2, ,F有改进,所有回归系数置信有改进,所有回归系数置信区间都不含零点,模型完全可用区间都不含零点,模型完全可用 消除了不正常现象消除了不正常现象 异常数据异常数据( (33号号) )应去应去掉掉 05101520-1000-5000500e x1 123456-1000-5000500e 组合组合进一步的模型进一步的模型vY=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 13245 1367

32、7 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 27837 18838 17483 19207 19364;X1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20;X2=1 0 1 0 0 1 0 0 0 0 1

33、 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0; Ed=1 3 3 2 3 2 2 1 3 2 1 2 3 1 3 3 2 2 3 1 1 3 2 2 1 2 1 3 1 1 2 3 2 2 1 2 3 1 2 2 3 2 2 1 2 1;X3=zeros(46,1);X3(Ed=1)=1;X4=zeros(46,1);X4(Ed=2)=1;b,bint,r,rint,stats= regress(Y,ones(46,1) X1 X2 X3 X4 X2.*X3 X2.*X4)plot(1,r(X2=0

34、&X3=1),+,2,r(X2=1&X3=1),+,3,r(X2=0&X4=1),+,.4,r(X2=1&X4=1),+,5,r(X2=0&X3=0&X4=0),+,6,r(X2=1&X3=0&X4=0),+)axis(0 7 -500 500 )plot(X1,r,o)去掉异常数据后去掉异常数据后的结果的结果参数参数参数估计值参数估计值置信区间置信区间a01120011139 11261a1498494 503a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-3056-3171

35、2942a619971894 2100R2= 0.9998 F=36701 p=0.000005101520-200-1000100200e x1 123456-200-1000100200e 组合组合R2: 0.957 0.999 0.9998F: 226 554 36701 置信区间长度更短置信区间长度更短残差残差图十分正常图十分正常最终模型的结果可以应用最终模型的结果可以应用Y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 1324

36、5 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 27837 18838 17483 19207 19364;X1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20;X2=1 0 1 0 0 1 0 0

37、 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0; Ed=1 3 3 2 3 2 2 1 3 2 1 2 3 1 3 3 2 2 3 1 1 3 2 2 1 2 1 3 1 1 2 3 2 2 1 2 3 1 2 2 3 2 2 1 2 1;Y(33)=;X1(33)=;X2(33)=;Ed(33)=;X3=zeros(45,1);X3(Ed=1)=1;X4=zeros(45,1);X4(Ed=2)=1;b,bint,r,rint,stats= regress(Y,ones(45,1) X1

38、 X2 X3 X4 X2.*X3 X2.*X4)plot(1,r(X2=0&X3=1),+,2,r(X2=1&X3=1),+,3,r(X2=0&X4=1),+,.4,r(X2=1&X4=1),+,5,r(X2=0&X3=0&X4=0),+,6,r(X2=1&X3=0&X4=0),+)axis(0 7 -500 500 )plot(X1,r, o)制订制订6种管理种管理教育组合人员的教育组合人员的“基础基础”薪金薪金( (资历为资历为0)组合组合管理管理教育教育系数系数“基础基础”薪金薪金101a0+a39463211a0+a2+a

39、3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241426325443322110 xxaxxaxaxaxaxaay中学:中学:x3=1, x4=0 ;大大学:学:x3=0, x4=1; 更高:更高:x3=0, x4=0 x1= = 0; x2 = = 1 管理,管理,x2 = = 0 非管理非管理大学程度管理人员比大学程度管理人员比更高更高程度管理人员的薪金高程度管理人员的薪金高 大学程度非管理人员比大学程度非管理人员比更高更高程度非管理人员的薪金略低程度非管理人员的薪金略低 模型应用模型应用对定性因素对定性因素(

40、(如管理、教育如管理、教育) ),可以,可以引入引入0- -1变量变量处理,处理,0- -1变量的个数应比定性因素的水平少变量的个数应比定性因素的水平少1 残差分析方法残差分析方法可以发现模型的缺陷,可以发现模型的缺陷,引入交互作用项引入交互作用项常常常能够改善模型常能够改善模型 剔除异常数据剔除异常数据,有助于得到更好的结果,有助于得到更好的结果注:可以直接对注:可以直接对6种管理种管理教育组合引入教育组合引入5个个0- -1变量变量 问问题题研究酶促反应(研究酶促反应(酶催化反应)酶催化反应)中嘌呤霉素对反应速度中嘌呤霉素对反应速度与底物与底物(反应物)(反应物)浓度之间关系的影响浓度之间

41、关系的影响 建立数学模型,反映该酶促反应的速度与底物浓度建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系以及经嘌呤霉素处理与否之间的关系 设计了两个实验设计了两个实验 :酶经过嘌呤霉素处理;酶未经嘌:酶经过嘌呤霉素处理;酶未经嘌呤霉素处理。实验数据见下表呤霉素处理。实验数据见下表: 方方案案底物浓度底物浓度(ppm)0.020.061.10反应速反应速度度处理处理764797107123139159152191201207200未处理未处理6751848698115131124144158160/ 酶促反应酶促反应基本模型基本模型 Micha

42、elis-Menten模型模型y 酶促反应的速度酶促反应的速度, x 底物浓度底物浓度 xxxfy21),( 1 , 2 待定待定系数系数 底物浓度较小时,反应速度大致与浓度成正比;底物浓度较小时,反应速度大致与浓度成正比;底物浓度很大、渐进饱和时,反应速度趋于固定值。底物浓度很大、渐进饱和时,反应速度趋于固定值。酶促反应的基本性质酶促反应的基本性质 xy0 1实验实验数据数据00.511.5050100150200250经嘌呤霉经嘌呤霉素处理素处理xy00.511.5050100150200250未经嘌呤未经嘌呤霉素处理霉素处理xyv clearx=0.02 0.06 0.11 0.220.

43、56 1.10;x=x;x;x=x(:);y1=76 4797107123139159152191201207200;y2=67 51848698115131124144158160;plot(x,y1,or,MarkerSize,10)figure(2)plot(x(1:end-1),y2,x,MarkerSize,10)线性化模型线性化模型 经嘌呤霉素处理后实验数据的估计结果经嘌呤霉素处理后实验数据的估计结果 参数参数参数估计值(参数估计值(10-3)置信区间(置信区间(10-3) 15.1073.539 6.676 20.2470.176 0.319R2=0.8557 F=59.2975

44、 p=0.00008027.195/11104841. 0/122对对 1 , 2非非线性线性 对对 1, 2线性线性 ,xyxyxx12122111111v u1=1./y1; u2=1./y2; v=1./x;v b1,bint,r,rint,stats=regress(u1,ones(length(u1),1) v)v theta11=1/b1(1)v theta12=b1(2)/b1(1)v b2,bint,r,rint,stats=regress(u2,ones(length(u2),1) v(1:end-1)v theta21=1/b2(1)v theta22=b2(2)/b2(1

45、)v vi=linspace(min(v),max(v),80);ui1=b1(1)+b1(2)*vi;v subplot(1,2,1),plot(v,u1,o,vi,ui1,r:)v subplot(1,2,2),plot(x,y1,o,1./vi,1./ui1,r:)线性化模型结果分析线性化模型结果分析 x较大时,较大时,y有较大偏差有较大偏差 1/x较小时有很好的线性较小时有很好的线性趋势,趋势,1/x较大时出现很较大时出现很大的起落大的起落 参数估计时,参数估计时,x较小较小(1/x很大)的数据控制很大)的数据控制了回归参数的确定了回归参数的确定 0102030405000.0050.

46、010.0150.020.0251/y1/xxy112100.511.5050100150200250 xxy21xybeta,R,J = nlinfit (x,y,model,beta0) beta的置信区间的置信区间输入输入 x自变量数据矩阵自变量数据矩阵y 因变量数据向量因变量数据向量beta 参数的估计值参数的估计值R 残差,残差,J 估计预估计预测误差的测误差的Jacobi矩阵矩阵 model 模型的函数模型的函数M文件名文件名beta0 给定的参数初值给定的参数初值 输出输出 非线性模型参数估计非线性模型参数估计MATLAB 统计工具箱统计工具箱 xxy21beta0线性化线性化模

47、型估计结果模型估计结果 x=0.020.06 0.11 0.22 0.56 1.10;x=x;x;x=x(:);y1=764797107123139159152191201207200;beta0=195.8027 0.04841;function y=f1(beta,x)y=beta(1)*x./(beta(2)+x);beta,R,J=nlinfit(x,y,f1,beta0);betaci=nlparci(beta,R,J);非线性模型结果分析非线性模型结果分析参数参数参数估计值参数估计值置信区间置信区间 1212.6819197.2029 228.1609 20.06410.0457

48、0.0826 画面左下方的画面左下方的Export 输出其它统计结果。输出其它统计结果。拖动画面的十字线,得拖动画面的十字线,得y的预测值和预测区间的预测值和预测区间剩余标准差剩余标准差s= 10.9337xxy21最终反应速度为最终反应速度为半速度点半速度点(达到最终速度一半达到最终速度一半时的时的x值值 )为为6831.21210641. 02其它输出其它输出命令命令nlintool 给出交互画给出交互画nlintool(x,y1,f1,beta0)00.511.5050100150200250o 原始数据原始数据+ 拟合结果拟合结果 00.81-500501001502

49、00250 x1为底物浓度,为底物浓度, x2为一示性变量为一示性变量 x2=1表示经过处理,表示经过处理,x2=0表示未经处理表示未经处理 1是未经处理的最终反应速度是未经处理的最终反应速度 1是经处理后最终反应速度的增长值是经处理后最终反应速度的增长值 2是未经处理的反应的半速度点是未经处理的反应的半速度点 2是经处理后反应的半速度点的增长值是经处理后反应的半速度点的增长值 在同一模型中考虑嘌呤霉素处理的影响在同一模型中考虑嘌呤霉素处理的影响xxy2112221211)(xxxxy)(混合反应模型混合反应模型v clearx=0.02 0.06 0.11 0.220.56 1.10;x=x;x;x;x;x1=x(:)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论