多元正态总体的统计推断_第1页
多元正态总体的统计推断_第2页
多元正态总体的统计推断_第3页
多元正态总体的统计推断_第4页
多元正态总体的统计推断_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元正态总体的统计推断2023/4/5第1页,共123页,2023年,2月20日,星期四第一节一元情形的回顾一、置信区间二、假设检验三、假设检验与置信区间的关系四、一元方差分析(挪到后面)2023/4/5第2页,共123页,2023年,2月20日,星期四第二节单个总体均值向量的推断一、均值向量的检验2023/4/5第3页,共123页,2023年,2月20日,星期四1.总体协方差矩阵S已知时由于样本均值,由正态分布性质,当H0成立时检验规则:2023/4/5第4页,共123页,2023年,2月20日,星期四2.总体协方差矩阵S未知时用样本协方差矩阵S

替代总体协方差矩阵S,由T2分布的性质,当H0成立时检验规则:这里2023/4/5第5页,共123页,2023年,2月20日,星期四例4.2.1

对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得样本数据如下表。根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性假定下检验该地区农村2周岁男婴是否与城市2周岁男婴有相同的均值。取a=0.01。编号身高(cm)胸围(cm)上半臂围(cm)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.02023/4/5第6页,共123页,2023年,2月20日,星期四解:在显著性水平0.01下拒绝原假设H0,即认为农村2周岁男婴与城市2周岁男婴上述3个指标的均值有显著差异。2023/4/5第7页,共123页,2023年,2月20日,星期四SAS程序1dataexam4_2_1;inputidx1x2x3;cards;17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0;proc

corr

noprint

covoutput=new;varx1x2x3;run;proc

iml;usenew;readallwhere(_TYPE_='COV')intoS;readallwhere(_TYPE_='MEAN')intoxm;readallvar{x1}where(_TYPE_='N')inton;mu0={90,58,16};xm=xm`;p=ncol(S);T2=n*(xm-mu0)`*inv(S)*(xm-mu0);T2a=p*(n-1)*finv(0.99,p,n-p)/(n-p);printT2T2a;ifT2>=T2athenprint'拒绝原假设H0';elseprint'接受原假设H0';run;2023/4/5第8页,共123页,2023年,2月20日,星期四SAS程序2dataexam4_2_1;inputidx1x2x3;y1=x1-90;y2=x2-58;y3=x3-16;cards;17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0;proc

anova;modely1y2y3=/nouni;manova

h=intercept;run;2023/4/5第9页,共123页,2023年,2月20日,星期四二、置信区域令,则由,即可得m

的置信水平为1-a的置信区域为思考:置信区域的形状如何?置信区域与假设检验有何联系?2023/4/5第10页,共123页,2023年,2月20日,星期四例4.2.2

为评估某职业培训中心的教学效果,随机抽取8名受训者,进行甲和乙两个项目的测试,测试结果列于下表。编号12345678甲项成绩x16280668475805479乙项成绩x27077758787916184假定,试求m的95%置信区域。解:2023/4/5第11页,共123页,2023年,2月20日,星期四可得m

的置信水平为0.95的置信区域为2023/4/5第12页,共123页,2023年,2月20日,星期四Matlab画置信椭圆的程序functionellipse_region(xdat,alpha)%画置信椭圆的程序,调用格式:ellipse_region(xdat,alpha)%xdat为二维样本数据(两行多列或多行两列)%alpha为显著性水平,1-alpha为置信水平[m,n]=size(xdat);p=min(m,n);ifp~=2error('应输入二维样本数据,并且样本容量应大于2')endifm<nxdat=xdat';endn=max(m,n);xm=mean(xdat)';s=cov(xdat);xrange=range(xdat);s=cov(xdat);xymin=xm-1.645*sqrt(diag(s));xymax=xm+1.645*sqrt(diag(s));xymin1=min(xdat)-xrange/15;xymax1=max(xdat)+xrange/15;xymin=min([xymin';xymin1]);xymax=max([xymax';xymax1]);xymin_max=[xymin;xymax];xymin_max=xymin_max(:)';s=inv(s);ta=p*(n-1)*finv(1-alpha,p,n-p)/(n-p);symsxy;f=n*(xm-[x;y])'*s*(xm-[x;y])-ta;figureh=ezplot(f,xymin_max);set(h,'color','r','linewidth',2);gridon;holdon;plot(xdat(:,1),xdat(:,2),'.','MarkerSize',6)%画样本散点plot(xm(1),xm(2),'k+');%椭圆中心holdoff2023/4/5第13页,共123页,2023年,2月20日,星期四一、问题引入第三节单个总体均值分量间结构关系的检验令则上面的假设可表达为思考:这里的C唯一吗?若不唯一,还可怎么构造?2023/4/5第14页,共123页,2023年,2月20日,星期四思考:若令y=Cx,m0=j

,您能把这里的假设检验问题与刚刚学过的单个正态总体均值向量的检验联系在一起吗?检验统计量如何构造呢?其中C为常数矩阵,k<p,rank(C)=k,j为常数向量。?令总体,这里,上面的假设相当于2023/4/5第15页,共123页,2023年,2月20日,星期四构造检验统计量检验规则:这里当H0为真时思考:想一想j=0时的情况2023/4/5第16页,共123页,2023年,2月20日,星期四例4.3.2

对在例4.2.1中,假定人类有这样一个一般规律:身高、胸围和上半臂围的平均尺寸比例为6:4:1,我们希望检验例4.2.1中的数据是否符合这一规律,取a=0.01。解:写出假设至少有两个不等令,则计算得2023/4/5第17页,共123页,2023年,2月20日,星期四从而所以在显著性水平0.01下拒绝原假设H0,即认为这组数据与人类的一般规律不一致。2023/4/5第18页,共123页,2023年,2月20日,星期四SAS程序dataexam4_3_2;inputidx1x2x3;cards;17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0;proc

corr

noprint

covoutput=new;varx1x2x3;run;proc

iml;usenew;readallwhere(_TYPE_='COV')intoS;readallwhere(_TYPE_='MEAN')intoxm;readallvar{x1}where(_TYPE_='N')inton;C={2-3

0,1

0-6};xm=xm`;k=nrow(C);T2=n*(C*xm)`*inv(C*S*C`)*(C*xm);T2a=k*(n-1)*finv(0.99,k,n-k)/(n-k);printT2T2a;ifT2>=T2athenprint'拒绝原假设H0';elseprint'接受原假设H0';run;2023/4/5第19页,共123页,2023年,2月20日,星期四一、两个独立样本的情形与一元随机变量的情形相同,我们常常需要检验两个总体总体的均值向量是否相等。考虑假设第四节两个正态总体均值的检验设从总体和总体未知,中各自独立地抽取样本和。2023/4/5第20页,共123页,2023年,2月20日,星期四根据两个样本可得m1和m2的无偏估计量为并且有2023/4/5第21页,共123页,2023年,2月20日,星期四根据两个样本可得S的联合无偏估计量为这里2023/4/5第22页,共123页,2023年,2月20日,星期四H0成立时检验统计量2023/4/5第23页,共123页,2023年,2月20日,星期四检验规则:这里2023/4/5第24页,共123页,2023年,2月20日,星期四例4.4.1

对21个破产的企业收集它们在破产前两年的年度财务数据,同时对25个财务良好的企业也收集同一时期的数据。数据涉及4个变量:x1=现金流量/总债务,x2=净收入/总资产,x3=流动资产/流动债务,x4=流动资产/净销售额。数据列于下表,1组为破产企业,2组为非破产企业。取a=0.05。2023/4/5第25页,共123页,2023年,2月20日,星期四编号 组别 X1 X2 X3 X4

1 1 -0.45 -0.41 1.09 0.45 2 1 -0.56 -0.31 1.51 0.16 3 1 0.06 0.02 1.01 0.40 4 1 -0.07 -0.09 1.45 0.26 5 1 -0.10 -0.09 1.56 0.67 6 1 -0.14 -0.07 0.71 0.28 7 1 0.04 0.01 1.50 0.71 8 1 -0.07 -0.06 1.37 0.40 9 1 0.07 -0.01 1.37 0.34 10 1 -0.14 -0.14 1.42 0.43 11 1 -0.23 -0.30 0.33 0.18 12 1 0.07 0.02 1.31 0.25 13 1 0.01 0.00 2.15 0.70 14 1 -0.28 -0.23 1.19 0.66 15 1 0.15 0.05 1.88 0.27 16 1 0.37 0.11 1.99 0.38 17 1 -0.08 -0.08 1.51 0.42 18 1 0.05 0.03 1.68 0.95 19 1 0.01 0.00 1.26 0.60 20 1 0.12 0.11 1.14 0.17 21 1 -0.28 -0.27 1.27 0.51 2023/4/5第26页,共123页,2023年,2月20日,星期四编号 组别 X1 X2 X3 X4

22 2 0.51 0.10 2.49 0.54 23 2 0.08 0.02 2.01 0.53 24 2 0.38 0.11 3.27 0.35 25 2 0.19 0.05 2.25 0.33 26 2 0.32 0.07 4.24 0.63 27 2 0.31 0.05 4.45 0.69 28 2 0.12 0.05 2.52 0.69 29 2 -0.02 0.02 2.05 0.35 30 2 0.22 0.08 2.35 0.40 31 2 0.17 0.07 1.80 0.52 32 2 0.15 0.05 2.17 0.55 33 2 -0.10 -0.01 2.50 0.58 34 2 0.14 -0.03 0.46 0.26 35 2 0.14 0.07 2.61 0.52 36 2 0.15 0.06 2.23 0.56 37 2 0.16 0.05 2.31 0.20 38 2 0.29 0.06 1.84 0.38 39 2 0.54 0.11 2.33 0.48 40 2 -0.33 -0.09 3.01 0.47 41 2 0.48 0.09 1.24 0.18 42 2 0.56 0.11 4.29 0.44 43 2 0.20 0.08 1.99 0.30 44 2 0.47 0.14 2.92 0.45 45 2 0.17 0.04 2.45 0.14 46 2 0.58 0.04 5.06 0.13 2023/4/5第27页,共123页,2023年,2月20日,星期四SAS程序1dataexam4_4_1_1;inputidgx1-x4;cards;数据略;proc

corr

cov

noprintoutput=new;varx1-x4;byg;proc

print;proc

iml;usenew;readallvar{x1x2x3x4}where(_TYPE_='COV'&g=1)intoS1;readallvar{x1x2x3x4}where(_TYPE_='COV'&g=2)intoS2;readallvar{x1x2x3x4}where(_TYPE_='MEAN'&g=1)intoxm;readallvar{x1x2x3x4}where(_TYPE_='MEAN'&g=2)intoym;readallvar{x1}where(_TYPE_='N'&g=1)inton1;readallvar{x1}where(_TYPE_='N'&g=2)inton2;p=ncol(S1);xm=xm`;ym=ym`;Sp=((n1-1)*S1+(n2-1)*S2)/(n1+n2-2);T2=n1*n2*(xm-ym)`*inv(Sp)*(xm-ym)/(n1+n2);T2a=p*(n1+n2-2)*finv(0.95,p,n1+n2-p-1)/(n1+n2-p-1);F=(n1+n2-p-1)*T2/p/(n1+n2-2);printxmymSpT2T2aF;ifT2>=T2athenprint'拒绝原假设H0';elseprint'接受原假设H0';run;2023/4/5第28页,共123页,2023年,2月20日,星期四

-0.069048-0.0814291.36666670.4376190.23520.05562.59360.4268T2=41.397602,Ta2=11.160842,F=9.6437597

0.04572280.01758410.05655-0.0017710.01758410.01084260.0165090.00166540.056550.0165090.6456510.0327005-0.0017710.00166540.03270050.0346528结论:拒绝原假设H0.2023/4/5第29页,共123页,2023年,2月20日,星期四SAS程序2dataexam4_4_1_2;inputidgx1-x4;cards;数据略;proc

anova;classg;modelx1x2x3x4=g/nouni;manova

h=g;run;2023/4/5第30页,共123页,2023年,2月20日,星期四StatisticValueFValueNumDFDenDFPr>FWilks'Lambda0.515236959.64441<.0001Pillai'sTrace0.484763059.64441<.0001Hotelling-LawleyTrace0.940854609.64441<.0001Roy'sGreatestRoot0.940854609.64441<.0001由p值可以得出结论:在显著性水平0.05下拒绝原假设H0.2023/4/5第31页,共123页,2023年,2月20日,星期四例4.4.2

(例4.2.1续)下表给出了相应于例4.2.1中数据的9名2周岁女婴的数据。我们欲在正态性假定下检验2周岁男婴与2周岁女婴的均值向量有无显著差异。取a=0.05。编号身高(cm)胸围(cm)上半臂围(cm)18058.414.027559.215.037860.315.047557.413.057959.514.067858.114.577558.012.586455.511.098059.212.52023/4/5第32页,共123页,2023年,2月20日,星期四SAS程序dataexam4_4_2;inputidsex$x1x2x3;cards;1 f80 58.4 14.02 f75 59.2 15.03 f78 60.3 15.04 f75 57.4 13.05 f79 59.5 14.06 f78 58.1 14.57 f75 58.0 12.58 f64 55.5 11.09 f80 59.2 12.510 m78 60.6 16.511 m76 58.1 12.512 m92 63.2 14.513 m81 59.0 14.014 m81 60.8 15.515 m84 59.5 14.0;proc

corr

noprint

cov

outp=new;varx1x2x3;bysex;proc

print;proc

iml;usenew;readallvar{x1x2x3}where(_TYPE_='COV'&sex='m')intoS1;readallvar{x1x2x3}where(_TYPE_='COV'&sex='f')intoS2;readallvar{x1x2x3}where(_TYPE_='MEAN'&sex='m')intoxm;readallvar{x1x2x3}where(_TYPE_='MEAN'&sex='f')intoym;readallvar{x1}where(_TYPE_='N'&sex='m')inton1;readallvar{x1}where(_TYPE_='N'&sex='f')inton2;p=ncol(S1);xm=xm`;ym=ym`;Sp=((n1-1)*S1+(n2-1)*S2)/(n1+n2-2);T2=n1*n2*(xm-ym)`*inv(Sp)*(xm-ym)/(n1+n2);T2a=p*(n1+n2-2)*finv(0.95,p,n1+n2-p-1)/(n1+n2-p-1);F=(n1+n2-p-1)*T2/p/(n1+n2-2);printxmymS1S2SpT2T2aF;ifT2>=T2athenprint'拒绝原假设H0';elseprint'接受原假设H0';run;2023/4/5第33页,共123页,2023年,2月20日,星期四

XMYMS1827631.68.040.560.258.48.043.1721.3114.513.50.51.311.9S2SP24.55.63754.312527.2307696.56153852.84615385.63751.971.456256.56153852.43230771.44.31251.456251.81252.84615381.41.8461538T2T2AF5.311725612.7190831.498179

接受原假设H02023/4/5第34页,共123页,2023年,2月20日,星期四二、成对试验的T2统计量前面我们讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的。例如当讨论男女职工的工资收入是否存在差异;一种新药的疗效等。例4.4.3

(从10例腹泻病患者服用某种新药前和后1天的粪便中测得大肠杆菌(Baci)的数据如下,试分析服药前后该新药对Baci的含量有无显著影响。取a=0.05。病人编号12345678910服药前Baci含量33.035.828.831.442.625.831.629.022.430.2服药后Baci含量23.324.721.722.832.023.124.323.721.824.6思考:两独立样本和成对样本的观测值有何不同?2023/4/5第35页,共123页,2023年,2月20日,星期四分析:由于两样本不独立,无法等同于前面的讨论,可对样本数据作差,化成单个总体均值向量的检验。令假设则上面的假设检验等价于2023/4/5第36页,共123页,2023年,2月20日,星期四检验统计量为检验规则:这里令当H0成立时2023/4/5第37页,共123页,2023年,2月20日,星期四例4.4.3

(从10例腹泻病患者服用某种新药前和后1天的粪便中测得大肠杆菌(Baci)的数据如下,试分析服药前后该新药对Baci的含量有无显著影响。取a=0.05。datattest4_4_3;inputbaci1baci2@@;diff=baci1-baci2;cards;33.023.335.821.728.819.431.426.842.632.025.823.131.625.329.023.722.421.830.217.6;proc

univariate

normal

plot;vardiff;run;2023/4/5第38页,共123页,2023年,2月20日,星期四

TestsforLocation:Mu0=0Test-Statistic------pValue------Student'stt5.476201Pr>|t|0.0004SignM5Pr>=|M|0.0020SignedRankS27.5Pr>=|S|0.0020TestsforNormalityTest--Statistic--------pValue------Shapiro-WilkW0.970391Pr<W0.8944Kolmogorov-SmirnovD0.160185Pr>D>0.1500Cramer-vonMisesW-Sq0.029715Pr>W-Sq>0.2500Anderson-DarlingA-Sq0.177302Pr>A-Sq>0.25002023/4/5第39页,共123页,2023年,2月20日,星期四例4.4.4

一组学生共5人,采用两种不同的方式进行教学,然后对5个学生进行测验,得如下的分数:学生序号

教学方式AB数学物理数学物理189908285298888083375696170476706766590766365分析不同的教学方式是否有差异。取a=0.05。2023/4/5第40页,共123页,2023年,2月20日,星期四dataexam4_4_4;inputx1x2y1y2@@;cards;8990828598888083756961707670676690766365;datad;seta;x12=x1-y1;y12=x2-y2;proc

corr

cov;varx12y12;run;proc

iml;s={63.50

21.000,21.00

18.200};mu={15.00,4.800};n=5;p=2;T2=5*t(mu)*inv(s)*mu;T2a=p*(n-1)*finv(0.95,p,n-p)/(n-p);printT2T2a;run;2023/4/5第41页,共123页,2023年,2月20日,星期四

CovarianceMatrix,DF=4x12y12x1263.5000000021.00000000y1221.0000000018.20000000SimpleStatisticsVariableNMeanStdDevSumMinimumMaximumx12515.000007.9686975.000007.0000027.00000y1254.800004.2661524.00000-1.0000011.00000

T2T2A17.72799825.4722522023/4/5第42页,共123页,2023年,2月20日,星期四一、问题的提出第五节两个总体均值分量间结构关系的检验例4.5.1

在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题:(1)你对伴侣的爱情的“热度”感觉如何?(2)伴侣对你的爱情的“热度”感觉如何?(3)你对伴侣的爱情的“可结伴”水平感觉如何?(4)伴侣对你的爱情的“可结伴”水平感觉如何?回答采用没有、很小、有些、很大和非常大5个等级,得到结果如表。现在我们关心均值分量间的差异是否满足某种结构关系。比如每个指标均值间的差异是否相等。2023/4/5第43页,共123页,2023年,2月20日,星期四丈夫对妻子妻子对丈夫

x1

x2

x3

x4

x1

x2

x3

x42355445555444555455544554344455533554455334533443444435444553455455544544433344444554555554455552023/4/5第44页,共123页,2023年,2月20日,星期四设丈夫对妻子的回答,妻子对丈夫的回答,这里欲检验令则等价于检验2023/4/5第45页,共123页,2023年,2月20日,星期四原假设为真时,检验统计量一般地,设从总体和总体未知,中各自独立地抽取样本和,这里欲检验其中C为常数矩阵,k<p,rank(C)=k,j为常数向量。2023/4/5第46页,共123页,2023年,2月20日,星期四检验规则:这里2023/4/5第47页,共123页,2023年,2月20日,星期四dataexam4_5_1;inputx1x2x3x4class@@;cards;2 3 5 5 1 4 4 5 5 25 5 4 4 1 4 5 5 5 24 5 5 5 1 4 4 5 5 24 3 4 4 1 4 5 5 5 23 3 5 5 1 4 4 5 5 23 3 4 5 1 3 3 4 4 23 4 4 4 1 4 3 5 4 24 4 5 5 1 3 4 5 5 24 5 5 5 1 4 4 5 4 24 4 3 3 1 3 4 4 4 24 4 5 5 1 4 5 5 5 25 5 4 4 1 5 5 5 5 2;proc

sort;byclass;proc

corr

noprint

cov

outp=new;varx1-x4;byclass;proc

print;proc

iml;usenew;readallvar{x1x2x3x4}where(_TYPE_='COV'&class=1)intoS1;readallvar{x1x2x3x4}where(_TYPE_='COV'&class=2)intoS2;readallvar{x1x2x3x4}where(_TYPE_='MEAN'&class=1)intoxm;readallvar{x1x2x3x4}where(_TYPE_='MEAN'&class=2)intoym;readallvar{x1}where(_TYPE_='N'&class=1)inton1;readallvar{x1}where(_TYPE_='N'&class=2)inton2;C={1-1

0

0,1

0-1

0,1

0

0-1};k=nrow(C);xm=xm`;ym=ym`;Sp=((n1-1)*S1+(n2-1)*S2)/(n1+n2-2);T2=n1*n2*(C*(xm-ym))`*inv(C*Sp*C`)*(C*(xm-ym))/(n1+n2);T2a=k*(n1+n2-2)*finv(0.95,k,n1+n2-k-1)/(n1+n2-k-1);F=(n1+n2-k-1)*T2/k/(n1+n2-2);printxmymS1S2SpT2T2aF;ifT2>=T2athenprint'拒绝原假设H0';elseprint'接受原假设H0';run;2023/4/5第48页,共123页,2023年,2月20日,星期四XMYMS13.753.83333330.750.5454545-0.159091-0.22727344.16666670.54545450.72727270-0.0909094.41666674.8333333-0.15909100.44696970.40909094.54.6666667-0.227273-0.0909090.40909090.4545455S2SP0.33333330.21212120.15151520.12121210.54166670.3787879-0.003788-0.053030.21212120.51515150.12121210.24242420.37878790.62121210.06060610.07575760.15151520.12121210.15151520.1212121-0.0037880.06060610.29924240.26515150.12121210.24242420.12121210.2424242-0.053030.07575760.26515150.3484848T2T2AF4.444221110.2246911.3467337接受原假设H02023/4/5第49页,共123页,2023年,2月20日,星期四dataexam451;inputx1x2x3x4class@@;cards;2 3 5 5 1 4 4 5 5 25 5 4 4 1 4 5 5 5 24 5 5 5 1 4 4 5 5 24 3 4 4 1 4 5 5 5 23 3 5 5 1 4 4 5 5 23 3 4 5 1 3 3 4 4 23 4 4 4 1 4 3 5 4 24 4 5 5 1 3 4 5 5 24 5 5 5 1 4 4 5 4 24 4 3 3 1 3 4 4 4 24 4 5 5 1 4 5 5 5 25 5 4 4 1 5 5 5 5 2;run;proc

anova;classclass;modelx1-x4=class;manova

h=classm=(1-1

0

0,

1

0-1

0,

1

0

0-1);run;2023/4/5第50页,共123页,2023年,2月20日,星期四StatisticValueFValueNumDFDenDFPr>FWilks'Lambda0.831939801.353200.2876Pillai'sTrace0.168060201.353200.2876Hotelling-LawleyTrace0.202010051.353200.2876Roy'sGreatestRoot0.202010051.353200.28762023/4/5第51页,共123页,2023年,2月20日,星期四方差分析就是多个正态总体均值的比较检验第六节单因素一元方差分析2023/4/5第52页,共123页,2023年,2月20日,星期四表1该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8例4.6.1某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见表1。试分析饮料的颜色对销售量是否产生影响。一、问题引入2023/4/5第53页,共123页,2023年,2月20日,星期四分析

检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同设1为无色饮料的平均销售量,2为粉色饮料的平均销售量,3为橘黄色饮料的平均销售量,4为绿色饮料的平均销售量,也就是检验下面的假设

H0:1234

H1:1,2,3,4

不全相等检验上述假设通常所采用的方法就是方差分析思考:例4.6.1中的4组数据为什么会有差异,数据间的差异是什么造成的?2023/4/5第54页,共123页,2023年,2月20日,星期四(1)试验(2)因素和试验指标影响试验结果的原因即为因素要分析饮料的颜色对销售量是否有影响,颜色是因素或因子,销售额是试验指标(3)水平因素的具体表现称为水平A1、A2、A3、A4四种颜色就是因素的水平(4)试验指标的观测值在每个因素水平下得到的样本值每种颜色饮料的销售量就是观测值1.基本概念2023/4/5第55页,共123页,2023年,2月20日,星期四(5)总体因素的每一个水平可以看作是一个总体比如A1、A2、A3、A4四种颜色可以看作是四个总体(6)样本数据上面的数据可以看作是从这四个总体中抽取的样本数据2023/4/5第56页,共123页,2023年,2月20日,星期四设有k

个总体,记为,它们的分布为2.单因素一元方差分析的数学模型今从这k

个总体中各自独立地抽取一个样本,取自总体的样本为,。列表如下2023/4/5第57页,共123页,2023年,2月20日,星期四设有k组数据,每组有ni个观察值sk2Tk…xkj…xk2xk1pk………………………si2Ti…xij…xi2xi1pi………………………s22T2…x2j…x22x21p2s12T1…x1j…x12x11p1均方平均总和观测值(xij,j=1,…,ni;

i=1,…,k)组别2023/4/5第58页,共123页,2023年,2月20日,星期四单因素一元方差分析的数学模型:其中和是未知的参数,且各相互独立。需要检验的假设检验问题为2023/4/5第59页,共123页,2023年,2月20日,星期四令则有这里称为因素A的第i个水平所引起的效应,可以看成是Ai对总平均的“贡献”大小。当时,称Ai的效应为正;当时,称Ai的效应为负。此时模型改写为2023/4/5第60页,共123页,2023年,2月20日,星期四观测数据总变异的平方和记为3.平方和与自由度的分解SST反映了全部数据总的偏差程度,称为总离差平方和;SSE反映了随机误差的大小,称为组内离差平方和;SSA反映了系统误差的大小,称为组间离差平方和。2023/4/5第61页,共123页,2023年,2月20日,星期四平方和可以改写成如下形式可得其中,2023/4/5第62页,共123页,2023年,2月20日,星期四从以上各式可知:SSE

仅依赖于重复试验中的随机误差;而当成立时,要还是反映了因素的不同水平效应的差异所引起的波动。由于SSA

仅反映了误差波动;不成立时,除反映误差波动外,主2023/4/5第63页,共123页,2023年,2月20日,星期四当成立时,当不成立时,故当成立时,应与1相差不大,而当不成立时,与1比较应有明显偏大的趋势。这样可用其作为检验统计量。2023/4/5第64页,共123页,2023年,2月20日,星期四H0成立时,检验统计量组间均方组间均方定理4.6.1

对于模型(Ⅰ),有2023/4/5第65页,共123页,2023年,2月20日,星期四如果H0为真,F=MSA/MSE1aF(k-1,n-k)0拒绝H0不能拒绝H0FF分布检验规则:2023/4/5第66页,共123页,2023年,2月20日,星期四方差来源SS(平方和)DF(自由度)MS(均方)F值F临界值组间(SSA)SSAk-1MSAF(k-1,n-k)组内(SSE)SSEn-kMSE总计(SST)SSTn-14.一元方差分析表2023/4/5第67页,共123页,2023年,2月20日,星期四方差来源DFSSMSFP值F临界值组间376.845525.615210.490.00053.2398组内1639.0842.4428总计19115.9295一元方差分析表这里取显著性水平为0.05,由于F值>F临界值,故拒绝H0,即认为饮料的颜色对销售量有显著影响。例4.6.1分析饮料的颜色对销售量是否产生影响。2023/4/5第68页,共123页,2023年,2月20日,星期四SAS程序datadrink_color;inputax@@;cards;126.5231.2327.9430.8128.7228.3325.1429.6125.1230.8328.5432.4129.1227.9324.2431.7127.2229.6326.5432.8;proc

anova

data=drink_color;classa;modelx=a;run;2023/4/5第69页,共123页,2023年,2月20日,星期四例4.6.2

研究6种氮肥施用法对小麦的效应,每种施肥法种5盆小麦,完全随机设计。最后测定它们的含氮量(mg),试作方差分析施氮法12345612.914.012.610.514.614.012.313.813.210.814.613.312.213.813.410.714.413.712.513.613.410.814.413.512.713.613.010.514.413.712.5213.7613.1210.6614.4813.642023/4/5第70页,共123页,2023年,2月20日,星期四SAS程序1dataexam4_6_2;inputgx@@;cards;112.9214.0 312.6 410.5 514.6 614.0112.3 213.8 313.2 410.8 514.6 613.3112.2 213.8 313.4 410.7 514.4 613.7112.5 213.6 313.4 410.8 514.4 613.5112.7 213.6 313.0 410.5 514.4 613.7;proc

anova;classg;modelx=g;run;2023/4/5第71页,共123页,2023年,2月20日,星期四SAS程序2dataexam462;inputxg@@;cards;12.9112.3112.2112.5112.7114213.8213.8213.6213.6212.6313.2313.4313.4313310.5410.8410.7410.8410.5414.6514.6514.4514.4514.4514613.3613.7613.5613.76;proc

anova;classg;modelx=g;run;2023/4/5第72页,共123页,2023年,2月20日,星期四方差分析表:SourceDFSumofSquaresMeanSquareFValuePr>FModel544.4638.8926164.17<0.0001Error241.30000.05416667CorrectedTotal2945.7632023/4/5第73页,共123页,2023年,2月20日,星期四例4.6.3

某灯泡厂用四种不同配料方案制成的灯丝生产四批灯泡,在每一批中取若干个作寿命试验,得如下数据(单位:小时):问灯丝的不同配料方案对灯泡寿命有无显著影响?灯泡品种A11600,1610,1650,1680,1700,1720,1800A21580,1640,1640,1700,1750A31460,1550,1600,1620,1640,1660,1740,1820A41510,1520,1530,1570,1600,16802023/4/5第74页,共123页,2023年,2月20日,星期四SAS程序dataexam4_6_3;inputgy@@;cards;1160011610116501168011700117201180021580216402164021700217503146031550316003162031640316603174031820415104152041530415704160041680;proc

glm;classg;modely=g;run;2023/4/5第75页,共123页,2023年,2月20日,星期四方差分析表:SourceDFSumofSquaresMeanSquareFValuePr>FModel344360.705114786.90172.150.1229Error22151350.83336879.5833CorrectedTotal25195711.53852023/4/5第76页,共123页,2023年,2月20日,星期四第七节双因素一元方差分析例4.7.1在某种橡胶的配方中,考虑了三种不同的促进剂,四种不同分量的氧化锌。各种配方试验一次,测得300%定强如下:问不同促进剂、不同分量氧化锌分别对定强有无显著影响?一、问题引入B1B2B3B4A1323535.538.5A233.536.53839.5A33637.539.543氧化锌B促进剂A2023/4/5第77页,共123页,2023年,2月20日,星期四例4.7.2考察合成纤维中对纤维弹性有影响的两个因素:收缩率A和总拉伸倍数B。A和B各取4种水平,整个试验重复一次,试验结果如下:试问收缩率和总拉伸倍数分别对纤维弹性有无显著影响,并问两者对纤维弹性有无显著交互作用?460(B1)520(B2)580(B3)640(B4)0(A1)71,7372,7375,7377,754(A2)73,7576,7478,7774,748(A3)76,7379,7774,7574,7312(A4)75,7373,7270,7169,69因子B因子A2023/4/5第78页,共123页,2023年,2月20日,星期四1.几点说明(1)如果A和B对试验结果的影响是相互独立的,分别判断因素A和因素B对试验指标的影响,这时的双因素方差分析称为无交互作用的双因素方差分析(2)如果除了A和B对试验结果的单独影响外,因素A和因素B的搭配还会对销售量产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析

(3)对于无交互作用的双因素方差分析,其结果与对每个因素分别进行单因素方差分析的结果相同2023/4/5第79页,共123页,2023年,2月20日,星期四二、等重复试验的二因素方差分析(考虑交互作用)设因素A有r个不同的水平:对每个可能的搭配进行c

次独立试验,共获得rsc个试验结果列表如下:因素B有s个不同的水平:B1B2BsA1A2Ar因子B因子A2023/4/5第80页,共123页,2023年,2月20日,星期四假定则为了解各因素的影响,令1.等重复试验二因素方差分析的数学模型2023/4/5第81页,共123页,2023年,2月20日,星期四显然称为理论总均值,表示所考虑的rs个总体数学期望的总平均;称ai

为因素A的第i个水平对试验结果的效应;称bj

为因素B的第j个水平对试验结果的效应;称gij

为水平搭配Ai×Bj对试验结果的交互效应。2023/4/5第82页,共123页,2023年,2月20日,星期四等重复试验二因素方差分析的数学模型2023/4/5第83页,共123页,2023年,2月20日,星期四令2.平方和与自由度的分解则2023/4/5第84页,共123页,2023年,2月20日,星期四观测数据总变异的平方和记为2023/4/5第85页,共123页,2023年,2月20日,星期四SST反映了全部数据总的偏差程度,称为总离差平方和;SSA称为因子A引起的离差平方和;SSB称为因子B引起的离差平方和;SSAXB称为因子A和B的交互作用引起的离差平方和;SSE称为随机误差引起的离差平方和。2023/4/5第86页,共123页,2023年,2月20日,星期四定理4.7.1

对于模型(Ⅱ),有2023/4/5第87页,共123页,2023年,2月20日,星期四定理4.7.2

对于模型(Ⅱ),有(1)(2)H0A成立时,(3)H0B成立时,(4)H0A×B成立时,(5)SSE

,SSA,SSB,SSA×B相互独立。2023/4/5第88页,共123页,2023年,2月20日,星期四H0A成立时,检验统计量由定理4.7.2,有H0B成立时,检验统计量H0A×B成立时,检验统计量2023/4/5第89页,共123页,2023年,2月20日,星期四检验规则:2023/4/5第90页,共123页,2023年,2月20日,星期四方差来源平方和SS自由度df均方MSF值临界值Fa因素A

因素BA×B误差总和SSASSBSSA×BSSESSTr-1s-1(r-1)(s-1)rs(c-1)rsc-1MSAMSBMSA×BMSEFAFBFA×B3.考虑交互作用的二因素方差分析表2023/4/5第91页,共123页,2023年,2月20日,星期四例4.7.2考察合成纤维中对纤维弹性有影响的两个因素:收缩率A和总拉伸倍数B。A和B各取4种水平,整个试验重复一次,试验结果如下:试问收缩率和总拉伸倍数分别对纤维弹性有无显著影响,并问两者对纤维弹性有无显著交互作用?460(B1)520(B2)580(B3)640(B4)0(A1)71,7372,7375,7377,754(A2)73,7576,7478,7774,748(A3)76,7379,7774,7574,7312(A4)75,7373,7270,7169,69因子B因子A2023/4/5第92页,共123页,2023年,2月20日,星期四SAS程序dataexam4_7_2;inputyAB@@;cards;7111731172127312 7513731377147514732175217622742278237723742474247631733179327732743375337434733475417341734272427043714369446944;proc

anova;classAB;modely=A|B;run;2023/4/5第93页,共123页,2023年,2月20日,星期四方差分析表:SourceDFSumofSquaresMeanSquareFValuePr>FA3

70.59375000

23.5312500017.51<.0001B3

8.59375000

2.8645833332.130.1363A*B979.531250008.836805566.580.0006Error16

21.5000000

1.3437500CorrectedTotal31

180.21875002023/4/5第94页,共123页,2023年,2月20日,星期四三、无重复试验的二因素方差分析(无交互作用)设因素A有r个不同的水平:对每个可能的搭配进行一次独立试验,共获得rs个试验结果列表如下:因素B有s个不同的水平:2023/4/5第95页,共123页,2023年,2月20日,星期四1.无重复试验二因素方差分析的数学模型2023/4/5第96页,共123页,2023年,2月20日,星期四令2.平方和与自由度的分解则2023/4/5第97页,共123页,2023年,2月20日,星期四观测数据总变异的平方和记为SST反映了全部数据总的偏差程度,称为总离差平方和;SSA称为因子A引起的离差平方和;SSB称为因子B引起的离差平方和;SSE称为随机误差引起的离差平方和。2023/4/5第98页,共123页,2023年,2月20日,星期四定理4.7.3

对于模型(Ⅲ),有2023/4/5第99页,共123页,2023年,2月20日,星期四定理4.7.4

对于模型(Ⅲ),有(1)(2)H0A成立时,(3)H0B成立时,(4)SSE

,SSA,SSB相互独立。2023/4/5第100页,共123页,2023年,2月20日,星期四H0A成立时,检验统计量由定理4.7.4,有H0B成立时,检验统计量检验规则:2023/4/5第101页,共123页,2023年,2月20日,星期四3.无交互作用的二因素方差分析表方差来源平方和SS自由度df均方MSF值临界值Fa因素A

因素B误差总和SSASSBSSESSTr-1s-1(r-1)(s-1)rs-1MSAMSBMSEFAFB2023/4/5第102页,共123页,2023年,2月20日,星期四例4.7.1在某种橡胶的配方中,考虑了三种不同的促进剂,四种不同分量的氧化锌。各种配方试验一次,测得300%定强如下:问不同促进剂、不同分量氧化锌分别对定强有无显著影响?B

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论