一元方差分析ppt课件_第1页
一元方差分析ppt课件_第2页
一元方差分析ppt课件_第3页
一元方差分析ppt课件_第4页
一元方差分析ppt课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、二、二元方差分析二、二元方差分析 一一 、一元方差分析、一元方差分析 方差分析方差分析二、统计分析二、统计分析一一 、总平方和的分解、总平方和的分解单因素试验的方差分析 例1 假定某型号的电子管的使用寿命服从正态分布,并且原料差异只影响平均寿命,不影响方差 。现用三种不同来源的材料各试生产了一批电子管。从每批中各抽取若干只做寿命实验,得数据如下表。2试问测试结果是否说明这批电子管的寿命有明显差异?材料批号寿命测定值 (单位:小时)1231600 1610 1650 1680 1700 1700 18001580 1640 1640 1700 17501460 1550 1600 1620 16

2、40 1660 1740 1820三个水平因素试验指标例例2 2 设对四种玉米品种进行对比实验,每个品设对四种玉米品种进行对比实验,每个品种都在同一块田的五个小区各做一次实验,实种都在同一块田的五个小区各做一次实验,实验结果如下表所示。试问不同品种对玉米的平验结果如下表所示。试问不同品种对玉米的平均产量是否有显著影响?均产量是否有显著影响?品种品种产量斤产量斤/小区)小区)32.3 34.0 34.3 35.0 36.5 33.3 33.0 36.3 36.8 34.530.8 34.3 35.3 32.3 35.81A2A3A4A 29.3 26.0 29.8 28.0 29.8水平因素试验

3、指标设在试验中,因素A有m个不同水平12,.,mA AA在水平下的试验结果2(,)(1,2,.,)iiXNim 。其中 和 是未知参数。在水平 下作 次独立实验,其结果如表1所示。i2iAin123in11211mXXX12222mXXX13233mXXX11nXmmnX子样均值 iX22nX1XmX2X容量样本水平1A2AmA2. 数学模型表1 是来自总体 的容量为 的 一个 样本,其观察值为 12iiiinXXX, ,iXin2iiiinxxx, ,012:mH112:,mH 不全相等(1)由于 相互独立,且ijX2(,)ijiXN 1,2,.,;1,2,iim jn若记那么( 1,2,;

4、1,2,)ijijiiXm jn2(0,),ijN且相互独立 要判断因素的各水平间是否有显著差异,也就是要 判断各正态总体的均值是否相等,即检验假设2(0,)1,2,1,2,ijiijijijiXNimjn相互独立(2)其中 与 均为未知参数。式2称为单因素方差分析的数学模型。iij11miiiiinn(1,2,)im(3)再令1miinn(5)1201,2,;1,2,(0,)ijiijmiiiiijXnimjnN且相互独立则是各水平下总体均值的加权平均,称为总平均值; 代表了第i水平下的总体均值与平均值的差异,这个差异称为 的效应,iiA10miiin(4)由式(2),(3)可以得到单因素方

5、差分析的等价数学模型它满足式式(5)说明:样本由总平均值说明:样本由总平均值 因素的水平效应因素的水平效应 随机误差三部分叠加而成。随机误差三部分叠加而成。因而式因而式(5)也称为线性可加模型。也称为线性可加模型。(5)1201,2,;1,2,(0,)ijiijmiiiiijXnimjnN且相互独立由于当 为真时,0H12m,=各水平的效应0,1,2,iiim=统计假设模型(1)等价于012:0mH112:,mH 不全为零(6)基本任务:根据样本提供的信息,对假设 (6)进行检验,并估计未知参数212,m,111,miiimiin Xnnn其中injijiin11 则类似记号:11111inr

6、rijiiijinnn通过分解,构造统计量组内平均111inmijijXXn11(1,2,)iniijjiXXimn(7)(8)两者间的关系称为总离差平方和。称为总离差平方和。211()inmTijijSXX引入记号引入记号211()inmTijijSXX(10)总离差平方和分解总离差平方和分解221111()()iinnmmijiiijijXXXX211()inmijiiijXXXX112()()inmijiiijXXXX其中其中11()()inmijiiijXXXX221111()()iinnmmTijiiijijSXXXX22111()()inmmijiiiijiXXn XXEASS11

7、()()inmiijiijXXXX110inmiijiiijXXXn X211()inmEijiijSXX为各水平下的样本与该水平下样本均值的离差平方和,为各水平下的样本与该水平下样本均值的离差平方和,反映了各水平下样本值的随机波动情况,称为组内平反映了各水平下样本值的随机波动情况,称为组内平方和。方和。它是由试验的随机误差引起的,故又称误差平方和。它是由试验的随机误差引起的,故又称误差平方和。21()mAiiiSn XX为各水平下的样本均值与样本总均值的加权为各水平下的样本均值与样本总均值的加权离差平方和,反映了各水平间的样本值的差异,离差平方和,反映了各水平间的样本值的差异,称为组间平方和

8、。称为组间平方和。形成它的主要原因是因素形成它的主要原因是因素A的各水平下的不同的各水平下的不同效应,故又称为效应平方和。效应,故又称为效应平方和。221miiin XnX常见统计量常见统计量1 1、样本均值、样本均值2 2、样本方差、样本方差nkkXnX11设设nXXX,21是来自总体是来自总体X的一个样本,的一个样本,常用来估计常用来估计EX.nkkXXnS122)(11nkkXnXn122)(11.,) 1 (2nXDXE.)()2(22SE,2DXEX结论:设为来自总体结论:设为来自总体 的一个样本,的一个样本,nXX,1X211()inmEijiijSXX222121()()()im

9、iiiiiniiXXXXXX12222111121112222122222222212()()()()()()()()()mnnmmmmmnmXXXXXXXXXXXXXXXXXX21(1)n222212(1)(1)(1)()EmSnnnnm21(1)miiinS2(,),ijiTXNS 且独立 将写成:2211()(1),inmTijijSXXnS22111 ()1inmijijSXXn其中2222(1)(1),(1)TQnSnn自由度为222111()inmmAiiiijiSXXn XnX2211(,),( ,),0mmiiiiiiiiXNXNnnnnn222211()mmAiiiiiiES

10、En XnXn E XnEX221(1)rAiiiESnn即22221()()miiiinnnn2222111(1)2mmmiiiiiiiimnnnn221(1)miiimn11 0 miiiiiimiiiAnnn 第 个 水 平的 效 应故故2()EE Snm221(1)mAiiiE Smn(12)(13)记EESSnm2EE S22111mAiiiE Snm(14)(15)1AASSm的均方的均方ASES的均方的均方2EES22111mAiiiESnm(14)(15)(14)(14)及及(15)(15)两式表明:两式表明:ES是是 的无偏估计,的无偏估计,2AS仅当仅当0H成立时才是成立时

11、才是 的无偏估计,的无偏估计,2否则它的期望值要大于否则它的期望值要大于2。/AESS在在 成立时应接近于成立时应接近于1 1,0H而当而当 H1成立时总有偏大的倾向。成立时总有偏大的倾向。如果比值如果比值比比1大得多,就应拒绝假设大得多,就应拒绝假设/AESS0H 。为此,我们采用为此,我们采用AESFS(16)作为检验统计量。作为检验统计量。0H当 成立时,2/ES与2/AS相互独立,且分别服从自由度相互独立,且分别服从自由度(n-m),(m-1)的的 分布,故分布,故222/(1)/()AESmFSnm/(1)/()AESmSnm(1,)AESF mnmS复习:复习:F 分布的分位点分布

12、的分位点 对于给定的正数对于给定的正数10 ,称满足条件称满足条件),(2121)(),(nnFdzzfnnFFP的点的点为为分位点分位点分布的上分布的上),(21nnF),(21nnF),(21nnF对给定的显著性水平 ,由(1,)P FF mnm得检验问题(1.1)或(1.6)的拒绝域为(1,)FF mnm(17)上述分析的结果可排列成表2的形式称为方差分析表方差来源方差来源误差误差E因素因素A总和总和均方均方自由度自由度平方和平方和显著性显著性F比比211()inmEijiijSXXn m/()EESSn m/AEFSS1m1n/(1)AASSm211()inmTijijSXX21()m

13、AiiiSn XX在实际计算时,通常使用下列公式在实际计算时,通常使用下列公式22221111111iiinnnmmmTijijijijijijTSxxxnn22221111111iinnmmmiAijijijijiiiTTSxxnnnnETASSS11inmijijTx1,iniijjTx其中其中设对四种玉米品种进行对比实验,每个品种设对四种玉米品种进行对比实验,每个品种都在同一块田的五个小区各做一次实验,实都在同一块田的五个小区各做一次实验,实验结果如下表所示。试问不同品种对玉米的验结果如下表所示。试问不同品种对玉米的平均产量是否有显著影响?平均产量是否有显著影响?(=0.01)品种品种产

14、量斤产量斤/小区)小区)32.3 34.0 34.3 35.0 36.5 33.3 33.0 36.3 36.8 34.530.8 34.3 35.3 32.3 35.81A2A3A4A 29.3 26.0 29.8 28.0 29.8解解 分别以分别以 表示不同品种玉米平均表示不同品种玉米平均产量总体的均值,按题意需检验假设产量总体的均值,按题意需检验假设1234, 01234:H11234:,H 不全相等1234nnnn=5,1234nnnnn=20656.4,ijx 221677.50ijx 4m 品种地块产量1A2A4A3A1 32.3 33.3 30.8 29.3 172.1 173

15、.9 168.5 141.9 656.45 36.5 34.5 35.8 28.84 35.0 36.8 32.3 28.03 34.3 36.3 35.3 29.82 34.0 33.0 34.3 26.0iT2iT2/5iT521ijjx 5923.682 6048.242 5678.45 4027.122 21677.5029618.41 30241.21 28392.25 20195.61 5933.03 6060.07 5696.15 4035.97 21725.2224521120TijijTSx47.72ETASSS2241520iAiTTS134.452注意到注意到4,m 12

16、345,nnnn可得方差分析表可得方差分析表656.421725.22182.172202656.421677.520方差分析表方差分析表方差来源方差来源误差误差E因素因素A总和总和均均 方方自由度自由度平方和平方和显著性显著性F 比比47.72ES 2.98ES 15.04F 44.817AS 182.172TS 134.452AS 当当 时,时,0.01由由F分布表可查得分布表可查得0.01(3,16)(3,16)5.29FF由于由于0.0115.045.29(3,16),FF故拒绝故拒绝0,H即认为即认为这四个品种对玉米平均产量的影响高度显著。这四个品种对玉米平均产量的影响高度显著。31

17、916作区间估计,ji作点估计对为此可用jijiXX)11(),()(2jijijijijinnNXX,有代替以的无偏估计为EEESrnQS,22)()11()(rntSnnXXTEjijiji)()()(2222rnSrnQEEjiHji,:1至少有一对接受有时需要对有时需要对ji那么 的置信度为1 的置信区间为11)(2EjijiSnnrntXX由上面讨论,可得未知参数由上面讨论,可得未知参数2,i 的估计的估计2ESnm是是 的无偏估计。的无偏估计。21111iinniijiijjiiE XE Xnn11111iinnmijiiiijjE XE XnnniiXX, 如果检验结果为拒绝如果

18、检验结果为拒绝 ,0H即即12,m 不全相等。不全相等。 有时需要对第有时需要对第i个水平及第个水平及第k个水平均个水平均值差值差 作出区间估计。作出区间估计。ik为此,我们可以取为此,我们可以取作为作为 的点估计,的点估计,ikXXik注意到注意到()ikikE XX211()()ikikD XXnn()(0,1)11ikikikXXNnn又又2/ESnm是是 的无偏估计,的无偏估计,2而而2/ES2(),nm可以证明可以证明 与与 相互独立。相互独立。ikXXES2()1/1/()ikikikEXXnnTSnm() ()11()ikikEikXXt nmSnm nnik的置信度为的置信度为

19、 的置信区间为的置信区间为1211()()ikEikXXtnmSnn 求例2中未知参数 的点估计及均值差的置信度为0.95的区间估计。2i, ,解解 的点估计为222.98ESSnm= 及 的无偏估计分别为i45111656.432.8220ijijxxn(1,2,3,4)5iiiTxi1134.42,5T2234.78,5T333.70,428.38。当0.05 时, /20.025(204)(16)2.1199tt0.02511(16)()EiktSnn12,13,13的置信度为的置信度为0.95的置信的置信区间分别为区间分别为22.11992.982.3155(34.4233.702.3

20、15,34.4233.702.315)( 1.595,3.035) 34.4228.382.315,34.4228.382.315(3.725,8.355)(34.4234.782.315,34.4234.782.315)( 2.675,1.955) 121341 因素因素A分分3个水平,对每个水平进行个水平,对每个水平进行4次试验,次试验,结果如下表:结果如下表:1 38 20 21 试验号试验号i2 36 24 22 3 35 26 31 4 31 30 34 因因 素素 水水 平平1A3A2A假定样本都是从同方差的正态总体中抽取的。假定样本都是从同方差的正态总体中抽取的。 (1在显著性水

21、平 下,检验假设0.050:H组均值相等。组均值相等。 (2求未知参数及的点估计以及均值差的置信区间置信度为的点估计以及均值差的置信区间置信度为95%)2123, , 123, 解解(1用下表进行计算用下表进行计算1 38 1444 20 400 21 414 试验号试验号i2 36 1296 24 576 22 484 3 35 1225 26 676 31 9614 31 961 30 900 34 1156因因 素素 水水 平平1A3A2A21jnjijiQx 4926 2552 3042 10520jQ 1ix2ix23ix3ix22ix21ix 140 100 108 19600 1

22、0000 11664 4900 2500 2916 1jnjijiTx2jTjjjTPn348jTT10316jP221110520(348)42812TjSQTn2110316 10092224AjSPTn428224209ETASSS方差分析表方差分析表方差来源因素误差总和 224 3-1=2 112 4.94 204 13-3=9 22.67 428 12-1=11 均方自由度平方和 比AF查表得查表得0.05(2,9)4.26,4.944.26,AESFFS回绝回绝0,H即在显著性水平下,可以认为组平即在显著性水平下,可以认为组平0.05均值在整体上是有显著差异的。均值在整体上是有显著

23、差异的。(2)222.67EESSns1.1140/44.26x2.23.325,27xx1348291212xT1.135296xx查表查表0.025(9)2.2622t。0.0511(9)()EjktSnn121323, 的置信度为的置信度为95%的置信区间分别为的置信区间分别为(2.3837,17.6162),(0.3837,15.6162)3.327292xx 2.225294xx ( 9.6162,5.6162)2.2622222.6747.61626 一共进行了一共进行了13次试验,假设样本都是从同次试验,假设样本都是从同方差的正态总体中抽取的,试验结果如下表:方差的正态总体中抽取的,试验结果如下表: 1 2 3 4 5 6试验号i因素水平1A2A3A 37 47 40 60 60 86 67 92 95 98 69 100 98 (1在显著性水平在显著性水平 下检验假设下检验假设0.0101231123:,:,HH 不全相等(2求求 及及 的点估计及均值的点估计及均值2, ,i (1,2,3)ii差的差的95%置信区间。置信区间。解解用下表进行计算,得用下表进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论