版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、方差分析公式(2012-06-26 11:03:09) 转载标签: 杂谈分类: 统计方法 方差分析方差分析(analysis of variance,简写为anov或anova)可用于两个或两个以上样本均数的比较。应用时要求各样本是相互独立的随机样本;各样本来自正态分布总体且各总体方差相等。方差分析的基本思想是按实验设计和分析目的把全部观察值之间的总变异分为两部分或更多部分,然后再作分析。常用的设计有完全随机设计和随机区组设计的多个样本均数的比较。一、完全随机设计的多个样本均数的比较又称单因素方差分析。把总变异分解为组间(处理间)变异和组内变异(误差)两部分。目的是推断k个样本所分别代表的1,
2、2,k是否相等,以便比较多个处理的差别有无统计学意义。其计算公式见表19-6.表19-6 完全随机设计的多个样本均数比较的方差分析公式变异来源离均差平方和ss自由度v均方msf总x2-c*n-1组间(处理组间)k-1ss组间/v组间ms组间/ms组间组内(误差)ss总-ss组间n-kss组内/v组内*c=(x)2/n=ni,k为处理组数表19-7 f值、p值与统计结论f值p值统计结论0.05f0.05(v1.v2)0.05不拒绝h0,差别无统计学意义0.05f0.05(v1.v2)0.05拒绝h0,接受h1,差别有统计学意义0.01f0.01(v1.v2)0.01拒绝h0,接受h1,差别有高度
3、统计学意义方差分析计算的统计量为f,按表19-7所示关系作判断。例19.9 某湖水不同季节氯化物含量测量值如表19-8,问不同季节氯化物含量有无差别?表19-8 某湖水不同季节氯化物含量(mg/l) xij春夏秋冬22.619.118.919.022.822.813.616.921.024.517.217.616.918.015.114.820.015.216.613.121.918.414.216.921.520.116.716.221.221.219.614.8xij j167.9159.3131.9129.3588.4(x)ni888832(n)xi20.9919.9116.4916.1
4、6x2ijj 3548.51 3231.95 2206.27 2114.1111100.84(x2)h0:湖水四个季节氯化物含量的总体均数相等,即1=2=3=4h1:四个总体均数不等或不全相等=0.05先作表19-8下半部分的基础计算。c= (x)2/n=(588.4)2/32=10819.205ss总=x2-c=11100.84-10819.205=281.635v总=n-1=31v组间=k-1=4-1=3ss组内=ss总-ss组间=281.635-141.107=140.465v组内=n-k=32-4=28ms组间=ss组间/v组间=141.107/3=47.057ms组内=ss组内/v组
5、内=140.465/28=5.017f=ms组间/ms组内=47.057/5.017=9.380以v1(即组间自由度)=3,v2(即组内自由度)=28查附表19-2,f界值表,得f0.05(3,28)=2.95,f0.01(3,28)=4.57.本例算得的f=9.380f0.01(3,28),p0.01,按=0.05检验水准拒绝h0,接受h1,可认为湖水不同季节的氯化物含量不等或不全相等。必要时可进一步和两两比较的q检验,以确定是否任两总体均数间不等。资料分析时,常把上述计算结果列入方差分析表内,如表19-9.表19-9 例19.9资料的方差分析表变异来源ssvmsfp组间141.170347
6、.0579.380.01组内140.465285.017总281.63531二、随机区组(配伍组)设计的多个样本均数比较又称两因素方差分析。把总变异分解为处理间变异、区组间变异及误差三部分。除推断k个样本所代表的总体均数,1,2,k是否相等外,还要推断b个区组所代表的总体均数是否相等。也就是说,除比较多个处理的差别有无统计学意义外,还要比较区组间的差别有无统计学意义。该设计考虑了个体变异对处理的影响,故可提高检验效率。表19-10随机区组设计的多个样本均数比较的方差分析公式变异来源离均差平方和ss自由度v均方msf总x2-cn-1处理间k-1ss处理/v处理ms处理/ms误差区组间b-1ss区
7、组/v区组ms区组ms误差误差ss总-ss处理-ss区组v总-v处理-v区组ss误差/v误差c、k、n的意义同表19-6,b为区组数例19.10为研究酵解作用对血糖浓度的影响,从8名健康人中抽血并制成血滤液。每个受试者的血滤液被分成4份,再随机地把4份血滤液分别放置0,45,90,135分钟,测定其血溏浓度(表19-11),试问放置不同时间的血糖浓度有无差别?处理间:h0:四个不同时间血糖浓度的总体均数相等,即1=2=3=4表19-11 血滤放置不同时间的血糖浓度(mmol/l) 区组号放置时间(分)受试者小计 xijj0459013515.275.274.944.6120.0925.275.
8、224.884.6620.0335.885.835.385.0022.0945.445.385.275.0021.0955.665.445.384.8821.3666.226.225.615.2223.2775.835.725.384.8821.8185.275.115.004.4419.82xij j44.8444.1941.8438.69169.56(x)ni888832(n)xi5.60505.52385.23004.8363x2ij j252.1996245.0671219.2962187.5585904.1214(x2)h1:四个总体均数不等或不全相等=0.05区组间:h0:八个区组
9、的总体均数相等,即1=2=8h1:八个区组的总体均数不等或不全相等=0.05先作表19-11下半部分和右侧一栏的基本计算。c=(x)2/n=(169.56)2/32=898.45605ss总=x2-c=904.1214-898.45605=5.66535v总=n-1=32-1=31v处理=k-1=4-1=3v区组=b-1=8-1=7ss误差=ss总-ss处理-ss区组=5.66535-2.90438-2.49800=0.26297v误差=(k-1)(b-1)=3×7=21ms处理=ss处理/v处理=2.90438/3=0.9681ms区组=ss区组/v区组=2.49800/7=0.3
10、569ms误差=ss误差/v误差=0.26297/21=0.0125f处理=ms处理/ms误差=0.9681/0.0125=77.448f区组=ms区组/ms误差=0.3569/0.0125=28.552推断处理间的差别,按v1=3,v2=21查f界值表,得f0.005(3,21)=3.07,f0.01(3,21)=4.87,p0.01;推断区组间的差别,按v1=7,v2=21查f界值表,得f0.05(7,21)=2.49,f0.01(7,21)=3.64,p0.01.按=0.05检验水准皆拒绝h0,接受h1,可认为放置时间长短会影响血糖浓度且不同受试者的血糖浓度亦有差别。但尚不能认为任两个不
11、同放置时间的血糖浓度总体均数皆有差别,必要时可进一步作两两比较的q检验。表19-12 例19.10资料的方差分析表变异来源ssvmsfp处理间2.9043830.968177.4480.01区组间2.4980070.356928.5520.01误差0.26297210.0125总5.6653831三、多个样本均数间的两两比较的q检验经方差分析后,若按=0.05检验水准不拒绝h0,通常就不再作进一步分析;若按=0.05甚至=0.01检验水准拒绝h0,且需了解任两个总体均数间是否都存在差别,可进一步作多个样本均数间的两两比较。两两比较的方法较多,在此仅介绍较常用的q检验(newman-keuls法
12、)(各组ni相等)公式(19.14)(各组ni不等)公式(19.15)式中,xa-xb为两两对比中,任两个对比组a、b的样本均数之差;sxa-xb为两样本均数差的标准误;ni为各处理组的样本含量;na,nb分别为a、b两对比组的样本含量;ms误差为单因素方差分析中的组内均方(ms组内)或两因素方差分析中的误差均方(ms误差)。计算的统计量为q,按表19-13所示关系作判断。例19.11 对例19.9资料作两两比较h0:任两个季节的湖水氯化物含量的总体均数相等,即a=bh1:任两总体均数不等,即ab表19-13 |q| 值、p值与统计结论|q|p值统计结论0.05q0.05(v.a)0.05不拒
13、绝h0,差别无统计学意义0.05q0.05(v.a)0.05拒绝h0。接受h1,差别有统计学意义0.01q0.01(v.a)0.01拒绝h0,接受h1,差别有高度统计学意义= 0.051.将四个样本的均数由大到小排列编秩,注明处理组。xi167.9159.3131.9129.3处理组春夏秋冬秩次12342.计算 sxa-xb本例各处理组的样本含量n1相等,按式(19,14)计算两均数差的标准误。已知ms组内=5.017,n=83.列两两比较的q检验计算表(表19-14)表19-14 两两比较的q检验计算表a与b (1)x-x (2)组数,a(3)q值 (4)=(2)/0.7919q0.05(v
14、.a)(5)q0.01(v.a)(6)p值 (7)(1)与(4)38.6448.7443.854.800.01(1)与(3)36.0345.4603.494.450.01(1)与(2)8.6210.8602.893.890.01(2)与(4)30.0337.8843.494.450.01(2)与(3)27.4234.6002.893.890.01(2)与(4)2.623.2832.893.890.05表中第(1)栏为各对比组,如第一行1与4,指a为第1组,b为第4组。第(2)栏为两对比组均数之差,如第一行为x1与x4之差,余类推。第(3)栏为四个样本均数按大小排列时,a、b两对比组范围内所包含的组数a,如第一“1与4”范围内包含4个组,故a=4.第(4)栏是按式(19.13)计算的统计量q值,式中的分母0.7919是按式(19.14)计算出来的sxa-xb.第(5)、(6)栏是根据误差自由度v与组数a查附表19-3q界值表所得的q界值,本例v误差=28,因q界值表中自由度一栏无28,可用近似值30或用内插法得出q界值,本例用近似值30查表,当a=4时,q0.05(30,4)=3.85,q0.01(30,4)=4.80 ,余类推。第(7)栏是按表19-13判定的。4.结论由表1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国泡沫塑料制作行业生产状况分析及投资策略研究报告版
- 2024-2030年中国汽车轮胎螺丝总成行业市场运营模式及未来发展动向预测报告
- 2024年生物质压缩成型设备项目提案报告模板
- 2024年热反射玻璃(非采暖区用)项目立项申请报告
- 2022年大学机械专业大学物理二月考试题C卷-附解析
- 电力公司6S设备维护管理制度
- 公司员工外出拜访客户审批制度
- 培训机构学员请假制度与补课安排
- 年度促生长药竞争策略分析报告
- 新冠重症患者监护管理制度
- 事业单位招聘《综合基础知识》考试试题及答案
- 《突发事件应急预案管理办法》知识培训
- 江苏省南京市建邺区2024-2025学年九年级上学期期中考试物理试题(无答案)
- 中小学师德师风建设各项制度汇编
- 2024年保安员证考试题库及答案(共260题)
- 公务员2024年国考申论真题(地市级)及参考答案
- XXXX酒店管理公司成立方案
- 民用无人机操控员执照(CAAC)考试复习重点题及答案
- 疼痛科整体规划和发展方案
- 2024年中国南水北调集团水网水务投资限公司及下属单位社会招聘高频难、易错点500题模拟试题附带答案详解
- (新版)食品生产企业食品安全员理论考试题库500题(含答案)
评论
0/150
提交评论