数学方差分析_第1页
数学方差分析_第2页
数学方差分析_第3页
数学方差分析_第4页
数学方差分析_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、方差分析analysis of variance 一方差分析的意义1.意义H0:1=2=3可靠度成为 (1-0.05)3=0.857H0:1=2=3=4四均数比较作6次 (1-0.05)6=0.735五均数比较作10次 (1-0.05)10=0.599六均数比较作15次 (1-0.05)15=0.463鉴于以上的原因,对多组均数的比较问题我们采用方差分析(analysis of variance),简称ANOVA。方差分析采用F检验统计量,也称F检验。2优点 不受比较的组数限制。 可同时分析多个因素的作用。 可分析因素间的交互作用。3应用条件 各样本是相互独立的随机样本 各样本来自正态总体 各

2、组总体方差相等,即方差齐二成组设计的多个样本均数比较1基本思想先讲述几个记号:xij表示第i组第j个样本观察值, 表示第i组的均数(= ), 表示总平均(= )例1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者x1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人x2:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.8724名患者与健康人的血磷值大小不等,称这种变异为总变异。

3、可以用总离均差平方和 SST= 及N来反映,总自由度 T=N-1。2个组各组内部血磷值也不等,这种变异称为组内变异,其大小可用2组组内离均差平方和及各组例数ni来反映,自由度E=N-k(k是组数),它反映了随机误差。2组样本均数也不等,这种变异称为组间变异,反映了克山病对血磷值的影响和随机误差2三者关系SST=SSA+SSET=A+E3直观意义检验统计量 F统计量具2个自由度: 1, 2如果两组样本来自同一总体,即克山病患者与健康人血磷值相同,则理论上F应等于1,因为两种变异都只反映随机误差。由于抽样误差的影响,F值未必是1,但应在1附近。若F较小,我们断定2组均数相同,或者说来自同一总体,F

4、较大,推断不是来自同一总体。例2 某社区随机抽取了30名糖尿病患者、IGT异常和正常人进行载脂蛋白(mg/dL)测定,结果如下,问三种人的载脂蛋白有无差别?85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.95.3110.0123.0110.095.2127.0100.099.0121.0125.6120.0159.0111.0115.0合计xij1160921.512283309.5(x)ni1191030(N)均数105.45102.39122.80110.32()糖尿病IGT正常人xij106.5xi

5、j2123509.5296045.35153420372974.87(x2)85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.95.3110.0123.0110.095.2127.0100.099.0121.0125.6120.0159.0111.0115.0合计xij1160921.512283309.5(x)ni1191030(N)均数105.45102.39122.80110.32()糖尿病IGT正常人xij106.5xij2123509.5296045.35153420372974.87(x2)所有

6、人的载脂蛋白的变异可分解为两部分:组内变异,反映载脂蛋白测定值的随机误差和个体差异; 组间变异,反映随机误差和不同的生理病理状态对载脂蛋白的影响。(1) 建立假设和确定检验水平H0: 三种人载脂蛋白的总体均数相等, 1=2=3H1: 三组总体均数不相等=0.05(2)计算C=(x) 2/N=(3309.5) 2/30=365093SST=x2-C=372974.87-365093=7881.87SSE=SST-SSA=7881.87-2384.026=5497.84T=N-1=29 A=k-1=2 E=N-k=30-3=27 MSA=SSA/A =1192.01 MSE=SSE/E =203.

7、62F=MSA/MSE=5.8540得到方差分析表,查表确定P值:(3) 作出推断结论按=0.05水平拒绝H0,接受H1,认为三种人载脂蛋白的总体均数不同。三随机区组设计的方差分析随机区组设计又称配伍组设计(Random Block Design)。起源:农业在医学研究中,也存在区组因素,比如动物试验中动物的窝别、年龄、性别、地区的差异等。例3 对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果,采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)如下,问小白

8、鼠经三种不同营养素喂养后所增体重有无差别?本例的总变异中除了不同营养素的变异(处理差异)、随机误差外,还存在着区组之间的变异,是由小白鼠的遗传特征不同所致。xij表示第i个处理组第j个区组样本观察值, 表示第i个处理组的均数(= ), 表示第j个区组的均数(= ), 表示总平均=SS总=SS处理+SS区组+SS误差 =总=处理+区组+误差 (T=A+B+E) 总=N-1=bk-1 处理=k-1 区组=b-1 误差=(k-1)(b-1)(1) 建立假设和确定检验水准H0: 1=2=3H1: 三组总体均数不相等=0.05(2) 计算检验统计量C=(x)2/N=(1335.9)2/24=74359.

9、53SST=xij 2-C=2681.84 T=23(3)查表确定p值和作出推断结论按=0.05水平不拒绝H0,认为小白鼠经三种不同营养素喂养后所增体重无差别。注:作方差分析时同样可以检验区组效应,本例区组效应显著,即不同窝别的小白鼠的增重不全相等。要区别完全随机化设计和随机区组设计例 某湖水不同季节的氯化物含量测定值如下,问在不同季节该湖水中氯化物含量有无差别?某湖水中不同季节氯化物含量测定值(mg/L)春夏秋冬22.619.118.919.022.822.813.616.921.024.517.217.616.918.015.114.820.015.216.613.121.918.414.

10、216.921.520.116.716.221.221.219.614.8某湖水中不同季节氯化物含量测定值(mg/L)采样点春夏秋冬122.619.118.919.0222.822.813.616.9321.024.517.217.6416.918.015.114.8520.015.216.613.1621.918.414.216.9721.520.116.716.2821.221.219.614.8方法不当会影响统计结果例 某医师为研究脾切除手术过程中门静脉压力kPa的变化,测得以下数据,试作分析。脾切除手术中不同时期的门静脉压力kPa病例号切脾后贲门周围断流后胃底断流后13.923.533

11、.5321.861.671.7733.923.924.2145.295.495.6853.533.243.9263.923.924.3173.534.214.3183.533.924.21结论:Analysis of Variance Procedure Sum of MeanSource DF Squares Square F Value Pr FGROUP 2 0.4281 0.2141 3.99 0.0425block 7 21.6556 3.0937 57.68 0.0001Error 14 0.7509 0.0536Corrected Total 23 22.8346Analysis

12、 of Variance Procedure Sum of MeanSource DF Squares Square F Value Pr FGROUP 2 0.4281 0.2141 0.20 0.8198Error 21 22.4065 1.0670Corrected Total 23 22.8346四.多个样本均数间的两两比较(又称多重比较)1多个样本均数间每两个均数的比较适用于:在研究设计阶段未预先考虑或未预料到,经数据结果的提示后,才决定的多个均数间的两两比较,常见于探索性研究。常用方法是q检验(又称Student-Newman-Keuls法,简称SNK法)检验统计量 q检验界值表见

13、表4,它有两个自由度,一个是=E,另一个是a,a指将方差分析中的几组样本均数按从小到大顺序排列后要比较的A、B两组所包含的组数(包含A、B两组本身)。例(续例3)对三个人群的载脂蛋白作两两比较。H0: 任2个人群的载脂蛋白的总体均数相等,即A=BH1: AB将3组样本均数从小到大(或从大到小)顺序排列,并编上组次组次 1 2 3均数 102.39 105.45 122.80组别 IGT异常 糖尿病患者 正常人 三组均数比较的q检验从p值一栏中可以推断出结论,即IGT异常与正常人的载脂蛋白有差别, 糖尿病患者与正常人的载脂蛋白有差别。2多个实验组与一个对照组均数间的两两比较有是并不要将几组均数都

14、一一作比较,而只须将对照组与几个实验组作比较。常用的方法有:(1)最小显著差数法(LSD法),侧重于减少第二类错误,此法精度较差,易把不该判断为显著的差异错判为显著。例(续例2) IGT异常与糖尿病患者的比较H0:1=2 H1: 12 =0.05p0.05, 认为二者无差别 IGT异常与正常人的比较H0:2=3 H1: 23 =0.05 =270.002p0.005, 认为二者有差别(3)Dunnett-t检验Dunnett-t检验界值表见表5除了以上介绍的三种方法以外,还有:Duncan法、Scheffe法等等。五多个方差的齐性检验方差分析中要求各总体的方差相等,所以在作方差分析前,应作多个

15、方差的齐性检验,通常用Bartlett法,检验统计量为:ni为各组样本例数,k为组数 N=ni si2 为各组方差, sc2为合并方差。基本思想:假设各总体方差相等,均等于合并方差(各组方差的加权平均),则各si2与sc2相差不会很大,出现大的x2值的概率P小, 若P,拒绝方差相等的假设, P值可查 P208的x2界值表。方差不齐时不宜作方差分析,解决方法有:(1)变量变换,使方差齐 (2) 秩和检验 (3)近似F检验 六变量变换 方差分析和t检验要求:方差齐性、正态分布。有时并不能满足,上节已介绍了3种不同的方法。通过变量变换来改变原数据分布形式,使之满足上述条件,经过变换,虽然分布形式已改

16、变,但数据之间的相对关系仍保留,可以用变换后的数据作统计分析。1平方根变换 y= 适用于各组方差与其均数之间有某种比例关系的资料,尤其适用于总体呈Poisson分布的资料,如放射性物质在单位时间内的放射次数等表现为稀有现象的计数资料。2.对数变换 y=lg x适用于各组标准差与其均数之间有某种比例关系的资料,如研究动物的体重等资料,尤其是关于生长率的资料。当数据中有0或较小值时,也可y=lg(x+1)某实验室用三种不同抗原对恶性虐原虫阳性患者间接荧光抗体的测定结果如下,问三种抗原测定结果之间的差别有无显著性意义?A 1:160 1:160 1:320 1:320 1:640 1:640 1:640 1:640 1:640 1:1280B 1:80 1:160 1:160 1:160 1:160 1:320 1:320 1:320 1:320 1:640C 1:40 1:80 1:80 1:80 1:160 1:160 1:160 1:160 1:320 1:3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论