第十四章多变量数据的统计描述与推断_第1页
第十四章多变量数据的统计描述与推断_第2页
第十四章多变量数据的统计描述与推断_第3页
第十四章多变量数据的统计描述与推断_第4页
第十四章多变量数据的统计描述与推断_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单变量多变量统计描述均数均数向量方差协方差阵相关系数相关矩阵统计推断单变量t检验HotellingT2检验单变量方差分析多变量方差分析单变量与多变量之间的比较

多变量数据的统计描述和统计推断在描述与表达时采用了多变量的向量和矩阵的表示方法。目前一页\总数五十七页\编于十八点三多组比较1多变量方差分析通过g个均数向量推断是否成立。其备择假设H1:g个组中至少有两个均向量不相等。目前二页\总数五十七页\编于十八点

方差分析单变量分析

目前三页\总数五十七页\编于十八点两两比较:LSD\SNK\目前四页\总数五十七页\编于十八点描述固定与随机效应方差齐性检验B-F检验Welch检验目前五页\总数五十七页\编于十八点目前六页\总数五十七页\编于十八点目前七页\总数五十七页\编于十八点正态性、方差不齐

时对应的统计分析方法资料转换秩和检验稳健估计

Welch(F’)Brown-Forsythe目前八页\总数五十七页\编于十八点多变量方差分析的主要思想:将实验结果的总离差平方和SS总分解为SS组间和SS组内两部分,其中SS总,SS组间和SS组内矩阵表示。求得WilksLambda统计量

计算F值,作出统计推断。目前九页\总数五十七页\编于十八点例14-4将患慢性胃炎的儿童随机分为3组,其中I组、II组为治疗组,另一组为对照组。试比较治疗药T细胞免疫功能(外周血T3,T4,T8细胞百分比)的影响。表14-5是其中部分儿童的T细胞免疫功能的测量结果。试比较三组慢性胃炎儿童T细胞免疫功能是否存在差异?目前十页\总数五十七页\编于十八点编号治疗I组编号治疗II组编号对照组T3T4T8T3T4T8T3T4T8163.630.231.2153.422.525.0172.442.529.9260.030.033.4246.520.014.6275.049.529.3363.235.327.9338.125.918.1375.930.040.0432.112.111.8470.032.036.4572.836.733.1表14-5三组慢性胃炎儿童的T细胞免疫攻能(%)目前十一页\总数五十七页\编于十八点1作出检验假设,确定检验水准,即三组药物对T细胞免疫功能的影响是相等的。H1:三个均向量不都相等。目前十二页\总数五十七页\编于十八点表14-4多变量方差分析表变异来源自由度离均差平和矩阵总变异H+E组间g-1组内2计算统计量Λ*及FH--groupSSCPE—Residual(error)SSCP目前十三页\总数五十七页\编于十八点计算均数:目前十四页\总数五十七页\编于十八点求得组间离均差平方和矩阵H:目前十五页\总数五十七页\编于十八点计算组内离均差平方和计算总离均差平方和矩阵目前十六页\总数五十七页\编于十八点变异来源自由度离均差平方和矩阵总变质11组间2组内9表14-6多变量方差分析表目前十七页\总数五十七页\编于十八点计算统计量Λ*目前十八页\总数五十七页\编于十八点表14-7常见情况下与F值的关系反应变量数组数转换关系F分布自由度m=1g≥2M=2g≥2m≥1G=2m≥1G=3目前十九页\总数五十七页\编于十八点

由表14-7可知,两组均数向量作假设检验时,除HotellingT2外,还可用多变量方差分析。

m=3,g=3,代入表14-7的第四个公式得:目前二十页\总数五十七页\编于十八点3确定P值,作出结论查F值表,拒绝H0,接受H1.认为三个组慢性胃炎儿童T细胞免疫功能有差别。从三组的均数向量可看出,两个治疗组的T细胞免疫功能均比对照组低。目前二十一页\总数五十七页\编于十八点SPSS操作目前二十二页\总数五十七页\编于十八点dataex14_5;if_n_<4thenc=1;elseif_n_<8thenc=2;elsec=3;inputidT3T4T8@@;cards;163.630.231.2260.030.033.4……1272.836.733.1;procglm;classc;modelT3T4T8=c;manovaH=c/printeprinth;lsmeansc/stderrpdiff;Run;目前二十三页\总数五十七页\编于十八点统计量Wilks=det(E)/det(H+E)Pilai迹=trace(H(H+E)-1)Hotelling-Lawley迹=trace(E-1H)R最大特征根=E-1H的最大特征根MANOVATestCriteriaandFApproximationsfortheHypothesisofNoOverallcEffect

H=TypeIIISSCPMatrixforc

E=ErrorSSCPMatrix

S=2M=0N=2.5StatisticValueFValueNum

DFDenDFPr

>

FWilks'Lambda0.088735385.506140.0041Pillai'sTrace1.049164542.946160.0394Hotelling-LawleyTrace8.715404369.7767.78950.0028Roy'sGreatestRoot8.5332872122.76380.0003目前二十四页\总数五十七页\编于十八点四多变量与单变量分析

多变量与对m个反应变量进行一次假设检验,对组间的差别作出推论。在大多数情况下,多变量假设检验结论与m次单变量假设检验的结论是一致的。即多变量假设检验拒绝H0,m次单变量假设检验至少有一次拒绝H0。目前二十五页\总数五十七页\编于十八点

(1)假定有k个样本均数向量,对每两个样本均数向量间的差别都作F检验,可作k!/2!(k-2)!次比较,每个样本均数向量都重复比较了k-1次,如果仍以为临界值,其Ⅰ型错误的概率会远远超过0.05。理论上,单变量假设检验不能代替多变量假设检验目前二十六页\总数五十七页\编于十八点

若有3个样本均数向量的比较,共作3次F检验,若每次比较的检验水准=0.05,则每次不犯第一类错误的概率为(1-0.05)=0.95,则正确接受全部3次无效假设的概率为0.953=0.857,这时犯第一类错误的概率为1-0.857=0.143。因此,两两比较时,不宜用前面所述的F检验。目前二十七页\总数五十七页\编于十八点(2)单变量假设检验只能说明某一变量在数轴分布上的组间差别,不能反应多个变量在平面或空间上的差别,两者的意义不同。目前二十八页\总数五十七页\编于十八点表14-8两组新生儿出生时的体重与身长数据编号A组编号B组体重(Kg)身长(Cm)体重(Kg)身长(Cm)13.104614.106023.205023.504833.506233.355043.004643.354953.856753.204863.154863.555073.004673.506083.505583.6056均数3.2952.503.5252.63方差0.308.110.275.21P(t检验)1.62(0.13)0.04(0.97)HotellingT2T2=9.87,F=4.58,P=0.03目前二十九页\总数五十七页\编于十八点目前三十页\总数五十七页\编于十八点第三节重复测量资料的多变量分析

Ch12介绍了重复测量资料的单变量ANOVA分析方法。若数据服从“球对称”(sphericalsymmetricalproblem)时,就是通常的随机区组ANOVA。若不服从“球对称”时,须校正自由度。多变量分析的优点:不须考虑数据的“球对称”,直接利用HotellingT2检验。

目前三十一页\总数五十七页\编于十八点编号服药前体重值服药前后四周体重值第1周第2周第3周第4周1131.5128.4127.4125.3124.92154.7152.9150.7148.2145.93146.7145.5143.6140.5139.84163.2161.6158.4154.2153.45128.6125.3124.1122.8120.96134.2132.6130.4129.4124.87126.8125.7123.9123.5121.68119.5118.1115.6114.3112.19112.4108.6104.7102.6101.410121.3120.1118.5116.9114.2133.9131.9129.7127.8125.9S16.216.616.615.916.1表12-1高血压患者治疗前后的舒张压(mmHg)目前三十二页\总数五十七页\编于十八点1建立检验假设

Cμ为初始时间为基线的重复测量对比矩阵(Repeatedconstrasts)目前三十三页\总数五十七页\编于十八点2计算HotellingT2与F统计量目前三十四页\总数五十七页\编于十八点本例中n=10,m=5。目前三十五页\总数五十七页\编于十八点3确定P值,作出检验结论查表3.1得拒绝H0,接受H1,即认为服药后1-4周的体重比服药前有所降低。目前三十六页\总数五十七页\编于十八点图14-210名肥胖患者服药前后体重的变化趋势分析服药后1-4周的体重降低的变化趋势目前三十七页\总数五十七页\编于十八点

将10名患者组内变异SS组内(v=4)分解为多项式的1次项、2次项、3次项、4次项,描述体重随时间变化的曲线趋势。目前三十八页\总数五十七页\编于十八点SPSS操作目前三十九页\总数五十七页\编于十八点目前四十页\总数五十七页\编于十八点结果目前四十一页\总数五十七页\编于十八点第四节轮廓分析

轮廓(profile)分析是比较两组或多组多变量均数向量的轮廓是否相等。轮廓是指各组均数所连成的折线。轮廓分析通常进行组间轮廓相似性或平行性(parallel)

、组间平均水平差异显著性和组内条件(如时间或各反应变量间)变异显著性三个方面的假设检验。目前四十二页\总数五十七页\编于十八点图14-3不同麻醉诱导时相的平均收缩压目前四十三页\总数五十七页\编于十八点分析思路:如果组间轮廓相似,可进一步分析其他的变异,即了解组间轮廓是否完全一致(即重合)以及各组的轮廓图是否与水平轴(表示组内因素水平间差异,如时间上的差别)平行,因此,轮廓分析首先进行的是轮廓相似性检。目前四十四页\总数五十七页\编于十八点例14-7分别对50名硕士生和30名博士生进行健康状况抽样调查。调查问题设计如下7个问题:对自已健康状况的满意程序(X1)

是否需要调养身体(X2)

身体胡不适或不舒服的感觉(X3)

有生病的感觉(X4)

有紧张情绪和压力感(X5)

晚间休息感到不能很快入睡(X6)

吃饭有时觉得胃口不好(X7)目前四十五页\总数五十七页\编于十八点图14-4调查问卷7个问题的平均得分目前四十六页\总数五十七页\编于十八点表14-10两组研究生健康问卷的平均得分问题1问题2问题3问题4问题5问题6问题7硕士生均数2.022.322.181.982.442.062.16n=50S0.430.710.480.510.840.840.84博士生均数2.032.302.271.902.271.902.13n=30S0.490.650.520.550.910.760.86合计均数2.032.312.211.952.382.002.15n=80S0.450.690.500.530.860.810.84目前四十七页\总数五十七页\编于十八点1平行检验轮廓对比矩阵(parallelcontrasts)

目前四十八页\总数五十七页\编于十八点计算统计量HotellingT2与F统计量目前四十九页\总数五十七页\编于十八点研究P值,作出统计推断不能认为两个总体的轮廓相互平行。目前五十页\总数五十七页\编于十八点2相合检验(coincident)目的:检验两个总体的轮廓是否重合。如果两个总体的轮廓相互平行,且时两个总体的轮廓重合。目前五十一页\总数五十七页\编于十八点检验假设:统计量

结论:尚不能拒绝H0,可认不两个总体的轮廓重合目前五十二页\总数五十七页\编于十八点3水平轮廓检验

检验两个总体的轮廓是否为水平直线平行。若

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论