第十四章多变量数据的统计描述与推断II_第1页
第十四章多变量数据的统计描述与推断II_第2页
第十四章多变量数据的统计描述与推断II_第3页
第十四章多变量数据的统计描述与推断II_第4页
第十四章多变量数据的统计描述与推断II_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十四章多变量数据的统计描述与推断II第1页,共58页,2023年,2月20日,星期二单变量多变量统计描述均数均数向量方差协方差阵相关系数相关矩阵统计推断单变量t检验HotellingT2检验单变量方差分析多变量方差分析单变量与多变量之间的比较

多变量数据的统计描述和统计推断在描述与表达时采用了多变量的向量和矩阵的表示方法。第2页,共58页,2023年,2月20日,星期二三多组比较1多变量方差分析通过g个均数向量推断是否成立。其备择假设H1:g个组中至少有两个均向量不相等。第3页,共58页,2023年,2月20日,星期二

方差分析单变量分析

第4页,共58页,2023年,2月20日,星期二两两比较:LSD\SNK\第5页,共58页,2023年,2月20日,星期二描述固定与随机效应方差齐性检验B-F检验Welch检验第6页,共58页,2023年,2月20日,星期二第7页,共58页,2023年,2月20日,星期二第8页,共58页,2023年,2月20日,星期二正态性、方差不齐

时对应的统计分析方法资料转换秩和检验稳健估计

Welch(F’)Brown-Forsythe第9页,共58页,2023年,2月20日,星期二多变量方差分析的主要思想:将实验结果的总离差平方和SS总分解为SS组间和SS组内两部分,其中SS总,SS组间和SS组内矩阵表示。求得WilksLambda统计量

计算F值,作出统计推断。第10页,共58页,2023年,2月20日,星期二例14-4将患慢性胃炎的儿童随机分为3组,其中I组、II组为治疗组,另一组为对照组。试比较治疗药T细胞免疫功能(外周血T3,T4,T8细胞百分比)的影响。表14-5是其中部分儿童的T细胞免疫功能的测量结果。试比较三组慢性胃炎儿童T细胞免疫功能是否存在差异?第11页,共58页,2023年,2月20日,星期二编号治疗I组编号治疗II组编号对照组T3T4T8T3T4T8T3T4T8163.630.231.2153.422.525.0172.442.529.9260.030.033.4246.520.014.6275.049.529.3363.235.327.9338.125.918.1375.930.040.0432.112.111.8470.032.036.4572.836.733.1表14-5三组慢性胃炎儿童的T细胞免疫攻能(%)第12页,共58页,2023年,2月20日,星期二1作出检验假设,确定检验水准,即三组药物对T细胞免疫功能的影响是相等的。H1:三个均向量不都相等。第13页,共58页,2023年,2月20日,星期二表14-4多变量方差分析表变异来源自由度离均差平和矩阵总变异H+E组间g-1组内2计算统计量Λ*及FH--groupSSCPE—Residual(error)SSCP第14页,共58页,2023年,2月20日,星期二计算均数:第15页,共58页,2023年,2月20日,星期二求得组间离均差平方和矩阵H:第16页,共58页,2023年,2月20日,星期二计算组内离均差平方和计算总离均差平方和矩阵第17页,共58页,2023年,2月20日,星期二变异来源自由度离均差平方和矩阵总变质11组间2组内9表14-6多变量方差分析表第18页,共58页,2023年,2月20日,星期二计算统计量Λ*第19页,共58页,2023年,2月20日,星期二表14-7常见情况下与F值的关系反应变量数组数转换关系F分布自由度m=1g≥2M=2g≥2m≥1G=2m≥1G=3第20页,共58页,2023年,2月20日,星期二

由表14-7可知,两组均数向量作假设检验时,除HotellingT2外,还可用多变量方差分析。

m=3,g=3,代入表14-7的第四个公式得:第21页,共58页,2023年,2月20日,星期二3确定P值,作出结论查F值表,拒绝H0,接受H1.认为三个组慢性胃炎儿童T细胞免疫功能有差别。从三组的均数向量可看出,两个治疗组的T细胞免疫功能均比对照组低。第22页,共58页,2023年,2月20日,星期二SPSS操作第23页,共58页,2023年,2月20日,星期二dataex14_5;if_n_<4thenc=1;elseif_n_<8thenc=2;elsec=3;inputidT3T4T8@@;cards;163.630.231.2260.030.033.4……1272.836.733.1;procglm;classc;modelT3T4T8=c;manovaH=c/printeprinth;lsmeansc/stderrpdiff;Run;第24页,共58页,2023年,2月20日,星期二统计量Wilks=det(E)/det(H+E)Pilai迹=trace(H(H+E)-1)Hotelling-Lawley迹=trace(E-1H)R最大特征根=E-1H的最大特征根MANOVATestCriteriaandFApproximationsfortheHypothesisofNoOverallcEffect

H=TypeIIISSCPMatrixforc

E=ErrorSSCPMatrix

S=2M=0N=2.5StatisticValueFValueNum

DFDenDFPr

>

FWilks'Lambda0.088735385.506140.0041Pillai'sTrace1.049164542.946160.0394Hotelling-LawleyTrace8.715404369.7767.78950.0028Roy'sGreatestRoot8.5332872122.76380.0003第25页,共58页,2023年,2月20日,星期二四多变量与单变量分析

多变量与对m个反应变量进行一次假设检验,对组间的差别作出推论。在大多数情况下,多变量假设检验结论与m次单变量假设检验的结论是一致的。即多变量假设检验拒绝H0,m次单变量假设检验至少有一次拒绝H0。第26页,共58页,2023年,2月20日,星期二

(1)假定有k个样本均数向量,对每两个样本均数向量间的差别都作F检验,可作k!/2!(k-2)!次比较,每个样本均数向量都重复比较了k-1次,如果仍以为临界值,其Ⅰ型错误的概率会远远超过0.05。理论上,单变量假设检验不能代替多变量假设检验第27页,共58页,2023年,2月20日,星期二

若有3个样本均数向量的比较,共作3次F检验,若每次比较的检验水准=0.05,则每次不犯第一类错误的概率为(1-0.05)=0.95,则正确接受全部3次无效假设的概率为0.953=0.857,这时犯第一类错误的概率为1-0.857=0.143。因此,两两比较时,不宜用前面所述的F检验。第28页,共58页,2023年,2月20日,星期二(2)单变量假设检验只能说明某一变量在数轴分布上的组间差别,不能反应多个变量在平面或空间上的差别,两者的意义不同。第29页,共58页,2023年,2月20日,星期二表14-8两组新生儿出生时的体重与身长数据编号A组编号B组体重(Kg)身长(Cm)体重(Kg)身长(Cm)13.104614.106023.205023.504833.506233.355043.004643.354953.856753.204863.154863.555073.004673.506083.505583.6056均数3.2952.503.5252.63方差0.308.110.275.21P(t检验)1.62(0.13)0.04(0.97)HotellingT2T2=9.87,F=4.58,P=0.03第30页,共58页,2023年,2月20日,星期二第31页,共58页,2023年,2月20日,星期二第三节重复测量资料的多变量分析

Ch12介绍了重复测量资料的单变量ANOVA分析方法。若数据服从“球对称”(sphericalsymmetricalproblem)时,就是通常的随机区组ANOVA。若不服从“球对称”时,须校正自由度。多变量分析的优点:不须考虑数据的“球对称”,直接利用HotellingT2检验。

第32页,共58页,2023年,2月20日,星期二编号服药前体重值服药前后四周体重值第1周第2周第3周第4周1131.5128.4127.4125.3124.92154.7152.9150.7148.2145.93146.7145.5143.6140.5139.84163.2161.6158.4154.2153.45128.6125.3124.1122.8120.96134.2132.6130.4129.4124.87126.8125.7123.9123.5121.68119.5118.1115.6114.3112.19112.4108.6104.7102.6101.410121.3120.1118.5116.9114.2133.9131.9129.7127.8125.9S16.216.616.615.916.1表12-1高血压患者治疗前后的舒张压(mmHg)第33页,共58页,2023年,2月20日,星期二1建立检验假设

Cμ为初始时间为基线的重复测量对比矩阵(Repeatedconstrasts)第34页,共58页,2023年,2月20日,星期二2计算HotellingT2与F统计量第35页,共58页,2023年,2月20日,星期二本例中n=10,m=5。第36页,共58页,2023年,2月20日,星期二3确定P值,作出检验结论查表3.1得拒绝H0,接受H1,即认为服药后1-4周的体重比服药前有所降低。第37页,共58页,2023年,2月20日,星期二图14-210名肥胖患者服药前后体重的变化趋势分析服药后1-4周的体重降低的变化趋势第38页,共58页,2023年,2月20日,星期二

将10名患者组内变异SS组内(v=4)分解为多项式的1次项、2次项、3次项、4次项,描述体重随时间变化的曲线趋势。第39页,共58页,2023年,2月20日,星期二SPSS操作第40页,共58页,2023年,2月20日,星期二第41页,共58页,2023年,2月20日,星期二结果第42页,共58页,2023年,2月20日,星期二第四节轮廓分析

轮廓(profile)分析是比较两组或多组多变量均数向量的轮廓是否相等。轮廓是指各组均数所连成的折线。轮廓分析通常进行组间轮廓相似性或平行性(parallel)

、组间平均水平差异显著性和组内条件(如时间或各反应变量间)变异显著性三个方面的假设检验。第43页,共58页,2023年,2月20日,星期二图14-3不同麻醉诱导时相的平均收缩压第44页,共58页,2023年,2月20日,星期二分析思路:如果组间轮廓相似,可进一步分析其他的变异,即了解组间轮廓是否完全一致(即重合)以及各组的轮廓图是否与水平轴(表示组内因素水平间差异,如时间上的差别)平行,因此,轮廓分析首先进行的是轮廓相似性检。第45页,共58页,2023年,2月20日,星期二例14-7分别对50名硕士生和30名博士生进行健康状况抽样调查。调查问题设计如下7个问题:对自已健康状况的满意程序(X1)

是否需要调养身体(X2)

身体胡不适或不舒服的感觉(X3)

有生病的感觉(X4)

有紧张情绪和压力感(X5)

晚间休息感到不能很快入睡(X6)

吃饭有时觉得胃口不好(X7)第46页,共58页,2023年,2月20日,星期二图14-4调查问卷7个问题的平均得分第47页,共58页,2023年,2月20日,星期二表14-10两组研究生健康问卷的平均得分问题1问题2问题3问题4问题5问题6问题7硕士生均数2.022.322.181.982.442.062.16n=50S0.430.710.480.510.840.840.84博士生均数2.032.302.271.902.271.902.13n=30S0.490.650.520.550.910.760.86合计均数2.032.312.211.952.382.002.15n=80S0.450.690.500.530.860.810.84第48页,共58页,2023年,2月20日,星期二1平行检验轮廓对比矩阵(parallelcontrasts)

第49页,共58页,2023年,2月20日,星期二计算统计量HotellingT2与F统计量第50页,共58页,2023年,2月20日,星期二研究P值,作出统计推断不能认为两个总体的轮廓相互平行。第51页,共58页,2023年,2月20日,星期二2相合检验(coincident)目的:检验两个总体的轮廓是否重合。如果两个总体的轮廓相互平行,且时两个总体的轮廓重合。第52页,共58页,2023年,2月20日,星期二检验假设:统计量

结论:尚不能拒绝H0,可认不两个总体的轮廓重合第53页,共58页,2023年,2月20日,星期二3水平轮廓检验

检验两个总体的轮廓

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论