专题分组数据的统计分析复习课程_第1页
专题分组数据的统计分析复习课程_第2页
专题分组数据的统计分析复习课程_第3页
专题分组数据的统计分析复习课程_第4页
专题分组数据的统计分析复习课程_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题:分组数据的统计分析分析方法选择的依据需要哪种分析方法:描述或推论拥有哪类样本:概率样本与非概率样本测量尺度:定距/定比,定序,定类何种比较:集中趋势,变异性,形状,比例,相关性结果呈现方式:表,图,统计摘要分组方式:单组或与已知值对比,两组,多组分组独立性:独立样本,配对样本正态性:因变量是否满足正态分布方差齐性:各组因变量方差是否相同自变量数量:多个自变量的独立影响,偏影响检验1:两个相关样本1.符号检验对于配对样本,检验两个组的对应样本之差,计算取+号和取-号的频数,进行符号检验。可以进行双侧检验和单侧检验。2、Wilcoxon符号秩检验符号秩检验与符号检验的原理相同,但增加了对差值大小的检验,因此判断能力更强考察以下数据24.325.825.424.825.225.125.025.5能否认为其中位数是25?建立原假设H0:数据中位数为25计算下表编号数值的秩D的符号124.3-0.70.76—225.80.80.87+325.40.40.44+424.8-0.20.22.5—525.20.20.22.5+625.10.10.11+725.000825.50.50.55+计算所有+号的秩和T+=19.5,所有-号的秩和T-=8.5查表得P-level=0.211,不能拒绝原假设,即无法否认中位数为25。在N足够大时对于两个相关样本的情况,可以计算二者之差,然后建立原假设,检验二者之差的中位数为0,在此基础上进行Wilcoxon符号秩检验。检验2:两个独立样本1、Mann-Whitney-Wilcoxon检验译作:曼-惠特尼-威尔克森检验,有时简作“曼-惠特尼U检验”。检验目的在于判断两个独立样本是否为同分布。对于两个独立样本X和Y,假定其样本量分别为m和n,将其进行混合,并进行排列,计算各自的秩和。在一次实验中,获得实验组和对照组结果如下实验组(X):8,12,18对照组(Y):6,9,11,13建立原假设H0:两个独立样本同分布,进行混合排序计算X和Y的秩和均为14。构造统计量在m≤n≤10的条件下,可以查表获得其显著性。M和n均大于10时数据68911121318秩1234567组别YXYYXYX2、Wald-Wolfowitz游程检验H0:两个独立样本同分布,或者二者有相同的中位数。将两组数据进行混合排列,观察所产生的序列的游程数U。在原假设成立的情况下,两个样本高度混合,游程数较多。如果游程数偏少,则表明二者的中位数不同。在m+n<20时,可通过查表获得检验结果。当m+n>20时,U近似服从于正态分布。3、两样本的χ2检验对于两个定类尺度的样本,假定划分为R个组,则各组的理论频数可以按下列公式计算构造统计量若两总体同分布,Q服从于r-1个自由度的卡方分布4、两样本的Kolmogorov-Smirnov检验对于两个定序以上尺度的样本,计算建立原假设H0:两个样本同分布在假设下,D值应当很小。当D值超过指定的边界值时,拒绝原假设。检验3:K个相关样本1、CochranQ检验用于检验K个组的某些定类测量结果是否存在差异。观察一个口味调查的例子:对18名受访者进行四种饮料(热牛奶,酸奶,果汁,可乐)的偏好调查,得到数据如下消费者热牛奶酸奶果汁可乐合计(Y)110012200101300112411002510102601001700011801001901102101110311001011200101131001214110021511002160100117100121800011合计(X)887629建立原假设H0:K个样本间无明显差异构造统计量在样本量N比较大时,Q服从于K-1个自由度的卡方分布。2.Friedman检验检验K个样本是否来自于同一个总体,与CochranQ检验一样,Friedman检验也要求样本是配对样本,即在K个不同条件下的同一组样本作出的反应。Friedman检验主要针对定序数据。构造Q服从于K-1个自由度的卡方分布学生组电视教学课堂讲授课堂讨论11322123323143215213613271238231921310213111321213213123141321512.52.5161231712318123合计()2540.542.5数据:将54名学生分成18个组,每组3名学生,分别接受电视教学、课堂讲授和课堂讨论三种教学方法。学习后进行测试,根据分数计算三种方法的秩如下。计算Q=10.8,2个自由度的卡方值为5.99,拒绝原假设,即认为三种教学方法存在差异性。检验4:K个独立样本1、Kruskol-Wallis检验译作“克拉夏尔-瓦里斯检验”,也可称为“克氏检验”,是对两个独立样本的Mann-Whitney-Wilcoxon检验的推广。假设有K个总体,各自的连续累积分布函数分别为Fi(x)。建立原假设将K个样本进行混合,其秩和为N(N+1)/2,平均每个值的秩为(N+1)/2考察第J个样本,其实际秩和为Rj,理论秩和为nj(N+1)/2。在原假设成立的情况下,实际秩和与理论秩和的差异应当很小。构造统计量H服从K-1个自由度的卡方分布。2.K个样本的χ2检验建立原假设H0:K个样本同分布将K个样本分布为r个组,每组计算期望频数和理论频数。统计量Q服从于(k-1)(r-1)个自由度的卡方分布检验5:两个样本的相关分析1、等级相关计算斯皮尔曼等级相关系数(Spearmancoefficientofrankcorrelation)。将两个样本按观察数据的顺序进行配对,分别计算每个数据的秩,将两组样本的秩分别记录为U和V。如果两个测度完全一致,则U与V的差异应当为0。计算D=U-V的平方和,该值越大,表明相关性越差。2、Kendall秩相关对于n个配对样本,先将样本X的秩按自然顺序排列,然后将Y的秩与X的秩相对应,从而得到Y的一个秩排列顺序。计算Y的秩序情况,得到“一致对”的数量U和“非一致对”的数量V。利用上述三个公式之一,可以计算出秩相关系数T,取值在-1至+1之间。K=U-V,T为希腊字母τ的大写,发音为Tao。Kendall秩相关中的“一致对”也称协同对(Concordant),意思为满足下列条件的数对:协同对的数量减去不协同对的数量得到的K值在大样本条件下有3.偏秩相关偏秩相关是检验当存在第三组样本量时,前两组样本之间的相关系数独立于第三组样本的情况。该相关系数的取值范围也在-1至+1之间,但其抽样分布至今未知,因此难以进行显著性检验。检验6:K个样本的相关分析1、完全秩评定的Kendall协和系数KendallCoefficientofConcordanceforCompleteRankings。数据:3名消费者对6个品牌的电冰箱质量评定的秩如下消费者品牌A品牌B品牌C品牌D品牌E品牌F116325421564233632541秩和(Rj)8141111118各品牌秩和的期望值为k(n+1)/2,在各组呈正相关的情况下,秩和Rj的离散程度较大。特别是,当各组的秩评定严格相等的时候,秩和表现为如下序列:k,2k,3k,……,jk。构造统计量定义Kendall完全秩评定协和系数为该系数取值为0-1,取值为0时,表示K组秩不相关2.Kendall不完全秩评定协和系数假定有K个样本,每组含有n个观察值,但每组观察值评定的秩为m,m<n,此为不完全秩评定。考虑评定次数λ的影响,建立以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论