下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计分析方法总结分享胡斌00:06分享,并说:统计1.连续性资料1.1两组独立样本比拟1.1.1资料符合正态分布,且两组方差齐性,直接采用t检验。1.1.2资料不符合正态分布,1可进行数据转换,如对数转换等,使之服从正态 分布,然后对转换后的数据采用t检验;2采用非参数检验,如Wilcoxon检验。1.1.3资料方差不齐,1采用Satterthwate的t检验;2采用非参数检验,如Wilcoxon检验。1.2两组配对样本的比拟1.2.1两组差值服从正态分布,采用配对t检验。1.2.2两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。1.3多组完全随机样本比拟1.3.1资料符合正态
2、分布,且各组方差齐性,直接采用完全随机的方差分析。如 果检验结果为有统计学意义,那么进一步作两两比拟,两两比拟的方法有LSD检 验,Bonferroni法,tukey法,Scheffe法,SNK法等。1.3.2资料不符合正态分布, 或各组方差不齐, 那么采用非参数检验的Kruscal - Wallis法。如果检验结果为有统计学意义,那么进一步作两两比拟,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。1.4多组随机区组样本比拟1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如 果检验结果为有统计学意义,那么进一步作两两比拟,两两比拟的方法有LS
3、D检验,Bonferroni法,tukey法,Scheffe法,SNK法等。1.4.2资料不符合正态分布,或各组方差不齐,那么采用非参数检验的Fridman检验法。 如果检验结果为有统计学意义, 那么进一步作两两比拟, 一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。*需要注意的问题:1一般来说,如果是大样本,比方各组例数大丁50,可以不作正态性检验, 直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从 正态分布的。2当进行多组比拟时,最容易犯的错误是仅比拟其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。 正确的做法应该是,先作总的
4、各组问的比拟,如果总的来说差异有统计学意义, 然后才能作其中任意两组的比拟,这些两两比拟有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。*绝不能对其中的两组直接采用t检验,这样即使 得出结果也未必正确*3关丁常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不 同设计会有差异。常用的设计如完全随即设计, 随机区组设计,析因设计,裂区 设计,嵌套设计等。2.分类资料2.1四格表资料2.1.1例数大于40,且所有理论数大于5,那么用普通的Pearson检验。2.1.2例数大于40,所有理论数大于1,且至少一个理论数小于5,那么用校
5、正的 检 验或Fisher s确切概率法检验。2.1.3例数小于40,或有理论数小于2,那么用Fisher s确切概率法检验。2.22X C表或RX 2表资料的统计分析2.2.1列变量&行变量均为无序分类变量, 那么1例数大于40,且理论数小于5的格子数目总格子数目的25%,贝U用普通的Pearson检验。2例数小于40,或理论数小于5的格子数目总格子数目的25%,那么用Fisher s确切概率法检 验。2.2.2歹0变量为效应指标, 且为有序多分类变量, 行变量为分组变量, 用普通的Pearson检验只说明组问构成比不同,如要说明疗效,那么可用行平均分差检验或 成组的Wilcoxon
6、秩和检验。2.2.3歹0变量为效应指标,且为二分类变量,行变量为有序多分类变量,那么可米用普通的Pearson检验比拟各组之间有无差异,如果总的来说有差异,还可进一 步作两两比拟,以说明是否任意两组之间的差异都有统计学意义。2.3R X C表资料的统计分析2.2.1列变量&行变量均为无序分类变量, 那么1例数大于40,且理论数小于5的格子数目总格子数目的25%,贝U用普通的Pearson检验。2例数小于40,或理论数小于5的格子数目总格子数目的25%,那么用Fisher s确切概率法检 验。3如果要作相关性分析,可采用Pearson目关系数。2.2.2歹0变量为效应指标, 且为有序多分
7、类变量, 行变量为分组变量, 用普通的Pearson检验只说明组问构成比不同,如要说明疗效或强弱程度的不同,贝U可用 行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。2.2.3歹0变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,那么 可采用普通的Pearson检验比拟各组之间有无差异,如果有差异,还可进一步作 两两比拟,以说明是否任意两组之间的差异都有统计学意义。2.2.4列变量&行变量均为有序多分类变量,1如要做组问差异分析,那么可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有差异, 还可进一步作两两比拟,以说明是否任意两
8、组之间的差异都有统计学意义。2如果要做两变量之间的相关性,可采用Spearsonfg关分析。2.4配对分类资料的统计分析2.4.1四格表配对资料,1 b+ c40,那么用McNemar配对 检验。2 b+ c40,那么用校正的配对检验。2.4.1 CX C资料,1配比照拟:用McNemar配对 检验。2一致性检验, 用Kappa检验。在SPS湫件相关分析中,pearson皮尔逊,kendall肯德尔 和spearman斯伯曼/斯皮尔曼三种相关分析方法有什么异同两个连续变量问呈线性相关时,使用Pearson积差相关系数,不满足积差 相关分析的适用条件时,使用Spearman秩相关系数来描述.Sp
9、earman相关系数乂称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,届于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数, 但统计效能要 低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公 式,但公式中的x和y用相应的秩次代替即可。Kendalls tau-b等级相关系数:用于反映分类变量相关性的指标,适用 于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;计算积距pearson相关系数,连续性变量才可采用;计算
10、Spearman秩相关 系数,适合于定序变量或不满足正态分布假设的等间隔数据;计算Kendall秩相 关系数,适合于定序变量或不满足正态分布假设的等间隔数据。计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数 据用等级表示时,宜用spearman或kendall相关Pearson相关复选项积差相关计算连续变量或是等间距测度的变量问 的相关分析Kendall复选项等级相关计算分类变量间的秩相关,适用于合并等级资料Spearman复选项等级相关计算斯皮尔曼相关,适用于连续等级资料 注:1假设非等间距测度的连续变量 因为分布不明-可用等级相关/也可用Pearson相 关,对于完全等级离
11、散变量必用等级相关2当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用Spearman或Kendall相关。3假设不恰当用了Kendall等级相关分析那么可能得出相关系数偏小的结论。那么假设 不恰当使用,可能得相关系数偏小或偏大结论而考察不到不同变量问存在的密切 关系。对一般情况默认数据服从正态分布的,故用Pearson分析方法。在SPS眦进入Correlate Bivariate,在变量下面Correlation Coefficients复选框组里有3个选项:PearsonKendalls tau-bSpearman:Spearmanspearman斯伯曼/斯皮尔曼相关
12、系数 斯皮尔曼等级相关是根据等级资料研究两个变量问相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的,所以乂称为“等级差数法 斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料, 或者是由连续变量观测资料转化得到的等级 资料,不管两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼 等级相关来进行研究Kendalls相关系数肯德尔KendallW系数乂称和谐系数,是表示多列等级变量相关程度的 一种方法。适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委被试评定N件事物,或1个评委被试先后K次评定N件事物。等 级评
13、定法每个评价者对N件事物排出一个等级顺序,最小的等级序数为1,最大的为N,假设并列等级时,贝W分共同应该占据的等级,如,平时所说的两个并 列第一名,他们应该占据1, 2名,所以它们的等级应是1.5,乂如一个第一名, 两个并列第二名,三个并列第三名,那么它们对应的等级应该是1,2.5,2.5,5,5,5,这里2.5是2,3的平均,5是4,5,6的平均。肯德尔KendallU系数乂称一致性系数,是表示多列等级变量相关程度 的一种方法。该方法同样适用于让K个评委被试评定N件事物,或1个评委 被试先后K次评定N件事物所得的数据资料,只不过评定时采用对偶评定的 方法,即每一次评定都要将N个事物两两比拟,
14、评定结果如下表所示,表格中空 白位阴影局部可以不管填入的数据为:假设i比j好记1,假设i比j差记0,两者相同那么记0.5。一共将得到K张这样的表格,将这K张表格重叠起来,对应 位置的数据累加起来作为最后进行计算的数据,这些数据记为j。正态分布的相关检验对来自正态总体的两个样本进行均值比拟常使用T检验的方法。T检验 要求两个被比拟的样本来自正态总体。两个样本方差相等与不等时用的计算T值的公式不同。进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。P值小于0.05说明在该水平上否认原假设,方差不齐;否那么两组方差无显著性 差异。U检验时用服从正态分布的检验量去检验总体均值差异情况的方法。 在这 种情况下总体方差通常是的。虽然T检验法与U检验法所解决的问题大体相同,但在小样本样本数n =30作为大样本且均方差未知的情况下就不能用U检验法了。均值检验时不同的数据使用不同的统计量使用MEAN过程求假设十组的描述统计量,目的在于比拟。因此必须分组求 均值。这是与Descriptives过程不同之处。检验单个变量的均值是否与给定的常数之间存在差异,用One-Sample TTest单样本T检验过程。检验两个不相关的样本是否来自来具有相同均值的总体,用Independen
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论