




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
4. T检验与非参数检验 4.1常用统计概念简介 4.1.1 常用统计概念 4.1.2概率、概率分布 4.1.3 二项分布 4.1.4 泊松分布 4.1.5 正态分布 正态概率分布有以下重要特征:(见图 4-2) (1)正态分布是对称分布,对称轴是 x=。 (2)当 x= 时,正态概率密度最大。 (3)正态分布的图形由 和 决定。 (4)当 为定值时, 的变化引起正态概率密度曲线在横轴上 平行移动。 (5)当 为定值时, 的变化将引起正态概率密度曲线的形状 变得尖峭或偏平。 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0 1 2 3 4 5 6 曲 线 1 曲 线 2 曲 线 3 注:正态曲线 1的 =2.4,=0.8; 正态曲线 2的 =3.4,=0.8; 正态曲线 3的 =3.4,=1.2。 正态分布与二项分布的主要区别: 正态分布是连续的,而二项分布是离散的。象所有连续随机变量 一样,正态随机变量任意一个确定值的概率为 0,非 0概率只有 在确定区间内才能得到。 二项分布与正态分布存在渐近关系。二项分布的参数是 n和 p。 则概率 P(aF的值大于 0.05,说明来自同一方差总体,可以使用 t检 验方法进行分析,否则应采用非参数检验。然后看中的 Equal 一行,判断两组均值是否相等,如果不等且 PrF值小于 0.05, 说明两组均值有显著差异,否则无差异。然后查看中 Mean列, 根据专业知识及两组均值的大小,判断是大的好还是小的好。 例 4.2 将 20个样本随机分为两组,分别用两种培养基进行培养 试验,测得有效成份如下,问两组的平均值有无差别。 treat1:a 培养基(11) 10,20,40,40,40,80,80,160,160,160,320 treat2:b 培养基(9 人)10,10,10,20,20,20,20,40,40 Ho: 两组均值相等 1=2 ,Ha: 两组均值不等 12 , 显著水平 =0.05 。 由于数据面倍数关系,所以先将两组数据分别取对数,以对数作 为新变量进行比较。 用变换后的数据再代入以上公式计算 t值。 SAS程序 Ttest4_2.sas 4.2.3 双尾检验与单尾检验 4.2.4 非参数检验 1 2 检验 2符号检验 3秩和检验法 4.3 TTEST过程比较 t检验 4.3.1 TEST过程简介 1TEST 过程简介 TTEST过程在一些假设条件下计算 t统计量,用以检验“两组观 测值均值相等”这个原假设。假设条件有以下两点: 1)两组观测方差相等。 2)在每个组内,各个观测独立,且服从相同的正态分布。 4.3 TTEST过程比较 t检验 如果两组观测方差不等,则计算近似的 t统计量,同时用 Satterhwaire方法计算其近似自由度,又可以要求用 Cochran和 Cox方法近似计算 t检验的概率水平。计算 F(Folded)统计量 用于检验两个方差是否相等。TTEST 过程不是为成对数据比较设 计的,对成对数据,可用 MEANS过程或 UNIVERATE过程检验成对 数据的差值是否为零,以判断成对数据均值是否相等。 4.3.2 TTEST过程举例说明 例 4.3 为了解某乡粮田土壤肥力的变化情况,1998 年和 1999年 连续两年对 9个监测点进行取土样化验有机质含量。y1 代表 1998 年化验结果,该年土壤有机质平均含量为 1.21%,y2 代表 1999年 化验结果,分析两年间土壤有机质变化情况。 SAS程序test4_3.sas 输出结果简介: For H0: Variances are equal, F = 2.08 DF = (8,8) ProbF = 0.3203 从输出的最下方可知,两组变量来自同一方差总体。 T-Tests Variable Method Variances DF t Value Pr |t| x Pooled Equal 16 0.52 0.6127 x Satterthwaite Unequal 14.2 0.52 0.6136 在方差相等的前提下,两组均值相等的概率为 0.6127,所以 1998 年和 1999年间该乡土壤有机质含量没有大的变化,即土壤肥力差 异不明显。 例 4.4 此试验的目的是看看与单纯繁殖相比,杂交能否显著提高 肉鸡的生长速度。实验数据是在 8周龄测得的体重(单位:克) 。 SAS程序 Ttest4_4.sas 例 4.5 研究皱纹盘鲍卵受精时间对受精率及孵化率的影响,其中 a、b 代表不同的受精时间,a:受精时间 0.5小时;b:受精时间 1.0小时;每组有 8个试验组,则数据集有 16个观测,观测值均 为百分数,请分析在不同的受精时间下,对海产单壳经济水产品 皱纹盘鲍卵的孵化率是否有显著差异,以确定人工繁殖时的受精 时间,提高孵化率。 SAS程序 Ttest4_5.sas 例 4.5结果说明: 从 t检验输出结果可以看出:方差相等的假设是不合理的,方差 相等假设成立的概率仅为 0.0594。双边检验 F值(大方差除以小 方差)为 4.67,所以应该使用方差不相等的检验。从而采用 Unequel一行的 t值、DF 和概率。 通过 t检验结果得出,受精时间为 0.5h和受精时间为 1.0h的两 个试验组在孵化率上有显著的差异,概率水平为 0.0022。受精时 间为 0.5h的皱纹盘鲍卵的孵化率显著高于受精时间为 1.0h的皱 纹盘鲍卵的孵化率。 但对于两组变量,当方差不等,且样本数小于 30时,应采用非参 数检验,否则可能得出错误的结论。建议使用后面讲到的 Npar1way过程进行非参数检验。 4.4 NPAR1WAY过程(非参数检验过程) 1NPAR1WAY 过程简介 NPAR1WAY过程是基于经验分布函数(EDF)和跨过单向分类的因 变量的秩得分,计算出几个统计量,用以检验变量的分布在跨过 不同组时有相同的位置参数。秩得分包括 Wilcoxon得分,中位数 得分,Savage 得分和 Van der Waerden得分。关于这些得分的说 明请参考有关非参数检验的统计书。 NPAR1WAY过程语句 PROC NPAR1WAY 选择项 ; CLASS 变量列表 ; BY 变量列表 ; VAR 变量列表 ; RUN ; 4.4.2 NPAR1WAY过程举例说明 例 4.6 将例 4.5用 NPAR1WAY过程进行非参数检验。SAS 程序 Npar1way4_6.sas data npar1way4_6 ; input time $ fuhualv ; cards ; a 73 a 65 a 72 a 65 a 64 a 77 a 71 a 66 b 59 b 64 b 61 b 63 b 64 b 61 b 62 b 58 ; proc npar1way ; class time ; var fuhualv ; title fuhualv ; run ; 结果说明:通过多种方法的比较与检验,两组数据都存在显著差 异,即受精时间为 0.5h和受精时间为 1.0h的两个试验组在孵化 率上有显著的差异。受精时间为 0.5h的皱纹盘鲍卵的孵化率显著 高于受精时间为 1.0h的皱纹盘鲍卵的孵化率。 虽然与 t检验在方差不等的前提下得到的结论相同,但通过进行 多种非参数检验,结论更有说服力,且显著水平也明显高于 t检 验的结果。Kruskal Wallis卡方检验的显著水平为 0.0011, Van der Waerden法的显著水平为 0.0017。均高于 0.0022,说明对于 这种数据,采用非参数检验,统计结果更精确。因此根据数据特 点选择合适的方法进行统计分析,有助于我们得到科学而准确的 结论。 例 4.7数据来源:中国农大昌平试验站用 a、b 两种饲料对香猪进 行饲养试验。每组 6头香猪,两组共有 12个观测值。数据是 6周 时每头香猪的增重结果,单位:Kg。分析这两种饲料对香猪的增 重有无差异。增重数据如下: a种饲料:6.65 6.35 7.05 7.90 8.04 4.45 b种饲料:5.34 7.00 7.89 7.05 6.74 7.28 由于试验样本小,应采用非参数检验方法进行检验。 SAS程序 Npar1way4_7.sas 结果说明: 其中 Chi-Square 是卡方 2统计量,Kruskal-Wallis 检验的 Chi-Square=0.0064,Prob Chi-Square=0.9361,大于 0.05, 卡方检验不显著,即用 a、b 两种饲料饲喟香猪对香猪的增重效果 没有差异,两种饲料的增重效果一样。 这个试验数据计算出的概率值为 1.0,有些特殊,通常我们处理 的数据不会这样。 如果使用 TTEST过程对这组数据进行检验,也得到两种饲料对香 猪的增重效果无差异的结论。但是对于小样本的试验数据应选择 非参数检验方法进行统计分析,否则得到的结论的可信度会受到 质疑。 4.5 综合应用 4.5.1 配对数据的统计分析 配对试验设计 进行单因素 2水平试验设计时,对同一个指标观测 2个数据,这 2个数据来自同 1个受试对象或来自非常相同(对重要的非处理因 素而言)的 2个受试对象,故把这 2个数据看作一对。这种设计称 为配对设计。 根据每对数据所对应的具体条件,可将配对设计分为以下 3种: 自身配对设计:每对数据测量来自同一个受试对象。 同源配对设计:每对数据测量来自同一窝(或胎)的 2个受试对象。 条件相近者配对设计:每对数据测量来自条件(指最重要的非处理 因素)相近的 2个受试对象。 结果说明: 第 1部分是对差量算出的各种简单样本统计量的值。如均数 =7.59,标准差=4.38。第 2部分是有关统计检验的结果。先看差 量是否服从正态分布,零假设是差量服从正态分布,备择假设是 差量不服从正态分布。W=0.970391,P=0.8944,大于 0.05,接受 零假设。应该用关于差量的总体均数为零的 t检验的结果: t=5.47,P=0.0004,拒绝 Ho:差量均数为零的假设。结论为:服 这种亲朋药前后对病人体内的 Baci含量有显著影响,这种药对治 疗腹泻有较好的效果。 (提示:如果差量不服从正态分布,则应该用符号秩(Sgn Rank) 检验的结果,即参照 Sign M Pr=|M| 一行的结论。 ) 4.5.2 成组试验数据的统计分析 1.单因素双水平随机试验设计 2. 检验方法的前提条件 对成组设计的试验数据进行检验分析之前,要先判断试验数 据是否满足以下 2个前提条件: 1)正态性:各组数据应独立,且来自同一正态总体。 2)方差齐性:2 组数据的总体方差应该相等。 例 4.10 某植物营养实验室进行肥料对草坪颜色质量的研究,选 择两种肥料进行试验,数据是两种肥料对草坪颜色的分数。分析 两种肥料对草坪颜色质量的影响是否有差异。 由于样本量小,应采用非参数检验。 SAS程序 npar1way4_10.sas 以上是 NPAR1WAY过程的非参数秩和检验结果。Kruskal-Wallis 卡方检验得:Chi-Square=4.6933,p=0.303, ,两组秩和相等的概 率小于 0.05 ,即两组秩和不等,两种肥料对草平颜色质量的影 响有显著的差异。由秩和得分知:f1 肥料显著好
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中语文练习:第一单元第课论“雅而不高”
- 《冲突与沟通管理【高起专】》作业答案-学习资料
- 第5课《黄河颂》课件-统编版语文七年级下册
- 山东省临沭县第三初级中学八年级信息技术下册《节约用水算水价》教学设计
- 七年级地理上册 第一章 第二节 地球的运动教学设计3 (新版)新人教版
- 四年级数学上册 七 整数四则混合运算第1课时 不含括号的三步混合运算教学设计 苏教版
- Starter Units 3 What color is it 1a-2e-教学设计 2023-2024学年人教版七年级英语上册
- 8.1 自主创业 公平竞争 课件高中政治统编版选择性必修二法律与生活
- 人教版美术七年级上册 第一单元 第一课 富于创造力的造型艺术(3) 教案
- 病房二级库房管理
- 长输管道施工工序
- 2023年郑州轨道工程职业学院单招职业适应性测试题库及答案解析
- 食品工程原理实验教学大纲
- SB/T 10104-2008糖果充气糖果
- 危险品运输车辆事故应急演练方案
- GA 499.1-2010气溶胶灭火系统第1部分:热气溶胶灭火装置
- 《西方哲学史》第二章-苏格拉底哲学和柏拉图哲学课件
- 水利基本建设财务管理讲义
- 会计学总论知识讲义课件
- 心包积液患者的护理查房ppt
- MSCCirc850船舶防火系统和设备保养检查指南
评论
0/150
提交评论