版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第6章 SPSS数值统计分析选讲,刘明祥,信息技术与传播学院,2,1 假设检验的基本思想,基本思想 在统计推断中,首先解决的一个工作是进行参数估计的问题,但是,在经过参数估计之后,需要对估计得到的参数进行检验。这就是假设检验的内容了。 假设检验的内容主要是关于在做出推论估计之后,对所估计的内容进行检验,在统计上确定所得到的估计是否是统计显著的,3,1 假设检验的基本思想,基本思想 某学校某年级男生千米跑的成绩均值为3 min 50s,两个月前来了一名新的长跑教练,经过两个月的教学训练之后,从中随机抽测了10名男生的千米跑成绩,得到其样本均值为3 min 30s,标准差为20 s。问题是:新教练
2、的训练方法是否使男生的千米跑成绩发生了改变? 从某培训班中随机抽取两个小组,实验组使用新的教学方法,对照组使用传统的教学方法,后期统一测验成绩,实验组为84、78、85、76、88、75、85、93、76、89;对照组为80、79、87、71、68、82、76、91、79、68。问题是:新的教学方法是否优于传统教学方法,4,1 假设检验的基本思想,基本思想 在假设检验中,通常把所做的那个需要检验是否为真的假设H0称为原建设。如H0:a=230或H0:a1a2。 如果原假设是关于总体参数的,则称它为参数假设,相应的检验则称为参数检验;如果原假设H0是关于总体分布类型的,则称它为分布假设,检验分布
3、假设的问题,称为分布检验(或称为非参数检验,5,1 假设检验的基本思想,基本思想 衡量一个事件发生与否可能性的标准用概率大小来表示,通常概率大的事件容易发生,概率小的事件不容易发生。 将概率很小,如P0.05的事件称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,因此如果只进行一次试验的话,可以看做不发生,6,1 假设检验的基本思想,基本思想 假设检验的基本思想是统计学的“小概率反证法”原理:对于一个小概率事件来说,其对立面发生的可能性显然要大大高于这一小概率事件,可以认为小概率事件在一次试验中不应当发生。 因此可以首先假定需要考察的假设是成立的,然后基于此进行推导,来计算一下在该
4、假设所代表的总体中进行抽样研究,得到当前样本的概率是多少。如果结果显示这是一个小概率事件,则意味着如果假设是成立的,则在一次抽样研究中竟然发生了小概率事件!这显然违反了小概率原理,因此可以按照反证法的思路推翻所给的假设,认为它们实际上是不成立的,这就是小概率反证法原理,7,1 假设检验的基本思想,基本思想 在一个袋子中装有红、白两种颜色的球共100个,有人说这100个球中只有一个是红球,其余99个都是白色球。问这种说法是否成立? 建立假设,P233,8,1 假设检验的基本思想,假设检验的两类错误 假设检验的依据是“小概率事件在一次试验中不会发生”,然后小概率事件并非是不可能发生的事件(只是它不
5、是经常发生),我们并不能完全排斥它发生的可能性,因而假设检验的结果就有可能出现错误,按照错误发生的不同情况可分为两类错误。 第一类错误:原假设H0实际上是正确的,但由于抽样误差的原因,或者说恰好发生了小概率事件的原因,使得我们错误的拒绝了它,从而犯了“弃真”的错误,统计学上称它为“第一类错误”。犯第一类错误的概率即统计检验水准,9,1 假设检验的基本思想,假设检验的两类错误 第二类错误:原假设H0实际上是不正确的,但由于抽样误差的原因,检验中得到的P值大于检验水准,使得我们未能拒绝H0,从而犯了“存伪”的错误,统计学上称它为“第二类错误”,用字母 表示。 若 小,则 就会增大;或 小,则 就会
6、增大。理论上可以证明,当样本容量增大时才能使犯两类错误的概率都减小,10,1 假设检验的基本思想,假设检验的两类错误 统计检验可能出现两种结果:第一,拒绝原假设,接受备选假设;第二,根据现有证据无法拒绝原假设。无法拒绝也无法确定原假设是否真实,得到一个摸棱两可的结果。 只有拒绝H0的结论才是统计上有明确意义的结果。因此,应将不希望出现的情况列为原假设,而将希望得到的结论设为备选假设,然后统计检验拒绝原假设,从而接受备选假设,11,1 假设检验的基本思想,假设检验中的其他问题 若备选假设以单方向形式描述的,则此检验为单尾检验one-tailed test,若要检验假设是否发生了变化,但是并不是非
7、常清楚的了解发生变化的方向,就要用双尾检验two-tailed test。 从专业知识的角度来判断是单尾检验还是双尾检验,一般来说双尾检验更加保守和稳妥一些。 假设检验还分为参数检验和非参数检验。通常参数检验是已知相关数据分布形式基础上,要了解相应参数取值时的检验形式,12,2 正态分布的检验,正态分布 在SPSS中,正态分布的考察方法有:通过计算偏度系数和峰度系数加以考察;通过绘制直方图等图形工具来考察;也可以通过进行各种假设检验。 最常用的对于正态分布的检验是K-S单样本检验,13,2 正态分布的检验,K-S检验 K-S检验是一种分布拟合优度的检验,其方法是将一个变量的累积分布函数与特定分
8、布进行比较。用Ai表示理论分布每个类别的累积相对频数,Oi表示样本频数的相应值,K-S检验是以Ai和Oi的绝对差异为基础的,其检验统计量为,则若原假设成立,则每次抽样研究中所得到的K值应当 不会偏离O太远,如果K值越大,说明基于原假设得到 当前样本的可能性就越小,就越有可能判断H0为错误。 通常可以直接应用K-S检验来对样本数据进行正态分布的 检验。但是,通常的做法是对样本数据进行图形描述, 图形可以给分析着一个直观的印象,14,2 正态分布的检验,K-S检验 某零售商希望了解其销售收益revenue的大致分布情况,依据其他销售商已有的资料,他认为其销售收益可能服从正态分布,为了检验其假设,考
9、虑是否与其他零售商一样,销售收益服从正态分布,收集到相关的销售收益数据sales.sav中。 请使用SPSS软件分析样本数据是否服从正态分布,K值:正向为0.019,负向为0.010,绝对值最大为0.019。 统计量Z值为0.750,相应的显著性水平为0.627,若正态分布的假设成立,则从一个正态分布的总体中按照现有样本量抽样,则平均每100次中会有62.7次得到实际数据与理论分布之间的差值K等于甚至大于现有样本的K值0.019。 因此不能拒绝样本数据,即该厂商的销售收益服从正态分布,15,3 二项分布检验,简介 二项分布检验Binomial Test是对二分类变量的拟合优度检验,它考察每个类
10、别中观察值的频数与特定二项分布下的预期频数间是否存在统计学差异。 对于一个服从二项分布的随机变量而言,在n次试验中结局A出现的次数X的概率分布为,16,3 二项分布检验,简介 使用上述公式,可以算出基于原假设时各发生次数的出现概率,利用小概率反证法,按照和K-S检验中类似的逻辑做出相应的检验结论。 根据经验,新生儿染色体异常率一般为1%,某医院观察了当地共400名新生儿,只发现一例染色体异常,数据见binom.sav,该地新生儿染色体异常率是否低于一般水平,检验假设H0:=0.01,该地新生儿染色体异常率并无不同。 H1: 0.01,该地新生儿染色体异常率低于一般。 因不存在传染性,新生儿染色
11、体是否异常可以认为是服从二 项分布的,单侧概率P=0.1050.05,而这里默认的小概率事件水准为0.05, 因此在400名新生儿中出现一例染色体异常,甚至于一例也没有 的情形并非小概率事件,因此不能拒绝原假设,尚不能认为异常率 低于一般,17,4 连续变量的t检验,简介 在针对连续变量的统计推断方法中,最常用的有t检验和方差分析两种。其中t检验是最基本的检验方法。 假设已知一个正态分布的总体N(,2),现从中进行抽样研究,每次抽样的样本量固定为n,这样对每一个样本都计算其均数X。由于这种抽样可进行无限多次,这些样本均数就会构成一个分布。统计学家发现,该分布正好就是正态分布N(,2/n,18,
12、4 连续变量的t检验,简介 也就是说,样本均数所在分布的中心位置和原数据分布中心位置相同,而其标准差则为/ ,通常将样本均数的标准差称为标准误。此为中心极限定理。 利用t分布规律可进行t检验,19,4 连续变量的t检验,单一样本的t检验 单一样本的t检验是一种关于总体均数的假设检验问题,此问题中只有一个随机抽取的样本,研究目的是推断这个样本相应的总体均数是否等于或大于或小于某个已知总体均数。 如将过去某一年的某门平均成绩做为已知总体均数,来检验今年某门课程的成绩与过去成绩是否存在显著差异。 Analyze-Compare Means-One-Sample T Test,20,4 连续变量的t检
13、验,单一样本的t检验 某工厂用自动打包机打包,每包标准质量为100Kg。为保证正常生产,每天开工后需先行试机,检查打包机是否有系统偏差,以及时进行调整。某日开工后在试机中共打了9个包,测得9包的质量Kg为: 99.3、98.7、100.5、101.2、98.3、99.7、99.5、102.1、100.5 请判断,打包机是否需要进行调整,建立假设: H0:= 0,打包机工作正常。 H1:0,打包机工作不正常。 =0.05,输入已知的总体均数,已知总体均数为100,t为-0.055,P为0.957,自由度df为8 两均数的差值等信息。由于0.9570.05,因此不拒绝原假设, 可认为打包机工作正常
14、,21,4 SPSS统计检验,t检验 1 建立假设,即假定两个总体平均数之间没有显著差异。 2 计算统计量t的值,对于不同类型的问题选用不同的统计量计算方法。 如果要判断一个总体中小样本平均数与总体平均值之间的差异程度,则t的计算公式为,22,4 SPSS统计检验,t检验 2 计算统计量t的值 如果要判断两组样本平均数之间的差异程度,则t的计算公式为,23,4 SPSS统计检验,t检验 3 根据自由度df=n-1,查t值表,找出规定的t理论值并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为t(df)0.01和t(df)0.05 4 比较计算得到的t值和理
15、论t值,推断发生的概率,对显著性关系做出判断,24,4 SPSS统计检验,t检验 4 t值比较,25,4 SPSS统计检验,t检验 例13-6,某班有50人,随机抽取20人利用多媒体教学软件进行语文教学试验。在期终考试结束后,得知全班语文考试成绩如表所示,其中前20人为参加试验的学生成绩。 试通过检验样本平均数与总体平均数之间的差异程序判断该实验的效果。 小样本平均差异的显著性检验t检验,26,4 SPSS统计检验,t检验 Analyze-Compare Means-One-Sample T Test,27,4 SPSS统计检验,t检验 t检验的结果为t值、自由度df、双尾显著性概率sig、均
16、值差异Mean Difference和均值差异的95%置信区间。 查t值表可知,t(df)0.05=t(19)0.05=2.093 样本t=38.544t(19)0.05 样本与总体之间存在显著差异,样本平均分高于总体平均分,28,4 SPSS统计检验,T检验 正常人脉搏平均数为72次/分,现测得15名患者的脉搏数据:71,55,76,68,72,69,56,70,79,67,58,77,63,66,78,试问这15名患者的脉搏与正常人的脉搏是否存在显著差异? 此为单样本的T检验,29,4 SPSS统计检验,T检验 查t表,t(df)0.05=t(14)0.05=2.145 实际t=-1.83
17、60.05,所以差异不显著,30,4 连续变量的t检验,独立样本的t检验 独立样本T检验是指两个总体独立,并且均数未知的检验。 Analyze-Compare Means-Indepentdent-Sample T Test 希望评价两位教师的教学质量,试比较其分别任教的甲、乙两班(设甲乙两班原成绩接近,不存在差别)考试后的成绩是否存在差异? 数据见ttest.sav,可认为两个班级的成绩是两组独立的数据,建立假设如下: H0:1= 2,两个班级成绩相同,两位任课教师的教学质量 不存在差别。 H1:12 ,两个班级成绩不同,两位任课教师的教学质量 存在差别。 差异显著性水平=0.05,第一部分
18、为方差齐性检验结果,F=0.733,P=0.3970.05,可认为两样本所在总体的方差是齐的。 则t为3.056,P=0.0040.05,可以认为两个班级成绩不同,两位任课教师的教学质量有差别,31,4 连续变量的t检验,独立样本的t检验 在应用t检验进行两样本均数的比较时,要求数据满足以下三个条件:正态性,各个样本均来源于正态分布的总体;方差齐性,各个样本所在总体的方差相等;独立性,各观察值之间是相互独立的,不能相互影响。 方差齐性检查,如果其所对应的P值小于设定的检验水准,则拒绝原假设,认为两组的方差不齐,32,4 SPSS统计检验,T检验 收集了某校30名学生的自信心值,数据如下,请问该
19、指标是否与性别有关? 此为独立样本的t检验,33,4 SPSS统计检验,T检验 由上图可知,方差齐性检验结果,P=0.8450.05,可以认为方差相等,故取方差相等的检验结果,T检验结果,P=0.4630.05 可以认为,差异不显著,即自信心值与性别无关,34,4 SPSS统计检验,T检验 配对样本的T检验,是指将同一水平的对象配成对子,然后随机分成两组或是一批对象自身对比的试验。 如同一对象处理前后的数据;同一对象两个部位的数据;同一样品用两种方法检验的结果;两个对象分别接受两种处理后的数据等。 Analyze-Compare Means-Paried-Sample T Test,35,4
20、SPSS统计检验,T检验 将条件相近的学生配成对子,再随机分成两组,采用两种不同的训练方法进行训练,训练一个周期后,测得两组学生跳高成绩如下,试问两种训练方法的效果是否相同? 此为配对样本的T检验Paried-Sample T Test,36,4 SPSS统计检验,T检验 检验结果,P=0.0060.01,差异非常显著,两种训练方法效果不同。 配对样本的t检验实际上就是单一样本的t检验,等价于已知总体均数为0的情况,37,4 SPSS统计检验,T检验 用某药治疗10名高血压病人,对每一病人治疗前后的舒张压mmhg进行了测量,结果见pairedt.sav,请问该药有无降压作用? 典型的配对样本的
21、t检验,P=0.027,可以认为使用该药会影响病人的血压。由于治疗前后的差值均数为正,故可推断该药使病人的血压下降,具有降压作用,38,4 SPSS中的均值比较与检验,Means过程 分组计算指定变量的描述统计量,包括均值、标准差、总和、方差等。 对Data11-01.sav,分性别和年龄统计身高和体重,一次课程结束,39,4 SPSS统计检验,方差分析 方差分析是由费歇尔(R. A. Fisher)提出的,它与T检验相比优越之处在于可以同时检验多个平均数之间的差异,并且可以解释几个因素水平之间的相互作用。 如教学效果受教法、教材、学生接受能力等诸多因素的影响,要研究这些因素对教学效果的影响程
22、度、分析它们之间交互作用的大小,T检验方法就无能为力了,而方差分析为解决这类问题提供了一种有效的方法,40,4 SPSS统计检验,方差分析 方差分析的基本功能就是对多组平均数差异的显著性进行检验。 通过组间差异与组内差异比值的分析,来推断几个相应平均数差异的显著性,这就是方差分析的逻辑。 方差分析分为单因素方差分析、多因素方差分析、协方差分析、多元方差分析、重复试验设计的方差分析与方差成分分析,41,4 SPSS统计检验,方差分析 因变量:试验中要观测的量,即所要考察的结果。 因素:影响因变量的指标,也称为自变量。 水平:因素在试验时所分的等级或因素的不同状态,可能是数量的,如年龄,也可能是分
23、类的,如性别等。 主效应:试验中由一个因素的不同水平引起的差异。 简单效应:一个因素的水平在另一个因素的某个水平上的差异。 处理效应:试验的总变异中由自变量引起的差异,主效应、简单效应、交互作用均为处理效应,42,4 SPSS统计检验,方差分析 交互作用:当一个因素的水平在另一个因素的不同水平上变化趋势不一致时,称两个因素之间存在着交互作用。 或者:若一个因素A对因变量的影响与另一个因素B取什么水平有关,就称因素A与因素B之间存在交互作用,即除了因素A与B单独的作用外,它们的不同水平的组合对因变量产生的作用。 当两个因素A与B之间的交互作用的方差很小、比误差项的方差还小时,可以认为A与B之间无
24、交互作用,相应的平方和只不过是误差的一种反映,可将该项与误差项合并,相应的自由度也合并,以提高分析的精度,43,4 SPSS统计检验,方差分析 基本假设 1 总体服从正态分布 2 变异的同质性,即各个组的变异是相等的: 以两个总体为例,则 一般情况下无差异。 3 独立性:试验中一个被试的观测值应独立于其他被试的观测值。 即方差必须是齐的,进行方差齐性检验,44,4 SPSS统计检验,方差分析 基本假设 样本含量n应适当大一些,最好在30人以上。 最简单的情况是单因素方差分析。对于影响一个因变量的众多因素,若仅使一个因素发生变化,而其它因素则保持不变或控制在一定范围内,分析这一因素对因变量的影响
25、是否显著,属于单因素方差分析。 Analyze-Compare Means-One-Way ANOVA,45,4 SPSS统计检验,方差分析 对于大学新生的入学成绩,可通过t检验来考察男女学生间的入学成绩是否有差异。但若想知道来自江苏、四川、山东、安徽、上海等省份的学生,其入学成绩是否有差异? 在田间试验时,科研人员将田地分成多块,分别在每一块上进行试验,要比较多块之间的农作物生长情况? 实际上是:在单一处理因素之下,多个不同水平之间的连续性观察值的比较,目的是通过对多个样本的研究,来判断这些样本是否来自于同一总体,46,4 SPSS统计检验,方差分析 多个均数比较时,不能采用t检验作两两比较
26、。 R A Fisher提出:将总变异分解为由研究因素所造成的部分和由抽样误差所造成的部分,通过比较来自于不同部分的变异,借助F分布做出统计推断,47,4 SPSS统计检验,方差分析 单因素方差分析所解决的是一个因素Factor之下的多个不同水平level之间的关系问题。一般来说,这个因素应是名义尺度的nominal scaled,用该变量的不同取值代表不同水平。 现希望比较美国、日本、欧洲的汽车,考察其每千米耗油量有无差异。 若为两个因素水平,则为t检验,但现在是三个因素水平,48,4 SPSS统计检验,方差分析 预分析:Means过程来检验方差齐性:标准差相差不大。通过直方图来考察正态性。 One-W
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 毽子里的铜钱课件
- 《心肌梗死健康宣教》课件
- 单位管理制度展示选集【职工管理】
- 单位管理制度展示大全【职员管理篇】
- 2025年家电行业策略报告:内销走出休息区关注外销自主品牌
- 幼儿园组织与管理课件
- 2025物品保管合同范本
- 北大中医养生学课件 饮食类养生
- 砂场项目立项申请报告模板
- 中国国有银行市场全面调研及行业投资潜力预测报告
- 93江苏省宿迁市泗洪县2023-2024学年八年级上学期期末英语试题()
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 亚朵酒店管理手册
- 纪检机关查办案件分析报告
- 高一期末家长会课件
- 2024年航空职业技能鉴定考试-航空乘务员危险品历年考试高频考点试题附带答案
- 2024版全文:中国2型糖尿病预防及治疗指南
- 医院禁毒行动方案
- 设立影视服务公司商业计划书
- 《流行性脑脊髓膜炎》课件
- 《工程地质勘察 》课件
评论
0/150
提交评论