第08章 假设检验_第1页
第08章 假设检验_第2页
第08章 假设检验_第3页
第08章 假设检验_第4页
第08章 假设检验_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章

假设检验授课教师:程晓谟主要内容★1假设检验的基本概念2单样本t检验3两个独立样本t检验4配对样本t检验5采用概率P值判断原假设是否成立6用SPSS作均值假设检验第一节

假设检验的基本问题什么是假设?

(hypothesis)对总体参数的数值所作的一种推断。总体参数包括总体均值、比例、方差等;分析之前必须先给出参数的估计值。我认为该地区新生婴儿的平均体重为3190克!什么是假设检验?

(hypothesistesting)事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立;有参数假设检验和非参数假设检验;采用逻辑上的反证法,依据统计上的小概率原理。假设检验中的小概率原理什么是小概率?在一次试验中,一个几乎不可能发生事件的发生概率;假如概率很小的随机事件,在一次实验中竟然发生了,则认为原假设不正确;小概率由研究者事先确定。小概率事件据统计,校园内受伤的概率是1/3;行车遭遇车祸(指道路)的概率是1/12;在家中受伤的概率是1/80;家中成员死于突发事件的概率是1/1000;死于道路交通车祸(乘坐车辆)的概率是1/5000;行人被汽车撞死的概率是1/40000;死于火灾的概率是1/50000;溺水而死的概率是1/50000;因中毒而死(不含自杀)的概率是1/86000;骑自行车死于车祸的概率是1/130000;吃东西被噎死的概率是1/160000;死于飞机失事的概率是1/2500000;被冻死、热死的概率是1/1500000;被动物咬死的概率是1/2000000;被龙卷风刮走摔死的概率是1/2000000。 数据来源“中国教育报”总体假设检验的过程抽取随机样本均值

X=20我认为人口的平均年龄是50岁提出假设

拒绝假设!

别无选择.作出决策假设检验的步骤提出原假设和备择假设

什么是原假设?(nullhypothesis)待检验的假设,又称“零假设”研究者想收集证据予以反对的假设总是有等号,或表示为H0H0:

某一数值例如,H0:

3190(克)什么是备择假设?(alternativehypothesis)与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号:

,

或表示为H1H1:

<某一数值,或某一数值例如,H1:

<3910(克),或3910(克)提出原假设和备择假设

什么是检验统计量?用于假设检验决策的统计量选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为:确定适当的检验统计量规定显著性水平

(significantlevel)

什么是显著性水平?是一个概率值;原假设为真时,拒绝原假设的概率;被称为抽样分布的拒绝域表示为(alpha);常用的值有0.01,0.05,0.10由研究者事先确定;作出统计决策计算检验的统计量;按P{当H0为真拒绝H0}≤求出拒绝域;将检验统计量的值与水平的临界值进行比较;得出接受或拒绝原假设的结论;假设检验中的两类错误第一类错误(弃真错误)原假设为真时拒绝原假设第一类错误的概率为P{拒绝H0∣H0为真}=被称为显著性水平第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为P{接受H0∣H0为假}=

错误和错误的关系n一定时,你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小双尾检验和单尾检验双尾检验(Two-Tailedtest)H0:μ=μ0;H1:μ≠μ0(即μ>μ0或μ<μ0);单尾检验(One-Tailedtest)左边检验:H0:μ≥μ0H1:μ<μ0右边检验:H0:μ≤μ0H1:μ>μ0双尾检验的拒绝域

(RejectionRegions)抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域1-置信水平双尾检验

(显著性水平与拒绝域)H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域抽样分布1-置信水平统计量的值双尾检验

(显著性水平与拒绝域)H0值临界值临界值

a/2a/2

样本统计量拒绝域拒绝域抽样分布1-置信水平统计量的值双尾检验

(显著性水平与拒绝域)H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域抽样分布1-置信水平统计量的值单尾检验

(左边检验的拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-置信水平左边检验

(显著性水平与拒绝域)H0值a抽样分布1-置信水平观察到的样本统计量拒绝域临界值样本统计量左边检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-置信水平观察到的样本统计量右边检验

(显著性水平与拒绝域)H0值a抽样分布1-置信水平观察到的样本统计量拒绝域临界值样本统计量右边检验

(显著性水平与拒绝域)H0值临界值a样本统计量抽样分布1-置信水平拒绝域观察到的样本统计量第二节

一个正态总体下的

参数假设检验总体均值μ的检验

(2

已知)假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)使用Z统计量2

已知:总体均值μ的检验

(2未知)假定条件总体为正态分布正态分布,2未知,且小样本使用t

统计量2

已知,检验假设:μ=μ0观察检验统计量~N(0,1)若原假设成立

值应该较小这个数值是多大?如果值很大,超过某一数值,则怀疑原假设的真实。假设时,拒绝H0如果H0是正确的,要使弃真的概率很小即a/2a/2

拒绝域拒绝域1-置信水平Z根据一个样本计算即的值如果发现说明在一次观察中,统计量Z就落入拒绝域而这是个小概率事件,在一次试验中几乎不可能发生,这样的结果是在原假设的基础上推导出来,因此有理由怀疑原假设的正确性。如果发现则接受原假设2

已知,检验假设:μ=μ0

(例题)【例】已知生产线上生产出来的零件直径服从正态分布,已知方差为0.09,通过抽取一批样本n=4,得到为10.01mm,现在假设H0:均值μ=10mm,试判断假设正确与否?(α=0.05)解:统计量接受H02

未知,检验假设:μ=μ0

(更符合统计实际需要)检验统计量具体检验思路与σ2已知相同SPSS软件主要完成这种情况下的均值假设检验拒绝域2

未知,单边假设检验左边检验H0:μ≥μ0;H1:μ<μ0拒绝域:右边检验H0:μ≤μ0;H1:μ>μ0拒绝域:单尾检验

(原假设与备择假设的确定)将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想证明供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致将研究者想收集证据证明其不正确的假设作为原假设H0先确立备择假设H1单尾检验

(原假设与备择假设的确定)一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立。研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“>”(寿命延长)建立的原假设与备择假设应为

H0:

1500H1:

1500单侧检验

(原假设与备择假设的确定)一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立。研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“<”(废品率降低)建立的原假设与备择假设应为

H0:2%H1:

<2%用概率P值判断原假设成立与否

(重点内容)双尾检验的P值P值是如果原假设为真,抽样分布中大于或小于样本统计量的概率。单尾检验的P值左边检验时,P值为曲线上方小于等于检验统计量部分的面积;右边检验时,P值为曲线上方大于等于检验统计量部分的面积。双尾检验的P值/

2/

2t拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值t统计量落入拒绝域等价于:P值<α双尾检验的P值/

2/

2tH0值临界值计算出的样本统计量临界值t统计量落入接受域等价于:P值>α左边检验的P

值H0值临界值a样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值t统计量落入拒绝域等价于:P值<α右边检验的P

值H0值临界值a拒绝域抽样分布1-置信水平计算出的样本统计量P值t统计量落入拒绝域等价于:P值<α利用P值进行检验

(决策准则)双尾检验若p值>

,

不能拒绝H0若p值<,拒绝H0单尾检验若p值>

,不能拒绝H0若p值<,拒绝H0关于正态总体方差2

的检验未知均值μ,检验总体方差σ2=σ02检验统计量c2拒绝域或未知均值μ,检验总体方差σ2>σ02检验统计量c2H0:拒绝域第三节

两个正态总体下的

参数假设检验适用条件μ1和μ2是否相等方差齐性检验未知总体均值μ1,μ2H1:H0:检验统计量拒绝域或两个总体方差的F

检验

(临界值)0不能拒绝H0F拒绝H0a/2a/2拒绝H0两个总体均值是否相等的检验

(12、22

未知但相等)H0:μ1=μ2拒绝域统计检验量两个总体均值是否相等的检验

(12、22

未知且不相等)H0:μ1=μ2统计检验量~t(f)大样本下两个任意总体

的均值检验大样本下两个任意总体

均值检验问题在大样本下12、22

已知的情况下,检验统计量为:近似服从12、22

未知的情况下,检验统计量为:大样本下两个0-1总体的

比例值检验问题原假设:p1-p2=0检验统计量为:原假设:p1-p2=0p1=p2=p检验统计量变成如何得到p的值?r1,r2是具有某性质的样本数第四节

用SPSS作假设检验单样本T检验

(One-SampleTTest)使用“Analyze→CompareMeans→One-SampleTTest”模块数据文件:

CH6参检1小学生400米v提高.savH0:该市五年级学生的400米成绩仍为100秒;H1:该市五年级学生的400米成绩不为100秒;输入你所假设的均值输入置信水平1-a计算所涉及的变量存在缺失值,则剔除在该变量上存在缺失值的个案。剔除在所有任意变量上存在缺失值的个案后再分析。Std.ErrorMean=Std.Deviation/=38.82007/=5.01165MeanDifference=Mean-100=5.38500t=MeanDifference/Std.ErrorMean=5.38500/5.01165=1.074df=N-1=60-1=59Sig.(2-tailed)=(1-CDF.T(1.074,59))*295%ConfidenceIntervaloftheDifference是95%的置信区间如何判断原假设成立?1.074<t0.025=2.000.287>0.05(-4.6433,15.4133)不能拒绝原假设!再看一个类似的例子使用数据文件:CH6参检1小学生400米v提高B.sav再次执行单样本T检验均值101.4017似乎和100差距较小,但sig值要小于0.05,拒绝H0,反而认为跑步的成绩明显下降了。相互独立的两组样本的T检验使用“Analyze→CompareMeans→Independent-SampleTTest”模块数据文件:教材:例8.11

经常食用谷类者

非经常使用谷类者午餐平均大卡摄入量是否存在差异一定要注意数据的组织形式!要求两组样本数据存放在一个SPSS变量中。还需要定义一个存放总体区分标志的变量。选入待检验的变量选入分组变量“1”输入Group1,“0”输入Group2注意与分类变量的编码对应若分组变量为连续变量,输入分界值置信水平1-a首先方差齐性检验,SPSS用LeveneF方法实现统计量F的值为0.207,介于[F0.975(14,19),F0.025(14,19)]即(0.30,2.65),没有落入拒绝域,同时sig值(即概率P值)为0.652>0.05,因此不能拒绝原假设,认为两个总体的方差相等。两个总体方差相等,选择“Equalvariancesassumed”这一行的数据来判断。其中df自由度为n1+n2-2=33,MeanDifference为均值差异=583.00-629.25t=-2.413>t0.025(33)=-2.035,落入拒绝域中,拒绝原假设;Sig值为0.022<0.05,拒绝原假设;

95%的置信区间在“0”点右侧,说明总体1的均值显著小于总体2的均值。数据支持研究者的结论,即早餐食用较多的谷类食物有助于减少午餐中热量的摄取。配对样本的T检验何为配对样本?个案在“前”、“后”两种状态下某属性的两种状态;对某事物两个不同侧面或方面的描述;两个样本是相互关联的,不是相互独立的;两个样本的顺序不可颠倒;两组样本的样本量必须相同。配对样本的T检验使用“Analyze→CompareMeans→Paired-SampleTTest”模块数据文件:

教材P235例8.15

H0:训练前和训练后的体重没有显著差异(μ1=μ2)H1:训练前和训练后的体重有显著差异(μ1≠μ2)配对样本t检验的数据组织用两个变量分别存放数据同时选中两个变量数据正态分布检验SPSS数据正态分布检验方法“Analyze”→“NonParametricTests”→“LegacyDialogs”→“1-SampleK-S”方法一“Analyze”→“DescriptiveStatistics”→“Explore”→“Plot”方法二方法一:K-S检验K-S检验思路首先,H0:样本来自的总体服从正态分布;在该假设前提下,计算各样本观测值在理论分布(正态分布)中出现的理论累计概率值F(x);其次,计算各样本观测值的实际累计概率值S(x),以及实际累计概率值与理论累计概率值的差D(x);最后,计算差值序列中的最大绝对值,即D=max(|S(xi)-F(xi)|),为使差值序列均匀,D修正为D=max[max(|S(xi)-F(xi)|)max(|S(xi-1)-F(x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论