假设检验基础:单样本检验课件1_第1页
假设检验基础:单样本检验课件1_第2页
假设检验基础:单样本检验课件1_第3页
假设检验基础:单样本检验课件1_第4页
假设检验基础:单样本检验课件1_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验基础:单样本检验假设检验基础:单样本检验1学习目标假设检验的基本原则如何用假设检验均值和比例如何评价假设检验中的假设,以及违背时的后果如何避免假设检验的缺陷假设检验中的道德问题学习目标假设检验的基本原则2原假设和备择假设原假设一般都是根据统计经验的事先判断,然后去证明是否符合这个假设,如果不符合那么就是备择假设,统计学原理中的假设检验只能回答是还是不是,而不是如何,怎么样,这样多种选择的问题。例如方差检验中原假设是各均值都相等,备择假设是各均值不全相等。原假设和备择假设原假设一般都是根据统计经验的事3什么是原假设政府统计数据Example:

美国家庭的户均拥有电视台数是3。()关注在是总体信息,而不是样本信息什么是原假设政府统计数据4

5原假设和备择假设的重要观点

原假设和备择假设的重要观点

6检验统计量的临界值假设检验方法背后的逻辑是根据样本得出的信息确定原假设是正确的可能性。如果统计值和总体参数的假设值之间有很大的差距,那么可以设为原假设是错误的。通常情况下不那么清晰,如何确定近似还是差距大是很主观的,缺乏明确的定义。假设检验的方法给出了如何衡量差距的明确定义。检验统计量的抽样分布通常是服从普遍的抽样分布的,像标准正态分布,t分布等,可以通过这些分布来确定原假设是否正确。检验统计量的临界值假设检验方法背后的逻辑是根据样本得出的信息7假设检测总体均值是50H0:μ=50, H1:μ≠50从总体中抽样,并统计其均值总体样本假设检测总体均值是50总体样本8

9如果样本均值与总体均值接近,那么原假设成立,不被拒绝。如果样本均值与总体均值相差很大,则原假设被拒绝。差距多大才能认为足够满足拒绝原假设H0呢?如果样本均值与总体均值接近,那么原假设成立,不被拒绝。10SamplingDistributionofX

μ

=50If

H0istrueIfitisunlikelythatyouwouldgetasamplemeanofthisvalue......thenyourejectthenullhypothesisthatμ=50.20...Wheninfactthiswere

thepopulationmean…XSamplingDistributionofXμ=11拒绝域和接受域检验统计量的抽样分布成两个区域,一个是拒绝域,也叫否定域,一个是接受域。如果检验统计值落在接受域之内,就不能拒绝原假设;如果检验统计值是落在拒绝域之内,则就要拒绝原假设。拒绝域和接受域检验统计量的抽样分布成两个区域,一个是拒绝域,12拒绝域和接受域临界值距样本均值的距离太远拒绝域拒绝域接受域拒绝域和接受域临界值拒绝域拒绝域接受域13拒绝域是由原假设为真时检验统计量不大可能出现的值所组成的。原假设错误时,这些值更有可能发生。因此检验统计值落在了拒绝域内,就可以拒绝原假设。拒绝域是由原假设为真时检验统计量不大可能出现的值所组成的。原14假设检验方法的风险

假设检验方法的风险

15假设检验方法的风险

检验的功效:与第II类错误概率互补的是(1-β),叫做统计检验的功效。统计检验的功效(1-β):是你拒绝原假设,而实际上该假设也是错误的或应该被拒绝的概率。假设检验方法的风险

检验的功效:与第II类错误概率互补的是(16假设检验和决策假设检验和决策统计决策实际情况H0

为真H0

为假没有拒绝H0正确判断概率=(1–α)第II类错误的概率=β拒绝H0第I类错误的概率=α正确决策的功效=(1–β)假设检验和决策假设检验和决策统计决策实际情况H0为真H017第I类错误和第II类错误的关系

第I类错误和第II错误不能同时发生

第I类错误只能在原假设H0

为真时发生

第II类错误只能在原假设H0

为假时发生

如果第I类错误的概率(),那么第II

类错误的概率(β)第I类错误和第II类错误的关系第I类错误和第II错18影响第II类错误的因素Allelseequal,

βwhenthedifferencebetweenhypothesizedparameteranditstruevalue

β when

β whenσ

β whenn影响第II类错误的因素Allelseequal,19显著信水平和拒绝域显著信水平=α

Thisisatwo-tailtestbecausethereisarejectionregioninbothtailsH0:μ=3H1:μ≠3临界值拒绝域α/20

α/2显著信水平和拒绝域显著信水平=αThisisatwo20

21均值的Z假设检验(σ

已知)

检验统计量是:σKnownσUnknown均值的假设检验已知未知(Z检验)(t检验)均值的Z假设检验(σ已知)

检验统计量是:σKnown22假设检验示例美国家庭户均拥有电视3台(假设

σ=0.8)1. 写出原假设和备择假设H0:μ=3H1:μ≠3(这属于双尾检验)2.选择显著性水平和样本容量

显著性水平:=0.05和样本容量:n=1003.因为σ已知,可以使用服从正态分布的Z检验统计量4.确定拒绝域

因为

=0.05所以Z检验的临界值为±1.96假设检验示例美国家庭户均拥有电视3台(假设σ=0.8)23假设检验示例(续)5.收集样本数据,计算检验统计量的值n=100,X=2.84(σ=0.8)所以检验统计量是:假设检验示例(续)5.收集样本数据,计算检验统计量的值24假设检验示例(续)拒绝H0接受H06. 判断这个检验值是否在拒绝域内?/2=0.025-Zα/2=-1.960如果ZSTAT<-1.96或ZSTAT>1.96,拒绝H0

,否则接受H0/2=0.025拒绝H0+Zα/2=+1.96这里,ZSTAT=-2.0<-1.96,所以检验值是在拒绝域内假设检验示例(续)拒绝H0接受H06. 判断这个检验值是25假设检验中的p值法

假设检验中的p值法

26P值检验示例美国家庭户均拥有电视3台(假设

σ=0.8)1. 写出原假设和备择假设H0:μ=3H1:μ≠3(这属于双尾检验)2.选择显著性水平和样本容量

显著性水平:=0.05和样本容量:n=1003.因为σ已知,可以使用服从正态分布的Z检验统计量P值检验示例美国家庭户均拥有电视3台(假设σ=0.8)27P值检验示例(续)4.

收集数据,计算检验值和p值

假设样本数据是 n=100,X=2.84(σ=0.8)计算检验统计量:P值检验示例(续)4.收集数据,计算检验值和p值28P值检验示例(续)4.(续)计算p值为了计算检验统计量在标准差之外的概率,要计算Z值大于或小于+2.0和-2.0的概率P值

=0.0228+0.0228=0.0456P(Z<-2.0)=0.02280-2.0Z2.0P(Z>2.0)=0.0228P值检验示例(续)4.(续)计算p值P值=0.0229P值检验示例(续)5.p值<α?p值=0.0456<α=0.05拒绝H0没有足够的证据支持电视在美国家庭的平均数等于3的结论P值检验示例(续)5.p值<α?没有足够的证据支持电视30假设检验(σ未知)如果总体标准差未知,我们只能利用样本的标准差S来完成检验因为这一变化,我们需要用t检验来替代Z检验,去检验原假设是否有效当使用t分布时,我们需确认所抽样的总体是服从正态分布的其他的步骤和方法就与前面的相同假设检验(σ未知)如果总体标准差未知,我们只能利用样本的31均值的t假设检验(σ

未知)HypothesisTestsforσKnownσUnknownKnownUnknown(Ztest)(ttest)

HypothesisTestsforσKnownσUnknownKnownUnknown(Ztest)(ttest)检验统计量:均值的假设检验σKnownσUnknown已知未知(Z检验)(t检验)均值的t假设检验(σ未知)HypothesisσKn32例子(双尾检验,未知)

H0:μ

=168H1:μ¹168例子(双尾检验,未知)

H0:μ=168H33例解a=0.05n

=25df=25-1=24未知,使用

t检验临界值:±t24,0.025=±2.0639不能拒绝H0拒绝H0拒绝H0a/2=.025-t24,0.025不拒绝H00a/2=.025-2.06392.06391.46H0:μ

=168H1:μ¹168t24,0.025例解a=0.05不能拒绝H0拒绝H0拒绝H0a/2=34采用p值法完成双尾T检验P值>α因此不能拒绝H0采用p值法完成双尾T检验P值>α35单尾检验在很多情况,备注假设关注的是某一边的情况H0:μ≥3H1:μ<3H0:μ≤3H1:μ>3备择假设关注的是低于均值3的

lower-tail备择假设关注的是高于均值3的upper-tail单尾检验在很多情况,备注假设关注的是某一边的情况H0:μ36lower-tail检测拒绝H0接受H0这里只有一个临界值,拒绝域只在一边存在a-Zαor-tα0μH0:μ≥3H1:μ<3ZortX临界值lower-tail检测拒绝H0接受H0这里只有一个临界37upper-tail检测拒绝H0接受H0aZα

ortα0μH0:μ≤3H1:μ>3这里只有一个临界值,拒绝域只在一边存在临界值ZortX_upper-tail检测拒绝H0接受H0aZαort38例子:基于均值的Upper-Tailt检验(未知)

一个电话公司的管理人员认为客户每月的电话费用在上升,现在平均每月的费用超过了$52,公司希望检测这种说法的可靠性

(假设总体呈正态分布)H0:μ≤52每月电话费均值没有超过$52H1:μ>52每月电话费均值超过$52形成假设检验:例子:基于均值的Upper-Tailt检验(未知39例解:找出拒绝域拒绝H0接受H0假设置信水平:=0.10此次检测的抽样样本n=25.找出拒绝域:=0.101.3180拒绝H0如果tSTAT>1.318,拒绝H0

例解:找出拒绝域拒绝H0接受H0假设置信水平:=040例解:计算检验值假设检验样本得出如下结论:

n=25,X=53.1,andS=10

检验统计量是:例解:计算检验值41例解:结论拒绝tH0接受H0

=0.101.3180拒绝H0因为tSTAT=0.55≤1.318,

不能拒绝H0

没有足够的证据证明假设不成立tSTAT=0.55例解:结论拒绝tH0接受H0=0.101.3180拒42例:利用p值法检验p值和进行比较拒绝H0

=0.10接受H01.3180拒绝H0tSTAT=.55P值

=0.2937因为p值=0.2937>=0.10,因此不能拒绝H0例:利用p值法检验p值和进行比较拒绝H0=0.1043例解:p值计算例解:p值计算44比例假设检验

比例假设检验

45比例的假设检验p抽样分布符合正态分布,所以单样本比例的Z检验ZSTAT

值:nπ5和

n(1-π)5p概率假设nπ<5或n(1-π)<5后续章节介绍比例的假设检验p抽样分布符合正态分布,所以单样本比例的Z检验46成功次数的比例Z检验将分子和分母都乘以n,将Z检验统计量转换成成功次数X的形式:X5andn-X5成功次数的假设XX<5orn-X<5后续章节再介绍成功次数的比例Z检验将分子和分母都乘以n,将Z检验统计量转换47例:比例的Z检验(临界值法)

Check:n

π=(500)(.08)=40n(1-π)=(500)(.92)=460例:比例的Z检验(临界值法)

Check:48求解a

=0.05n=151,p=0.5166在

=0.05下,接受H0

H0:π=0.5H1:π

¹0.5临界值:±1.96TestStatistic:决策:结论:z0拒绝拒绝.025.0251.96-0.4069目前一半杂货商认为沃尔玛是最大竞争对手的说法与Z检验结论没有矛盾-1.96求解a=0.05在=0.05下,接受H049用p值法求解接受H0拒绝H0拒绝H0/2

=.0251.960Z=-0.4069计算p值。然后与

进行比较

(对于双尾检验,其p值检验也是双尾的)P值=0.6841p值=0.6841>=0.05,所以不能拒绝H0

Z=0.4069-1.96/2

=.0250.4069-0.4069用p值法求解接受H0拒绝H0拒绝H0/2=.02550P值计算P值计算51假设检验潜在的缺陷和道德问题

假设检验潜在的缺陷和道德问题

52假设检验基础:单样本检验假设检验基础:单样本检验53学习目标假设检验的基本原则如何用假设检验均值和比例如何评价假设检验中的假设,以及违背时的后果如何避免假设检验的缺陷假设检验中的道德问题学习目标假设检验的基本原则54原假设和备择假设原假设一般都是根据统计经验的事先判断,然后去证明是否符合这个假设,如果不符合那么就是备择假设,统计学原理中的假设检验只能回答是还是不是,而不是如何,怎么样,这样多种选择的问题。例如方差检验中原假设是各均值都相等,备择假设是各均值不全相等。原假设和备择假设原假设一般都是根据统计经验的事55什么是原假设政府统计数据Example:

美国家庭的户均拥有电视台数是3。()关注在是总体信息,而不是样本信息什么是原假设政府统计数据56

57原假设和备择假设的重要观点

原假设和备择假设的重要观点

58检验统计量的临界值假设检验方法背后的逻辑是根据样本得出的信息确定原假设是正确的可能性。如果统计值和总体参数的假设值之间有很大的差距,那么可以设为原假设是错误的。通常情况下不那么清晰,如何确定近似还是差距大是很主观的,缺乏明确的定义。假设检验的方法给出了如何衡量差距的明确定义。检验统计量的抽样分布通常是服从普遍的抽样分布的,像标准正态分布,t分布等,可以通过这些分布来确定原假设是否正确。检验统计量的临界值假设检验方法背后的逻辑是根据样本得出的信息59假设检测总体均值是50H0:μ=50, H1:μ≠50从总体中抽样,并统计其均值总体样本假设检测总体均值是50总体样本60

61如果样本均值与总体均值接近,那么原假设成立,不被拒绝。如果样本均值与总体均值相差很大,则原假设被拒绝。差距多大才能认为足够满足拒绝原假设H0呢?如果样本均值与总体均值接近,那么原假设成立,不被拒绝。62SamplingDistributionofX

μ

=50If

H0istrueIfitisunlikelythatyouwouldgetasamplemeanofthisvalue......thenyourejectthenullhypothesisthatμ=50.20...Wheninfactthiswere

thepopulationmean…XSamplingDistributionofXμ=63拒绝域和接受域检验统计量的抽样分布成两个区域,一个是拒绝域,也叫否定域,一个是接受域。如果检验统计值落在接受域之内,就不能拒绝原假设;如果检验统计值是落在拒绝域之内,则就要拒绝原假设。拒绝域和接受域检验统计量的抽样分布成两个区域,一个是拒绝域,64拒绝域和接受域临界值距样本均值的距离太远拒绝域拒绝域接受域拒绝域和接受域临界值拒绝域拒绝域接受域65拒绝域是由原假设为真时检验统计量不大可能出现的值所组成的。原假设错误时,这些值更有可能发生。因此检验统计值落在了拒绝域内,就可以拒绝原假设。拒绝域是由原假设为真时检验统计量不大可能出现的值所组成的。原66假设检验方法的风险

假设检验方法的风险

67假设检验方法的风险

检验的功效:与第II类错误概率互补的是(1-β),叫做统计检验的功效。统计检验的功效(1-β):是你拒绝原假设,而实际上该假设也是错误的或应该被拒绝的概率。假设检验方法的风险

检验的功效:与第II类错误概率互补的是(68假设检验和决策假设检验和决策统计决策实际情况H0

为真H0

为假没有拒绝H0正确判断概率=(1–α)第II类错误的概率=β拒绝H0第I类错误的概率=α正确决策的功效=(1–β)假设检验和决策假设检验和决策统计决策实际情况H0为真H069第I类错误和第II类错误的关系

第I类错误和第II错误不能同时发生

第I类错误只能在原假设H0

为真时发生

第II类错误只能在原假设H0

为假时发生

如果第I类错误的概率(),那么第II

类错误的概率(β)第I类错误和第II类错误的关系第I类错误和第II错70影响第II类错误的因素Allelseequal,

βwhenthedifferencebetweenhypothesizedparameteranditstruevalue

β when

β whenσ

β whenn影响第II类错误的因素Allelseequal,71显著信水平和拒绝域显著信水平=α

Thisisatwo-tailtestbecausethereisarejectionregioninbothtailsH0:μ=3H1:μ≠3临界值拒绝域α/20

α/2显著信水平和拒绝域显著信水平=αThisisatwo72

73均值的Z假设检验(σ

已知)

检验统计量是:σKnownσUnknown均值的假设检验已知未知(Z检验)(t检验)均值的Z假设检验(σ已知)

检验统计量是:σKnown74假设检验示例美国家庭户均拥有电视3台(假设

σ=0.8)1. 写出原假设和备择假设H0:μ=3H1:μ≠3(这属于双尾检验)2.选择显著性水平和样本容量

显著性水平:=0.05和样本容量:n=1003.因为σ已知,可以使用服从正态分布的Z检验统计量4.确定拒绝域

因为

=0.05所以Z检验的临界值为±1.96假设检验示例美国家庭户均拥有电视3台(假设σ=0.8)75假设检验示例(续)5.收集样本数据,计算检验统计量的值n=100,X=2.84(σ=0.8)所以检验统计量是:假设检验示例(续)5.收集样本数据,计算检验统计量的值76假设检验示例(续)拒绝H0接受H06. 判断这个检验值是否在拒绝域内?/2=0.025-Zα/2=-1.960如果ZSTAT<-1.96或ZSTAT>1.96,拒绝H0

,否则接受H0/2=0.025拒绝H0+Zα/2=+1.96这里,ZSTAT=-2.0<-1.96,所以检验值是在拒绝域内假设检验示例(续)拒绝H0接受H06. 判断这个检验值是77假设检验中的p值法

假设检验中的p值法

78P值检验示例美国家庭户均拥有电视3台(假设

σ=0.8)1. 写出原假设和备择假设H0:μ=3H1:μ≠3(这属于双尾检验)2.选择显著性水平和样本容量

显著性水平:=0.05和样本容量:n=1003.因为σ已知,可以使用服从正态分布的Z检验统计量P值检验示例美国家庭户均拥有电视3台(假设σ=0.8)79P值检验示例(续)4.

收集数据,计算检验值和p值

假设样本数据是 n=100,X=2.84(σ=0.8)计算检验统计量:P值检验示例(续)4.收集数据,计算检验值和p值80P值检验示例(续)4.(续)计算p值为了计算检验统计量在标准差之外的概率,要计算Z值大于或小于+2.0和-2.0的概率P值

=0.0228+0.0228=0.0456P(Z<-2.0)=0.02280-2.0Z2.0P(Z>2.0)=0.0228P值检验示例(续)4.(续)计算p值P值=0.0281P值检验示例(续)5.p值<α?p值=0.0456<α=0.05拒绝H0没有足够的证据支持电视在美国家庭的平均数等于3的结论P值检验示例(续)5.p值<α?没有足够的证据支持电视82假设检验(σ未知)如果总体标准差未知,我们只能利用样本的标准差S来完成检验因为这一变化,我们需要用t检验来替代Z检验,去检验原假设是否有效当使用t分布时,我们需确认所抽样的总体是服从正态分布的其他的步骤和方法就与前面的相同假设检验(σ未知)如果总体标准差未知,我们只能利用样本的83均值的t假设检验(σ

未知)HypothesisTestsforσKnownσUnknownKnownUnknown(Ztest)(ttest)

HypothesisTestsforσKnownσUnknownKnownUnknown(Ztest)(ttest)检验统计量:均值的假设检验σKnownσUnknown已知未知(Z检验)(t检验)均值的t假设检验(σ未知)HypothesisσKn84例子(双尾检验,未知)

H0:μ

=168H1:μ¹168例子(双尾检验,未知)

H0:μ=168H85例解a=0.05n

=25df=25-1=24未知,使用

t检验临界值:±t24,0.025=±2.0639不能拒绝H0拒绝H0拒绝H0a/2=.025-t24,0.025不拒绝H00a/2=.025-2.06392.06391.46H0:μ

=168H1:μ¹168t24,0.025例解a=0.05不能拒绝H0拒绝H0拒绝H0a/2=86采用p值法完成双尾T检验P值>α因此不能拒绝H0采用p值法完成双尾T检验P值>α87单尾检验在很多情况,备注假设关注的是某一边的情况H0:μ≥3H1:μ<3H0:μ≤3H1:μ>3备择假设关注的是低于均值3的

lower-tail备择假设关注的是高于均值3的upper-tail单尾检验在很多情况,备注假设关注的是某一边的情况H0:μ88lower-tail检测拒绝H0接受H0这里只有一个临界值,拒绝域只在一边存在a-Zαor-tα0μH0:μ≥3H1:μ<3ZortX临界值lower-tail检测拒绝H0接受H0这里只有一个临界89upper-tail检测拒绝H0接受H0aZα

ortα0μH0:μ≤3H1:μ>3这里只有一个临界值,拒绝域只在一边存在临界值ZortX_upper-tail检测拒绝H0接受H0aZαort90例子:基于均值的Upper-Tailt检验(未知)

一个电话公司的管理人员认为客户每月的电话费用在上升,现在平均每月的费用超过了$52,公司希望检测这种说法的可靠性

(假设总体呈正态分布)H0:μ≤52每月电话费均值没有超过$52H1:μ>52每月电话费均值超过$52形成假设检验:例子:基于均值的Upper-Tailt检验(未知91例解:找出拒绝域拒绝H0接受H0假设置信水平:=0.10此次检测的抽样样本n=25.找出拒绝域:=0.101.3180拒绝H0如果tSTAT>1.318,拒绝H0

例解:找出拒绝域拒绝H0接受H0假设置信水平:=092例解:计算检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论