《统计学-基于R》(第4版)课件:假设检验_第1页
《统计学-基于R》(第4版)课件:假设检验_第2页
《统计学-基于R》(第4版)课件:假设检验_第3页
《统计学-基于R》(第4版)课件:假设检验_第4页
《统计学-基于R》(第4版)课件:假设检验_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

贾俊平2024/1/30StatisticswithR统计学R语言

贾俊平2024/1/306.1假设检验的原理6.2总体均值的检验6.3总体比例的检验6.4总体方差的检验6.5非参数检验

假设检验思维导图

6.1

假设检验的原理假设与假设检验假设—在参数检验中,是对总体参数的具体数值所作的陈述就一个总体而言,总体参数包括总体均值、比例、方差等分析之前必需陈述假设检验—先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理小概率是在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设

6.1

假设检验的原理原假设与备择假设

6.1

假设检验的原理双侧检验与单侧检验双侧检验—备择假设没有特定的方向性,并含有符号“

”的假设检验,称为双侧检验或双尾检验(two-tailedtest)单侧检验—备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验

备择假设的方向为“>”,称为右侧检验

假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0

6.1

假设检验的原理双侧检验与单侧检验——提出假设的一个例子【例6-2】农夫山泉饮用水瓶子上的标签钙≥400镁≥50钾≥35钠≥80偏硅酸≥180PH值(250C)7.3

0.5

6.1

假设检验的原理两类错误与显著性水平

6.1

假设检验的原理做出决策——用统计量决策

6.1

假设检验的原理做出决策——用P值决策

P

6.1

假设检验的原理做出决策——用P值决策P值原假设的对或错的概率无关它反映的是在某个总体的许多样本中某一类数据出现的经常程度,它是当原假设正确时,得到目前这个样本数据的概率值越小,你拒绝原假设的理由就越充分有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少

6.1

假设检验的原理结果表述——不拒绝而不是“接受”假设检验的目的主要是收集证据拒绝原假设,而支持你所倾向的备择假设假设检验只提供不利于原假设的证据。因此,当拒绝原假设时,表明样本提供的证据证明它是错误的,当没有拒绝原假设时,我们也没法证明它是正确的,因为假设检验的程序没有提供它正确的证据当不拒绝原假设时,我们也从来不说“接受原假设”,因为没有证明原假设是真的没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的,它仅仅意为着目前还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设“不拒绝”的表述方式实际上意味着没有得出明确的结论

6.1

假设检验的原理结果表述——“显著”或“不显著”拒绝原假设时,我样本结果是统计上显著的(statisticallySignificant);不拒绝原假设时,我们称样本结果是统计上不显著的在“显著”和“不显著”之间没有清除的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著但P值很小而拒绝原假设时,并不一定意味着检验的结果就有实际意义因为假设检验中所说的“显著”仅仅是“统计意义上的显著”一个在统计上显著的结论在实际中却不见得就很重要,也不意味着就有实际意义因为值与样本的大小密切相关,样本量越大,检验统计量的P值也就越大,P值就越小,就越有可能拒绝原假设

6.1

假设检验的原理效应量分析——找出差异程度假设检验拒绝原假设后,表示参数与假设值之间差异显著,但这一结果并未有告诉我们差异的大小(程度)。度量这种差异的统计量就是效应量,它描述了结果的差异程度是小、中还是大效应量的提出者是JacobCohen(1988),他提供了不同检验效应量小、中、大的度量标准

6.2

总体均值的检验一个总体均值的检验——大样本——例题分析例题分析【例6-3】检验空气中PM2.5的含量(

=0.05)load("C:/example/ch6/example6_3.RData")library(BSDA)z.test(example6_3$PM2.5值,mu=81,sigma.x=sd(example6_3$PM2.5值),alternative="less",conf.level=0.95)

总体方差已知总体方差未知82.674.779.987.573.879.887.068.368.578.086.276.975.789.980.285.185.189.277.757.565.380.274.768.897.675.080.176.685.176.181.672.593.577.880.784.577.383.382.285.5

6.2

总体均值的检验一个总体均值的检验——小样本——效应量

总体方差已知总体方差未知

一个总体均值的检验——小样本——例题分析例题分析【例6-4】检验砖的厚度xample6_4<-read.csv("C:/example/ch6/example6_4.csv")t.test(example6_5$厚度,mu=55)#计算效应量example6_4<-read.csv("C:/example/ch6/example6_4.csv")library(lsr)cohensD(example6_4$厚度,mu=5)

6.2

总体均值的检验两个总体均值差的检验——独立大样本——例题分析

6.2

总体均值的检验

总体方差已知总体方差未知

例题分析【例6-5】检验男女学生上网的平均时间

load("C:/example/ch6/example6_5.RData")library(BSDA)z.test(example6_5$男生上网时间,example6_5$女生上网时间,sigma.x=sd(example6_5$男生上网时间),sigma.y=sd(example6_5$女生上网时间),alternative="two.sided")值),alternative="less",conf.level=0.95)两个总体均值差的检验——独立小样本——例题分析

6.2

总体均值的检验假定条件两个独立的小样本;两个总体都是正态分布两个总体方差已知,或方差未知但相等,或方差未知且不相等检验统计量

总体方差已知总体方差未知但相等

总体方差未且不相等

两个总体均值差的检验——独立小样本——效应量

6.2

总体均值的检验

两个总体均值的检验——独立小样本——例题分析

example6_6<-read.csv("C:/example/ch6/example6_6.csv")t.test(example6_6$甲企业,example6_6$乙企业,var.equal=TRUE)t.test(example6_6$甲企业,example6_6$乙企业,var.equal=FALSE)#计算效应量library(lsr)cohensD(example6_6$甲企业,example6_6$乙企业)

6.2

总体均值的检验两个总体均值差的检验——配对样本——例题分析

6.2

总体均值的检验假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的数据配对或匹配(重复测量(前/后))检验统计量效应量

例题分析【例6-7】检验消费者对两款饮料的评分example6_7<-read.csv("C:/example/ch6/example6_7.csv")t.test(example6_7$旧款饮料,example6_7$新款饮料,paired=TRUE)#计算效应量library(lsr)cohensD(example6_7$旧款饮料,example6_7$新款饮料,method="paired")一个总体比例的检验——例题分析

6.3

总体比例的检验假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z统计量例题分析【例6-8】检验收视率是否达到制作人的预期n<-2000p<-450/2000pi0<-0.25z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)p_value<-1-pnorm(z)data.frame(z,p_value)

两个总体比例差的检验——例题分析

6.3

总体比例的检验

例题分析【例6-9】检验上网收费

n1<-200;n2<-200p1<-0.27;p2<-0.35p<-(p1*n1+p2*n2)/(n1+n2)z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))

p_value<-pnorm(z)data.frame(z,p_value)

例题分析【例6-10】检验两种生产方法n1<-300;n2<-300p1<-33/300;p2<-84/300d0<-0.08z<-((p1-p2)-0.08)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)p_value<-pnorm(z)data.frame(z,p_value)一个总体方差的检验——例题分析

6.4

总体方差的检验检验一个总体的方差或标准差假设总体近似服从正态分布使用卡方分布检验统计量例题分析【例6-11】检验填装量的方差example6_11<-read.csv("C:/example/ch6/example6_11.csv")library(TeachingDemos)sigma.test(example6_11$填装量,sigmasq=16,alternative="greater")

两个总体方差比的检验——例题分析

6.4

总体方差的检验假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本检验统计量例题分析【例6-12】检验两企业灯泡使用寿命的方差比example6_6<-read.csv("C:/example/ch6/example6_6.csv")var.test(example6_6[,1],example6_6[,2],alternative="two.sided")

正态性检验——Q-Q图

6.5

正态性的检验参数检验(如t检验,F检验等)通常都是在假定总体服从正态分布或总体分布形式已知的条件下进行的,而且要求所分析的数据是数值型的当总体的概率分布形式未知,或者无法对总体的概率分布做出假定时,参数检验方法往往会失效非参数检验(nonparametrictest)方法不仅对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论