假设检验课件_第1页
假设检验课件_第2页
假设检验课件_第3页
假设检验课件_第4页
假设检验课件_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验假设检验参数估计统计推断在总体理论分布和小概率原理的基础上,通过提出假设、确定显著水平、计算统计数、做出推断等步骤来完成在一定概率意义上的推断。会出现两类错误。参数估计又分为区间估计和点估计,与假设检验比较,二者主要是表示结果的形式不同,其本质是一样的。常见的假设检验有:一样个本平均数的检验两个样本平均数的检验频率检验U检验或Z检验t检验卡方检验F检验§1假设检验概述Hypothesistest

假设检验参数假设检验非参数假设检验总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题

一、解决的基本问题利用两组样本信息,根据一定概率对总体参数或分布的某一假设作出拒绝或保留的决断.。

生产流水线上罐装可乐不断地封装,然后装箱外运.怎么知道这批罐装可乐的容量是否合格呢?把每一罐都打开倒入量杯,看看容量是否合于标准.这样做显然不行!罐装可乐的容量按标准应在350毫升和360毫升之间.每隔一定时间,抽查若干罐.如每隔1小时,抽查5罐,得5个容量的值X1,…,X5,根据这些值来判断生产是否正常.

通常的办法是进行抽样检查.方法:事先对生产状况提出一个假设,然后利用样本统计量的值检验提出的假设是否正确。

(二)备择假设(alternativehypothesis),与原假设相对立(相反)的假设。一般为研究者想收集数据予以证实自己观点的假设。用H1表示。表示形式:H1:总体参数≠某值(<)(>)

H0:(=355)例:H1:二、两类假设(一)原假设(nullhypothesis),又称零假设,指检验前对总体参数值所做的假设。一般为研究者想收集证据予以反对的假设。用H0表示。表示形式:H0:总体参数=某值(≥)(≤)

例:三、假设检验的原理,如何判断原假设H0是否成立呢?在实践中普遍采用小概率原则:小概率事件在一次试验中基本上不会发生.如果在H0条件下发生了小概率事件,则认为H0不正确

四、双侧检验和单侧检验(一)双侧检验与单侧检验

(三类假设的形式,以均值为例)2、双侧检验的显著性水平与拒绝域

如果统计量的值界于左、右临界值间,则H0成立;

如果大于右临界值或小于左临界值,H0不成立。

抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域1-置信水平(三)单侧检验

1、定义:强调方向性的检验叫单侧检验。目的在于检验研究对象是高于(右尾检验)或低于某一水平(左尾检验)。2、左尾检验(左侧检验)例如:改进生产工艺后,会使产品的生产时间降低到2小时以下建立的原假设与备择假设应为

H0:12H1:1

<

2

单下尾检验(左侧检验)显著性水平与拒绝域:

如果统计量的值大于左临界值,则H0成立;如果小于左临界值,H0不成立。

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平右侧检验显著性水平与拒绝:

如果统计量值小于右临界值,则H0成立;如果大于右临界值,H0不成立。

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量五、假设检验中的两类错误(决策风险)

如果H0实际上为真,但统计量的实测值落入了否定域,从而作出否定H0的结论,那就犯了“以真为假”的错误.

如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了“以假为真”的错误.请看下表/2/2H0

真H0

不真6062.56567.57072.57567.57072.57577.58082.5两类错误的关系两类错误是互相关联的,当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加.要同时降低两类错误的概率,或者要在不变的条件下降低,需要增加样本容量.baab六、假设检验的过程与步骤2、假设检验的步骤

提出原假设和备择假设确定适当的计算检验统计量的公式规定显著性水平由样本信息,计算检验统计量的值作出统计决策提出原假设和备择假设1、

提出原假设与备择假设。H0、H1是对立的,“先将研究者收集证据要证明的观点定为H1,再提出H0”。2、三种假设形式

H0:参数=某值

H1:参数某值双侧检验H0:参数某值

H1:参数

某值右尾检验H0:参数某值

H1:参数

某值左尾检验作出统计决策

(1)临界值比较法

用计算出的统计量的值与双侧临界值,或单侧(左临界值、右临界值)比较。

(2)利用P值法

P值是指统计量值在分布曲线上所截取的剩余面积值,可由计算机自动给出。

无论是双侧还是单侧检验问题:当P≤α时,H0不成立;P>α时,H0成立

多重检验及校正

在同一研究中,有时我们会用到二次或多次显著性检验,从上表可以看出,如果我们将显著性水平确定为α=0.05水平,做一次显著性检验后我们只能保证有95%的研究结果与真值是一致的;如果做两次显著性检验后,研究结果与真值的符合程度就会降至95%*95%=90.25,当我们进行5次显著性检验后,就会降至77.4%,即在5次显著性检验后,由α水平所得到的显著性检验结果的可靠性只有3/4的可靠性。校正方法1:Bonferroni校正法----如果研究中进行了n次显著性检验,则将每次显著性检验的水平降至0.05的n分之一倍。****或实验结果的P值的n倍,与0.05比较校正方法2:Newman-Keuls检验法(SNK,检验)校正方法3:最小显著差法(LSD法)校正方法4:Q-value检验在同一个研究中,所有显著性检验的p值的分布也是随机的,符合一定的分布规律,因此可以通过这个特点对所得到的所有p值进行校正,使之与总体相一致。§2样本平均数的假设检验检验问题:用从总体中抽取的一个样本的均值,检验该总体均值是否等于某个值。一、单样本均值显著性检验(One-samplettest)

例:食品安全要求防腐剂添加量必须低于0.1g/kg,如何检验市场中投放的康氏方便面是否达标?方案:随机抽检20盒得到样本“防腐剂添加量均值”与0.1g/kg比较得出结论**********SPSS分析********

方法1:总体方差已知时的检验1、假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)2、原假设:H0:=0备择假设:H1:0

使用z-统计量:方法2:总体方差未知时的均值检验

*(2未知,小样本)1. 假定条件总体为正态分布2. 使用t统计量)1(~0--=ntn-1sxtm

方法3:近似正态分布的检验1t检验时,样本大于302总体非正态分布,样本大于300-=nsxZ'

m方法总结1、需要依据不同的数据特点选择不同的分析方法2、特点分析1:检验数据分布是否为正态分布?3、特点分析2:抽样数据样本是大样本还是小样本?单样本检验的SPSS分析操作1、检验数据分布是否为正态分布(非参数统计分析)2、无论是大样本还是小样本SPSS菜单:Analyze—》comparemean—》one-samplettest输入μ0值(testvalue)与显著性水平(confidenceinterval)值3、读取结果:用sig.值与0.05比较进行决策。

*单样本检验结果读取实例

检验问题:用两个样本平均数之间的差异值X1-X2检验所代表的两个总体之间u1-u2是否有差异?

二、平均数差值的显著性检验例:如何检验某种新型降压药的治疗效果?方案:病例----对照研究随机将高血压病人分为两组或用同一组病人服药前、后得到两个样本均值差异值检验其是否等于“0”得出结论**********SPSS分析********

数据获取与分析方案方案1:随机分组服药组服药后平均血压值统计分析方法:独立样本检验(Independent-samplesttest)方案2:配对分组服药组服药前平均血压值统计分析方法:配对样本检验(Paired-samplesttest)未服药组平均血压值服药组服药后平均血压值(一)独立样本检验

(Independent-samplesttest)

用于处理生物学研究中比较不同处理效应的差异显著性。数据资料中,两个样本的各个变量从各自总体中抽取,两个样本之间变量没有任何关联,即两个抽样样本彼此独立,不论两个样本容量是否相同。假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230)原假设

H0:1-

2

=0

备择假设:H1:1-

2

0检验统计量或方法1:两个总体方差都已知(或方差未知大样本)有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2=50公斤,x1=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(=0.05)例题

计算结果H0:

1-2=0H1:

1-2

0=

0.05n1=

32,n2

=

40临界值(s):检验统计量:决策:结论:

拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异Z01.96-1.96.025拒绝H0拒绝H0.025两个总体方差未知,但相等。(1)假定条件两个样本是独立随机样本两个总体都是正态分布两个总体方差未知但相等12=22(样本方差差异不显著)(2)假设:原假设?备择假设?(3)检验统计量其中:方法2:两个总体方差未知,小样本df=n1+n2-2例:用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大鼠的增重量(g)高蛋白组:134、146、106、119、124、161、107、83、113、129、97、123;低蛋白组:70、118、101、85、107、132、94;试问两种饲料饲养是否有差别?假设方差相等

假设H0:μ1=

μ2

H1:μ1≠μ2

检验计算:

结论:在t分布中,当df=17时,t0.05=2.112.

一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且s12=s22

。试问能否认为用第二种方法组装比用第一中方法组装更好?(=0.05)例题(计算结果)H0:

1-2

0H1:

1-2>0=

0.05n1=10,n2

=

8临界值(s):检验统计量:决策:结论:

接受H0没有证据表明用第二种方法组装更好t0拒绝域0.051.7459

两个总体方差未知,但不相等(齐性)(1)

假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但不相等1222(样本方差差异显著)(2)假设:原假设?备择假设?(3)检验统计量自由度为df’独立样本差异性检验SPSS操作SPSS菜单命令:AnalyzecomparemeanIndependent-samplesttest输入检验变量、分组编号读取结果:用sig.值与0.05比较进行决策。*独立样本差异性检验结果分析(二)配对样本检验

(Paired-samplesttest)

要求两个样本间配偶成对,每一对除随机地给予不同处理外,其他试验条件尽量一致。检验两个相关总体的均值配对或匹配重复测量(前/后)假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1

30,n230)配对样本的t检验

(数据形式)例:在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两差试验动物用随机分配法在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定其肝中的维生素A的含量,其结果如下表,试检验两组饲料对试验动物肝中维生素A含量的作用是否有显著差异。配对样本的t检验

(检验统计量)样本均值样本标准差自由度df=nD-1统计量【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:配对样本的t检验

(例子)在

=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?属于检验某项声明的假设!配对样本的t检验

(计算表)配对样本的t检验

(计算结果)样本均值样本标准差H0:

m1–m2

8.5H1:m1–m2

<8.5a=0.05df=

10-1=9临界值(s):检验统计量:决策:结论:

接受H0有证据表明该俱乐部的宣称是可信的配对样本的t检验

(计算结果)-1.833t0拒绝域.05配对样本差异性检验SPSS操作SPSS菜单:AnalyzecomparemeanPaired-samplesttest输入配对的检验变量读取结果:用sig.值与0.05比较进行决策。*配对样本差异性检验结果分析§3样本率的假设检验一、单样本率的检验

研究问题用1个总体中抽样样本计算出的率,检验该总体率是否等于某个值。必须有一个总体报告率值或标准率值。方法:

假定条件样本为大样本总体近似服从正态分布假设:H0:p=p0;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论