赵娜《应用统计分析》课件-(08)第8章 假设检验_第1页
赵娜《应用统计分析》课件-(08)第8章 假设检验_第2页
赵娜《应用统计分析》课件-(08)第8章 假设检验_第3页
赵娜《应用统计分析》课件-(08)第8章 假设检验_第4页
赵娜《应用统计分析》课件-(08)第8章 假设检验_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学

STATISTICS第8章假设检验

(第六版)

统计学

作者:中国人民大学统计学院

贾俊平

8-1

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS第8章假设检验

(第六版)

8.1假设检验的基本问题

8.2一个总体参数的检验

8.3两个总体参数的检验

8.4检验问题的进一步说明

8-2

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS学习目标

(第六版)

1.了解假设检验的基本思想

2.掌握假设检验的步骤

3.对实际问题作假设检验

4.利用置信区间进行假设检验

5.利用P-值进行假设检验

8-3

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS8.1假设检验的基本问题

(第六版)

8.1.1假设问题的提出

8.1.2假设的表达式

8.1.3两类错误

8.1.4假设检验的流程

8.1.5利用P值进行决策

8.1.6单侧检验

8-4

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

假设问题的提出

8-5

作者:贾俊平,中国人民大学统计学院

统计学什么是假设

STATISTICS?

(第六版)(hypothesis)

对总体参数的的数值所作的一种陈述

n总体参数包括总体参数包括总体均值总体均值、、比例比例、、方差方差等等

n分析分析之前之前必需陈述必需陈述

8-6

作者:贾俊平,中国人民大学统计学院

统计学什么是假设检验?

STATISTICS

(第六版)(hypothesistesting)

1.事先对总体参数或分布形式作出某种假设

,然后利用样本信息来判断原假设是否成

2.有参数假设检验和非参数假设检验

3.采用逻辑上的反证法,依据统计上的小概

率原理

8-7

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS提出原假设和备择假设

(第六版)

什么是原假设?(nullhypothesis)

1.待检验的假设,又称“0假设”

2.研究者想收集证据予以反对的假设

3.总是有等号,或

4.表示为H0

nHH00::某一数值某一数值

n指定为指定为==号,即号,即或或

n例如例如,,HH00::31903190((克)克)

8-8

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS提出原假设和备择假设

(第六版)

什么是备择假设?(alternativehypothesis)

1.与原假设对立的假设,也称“研究假设”

2.研究者想收集证据予以支持的假设总是有不

等号:,或

3.表示为H1

nHH11::<<某一数值,或某一数值,或某一数值某一数值

n例如例如,,HH11::<<3910(3910(克克)),或,或3910(3910(克克))

8-9

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

假设检验中的两类错误

(决策风险)

8-10

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS假设检验中的两类错误

(第六版)

1.1.第一类错误(弃真错误)第一类错误(弃真错误)

n原假设为真时拒绝原假设

n会产生一系列后果

n第一类错误的概率为

l被称为显著性水平

2.2.第二类错误(取伪错误)第二类错误(取伪错误)

n原假设为假时接受原假设

n第二类错误的概率为

(Beta)

8-11

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

假设检验的流程

§提出假设

§确定适当的检验统计量

§规定显著性水平

§计算检验统计量的值

§作出统计决策

8-12

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS确定适当的检验统计量

(第六版)

什么是检验统计量?

1.用于假设检验决策的统计量

2.选择统计量的方法与参数估计相同,需考虑

n是大样本还是小样本是大样本还是小样本

n总体方差已知还是未知总体方差已知还是未知

3.检验统计量的基本形式为

8-13

作者:贾俊平,中国人民大学统计学院

统计学规定显著性水平

STATISTICS

(significantlevel)

(第六版)

什么是显著性水平?

1.是一个概率值

2.原假设为真时,拒绝原假设的概率

n被称为抽样分布的拒绝被称为抽样分布的拒绝域域

3.表示为(alpha)

n常用的常用的值有值有0.01,0.01,0.05,0.05,0.100.10

4.由研究者事先确定

8-14

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS作出统计决策

(第六版)

1.计算检验的统计量

2.根据给定的显著性水平,查表得出相应

的临界值z或z/2,t或t/2

3.将检验统计量的值与水平的临界值进

行比较

4.得出拒绝或不拒绝原假设的结论

8-15

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

利用P值进行决策

8-16

作者:贾俊平,中国人民大学统计学院

统计学什么是P值?

STATISTICS

(第六版)(P-value)

1.是一个概率值

2.如果原假设为真,P-值是抽样分布中大于

或小于样本统计量的概率

n左侧检验时,左侧检验时,PP--值为曲线上方值为曲线上方小于等于小于等于检检

验统计量部分的面积验统计量部分的面积

n右侧检验时,右侧检验时,PP--值为曲线上方值为曲线上方大于等于大于等于检检

验统计量部分的面积验统计量部分的面积

3.被称为观察到的(或实测的)显著性水平

nHH00能被拒绝的最小值能被拒绝的最小值

8-17

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS双侧检验的P值

(第六版)

/2

/2

拒绝拒绝

1/21/2PP值值

1/21/2PP值值

HH值值ZZ

临界值临界值00临界值临界值

计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量

8-18

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS左侧检验的P值

(第六版)

抽样分布抽样分布置信水平

拒绝域拒绝域

11--

PP值值

HH值值样本统计量样本统计量样本统计量

临界值临界值00

8-19计算出的样本统计量计算出的样本统计量计算出的样本统计量

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS右侧检验的P值

(第六版)

抽样分布抽样分布置信水平置信水平

拒绝域拒绝域

11--

PP值值

HH00值值

临界值临界值

计算出的样本统计量计算出的样本统计量计算出的样本统计量

8-20

作者:贾俊平,中国人民大学统计学院

统计学利用P值进行检验

STATISTICS

(第六版)(决策准则)

1.单侧检验

n若若p-p-值值>>,,不拒绝不拒绝HH00

n若若p-p-值值<<,,拒绝拒绝HH00

2.双侧检验

n若若p-p-值值>>/2/2,,不拒绝不拒绝HH00

n若若p-p-值值<</2/2,,拒绝拒绝HH00

8-21

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

双侧检验和单侧检验

8-22

作者:贾俊平,中国人民大学统计学院

统计学双侧检验与单侧检验

STATISTICS

假设的形式

(第六版)()

研究的问题

假设

双侧检验左侧检验右侧检验

H0m==m0mm0mm0

H1m≠≠m0m<m0m>m0

8-23

作者:贾俊平,中国人民大学统计学院

统计学双侧检验

STATISTICS

(第六版)(原假设与备择假设的确定)

1.属于决策中的假设检验

2.不论是拒绝H0还是不拒绝H0,都必需采取

相应的行动措施

3.例如,某种零件的尺寸,要求其平均长度为

10cm,大于或小于10cm均属于不合格

n我我们们想想要要证证明明((检检验验))大大于于或或小小于于这这两两种种可可能能性性

中的任何一种是否成立中的任何一种是否成立

4.建立的原假设与备择假设应为

H0:=10H1:10

8-24

作者:贾俊平,中国人民大学统计学院

统计学双侧检验

STATISTICS

(第六版)(显著性水平与拒绝域)

抽样分布抽样分布置信水平置信水平

拒绝域拒绝域拒绝域拒绝域

/2/211--/2

HH00值样本统计量样本统计量

临界值临界值临界值临界值

8-25

作者:贾俊平,中国人民大学统计学院

统计学单侧检验

STATISTICS

(第六版)(显著性水平与拒绝域)

抽样分布抽样分布置信水平

拒绝域

1-

H值样本统计量

临界值0

8-26

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS8.2一个总体参数的检验

(第六版)

8.2.1检验统计量的确定

8.2.2总体均值的检验

8.2.3总体比例的检验

8.2.4总体方差的检验

8-27

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS一个总体参数的检验

(第六版)

一个总体

均值比例方差

Z检验t检验Z检验2检验

(单尾和双尾)(单尾和双尾)(单尾和双尾)(单尾和双尾)

8-28

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

总体均值检验

8-29

作者:贾俊平,中国人民大学统计学院

统计学总体均值的检验

STATISTICS

(第六版)(检验统计量)

是是否否

总体是否已知

大大小小

样本量n

用样本标

准差S代替

z检验z检验t检验

8-30

作者:贾俊平,中国人民大学统计学院

统计学总体均值的检验

STATISTICS

22

(第六版)(已知或未知大样本)

1.假定条件

n总体服从正态分布总体服从正态分布

n若不服从正态分布若不服从正态分布,,可用正态分布来近似可用正态分布来近似

((nn30)30)

2.使用Z-统计量

n22已知:已知:

n22未知:未知:

8-31

作者:贾俊平,中国人民大学统计学院

统计学2已知均值的检验

STATISTICS

例题分析

(第六版)()

【【例例】】某某机机床床厂厂加加工工一一种种零零件件,,根根

据据经经验验知知道道,,该该厂厂加加工工零零件件的的椭椭圆圆双侧检验

度度近近似似服服从从正正态态分分布布,,其其总总体体均均值值

为为00=0.081mm=0.081mm,,总总体体标标准准差差为为==

0.0250.025。。今今换换一一种种新新机机床床进进行行加加工工,,

抽抽取取nn=200=200个个零零件件进进行行检检验验,,得得到到的的

椭椭圆圆度度为为0.0760.076mmmm。。试试问问新新机机床床加加

工工零零件件的的椭椭圆圆度度的的均均值值与与以以前前有有无无

显著差异?(显著差异?(==0.050.05))

8-32

作者:贾俊平,中国人民大学统计学院

统计学2已知均值的检验

STATISTICS

(第六版)(例题分析)

HH0::==0.0810.081检验统计量检验统计量::

HH1::0.0810.081

==0.050.05

nn==200200

决策决策::

临界值临界值(s):(s):

在=0.05的水平上拒绝H0

拒绝H0拒绝H0

结论结论:

.025.025:

有有证证据据表表明明新新机机床床加加工工的的零零件件

的椭圆度与以前有显著差异的椭圆度与以前有显著差异

-1.96001.96ZZ

8-33

作者:贾俊平,中国人民大学统计学院

统计学2已知均值的检验

STATISTICS

(第六版)(P值的计算与应用)

第第11步步::进进入入ExcelExcel表表格格界界面面,,选选择择““插插入入””下下拉拉菜菜

单单

第第22步:步:选择选择““函数函数””点击点击

第第33步步::在在函函数数分分类类中中点点击击““统统计计””,,在在函函数数名名的的

菜菜

单下选择字符单下选择字符““NORMSDISTNORMSDIST””然后确定然后确定

第第44步:步:将将ZZ的绝对值的绝对值2.832.83录入,得到的函数值为录入,得到的函数值为

0.9976725370.997672537

PP值值=2(1=2(1--0.997672537)=0.0046540.997672537)=0.004654

8-34

作者:贾俊平,中国人民大学统计学院

PP值远远小于值远远小于,故拒绝,故拒绝HH00

统计学2已知均值的检验

STATISTICS(小样本例题分析)

(第六版)

【例】根据过去大量资料,

某厂生产的灯泡的使用寿命单侧检验

服从正态分布N~(1020,

1002)。现从最近生产的一批

产品中随机抽取16只,测得

样本平均寿命为1080小时。

试在0.05的显著性水平下判

断这批产品的使用寿命是否

有显著提高?(=0.05)

8-35

作者:贾俊平,中国人民大学统计学院

统计学2已知均值的检验

STATISTICS

小样本例题分析

(第六版)()

HH0::10201020检验统计量检验统计量::

HH1::>>10201020

==0.050.05

nn==1616

决策

临界值临界值(s):(s):决策

::

拒绝域在=0.05的水平上拒绝H0

0.05结论结论

有证据表明这批灯泡的使用::

寿命有显著提高

8-36001.645ZZ

作者:贾俊平,中国人民大学统计学院

统计学2未知大样本均值的检验

STATISTICS(例题分析)

(第六版)

【【例例】】某某电电子子元元件件批批量量生生产产的的

质质量量标标准准为为平平均均使使用用寿寿命命12001200单侧检验

小小时时。。某某厂厂宣宣称称他他们们采采用用一一种种

新新工工艺艺生生产产的的元元件件质质量量大大大大超超

过过规规定定标标准准。。为为了了进进行行验验证证,,

随随机机抽抽取取了了100100件件作作为为样样本本,,

测测得得平平均均使使用用寿寿命命12451245小小时时,,

标标准准差差300300小小时时。。能能否否说说该该厂厂

生生产产的的电电子子元元件件质质量量显显著著地地高高

于规定标准?于规定标准?((==0.050.05))

8-37

作者:贾俊平,中国人民大学统计学院

统计学2未知大样本均值的检验

STATISTICS

例题分析

(第六版)()

HH0::12001200检验统计量检验统计量::

HH1::>1200>1200

==0.050.05

nn==100100

临界值临界值(s):(s):决策决策

::

拒绝域在=0.05的水平上不拒绝H0

0.05结论结论

不能认为该厂生产的元件寿命::

显著地高于1200小时

8-38001.645ZZ

作者:贾俊平,中国人民大学统计学院

统计学总体均值的检验

STATISTICS

2

(第六版)(未知小样本)

1.假定条件

n总体为正态分布总体为正态分布

n22未知,且小样本未知,且小样本

2.使用t统计量

8-39

作者:贾俊平,中国人民大学统计学院

统计学2未知小样本均值的检验

STATISTICS

例题分析

(第六版)()

【例】某机器制造出的肥

皂厚度为5cm,今欲了解机双侧检验

器性能是否良好,随机抽

取10块肥皂为样本,测得

平均厚度为5.3cm,标准差

为0.3cm,试以0.05的显著

性水平检验机器性能良好

的假设。

8-40

作者:贾俊平,中国人民大学统计学院

统计学2未知小样本均值的检验

STATISTICS

例题分析

(第六版)()

HH0::==55检验统计量检验统计量::

HH1::55

==0.050.05

dfdf==1010--11==99

临界值临界值(s):(s):决策:决策:

拒绝拒绝

H0H0在在==0.050.05的水平上拒绝的水平上拒绝HH00

.025.025结论:结论:

说明该机器的性能不好说明该机器的性能不好

-2.26202.262tt

8-41

作者:贾俊平,中国人民大学统计学院

统计学2未知小样本均值的检验

STATISTICS

(第六版)(P值的计算与应用)

第第11步步::进进入入ExcelExcel表表格格界界面面,,选选择择““插插入入””下下拉拉菜菜

单单

第第22步步::选选择择““函函数数””点点击击,,并并在在函函数数分分类类中中点点击击

““统统

计计””,然后,在函数名的菜单中选择字符,然后,在函数名的菜单中选择字符

““TDISTTDIST””,,确定确定

第第33步:步:在弹出的在弹出的XX栏中录入计算出的栏中录入计算出的tt值值3.163.16

在自由度在自由度((Deg-freedomDeg-freedom))栏中录入栏中录入99

在在TailsTails栏中录入栏中录入22,表明是双侧检验,表明是双侧检验((单测单测

检验则在该栏内录入检验则在该栏内录入11))

8-42

作者:贾俊平,中国人民大学统计学院

PP值的结果为值的结果为0.01155<0.0250.01155<0.025,,拒绝拒绝HH00

统计学2未知小样本均值的检验

STATISTICS

例题分析

(第六版)()

【【例例】】一一个个汽汽车车轮轮胎胎制制造造商商声声称称,,

某某一一等等级级的的轮轮胎胎的的平平均均寿寿命命在在一一

单侧检验!定定的的汽汽车车重重量量和和正正常常行行驶驶条条件件下下

大大于于4000040000公公里里,,对对一一个个由由2020个个

轮轮胎胎组组成成的的随随机机样样本本作作了了试试验验,,

测测得得平平均均值值为为4100041000公公里里,,标标准准

差差为为50005000公公里里。。已已知知轮轮胎胎寿寿命命的的

公公里里数数服服从从正正态态分分布布,,我我们们能能否否

根根据据这这些些数数据据作作出出结结论论,,该该制制造造

商商的的产产品品同同他他所所说说的的标标准准相相符符??

8-43((==0.050.05))

作者:贾俊平,中国人民大学统计学院

统计学均值的单尾t检验

STATISTICS

(第六版)(计算结果)

HH0::4000040000检验统计量检验统计量::

HH1::<<4000040000

==0.0.0505

dfdf==2020--11==1919

临界值临界值(s):(s):决策决策::

拒绝域

在=0.05的水平上不拒绝H0

.05

结论结论::

不能认为制造商的产品同他所

-1.729100tt说的标准不相符

8-44

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

总体比例的检验

(Z检验)

8-45

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS一个总体比例检验

(第六版)

1.假定条件

n有两类结果有两类结果

n总体服从二项分布总体服从二项分布

n可用正态分布来近似可用正态分布来近似

2.比例检验的Z统计量

0为假设的总体比例

8-46

作者:贾俊平,中国人民大学统计学院

统计学一个总体比例的检验

STATISTICS(例题分析)

(第六版)

【【例例】】一一项项统统计计结结果果声声称称,,

某某市市老老年年人人口口((年年龄龄在在岁岁以以

6565双侧检验

上上))的的比比重重为为14.714.7%%,,该该市市老老

年年人人口口研研究究会会为为了了检检验验该该项项统统

计计是是否否可可靠靠,,随随机机抽抽选选了了400400

名名居居民民,,发发现现其其中中有有5757人人年年龄龄

在在6565岁岁以以上上。。调调查查结结果果是是否否支支

持持该该市市老老年年人人口口比比重重为为14.7%14.7%

的看法?的看法?((==0.050.05))

8-47

作者:贾俊平,中国人民大学统计学院

统计学一个总体比例的检验

STATISTICS

例题分析

(第六版)()

HH0::==14.7%14.7%检验统计量检验统计量::

HH1::14.7%14.7%

==0.050.05

nn==400400

临界值临界值(s):(s):

拒绝拒绝

拒绝H0拒绝H0决策决策::

在的水平上不拒绝

.025.025在=0.05的水平上不拒绝H0

结论结论::

-1.96001.96ZZ该市老年人口比重为14.7%

8-48

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

总体方差的检验

(2检验)

8-49

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS方差的卡方(2)检验

(第六版)

1.检验一个总体的方差或标准差

2.假设总体近似服从正态分布

3.检验统计量

样本方差

假设的总体方差

8-50

作者:贾俊平,中国人民大学统计学院

统计学方差的卡方(2)检验

STATISTICS(例题分析)

(第六版)

【例】某厂商生产出一种新型

0.3-0.4-0.71.4-0.6

的饮料装瓶机器,按设计要求,

该机器装一瓶一升(1000cm3)的-0.3-1.50.6-0.91.3

饮料误差上下不超过1cm3。如-1.30.71-0.50

果达到设计要求,表明机器的-0.60.7-1.5-0.2-1.9

稳定性非常好。现从该机器装-0.51-0.2-0.61.1

完的产品中随机抽取25瓶,分

别进行测定(用样本减

3

1000cm3),得到如下结果。检绿色

绿色

验该机器的性能是否达到设计健康饮品

验该机器的性能是否达到设计健康饮品

要求(=0.05)

双侧检验

8-51双侧检验

作者:贾俊平,中国人民大学统计学院

统计学方差的卡方(2)检验

STATISTICS

(第六版)(例题分析)

22

HH0::==11统计量统计量::

HH1::2211

==0.0.0505

dfdf==2525--11==2424

临界值临界值(s):(s):决策决策::

/2/2=.05=.05在=0.05的水平上不拒绝H0

结论结论::

不能认为该机器的性能未达到

0012.4012.4039.3639.3622设计要求

8-52

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS8.3两个总体参数的检验

(第六版)

8.3.1检验统计量的确定

8.3.2两个总体均值之差的检验

8.3.3两个总体比例之差的检验

8.3.4两个总体方差比的检验

8.3.5检验中的匹配样本

8-53

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS两个正态总体参数的检验

(第六版)

两个总体的检验

均值比例方差

独立样本独立样本配对样本配对样本

Z检验t检验t检验

Z检验F检验

(大样本(小样本(小样本

)))

8-54

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

独立样本总体均值之差的检验

8-55

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

22

(第六版)(1、2已知)

1.1.假定条件假定条件

n两个样本是独立的随机样本

n两个总体都是正态分布

n若不是正态分布,可以用正态分布来近似(n130

和n230)

2.检验统计量为检验统计量为

8-56

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

(第六版)(假设的形式)

研究的问题

假设

没有差异均值1均值2均值1均值2

有差异均值1<均值2均值1>均值2

H011––22==0011––220011––2200

H111––220011––22<<0011––22>>00

8-57

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

(第六版)(例题分析)

【【例例】】有有两两种种方方法法可可用用于于制制造造某某种种以以

抗抗拉拉强强度度为为重重要要特特征征的的产产品品。。根根据据以以双侧检验!

往往的的资资料料得得知知,,第第一一种种方方法法生生产产出出的的

产产品品其其抗抗拉拉强强度度的的标标准准差差为为88公公斤斤,,

第第二二种种方方法法的的标标准准差差为为1010公公斤斤。。从从两两

种种方方法法生生产产的的产产品品中中各各抽抽取取一一个个随随机机

样样本本,,样样本本量量分分别别为为nn11=32=32,,nn22=40=40,,

测测得得xx11==5050公公斤斤,,xx22==4444公公斤斤。。问问这这

两两种种方方法法生生产产的的产产品品平平均均抗抗拉拉强强度度是是

否有显著差别?否有显著差别?((==0.050.05))

8-58

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

例题分析

(第六版)()

HH0::11--22==00检验统计量检验统计量::

HH1::11--2200

==0.050.05

nn1==3232,,nn2==4040

临界值临界值(s):(s):决策决策::

在=0.05的水平上拒绝H

拒绝H0拒绝H00

.025.025结论结论::

有证据表明两种方法生产的产

-1.96001.96ZZ品其抗拉强度有显著差异

8-59

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

22

(第六版)(1、2未知且不相等,小样本)

1.检验具有不等方差的两个总体的均值检验具有不等方差的两个总体的均值

2.假定假定条件条件

n两个样本是独立的随机样本

n两个总体都是正态分布

22

n两个总体方差未知且不相等1=2

3.检验检验统计量统计量

其中:其中:

8-60

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

22

(第六版)(1、2未知但相等,小样本)

1.检验具有等方差的两个总体的均值检验具有等方差的两个总体的均值

2.假定假定条件条件

n两个样本是独立的随机样本

n两个总体都是正态分布

22

n两个总体方差未知但相等12

3.检验检验统计量统计量

8-61

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

例题分析

(第六版)()

【【例例】】““多多吃吃谷谷物物,,将将有有助助于于

减减肥肥。。””为为了了验验证证这这个个假假设设,,随随单侧检验

机机抽抽取取了了3535人人,,询询问问他他们们早早餐餐和和

午午餐餐的的通通常常食食谱谱,,根根据据他他们们的的食食

谱谱,,将将其其分分为为二二类类,,一一类类为为经经常常

的的谷谷类类食食用用者者((总总体体11)),,一一类类为为

非非经经常常谷谷类类食食用用者者((总总体体22))。。然然

后后测测度度每每人人午午餐餐的的大大卡卡摄摄取取量量。。

经经过过一一段段时时间间的的实实验验,,得得到到如如下下

结果:检验该假设结果:检验该假设((==0.050.05))

8-62

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

例题分析用统计量进行检验

(第六版)(—)

HH0::11--2200检验统计量检验统计量::

HH1::11--22<<00

==0.050.05

nn1==1515,,nn2==2020

临界值临界值(s):(s):决策决策::

拒绝域在=0.05的水平上拒绝H0

.05结论结论::

没有证据表明多吃谷物将有助

-1.69400tt于减肥

8-63

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

例题分析用进行检验

(第六版)(—Excel)

第第11步步::选选择择““工工具具””下下拉拉菜菜单单,,并并选选择择““数数据据分分析析””

选项选项

第第22步:步:选择选择““tt检验,双样本异方差假设检验,双样本异方差假设””

第第33步:步:当出现对话框后当出现对话框后

在在““变量变量11的区域的区域””方框内键入方框内键入数据区域数据区域

在在““变量变量22的区域的区域””方框内键入方框内键入数据区域数据区域

在在““假设平均差假设平均差””的方框内键入的方框内键入00

在在““αα(A)(A)””框内键入框内键入0.050.05

在在““输出选项输出选项””中选择输出区域中选择输出区域

选择选择““确定确定””

8-64

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

两个匹配(或配对)样本的均值检验

8-65

作者:贾俊平,中国人民大学统计学院

统计学两个总体均值之差的检验

STATISTICS

匹配样本的检验

(第六版)(t)

1.检验两个总体的均值

n配对或匹配配对或匹配

n重复测量重复测量((前前//后后))

3.假定条件

n两个总体都服从正态分布两个总体都服从正态分布

n如果不服从正态分布,可用正态分布来近如果不服从正态分布,可用正态分布来近

似似((nn113030,,nn223030))

8-66

作者:贾俊平,中国人民大学统计学院

统计学匹配样本的t检验

STATISTICS

(第六版)(假设的形式)

研究的问题

假设没有差异总体1总体2总体1总体2

有差异总体1<总体2总体1>总体2

H0mmDD==00mmDD00mmDD00

H1mmDD00mmDD<<00mmDD>>00

注:Dii=X1ii-X2ii,对第i对观察值

8-67

作者:贾俊平,中国人民大学统计学院

统计学匹配样本的t检验

STATISTICS

(第六版)(数据形式)

观察序号样本1样本2差值

1x11x21D1=x11-x21

2x12x22D1=x12-x22

MMMM

ix1ix2iD1=x1i-x2i

MMMM

nx1nx2nD1=x1n-x2n

8-68

作者:贾俊平,中国人民大学统计学院

统计学匹配样本的t检验

STATISTICS

(第六版)(检验统计量)

统计量统计量

D0:假设的差值

自由度df=nD-1

样本差值均值样本差值均值样本差值标准差样本差值标准差

8-69

作者:贾俊平,中国人民大学统计学院

统计学匹配样本的t检验

STATISTICS

(第六版)(例题分析)

【【例例】】一一个个以以减减肥肥为为主主要要目目标标的的健健美美俱俱乐乐部部声声称称,,

参参加加其其训训练练班班至至少少可可以以使使减减肥肥者者平平均均体体重重减减重重

8.58.5kgkg以以上上。。为为了了验验证证该该宣宣称称是是否否可可信信,,调调查查人人员员

随随机机抽抽取取了了1010名名参参加加者者,,得得到到他他们们的的体体重重记记录录如如下下

表:表:

训练前94.5101110103.59788.596.5101104116.5

训练后8589.5101.5968680.58793.593102

在在==0.050.05的显著性水平下,调查结果是否支持该的显著性水平下,调查结果是否支持该

俱乐部的声称?俱乐部的声称?

单侧检验

8-70

作者:贾俊平,中国人民大学统计学院

统计学配对样本的t检验

STATISTICS

(第六版)(例题分析)

样本差值计算表

训练前训练后差值Di

94.5859.5

10189.511.5

110101.58.5

103.5967.5

978611

88.580.58

96.5879.5

10193.57.5

1049311

116.510214.5

合计—98.5

8-71

作者:贾俊平,中国人民大学统计学院

统计学配对样本的t检验

STATISTICS

(第六版)(例题分析)

差值均值差值均值

差值标准差差值标准差

8-72

作者:贾俊平,中国人民大学统计学院

统计学配对样本的t检验

STATISTICS

(第六版)(例题分析)

HH0::mm11––mm228.58.5检验统计量检验统计量::

HH1::mm11––mm22<<8.58.5

aa==0.050.05

dfdf==1010--11==99

决策决策::

临界值临界值(s):(s):

在的水平上不拒绝

拒绝域在=0.05的水平上不拒绝H0

.05结论结论::

不能认为该俱乐部的宣称不可信

-1.83300tt

8-73

作者:贾俊平,中国人民大学统计学院

统计学配对样本的t检验

STATISTICS

(第六版)(例题分析—用Excel进行检验)

第第11步:步:选择选择““工具工具””

第第22步:步:选择选择““数据分析数据分析””选项选项

第第33步步::在在分分析析工工具具中中选选择择““tt检检验验::平平均均值值的的成成对对二二

样本分析样本分析””

第第44步:步:当出现对话框后当出现对话框后

在在““变量变量11的区域的区域””方框内键入方框内键入数据区域数据区域

在在““变量变量22的区域的区域””方框内键入方框内键入数据区域数据区域

在在““假设平均差假设平均差””方框内键入方框内键入8.58.5

显显著性水平保持默著性水平保持默认值认值

8-74

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS

(第六版)

两个总体比例之差的检验

8-75

作者:贾俊平,中国人民大学统计学院

统计学

STATISTICS两个总体比例之差的Z检验

(第六版)

1.假定条件

n两个总体是独立的两个总体是独立的

n两个两个总体都服从二项分布总体都服从二项分布

n可以用正态分布来近似可以用正态分布来近似

2.检验统计量

8-76

作者:贾俊平,中国人民大学统计学院

统计学两个总体比例之差的检验

STATISTICS

(第六版)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论