![统计学分布及假设检验_第1页](http://file4.renrendoc.com/view/b552fec5e59ae315b0e14e1928cd54c8/b552fec5e59ae315b0e14e1928cd54c81.gif)
![统计学分布及假设检验_第2页](http://file4.renrendoc.com/view/b552fec5e59ae315b0e14e1928cd54c8/b552fec5e59ae315b0e14e1928cd54c82.gif)
![统计学分布及假设检验_第3页](http://file4.renrendoc.com/view/b552fec5e59ae315b0e14e1928cd54c8/b552fec5e59ae315b0e14e1928cd54c83.gif)
![统计学分布及假设检验_第4页](http://file4.renrendoc.com/view/b552fec5e59ae315b0e14e1928cd54c8/b552fec5e59ae315b0e14e1928cd54c84.gif)
![统计学分布及假设检验_第5页](http://file4.renrendoc.com/view/b552fec5e59ae315b0e14e1928cd54c8/b552fec5e59ae315b0e14e1928cd54c85.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学分布及假设检验第一页,共七十七页,2022年,8月28日正态分布第二页,共七十七页,2022年,8月28日
正态分布是最常见最重要的一种分布,例如测量误差;人的生理特征尺寸如身高、体重等;正常情况下生产的产品尺寸:直径、长度、重量高度等都近似服从正态分布.正态分布的应用与背景
第三页,共七十七页,2022年,8月28日
记为分布定义:设
相互独立,都服从正态分布N(0,1),则称随机变量:
所服从的分布为自由度为
n
的分布.第四页,共七十七页,2022年,8月28日一般其中,在x>0时收敛,称为函数的密度函数为自由度为
n的n=2n=3n=5n=10n=15第五页,共七十七页,2022年,8月28日t
分布(Student分布)定义则称T服从自由度为n
的t分布.记为其密度函数为X,Y相互独立,设t
分布第六页,共七十七页,2022年,8月28日t分布的性质1°fn(t)是偶函数,性质n=1n=20t分布的图形(红色的是标准正态分布)第七页,共七十七页,2022年,8月28日F分布
定义若X~2(n1),Y~2(n2),X,Y相互独立,则称随机变量为第一自由度为n1,第二自由度为n2的F分布(或自由度为),其概率密度为第八页,共七十七页,2022年,8月28日第1章假设检验§1.1假设检验的基本问题§1.2一个正态总体参数的检验第九页,共七十七页,2022年,8月28日学习目标了解假设检验的基本思想掌握假设检验的步骤对实际问题作假设检验第十页,共七十七页,2022年,8月28日根据样本的信息检验关于总体的某个命题是否正确.有参数假设检验和非参数假设检验这类问题称作假设检验问题.基本概念§1.1
假设检验的基本问题第十一页,共七十七页,2022年,8月28日假设检验的步骤提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策第十二页,共七十七页,2022年,8月28日提出原假设和备择假设什么是原假设?(nullhypothesis)待检验的假设,又称“0假设”研究者想收集证据予以反对的假设3. 表示为H0H0:
某一数值指定为=号,即或例如,H0:
3190(克)为什么叫0假设?第十三页,共七十七页,2022年,8月28日什么是备择假设?(alternativehypothesis)与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号:
,
或表示为H1H1:
<某一数值,或某一数值例如,H1:
<3910(克),或3910(克)提出原假设和备择假设第十四页,共七十七页,2022年,8月28日什么是检验统计量?1. 用于假设检验决策的统计量2. 选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为确定适当的检验统计量第十五页,共七十七页,2022年,8月28日规定显著性水平
(significantlevel)什么显著性水平?1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 表示为(alpha)常用的值有0.01,0.05,0.104. 由研究者事先确定第十六页,共七十七页,2022年,8月28日作出统计决策计算检验的统计量根据给定的显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较得出拒绝或不拒绝原假设的结论第十七页,共七十七页,2022年,8月28日双侧检验与单侧检验
(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0m=m0m
m0m
m0H1m≠m0m<m0m>m0第十八页,共七十七页,2022年,8月28日单侧检验
(原假设与备择假设的确定)将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想证明供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致将研究者想收集证据证明其不正确的假设作为原假设H0先确立备择假设H1第十九页,共七十七页,2022年,8月28日单侧检验
(原假设与备择假设的确定)一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“>”(寿命延长)建立的原假设与备择假设应为
H0:
1500H1:
1500第二十页,共七十七页,2022年,8月28日双侧检验
(显著性水平与拒绝域)H0值临界值临界值a/2a/2
样本统计量拒绝域拒绝域抽样分布1-置信水平第二十一页,共七十七页,2022年,8月28日左侧检验
(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-置信水平观察到的样本统计量第二十二页,共七十七页,2022年,8月28日右侧检验
(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-置信水平观察到的样本统计量第二十三页,共七十七页,2022年,8月28日§1.2一个正态总体参数的检验1.总体均值的检验2.总体比例的检验3.总体方差的检验第二十四页,共七十七页,2022年,8月28日一个总体参数的检验Z检验(单尾和双尾)
t检验(单尾和双尾)Z检验(单尾和双尾)
2检验(单尾和双尾)均值一个总体比例方差第二十五页,共七十七页,2022年,8月28日总体均值的检验
(检验统计量)总体是否已知?用样本标准差S代替
t检验小样本容量n否是z检验
z检验大第二十六页,共七十七页,2022年,8月28日总体均值的检验
(2
已知或2未知大样本)1. 假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)使用Z-统计量2
已知:2
未知:第二十七页,共七十七页,2022年,8月28日2
已知均值的检验
(例题分析)【例】已知某种玉米平均穗重u0=300g,标准差=9.5g。喷施某种植物生长调节剂后,随机抽取9个果穗,重量分别308,305,311,298,315,300,321,294,320(g)。问这种调节剂对果穗重量是否有影响?(=0.05)第二十八页,共七十七页,2022年,8月28日2
已知均值的检验
(例题分析)H0:=300gH1:
300g
=0.05n=9临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:
在
=0.05的水平上拒绝H0认为喷施调节剂能够显著增加玉米果穗的重量第二十九页,共七十七页,2022年,8月28日2
未知大样本均值的检验
(例题分析)【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验第三十页,共七十七页,2022年,8月28日2
未知大样本均值的检验
(例题分析)H0:
1200H1:
>1200=0.05n=100临界值(s):检验统计量:在
=0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:Z0拒绝域0.051.645第三十一页,共七十七页,2022年,8月28日总体均值的检验
(2未知小样本)1. 假定条件总体为正态分布2未知,且小样本2. 使用t
统计量第三十二页,共七十七页,2022年,8月28日2
未知小样本均值的检验
(例题分析)【例】某鱼塘水中的含氧量多年平均为4.5mg/L。现在该鱼塘设10个点采集水样,测定水中含氧量分别为:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L)。试检验该次抽样测定的水中含氧量与多年平均值有无显著差别?
双侧检验第三十三页,共七十七页,2022年,8月28日2
未知小样本均值的检验
(例题分析)H0:=4.5H1:
4.5=0.05df=10-1=9临界值(s):检验统计量:在=0.05的水平上接受H0认为该次抽样测定的含氧量与多年平均含氧量没有显著差别。决策:结论:t02.262-2.262.025拒绝H0拒绝H0.025第三十四页,共七十七页,2022年,8月28日在R软件中,函数t.test()提供了t检验的功能,使用格式如下:t.test(x,y=NULL,alternative=c("two.sided","less","greater"),mu=0,paired=FALSE,var.equal=FALSE,conf.level=1-α)其中x,y是由数据构成的向量(如果只提供x,则作单个正态总体的均值检验,否则作两个总体的均值检验);alternative表示备择假设,less表示单边检验(H1:u<u0);mu表示原假设u0;var.equal=FALSE表示认为两总体方差不同,conf.level是置信水平,通常是0.95,即α=0.05第三十五页,共七十七页,2022年,8月28日总体比例的检验
(Z
检验)第三十六页,共七十七页,2022年,8月28日一个总体比例检验假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的Z统计量p0为假设的总体比例第三十七页,共七十七页,2022年,8月28日一个总体比例的检验
(例题分析)【例】有一批蔬菜种子的平均发芽率p0=0.85。现随机抽取500粒种子,用种衣剂进行浸种处理,结果445粒发芽。试检验种衣剂对种子发芽有无效果?双侧检验第三十八页,共七十七页,2022年,8月28日一个总体比例的检验
(例题分析)H0:p=0.85H1:
p
0.85=0.05n=
500临界值(s):检验统计量:在
=0.05的水平上拒绝H0种衣剂对种子发芽率有显著提高的效果(0.89>0.85)决策:结论:Z01.96-1.96.025拒绝H0拒绝H0.025第三十九页,共七十七页,2022年,8月28日方差的卡方(2)检验检验一个总体的方差或标准差假设总体近似服从正态分布检验统计量样本方差假设的总体方差第四十页,共七十七页,2022年,8月28日方差的卡方(2)检验
(例题分析)【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求(=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1双侧检验第四十一页,共七十七页,2022年,8月28日方差的卡方(2)检验
(例题分析)H0:2=1H1:2
1=0.05df=25-1=24临界值(s):统计量:
在
=0.05的水平上不拒绝H0不能认为该机器的性能未达到设计要求
2039.3612.40
/2=.05决策:结论:第四十二页,共七十七页,2022年,8月28日§1.3两个正态总体参数的检验检验统计量的确定两个总体均值之差的检验两个总体比例之差的检验两个总体方差比的检验检验中的匹配样本第四十三页,共七十七页,2022年,8月28日两个正态总体参数的检验两个总体的检验Z
检验(大样本)t
检验(小样本)t
检验(小样本)Z检验F
检验独立样本配对样本均值比例方差第四十四页,共七十七页,2022年,8月28日独立样本总体均值之差的检验第四十五页,共七十七页,2022年,8月28日两个独立样本之差的抽样分布
m1s1总体1s2
m2总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1-m2抽样分布第四十六页,共七十七页,2022年,8月28日两个总体均值之差的检验
(12、22
已知)1. 假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230)检验统计量为第四十七页,共七十七页,2022年,8月28日两个总体均值之差的检验
(假设的形式)假设研究的问题没有差异有差异均值1均值2均值1<均值2均值1均值2均值1>均值2H0
1–2=0
1–20
1–20H1
1–20
1–2<0
1–2>0第四十八页,共七十七页,2022年,8月28日两个总体均值之差的检验
(例题分析)
【例】现用甲、乙两种发酵法生产青霉素,其产品收率的方差分别为
=0.46(g/L)2,=0.37(g/L)2。现甲方法测得25个数据,=3.71g/L;乙方法测得30个数据,=3.46g/L。问甲、乙两种方法的收率是否相同?(=0.05)第四十九页,共七十七页,2022年,8月28日两个总体均值之差的检验
(例题分析)H0:1-2=0H1:1-2
0=0.05n1=25,n2
=
30临界值(s):检验统计量:决策:结论:
在=0.05的水平上接受H0甲、乙两种方法的收率相同,没有显著差异Z01.96-1.96.025拒绝H0拒绝H0.025第五十页,共七十七页,2022年,8月28日两个总体均值之差的检验
(12、22
未知且相等,小样本)检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知且相等12=22检验统计量其中:第五十一页,共七十七页,2022年,8月28日两个总体均值之差的检验
(12、22未知但不相等,小样本)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但不相等12=22检验统计量(n1≠n2,用近似的t检验)第五十二页,共七十七页,2022年,8月28日当n1=n2=n时,仍可用t检验法,其计算也与两个总体方差相等的情况一样,只是自由度df=n-1当n1≠n2时,其自由度df计算方式如下:第五十三页,共七十七页,2022年,8月28日两个总体均值之差的检验
(例题分析)【例】用高蛋白和低蛋白两种饲料饲料1月龄大白鼠,在3个月时,测定两组大白鼠的增重量(g),
两组数据如下:高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123低蛋白组:70,118,101,85,107,132,94试问两种饲料饲养的大白鼠增重量是否有差别?第五十四页,共七十七页,2022年,8月28日两个总体均值之差的检验
(该题由后面的F检验可以得出两总体方差相等)H0:
1-2
=
0H1:1-2
≠0=
0.05n1=12,n2
=
7临界值(s):检验统计量:决策:结论:
在=0.05的水平上接受H0认为两种饲料饲养的大白鼠增重量没有显著差别Z01.96-1.96.025拒绝H0拒绝H0.025第五十五页,共七十七页,2022年,8月28日两个总体均值之差的检验
(匹配样本的t
检验)1. 检验两个总体的均值配对或匹配重复测量(前/后)2. 假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1
30,n230)第五十六页,共七十七页,2022年,8月28日匹配样本的t
检验
(假设的形式)假设研究的问题没有差异有差异总体1总体2总体1<总体2总体1总体2总体1>总体2H0mD=0mD0mD0H1mD0mD<0mD>0注:Di=X1i-X2i
,对第i对观察值第五十七页,共七十七页,2022年,8月28日匹配样本的t
检验
(数据形式)
观察序号样本1样本2差值1x11x21D1=x11-x212x12x22D1=x12-x22MMMMix1ix2iD1=x1i-x2iMMMMnx1nx2nD1=x1n-x2n第五十八页,共七十七页,2022年,8月28日匹配样本的t
检验
(检验统计量)样本差值均值样本差值标准差自由度df=nD-1统计量D0:假设的差值第五十九页,共七十七页,2022年,8月28日【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:匹配样本的t
检验
(例题分析)在
=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前94.5101110103.59788.596.5101104116.5训练后8589.5101.5968680.58793.593102单侧检验第六十页,共七十七页,2022年,8月28日样本差值计算表训练前训练后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计—98.5配对样本的t
检验
(例题分析)第六十一页,共七十七页,2022年,8月28日配对样本的t
检验
(例题分析)差值均值差值标准差第六十二页,共七十七页,2022年,8月28日H0:
m1–m2
8.5H1:
m1–m2
<8.5a=0.05df=
10-1=9临界值(s):检验统计量:决策:结论:
在
=0.05的水平上不拒绝H0不能认为该俱乐部的宣称不可信配对样本的t
检验
(例题分析)-1.833t0拒绝域.05第六十三页,共七十七页,2022年,8月28日两个总体比例之差的检验第六十四页,共七十七页,2022年,8月28日1. 假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似检验统计量两个总体比例之差的Z检验第六十五页,共七十七页,2022年,8月28日两个总体比例之差的检验
(假设的形式)假设研究的问题没有差异有差异比例1≥比例2比例1<比例2总体1≤比例2总体1>比例2H0P1–P2=0P1–P20P1–P20H1P1–P20P1–P2<0P1–P2>0第六十六页,共七十七页,2022年,8月28日两个总体比例之差的Z检验
(例题分析)
【例】现研究地势对小麦锈病发病率的影响。调查低洼地麦田378株,其中锈病株342株;调查高坡地麦田396株,其中锈病株313株。比较两块地麦田锈病发病率是否有显著性差异?第六十七页,共七十七页,2022年,8月28日两个总体比例之差的Z检验
(例题分析)H0:P1-P2
=0H1:P1-P2
≠0=0.05n1=378,n2
=
396临界值(s):检验统计量:决策:结论:
在
=0.05的水平上拒绝H0低洼地麦田锈病发病率显著高于高坡地麦田Z01.96-1.96.025拒绝H0拒绝H0.025第六十八页,共七十七页,2022年,8月28日两个总体方差比的检验
(F
检验)假定条件两个总体都服从正态分布两个独立的随机样本假定形式H0:s12=s22
或H0:s12
s22
(或
)H1:s12
s22H1:s12
<s22
(或>)检验统计量F=S12/S22~F(n1–1,n2–1)第六十九页,共七十七页,2022年,8月28日两个总体均值之差的检验
(例题分析)【例】用高蛋白和低蛋白两种饲料饲料1月龄大白鼠,在3个月时,测定两组大白鼠的增重量(g),
两组数据如下:高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123低蛋白组:70,118,101,85,107,132,94试问这两个总体的方差是否有显著差异?第七十页,共七十七页,2022年,8月28日两个总体方差的F
检验
(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025物业工程部的工作要点计划月历表范文(28篇)
- 智慧农业创新趋势与投资策略研究
- 中级经济师金融专业-中级经济师考试金融专业实务模拟试卷1
- 2025至2030年中国玻璃果酱瓶数据监测研究报告
- 2024年两种人考试(不含带电作业)复习测试卷含答案
- 2025年中国3-甲氧基-2-硝基吡啶市场调查研究报告
- 2025至2031年中国跳舞灯行业投资前景及策略咨询研究报告
- 2025至2030年中国铁饼推车数据监测研究报告
- 2025至2030年中国聚酯瓶吹瓶机数据监测研究报告
- 2025至2030年中国精密零部件自动检测与分选设备数据监测研究报告
- 二零二五年度大型自动化设备买卖合同模板2篇
- 江西省部分学校2024-2025学年高三上学期1月期末英语试题(含解析无听力音频有听力原文)
- GA/T 2145-2024法庭科学涉火案件物证检验实验室建设技术规范
- 2025内蒙古汇能煤化工限公司招聘300人高频重点提升(共500题)附带答案详解
- 2025年中国融通资产管理集团限公司春季招聘(511人)高频重点提升(共500题)附带答案详解
- 宠物护理行业客户回访制度构建
- 电厂检修管理
- 《SPIN销售法课件》课件
- 机动车属性鉴定申请书
- 2024年中考语文试题分类汇编:非连续性文本阅读(学生版)
- 2024年度窑炉施工协议详例细则版B版
评论
0/150
提交评论