统计估计和假设检定_第1页
统计估计和假设检定_第2页
统计估计和假设检定_第3页
统计估计和假设检定_第4页
统计估计和假设检定_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计估计和假设检定1第1页,共77页,2023年,2月20日,星期六重点内容统计估计的原理假设检定的逻辑假设检定的程序假设检定的三种方式2第2页,共77页,2023年,2月20日,星期六一、中央极限定理

(centrallimittheorem)样本平均数的抽样分配(samplingdistributionofsamplemeans)样本平均数的平均数(TheMeanoftheSamplingDistributionofMeans,)3第3页,共77页,2023年,2月20日,星期六标准误(,standarderror):样本平均数抽样分配的标准差4第4页,共77页,2023年,2月20日,星期六中央极限定理:自某一母体中抽样,假定所有样本数为N的样本都被抽出来(也就是有K套样本)并计算其平均数(),在样本数够大的情况下,这K个样本平均数会形成常态分配,而且这些样本平均数的平均数()会等於母体平均数(),这些样本平均数的标准差(标准误)会等於

5第5页,共77页,2023年,2月20日,星期六中央极限定理:6第6页,共77页,2023年,2月20日,星期六中央极限定理提供了推论统计的理论基础这个定理适用於任何形态的分配样本平均数的平均数会等於母体平均数7第7页,共77页,2023年,2月20日,星期六标准误会比母体标准差来得小标准误是与样本数的大小成反比的关系8第8页,共77页,2023年,2月20日,星期六二、信赖区间与统计估计统计估计可分为点估计(pointestimate)信赖区间(confidenceinterval)估计9第9页,共77页,2023年,2月20日,星期六区间估计的逻辑是以机率抽样方法自母体抽取一个样本,计算其平均数,依照所要的信心水准,将加减K个而得到上下区间。10第10页,共77页,2023年,2月20日,星期六信赖区间就是区间的宽度,通常也称为抽样误差(samplingerror)11第11页,共77页,2023年,2月20日,星期六例1:随机抽样1000位北京男性市民后,样本平均身高为172公分,样本标准差为30公分,在95%的信心水准下,北京男性市民的平均身高为何?12第12页,共77页,2023年,2月20日,星期六95%信赖区间13第13页,共77页,2023年,2月20日,星期六(续-信赖区间)这就表示在95%的信心水准下,北京男性市民的平均身高是在170.14与173.86公分之间,其抽样误差为公分14第14页,共77页,2023年,2月20日,星期六99%信赖区间15第15页,共77页,2023年,2月20日,星期六(续-信赖区间)这就表示在99%的信心水准下,北京男性市民的平均身高是在169.55与174.45公分之间,其抽样误差为公分16第16页,共77页,2023年,2月20日,星期六一般对这信赖区间的解释是,我们有95%的信心,在这个区间中会包含着母体平均数。17第17页,共77页,2023年,2月20日,星期六真正意乂是:如果连续抽样100次,每次都建立一个信赖区间,所谓95%信赖区间是指这100个信赖区间中,会有95个区间会正确地包含着母体平均数,约有五个不包含着18第18页,共77页,2023年,2月20日,星期六例2:美国某家医院随机抽样1024个案例,其平均医疗费用为$810,样本标准差为$64建构90%的信赖区间建构95%的信赖区间建构99%的信赖区间19第19页,共77页,2023年,2月20日,星期六因此,区间估计的逻辑是以机率抽样方法自母体抽取一个样本,计算其平均数,依照所要的信心水准,加减K个所得到上下区间20第20页,共77页,2023年,2月20日,星期六

95%和99%就是“信心水准”就是抽样误差信心水准愈高,信赖区间也就愈宽,但太宽的信赖区间会使之失去实际的效用

21第21页,共77页,2023年,2月20日,星期六值:代表“不包含”母体特性的机率,也就是结论是错误的机率。又称为显著程度(significancelevel)在95%的信心水准下,

=1–0.95=0.05

在99%的信心水准下,

=1–0.99=0.0122第22页,共77页,2023年,2月20日,星期六“判别值”(criticalvalue):与值相对应的z

值95%信赖区间的判别值:99%信赖区间的判别值:23第23页,共77页,2023年,2月20日,星期六上述的信赖区间也可以t分数来建构:信赖区间24第24页,共77页,2023年,2月20日,星期六以t分数来建构信赖区间:例1:设N=1000,=.05例2:设N=16,=.0525第25页,共77页,2023年,2月20日,星期六一个控制抽样误差的方法是从样本数着手但是,当样本数超过一定数目后,标准误减少得很有限,抽样成本会随着样本数增大

26第26页,共77页,2023年,2月20日,星期六三、假设检定统计估计:估计母体参数假设检定:假设母体参数为某值,再以样本资料来检证这项假定是否为真27第27页,共77页,2023年,2月20日,星期六例3:某厂商要测试所生产的盒装果汁容量是否是16oz取样1024盒并计算平均数这平均数等於16的机率很低(15.99,16.01,16.1,16.2,)如果样本标准差=1.6,样本平均数=16.2厂商的结论为何?28第28页,共77页,2023年,2月20日,星期六假设检定的2种类型选用何种检定方法要考虑的三个因素:样本的个数和类型,样本的规模,变量的测量尺度29第29页,共77页,2023年,2月20日,星期六1、参数检定:Z、t检验(样本随机、正态分布、定距层级)

F检验(样本随机、有一个变量是定距层级的,各子总体正态分布且具有相等的方差)2、非参数检定:卡方检验(两个变量均为定类,样本随机)30第30页,共77页,2023年,2月20日,星期六(定距层次的变量)假设检定的三种方法:信赖区间检定法z分数(或t分数)检定法p值检定法31第31页,共77页,2023年,2月20日,星期六假设检定的程序:1)设立假设2)决定显著程度(α)3)设立决定规则4)计算检定数据5)结论32第32页,共77页,2023年,2月20日,星期六1.双尾检定:信赖区间检定法1)设立假设:虚无假设〔nullhypothesis〕:假定变数间没有任何关系或是假定样本观察值与母体参数间没有差别对立假设(alternativehypothesis):假定变数间有关系或是假定样本观察值与母体参数间有差别33第33页,共77页,2023年,2月20日,星期六:盒装果汁容量为16oz:盒装果汁容量不是16oz34第34页,共77页,2023年,2月20日,星期六2)决定显著程度(α):通常为.05或.01在检定虚无假设时:拒绝虚无假设:即认为样本观察值与母体参数间,存在着统计上显著的差别(statisticallysignificantdifference)不拒绝虚无假设:即认为样本观察值与母体参数间,没有统计上显著的差别(statisticallyinsignificant)35第35页,共77页,2023年,2月20日,星期六虚无假设事实上是对的(Right)错的(fAlse)决定不拒绝虚无假设(Accept)正确的决定(第二型错误):不拒绝错的H0的机率(AA)拒绝虚无假设(Reject)(第一型错误):拒绝对的H0的机率(RR)正确的决定假设检定的两种错误类型表

36第36页,共77页,2023年,2月20日,星期六()就是前述的信心水准,而就是显著程度(significancelevel)所以当为0.05时,信心水准为95%;当为0.01时,信心水准为99%37第37页,共77页,2023年,2月20日,星期六3)设立决定规则(信赖区间检定法)如果样本值在估计区间内,我们就无法拒绝虚无假设如果样本值在估计区间外,我们就拒绝虚无假设38第38页,共77页,2023年,2月20日,星期六4)计算检定数据如

α=.05

16-.098<<16+.098

15.902<<16.09839第39页,共77页,2023年,2月20日,星期六5)结论因为样本观察值为16.2,落在估计区间外,依照上述的决定规则,我们拒绝虚无假设(统计上显著)。盒装果汁容量不是16oz40第40页,共77页,2023年,2月20日,星期六信赖区间检定法的逻辑是:如果母体的平均数等於,则所观测到的样本平均数应非常接近。因此,我们可以假定的母体的平均数来建构信赖区间,在一定的信心水准下(如95%),如果所观测到的样本值落在估计区间内,我们就无法拒绝虚无假设,表示样本观察值与母体参数间,没有统计上显著的差别41第41页,共77页,2023年,2月20日,星期六以样本平均数建立信赖区间1)设立假设:盒装果汁容量为16oz:盒装果汁容量不是16oz42第42页,共77页,2023年,2月20日,星期六3)设立决定规则(信赖区间检定法)如果母体平均值在估计区间内,我们就无法拒绝虚无假设如果母体平均值在估计区间外,我们就拒绝虚无假设43第43页,共77页,2023年,2月20日,星期六如

α=.0516.2-.098<<16.2+.098

16.102

<<16.29844第44页,共77页,2023年,2月20日,星期六结论(以样本平均数建立信赖区间)因为假定的母体平均数为16,在估计区间外,依照上述的决定规则,我们拒绝虚无假设(统计上显著)。盒装果汁容量不是16oz45第45页,共77页,2023年,2月20日,星期六以样本平均数建立信赖区间检定的逻辑是:我们可以样本平均数来建构信赖区间,在一定的信心水准下(如95%),如果假定的母体平均数在估计区间内,我们就无法拒绝虚无假设,表示样本观察值与母体参数间,没有统计上显著的差别46第46页,共77页,2023年,2月20日,星期六即统计上不显著,无法拒绝H0

,或

统计上显著, 拒绝H047第47页,共77页,2023年,2月20日,星期六例4:某厂商要测试所生产的铁圈直径是否是4公分。如果样本数为1024,样本平均数为3.97,样本标准差为.16厂商的结论为何?48第48页,共77页,2023年,2月20日,星期六1)设立假设::铁圈直径是4 公分:铁圈直径不 是4公分49第49页,共77页,2023年,2月20日,星期六2)决定显著程度:α=.013)设立决定规则:如果假定的母体平均数在估计区间内,我们就无法拒绝虚无假设如果假定的母体平均数在估计区间外,我们就拒绝虚无假设50第50页,共77页,2023年,2月20日,星期六4)计算检定数据(样本平均数)51第51页,共77页,2023年,2月20日,星期六5)结论因为假定的母体平均数为4,在估计区间外,依照上述的决定规则,我们拒绝虚无假设(统计上显著)。铁圈直径不是4公分52第52页,共77页,2023年,2月20日,星期六(铁圈例子)如果显著程度为α=.05,厂商的结论为何?(以样本平均数)信赖区间:3.96–3.9853第53页,共77页,2023年,2月20日,星期六如果=.01时,我们拒绝虚无假设(统计上显著),则

=.05时,我们必然拒绝虚无假设,反之不必然54第54页,共77页,2023年,2月20日,星期六(铁圈例子)如果样本数为16,厂商的结论为何?55第55页,共77页,2023年,2月20日,星期六(盒装果汁例子)1)设立假设:盒装果汁容量为16oz:盒装果汁容量不是16oz2)决定显著程度(α):2.双尾检定:z分数(或t分数)检定56第56页,共77页,2023年,2月20日,星期六3)设立决定规则:(判别值)如统计上显著如统计上不显著57第57页,共77页,2023年,2月20日,星期六4)计算检定数据5)结论因为z=4>1.96,依照上述的决定规则,我们拒绝虚无假设(统计上显著)。盒装果汁容量不是16oz58第58页,共77页,2023年,2月20日,星期六双尾检定-z分数(或t分数)检定的逻辑是:

如统计上显著,拒绝H0如统计上不显著,无法拒绝H059第59页,共77页,2023年,2月20日,星期六双尾检定:z分数(或t分数)检定(铁圈例子)如果样本数为16,厂商的结论为何?60第60页,共77页,2023年,2月20日,星期六3.双尾检定:

p值检定法(铁圈例子)

设α=.05,

因z=6,=.000032设立决定规则如p<α,拒绝H0如p>α,无法拒绝H061第61页,共77页,2023年,2月20日,星期六结论:因为

p=.000064

<α=.05,依照上述的决定规则,我们拒绝虚无假设(统计上显著)。铁圈直径不是4公分62第62页,共77页,2023年,2月20日,星期六双尾检定-p值检定法的逻辑是:如p<α,统计上显著,拒绝H0如p>α,统计上不显著,无法拒绝H063第63页,共77页,2023年,2月20日,星期六双尾检定:因为据绝区是在两尾端,只能检验样本观察值与母体参数间有没有统计上显著的差别单尾检定:检验样本值是不是比母体参数大或比母体参数小64第64页,共77页,2023年,2月20日,星期六4.单尾检定:信赖区间检定法某厂商要测试所生产的盒装果汁容量是否多於16oz取样1024盒并计算平均数如果样本标准差=1.6,样本平均数=16.2厂商的结论为何?65第65页,共77页,2023年,2月20日,星期六1)设立假设:2)决定显著程度(α)66第66页,共77页,2023年,2月20日,星期六3)设立决定规则:拒绝

H0

如果样本平均数

(16.2)大於或

67第67页,共77页,2023年,2月20日,星期六4)计算检定数据,

如α=.05,16+1.65x.05=16.08255)结论:因为

16.2>16.0825,依照上述的决定规则,我们拒绝虚无假设(统计上显著),盒装果汁容量多於16oz68第68页,共77页,2023年,2月20日,星期六单尾检定(信赖区间检定法)的逻辑是:如果,当统计上显著, 拒绝H0如果,当拒绝H0

69第69页,共77页,2023年,2月20日,星期六5.单尾检定:z分数(或t分数)检定

(盒装果汁例子)设立决定规则:如果,拒绝虚无假设如果,不拒绝虚无假设(注意:此处无绝对值)70第70页,共77页,2023年,2月20日,星期六因为依照上述的决定规则4>1.65,我们拒绝虚无假设(统计上显著),盒装果汁容量多於16oz71第71页,共77页,2023年,2月20日,星期六单尾检定-z分数(或t分数)检定)的逻辑是:如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论