第三章抽样误差与假设检验详解演示文稿_第1页
第三章抽样误差与假设检验详解演示文稿_第2页
第三章抽样误差与假设检验详解演示文稿_第3页
第三章抽样误差与假设检验详解演示文稿_第4页
第三章抽样误差与假设检验详解演示文稿_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章抽样误差与假设检验详解演示文稿1本文档共32页;当前第1页;编辑于星期六\9点47分优选第三章抽样误差与假设检验2本文档共32页;当前第2页;编辑于星期六\9点47分熟悉:1、抽样误差的概念2、引起抽样误差的原因3、均数的标准误的计算4、标准差和标准误的区别第三章抽样误差与假设检验3本文档共32页;当前第3页;编辑于星期六\9点47分第一节抽样分布与抽样误差一.抽样研究(一)抽样研究的意义样本总体4本文档共32页;当前第4页;编辑于星期六\9点47分(1)由于研究对象很多是无限总体,要直接研究总体的情况是不可能的。(2)即使对有限总体来说,若包含的观察单位数过多,需要耗费大量的人力、物力和时间,而且也不易组织,难以保证工作的质量。(3)有的时候,观察的实质就是一种破坏性实验,根本就不允许对总体中的每一个体逐一观察。为什么要做抽样研究?5本文档共32页;当前第5页;编辑于星期六\9点47分目前抽样研究的理论与技术已发展成熟,只要严格按照有关抽样研究的要求去做,这是完全可行的。目的:就是要用样本信息来推断总体特征,这就叫统计推断(statisticalinference)6本文档共32页;当前第6页;编辑于星期六\9点47分(二)抽样研究和抽样误差抽样研究是指从总体中按照随机化的原则,抽取一定数量的个体组成样本进行研究,从而推断总体的研究方法。在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差(samplingerror),7本文档共32页;当前第7页;编辑于星期六\9点47分

(三)、抽样误差的分布

理论上可以证明:若从正态总体中,反复多次随机抽取样本含量固定为n的样本,那么这些样本均数也服从正态分布,即的总体均数仍为,样本均数的标准差为。抽样分布抽样分布示意图8本文档共32页;当前第8页;编辑于星期六\9点47分

(三)、抽样误差的分布中心极限定理当样本含量很大的情况下,无论原始测量变量服从什么分布,的抽样分布均近似正态。

抽样分布图抽样分布示意图9本文档共32页;当前第9页;编辑于星期六\9点47分二.均数的抽样误差如上所述,数理统计研究表明,抽样误差具有一定的规律性,可以用特定的指标来描述。这个指标称为标准误(standarderrorSE)。标准误除了反映样本统计量之间的离散程度外,也反映样本统计量与相应总体参数之间的差异,即抽样误差大小。10本文档共32页;当前第10页;编辑于星期六\9点47分意义:反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。与样本量的关系:S一定,n↑,标准误↓标准误的计算公式:11本文档共32页;当前第11页;编辑于星期六\9点47分例4.1在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38×1012/L,试计算均数的标准误。

12本文档共32页;当前第12页;编辑于星期六\9点47分均数标准误的用途1.衡量样本均数的可靠性由于均数标准误越小,均数的抽样误差越小,样本均数就越可靠,代表性越好。2.估计总体均数的可信区间。3.用于均数的假设检验。

13本文档共32页;当前第13页;编辑于星期六\9点47分第二节t分布一.t分布(t-distribution)(一)Z分布正态分布(normaldistribution)常将一般的正态变量X通过变换[

]转化成标准正态变量Z,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standardnormal

distribution),亦称Z分布。14本文档共32页;当前第14页;编辑于星期六\9点47分在正态分布总体中以固定n(如n=10)抽取若干个样本时,样本均数的分布仍服从正态分布,即。所以,对样本均数的分布进行Z变换[

],也可变换为标准正态分布N

(0,1)。15本文档共32页;当前第15页;编辑于星期六\9点47分由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与Z变换区别,称为t变换t=,统计量t值的分布称为t分布。(二)t分布16本文档共32页;当前第16页;编辑于星期六\9点47分t分布有如下特征1.以0为中心,左右对称的单峰分布;2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线,如图4.1。

图4.1自由度为1、5、∞的t分布17本文档共32页;当前第17页;编辑于星期六\9点47分t分布曲线下的面积与自由度ν有关系。如t分布曲线下面积为95%或99%的界值不是一个常量,而是随着自由度大小而变化的,分别用和表示。t分布曲线下面积18本文档共32页;当前第18页;编辑于星期六\9点47分第三节总体均数的估计统计推断包括两个重要的方面:参数估计和假设检验。参数估计就是用样本指标(称为统计量,statistic)来估计总体指标(参数,parameter)。参数估计有两种方法:点估计和区间估计。19本文档共32页;当前第19页;编辑于星期六\9点47分

第三节总体均数的估计一、可信区间的概念(ConfidenceInterval)

区间估计:指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率称为可信度,通常取。参数估计点估计:不考虑抽样误差,如区间估计:考虑抽样误差20本文档共32页;当前第20页;编辑于星期六\9点47分1.σ已知或σ未知但n(n>50)足够大时,由Z分布可知:(1)σ已知:即写成区间形式:二、可信区间的计算

21本文档共32页;当前第21页;编辑于星期六\9点47分同理,单侧可信区间为:或或(2)σ未知,但足够大:可信区间为:22本文档共32页;当前第22页;编辑于星期六\9点47分2.σ未知,且n(n<50)不够大时,按t分布原理得到均数的可信区间为:即:同理,单侧可信区间为:,23本文档共32页;当前第23页;编辑于星期六\9点47分(10.9-2.093*3.86/例对某人群随机抽取20人,用某批号的结核菌素作皮试,平均浸润直径为10.9cm,标准差为3.86cm。问这批结核菌素在该人群中使用时,皮试的平均浸润直径的95%可信区间是多少?该例n=20,n较小,因此,可认为平均浸润直径服从t分布。自由度ν=20-1=19,查t

界值表,得=2.093,10.9+2.093*3.86/即(9.1,12.7)cm。)cm24本文档共32页;当前第24页;编辑于星期六\9点47分

图4-2模拟抽样成年男子红细胞数100次的95%可信区间示意图

******三可信区间的注意问题1.可信区间的涵义25本文档共32页;当前第25页;编辑于星期六\9点47分准确度:反映在可信度的大小,即区间包含总体均数的概率的大小,愈接近1愈好。精密度:反映在区间的长度,长度愈小愈好。三可信区间的注意问题2.可信区间的两个要素:准确度和精密度。26本文档共32页;当前第26页;编辑于星期六\9点47分3.均数的可信区间与参考值范围的区别表均数的可信区间与参考值范围的区别含义计算公式用途可信区间按预先给定的概率,确定总体均数的可能范围;总体均数的波动范围。σ未知,σ已知或n很大,总体均数的区间估计参考值范围正常人的解剖、生理、生化某项指标的波动范围;个体值的波动范围。正态分布,偏态分布绝大多数观察对象某项指标的分布范围27本文档共32页;当前第27页;编辑于星期六\9点47分第四节、假设检验的基本步骤假设检验(hypothesistest)是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。假设检验亦称差别有无统计学意义检验(significancetest)一、假设检验的基本思想28本文档共32页;当前第28页;编辑于星期六\9点47分例:为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数,如某医生在某山区随机测量了25名健康成年男子的脉搏,平均次数为74.2次/分钟,标准差为6.0次/分钟,但是根据医学常识,一般男子的平均脉搏次数为72次/分钟,问该山区男子脉搏均数是否高于一般男子的脉搏均数?结果是怎样呢?一、假设检验的基本思想29本文档共32页;当前第29页;编辑于星期六\9点47分1)由抽样误差所造成;2)该样本均数确实与正常成年男性脉搏数不同。

两种可能:一、假设检验的基本思想30本文档共32页;当前第30页;编辑于星期六\9点47分先对总体的特征建立假设,然后判断此假设应该被拒绝或不被拒绝。假设检验的基本思想是小概率(P<0.05)反证法思想,是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。一、假设检验的基本思想31本文档共32页;当前第31页;编辑于星期六\9点47分二、假设检验的基本步骤零假设、无效假

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论