




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 抽样推断,第一节 抽样推断的基本问题,一、抽样推断的定义:,二、抽样推断的特点:,按随机原则从总体中抽取一部分单位进行调查,然后以一定的把握程度推断总体。,1、抽取样本单位的随机性;,抽样时遵循随机原则的原因: 能保证样本和总体有相似的结构(分布),使样本能够较好的代表总体; 只有遵循随机原则,才能对估计的精确度和可靠度进行数理推断。,随机性原则的实现:抽签法、随机数表法、计算机模拟法。,3、推断总体一定存在误差,但这种误差可以事先计算 并加以控制。,2、抽样推断可以推断总体;,与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。我国在1994年确立
2、了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系。,三、抽样推断的应用,(一)调查具有破坏性的场合;,(二)有些试验虽不具有破坏性,但采用抽样方法可以 节省大量人、财和物力;,(三)应用于质量管理;,(四)对无限总体或总体规模非常大的场合进行调查;,(五)对全面调查的结果进行核查和修正。,四、抽样推断的理论基础,1、大数定律,表明大量随机观象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。,2、中心极限定律,如果变量总
3、体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。,按照全及总体所包含总体单位个数的多少,可以分为有限总体和无限总体。,五、抽样推断中的几个基本概念,(一)总体和样本,1、总体,目标总体:抽样调查预先确定的所要研究对象的全体。 抽样总体:从中抽取样本的总体,亦即样本单位实际 来源的总体。,按照样本单位的来源不同,可将总体分为目标总体和抽样总体。,在实践中两者有时可能不一致。,2、样本,样本是按随机原则从总体中抽取一部分单位组成的 小总体,又称子样。,样本单位:样本中的每个单位。,样本容量:一个样本中,样本单位的数目,用n表示。,总体是
4、确定的,样本是随机的,所以又称随机样本。 对于一次具体抽样,设抽到x1,x2, xn,称为观测 样本,它是随机样本的一个表现。,样本个数:又称样本可能数目,是指从一个全及总体中可能抽取的样本个数。,样本容量n30为大样本,n30为小样本,(二)总体指标和样本指标,1、总体指标,(1)总体平均数,总体指标和样本指标一一对应。,或,(2)总体成数,(参数和统计量),反映总体离中分布趋势的方差或标准差,(3)总体方差,是非标志的方差或标准差,总体指标又叫参数,(1)样本平均数,2、样本指标,(2)样本成数,对于属性样本总体,当n较大时,(3)样本方差,样本指标又叫统计量,(三)抽样方法,考虑顺序抽样
5、,考虑各单位的中选顺序。,ABCCBA,不考虑顺序抽样,不考虑各单位的中选顺序。,ABCCBA,1、重复抽样,又称重置抽样、回置抽样(往返抽样、放回抽样),从总体N个单位中随机抽取一个单位数为n的样本,每次从总体中抽取一个单位,并把它看作一次试验,连续进行n次试验构成的样本。 每次抽出一个单位,把结果登记下来,又重新放回参加下次的抽选,因而重复抽样是由n次相互独立的连续实验构成的,每次试验是在完全相同的条件下进行,每个单位中选的机会在每次都完全一样。,样本个数又称样本可能数目,是指从一个总体中可能抽取的样本个数。,所有可能样本数,例如:从甲、乙、丙、丁四个人中抽取2人,可能有多少样本个数? 已
6、知:N 4 n 2,考虑顺序的重复抽样,一个总体可能抽取多少个样本,和样本的容量有关,也和抽样方法有关。在样本的容量已经确定之后,样本的可能个数完全取决于抽样方法。,注意:学习这部分时,面对总体抽样时,摆在面前有多种可能性(16),这样的样本都有可能被抽到,但这样的样本并不是都要把它抽出,现在从中抽取了,只能抽到其中的一个,对具体抽到的那个样本进行计算。,2、不重复抽样,又称不回置抽样,它是从总体N个单位中随机抽取一个容量为n的样本,每次从总体中抽样取出一个单位,但不再放回,连续进行n次抽取构成一个样本。 其特点是:样本由n次连续抽取的结果构成,实质上等于一次从总体中抽n个样本单位。 连续n次
7、抽选的结果不是相互独立的,第一次抽取的结果影响下一次抽取,每个单位的中选机会在各次是不同的。,考虑顺序的不重复抽样,所有可能样本数,例如:从甲、乙、丙、丁四个人中抽取2人,可能有多少样本个数? 已知:N 4 n 2,第二节:抽样误差和抽样平均误差,一、抽样误差,统计误差,指统计调查结果所获得的统计数字与客观事物实际数值的差别。,(一)登记性误差,(二)代表性误差,指采用非全面调查的方式,利用部分单位资料推断总体资料时所产生的误差。,1、系统性误差,抽取样本单位时,未用、破坏随即原则产生的误差。,2、随机误差,遵循随即原则下产生的误差,,即抽样误差。,抽样误差的定义:,在随机抽样的条件下,在克服
8、了或消灭了登记性误差的条件下,样本指标与总体指标之间的误差。如:,1、抽样误差是个概念,只能理解无法计算;,2、抽样误差是个变量,随着样本不同而不同。,问:抽样误差是个变量,那么抽样误差有多少个变量值?,抽样误差,167CM,169CM,172CM,160CM,162CM,167CM,175CM,180CM,165CM,167CM,170CM,175CM,178CM,180CM,162CM,173CM,155CM,160CM,170CM,165CM,平均身高=169.8CM,平均身高=174.6CM,总平均身高=168.6CM,平均误差,二、抽样平均误差,(一)抽样平均误差的定义公式,1、平均
9、数的抽样平均误差,2、成数的抽样平均误差,(二)抽样平均误差的计算公式,1、平均数的抽样平均误差,n: 样本容量,总体方差,(1)重复抽样时,已知总体标准差:,(2)不重复抽样时,n: 样本容量,总体方差,N: 总体单位数,不是成数,是抽样比例,又叫修正系数,2、成数的抽样平均误差,(1)重复抽样时,n: 样本容量,P(1-P): 是非标志的方差,(2)不重复抽样时,n: 样本容量,P(1-P): 是非标志的方差,N: 总体单位数,下面举例说明抽样平均误差的计算式和其定义式等价,例:设有甲、乙、丙、丁四个人,他们的年龄分别是20、21、23、24岁,现从中抽取2人(n=2)调查他们的平均年龄。
10、试计算抽样平均误差。,解:,1、重复条件下:,甲、乙、丙、丁四个人,他们的年龄分别是20、21、23、24岁,20 20,20 21,20 23,20 24,21 20,21 21,21 23,21 24,23 20,23 21,23 23,23 24,24 20,24 21,24 23,24 24,20,20.5,21.5,22,20.5,21,22,22.5,21.5,22,23,23.5,22,22.5,23.5,24,4,2.25,0.25,0,2.25,1,0,0.25,0.25,0,1,2.25,0,0.25,2.25,4,20,解:,1、重复条件下:,用定义公式计算,用计算公式计
11、算,2、不重复条件下:,用定义公式计算,用计算公式计算,通过上例还可以得出所有样本平均数的平均数如下:,可以得出如下结论:无论重复抽样还是不重复抽样,所有样本平均数的平均数等于总体平均数即:,同理:无论重复抽样还是不重复抽样,所有样本成数的平均数等于总体成数即:,由上述结论可得:,可见抽样平均误差也是一个标准差的概念。,平均数的抽样平均误差是所有可能的样本的平均数的标准差; 同理,成数的抽样平均误差是所有可能的样本的成数的标准差。,对抽样平均误差的确切定义:,概括为:抽样平均误差是所有可能的样本指标的标准差。,(三)影响抽样平均误差的因素,1、样本容量(n),2、总体方差( ),3、抽样方法,
12、4、抽样组织形式,请判断以下几句话的对错: 1、为缩小抽样误差,我们可采取适当样本容量; 2、为缩小抽样误差,我们可采取不重复抽样方法; 3、为缩小抽样误差,我们可缩小总体方差。,(四)计算抽样平均误差时,总体方差未知怎办,1、用过去的资料代替; 2、用样本方差代替; 3、先搞试点。,第三节 点估计和区间估计,一、点估计,直接用样本指标代替总体指标。,一个优良的估计量要求满足: (一)无偏性 (二)一致性 (三)有效性 点估计给出的只是总体指标的一个估计数值,既没有给出准确度,也没有给出可靠程度。因此,在实际工作中不单独使用。,二、区间估计,以一定的把握程度估计总体指标在什么范围内,并给出这个
13、范围的概率(可信程度、置信度、把握程度)。,1、估计总体平均数时,为Z的函数:,为概率、置信度、把握程度和可信程度;也表示为 (1 - ) 为显著性水平。,2、估计总体成数时,的概率为 。,【例1】 对一批产品随机抽取100件,测量其长度的平均长度为10cm,标准差为0.5cm,试以95.45%的概率估计该批产品平均长度的区间范围。,解: 已知 ,n=100,= 95.45%,可得 z=2,答:该批产品平均长度在9.9,10.1 范围内变动。,【例2】 对某工厂工人随机抽取50人调查他们的月工资资料如下:,试以95.45%的概率估计该厂工人平均工资的区间范围。,= 95.45%,可得 z=2,
14、答:该厂工人的平均工资在614.08,665.92 范围内变动。,【例3】 对一批粮食作物的种子随机抽取200粒,进行发芽实验,结果有180粒发芽。试以95%的概率估计该批种子发芽的区间范围。,解: n=200,= 95%,可得 z=1.96,答:有95%的概率认为该批种子发芽率内85.84%,94.16%范围内。,练习:某厂负责人与估计6000根某零件的长度,随机抽取350根,测验得其平均长度为21.4mm,样本标准差为0.15mm,试求总体均值的置信度为95%的置信区间?,解: 已知 ,n=350 , N=6000,= 95%,可得 z=1.96,答:总体均值的置信度为95%的置信区间为2
15、1.38,21.42 。,四、必要的样本容量的确定,概念1: 在抽样调查中称 Z 为概率度 Z区间范围中样本标准差个数,概念2:,称为抽样极限误差,指样本指标与全及总体指标之间误差的范围,也叫抽样允许误差。,(一)推断总体平均数时,1、重复抽样,2、不重复抽样,1、重复抽样,(二)推断总体成数时,2、不重复抽样,计算必要样本容量时需注意的几个问题 1、采用上述公式计算样本容量时,往往未知所需的总体方差,在具体计算时可采用以下方法解决: 若有同类问题的全面资料,可用其全面资料来代替。若有多次资料,应选择最大的方差。 用样本方差来代替。 组织实验调查,以实验调查的方差来代替。 若有几个实验调查的资
16、料,应选择最大的。 成数方差应选择限定条件下的极大值。 在完全缺乏资料的情况下,可用成数方差的最大值0.25来代替。,2、若在一次抽样调查中,同时要推断总体平均数和总体成数,运用上述计算公式可计算出两个样本容量,为同时满足两方面的要求,实际抽样调查中必要样本容量应为其中较大的一个。 3、样本容量应取整数。且不采用四舍五入,而是逢小数就入的取整办法。,例如:对一批产品随机抽取100件,发现其中有90件合格, 1、以95.45%的概率估计全部产品合格率的区间范围; 2、若抽样极限误差缩小1/2,其他条件不变应至少抽取多少件产品调查? 3、若抽样极限物产缩小1/3呢?,练习:一家市场调查公司欲估计某
17、城市有电脑家庭所占比例,该公司希望估计误差不超过0.05,要求置信度为95%,则应取多大样本容量的样本?,答:应对385户家庭调查。,作业1:某高校在一项高校关于旷课原因的研究中,从总体随机抽选了200人组成样本,在对其进行问卷调查中,有60人说他们旷课是由于任课教师讲课枯燥。试对由于这种原因而旷课的学生的真正比例构造95%的置信区间。,作业2:某调查公司欲了解某居民区内看过某电视广告的家庭所占比重,需要从该区抽选多个家庭作样本。该小区居民共有1050户,分析人员希望以95%的置信度对这个成数做出估计,并使估计值处在真正成数附近0.05的范围内,在一个以前抽取的样本中,有28%的家庭看过该广告
18、,试问应抽取多大的样本?,第四节 抽样组织形式,一、简单随机抽样,二、分层抽样,三、系统抽样,四、整群抽样,1、简单随机抽样(纯随机抽样),方法:将总体单位编成抽样框,而后按随机原则用抽签或随机数表直接抽取样本单位。,适用:总体规模不大;总体内部差异小,2、分层抽样(类型抽样),方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。,总体 N,样本 n,等额分配,等比例分配,最优分配,3、系统抽样,方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。,排序依据的标志:(1)无关标志;(2)有关标志,(总体单位按某一标志排序),4、整群抽样,方法: 将总体
19、全部单位分为许多个“群”,然后随机抽取若干“群”,对被抽中的各“群”内的所有单位登记调查。,例:,第五节 假设检验,一、假设检验的基本原理,(一)假设检验的概念,事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立,2、参数估计和假设检验的区别,参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。 参数估计是在总体参数未知的情况下用样本统计量估计总体参数。 假设检验是先对总体参数提出一个假设,然后利用样本信息去检验这个假设是否成立,如果成立,就接受这个假设,否则就放弃。,1、假设检验的定义,例如1:某企业生产了一批灯管,按规定每只灯
20、管的使用寿命不得低于1000小时。现从中任意抽取100只,发现有6只的使用寿命低于1000小时,若规定不合格率达到5%时,灯管就不能出厂,问该批灯管能否出厂。 例如2:从2002年的新生儿中随机抽取30个,测得其平均体重为此3210克,而2001年为3190克,问新生儿体重2002年比2001年有无显著差异。,(二)假设检验的特点,1、采用逻辑上的反证法,2、依据统计上的小概率原理,如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。,总 体 (某种假设),抽样,样
21、 本 (观察结果),检验,(拒绝),(接受),小概率事件 发 生,小概率事件 未 发 生,例1:我国出口凤尾鱼罐头,标准规格是每罐净重 250克,据以往经验,标准差是3克。某食品厂生产 一批供出口用的这种罐头,从中抽取100罐检验,其平均净重251克。假定罐头重量服从正态分布,按规定显著性水平 ,问这批罐头是否合乎出口标准?,解:,第一,提出原假设和备择假设 把需要通过样本去推断其正确与否的命题称为原假设, 用 表示。 与原假设对立的假设是备择假设,,双侧检验,二、假设检验步骤,第二,确定适当的检验统计量,若原假设为真,可以认定罐头的重量属于正态分布,均值为250克,标准差为3克。当被抽样总体
22、为正态分布,且总体方差已知时,样本均值 服从于均值为 ,方差 的正态分布。这时检验统计量为Z。,第三,规定显著性水平 1.显著性水平是一个概率值; 2.原假设为真时,拒绝原假设的概率 -被称为抽样分布的拒绝域; 3.表示为 (alpha) 常用的 值有0.01, 0.05, 0.10; 4.由研究者事先确定。,第四,作出统计决策,找出临界值,例2:某批发商欲从厂家购进一批灯泡,根据合同 规定,灯泡的使用寿命平均不能低于1000小时。 已知灯泡使用寿命服从正态分布,标准差为20小时。 在总体中随机抽取了100个灯泡,得知样本均值为 960小时,批发商是否应该购买这批灯泡?,解:,左单侧检验,临界
23、值,例3:微波炉在炉门关闭时的辐射量是一个重 要的质量指标。某厂该指标服从正态分布,常期以来 标准差为0.1,且均值都符合要求不超过0.12。为检查 近期的产品的质量,抽查了25台,得其炉门关闭时 辐射量的均值为0.1203。试问显著性水平为0.05水平 上该厂炉门关闭时辐射量是否升高了?,解:,右单侧检验,三、假设检验中的两类错误,1.第一类错误(弃真错误) 原假设为真时拒绝原假设 指原假设本来正确却否定了它,犯这类错误 的概率正好为,被称为显著性水平 2.第二类错误(取伪错误) 接受原假设时产生的,原假设不正确却接受了它,第二类错误的概率为(Beta),采用以下原则: 当样本容量固定时,在控制第一类错误的概率不大于显著性水平条件下,使非第二类错误的概率尽可能小。,二、假设检验的步骤,第一,提出原假设和替换假设 把需要通过样本去推断其正确与否的命题称为原假设, 用 表示。上例 : 与原假设对立的假设是替换假设,,第二,确定适当的检验统计量,1.用于假设检验问题的统计量 2.选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 修建性设计合同范本
- 10万吨煤矿合同范本
- 单位只交社保合同范本
- 公司销售代理合同范本
- 出售机械板车合同范本
- 医药培训销售合同范本
- 个人精装房租赁合同范例
- 保洁大扫除合同范本
- 买汽车有没有三包合同范本
- 加工基地 合同范本
- JJG 705-2014液相色谱仪行业标准
- (高清版)TDT 1056-2019 县级国土资源调查生产成本定额
- 小学班级管理现状及策略分析
- 公司合作计划书
- 2016-2023年南京信息职业技术学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 半固态电池技术工艺
- 跨领域联合诊疗(MDT)管理法规
- 光伏电站运维安全风险管控清单
- 保安员考核评分标准与细则
- 四年级竖式计算大全100道
- GB/T 2659.3-2023世界各国和地区及其行政区划名称代码第3部分:原先使用的国家和地区代码
评论
0/150
提交评论