统计模块四05_第1页
统计模块四05_第2页
统计模块四05_第3页
统计模块四05_第4页
统计模块四05_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计基础与实务统计基础与实务 复习导入复习导入 统计报表 调查 全面调查普查 方式 专门调查重点调查 非全面调查 典型调查 抽样调查【任务导入任务导入】n在实际生活和工作过程中,常常会遇到一些统计资料很难全面收集的难题,如一批炮弹的杀伤力、某地区居民消费支出情况、某车间产品的合格率等等,能对个体一一进行测量或调查吗?显然无法办到,怎么办?如何才能了解全面的数据资料?采取哪种调查方式才能既准确又相对可靠,既快速又节约成本?模块四模块四 统计分析与应用统计分析与应用 单元五单元五 抽样分析与应用抽样分析与应用 任务一任务一 抽样推断概述抽样推断概述 任务二任务二 抽样误差抽样误差 任务三任务三 参

2、数估计方法参数估计方法 任务四任务四 必要样本容量的确定必要样本容量的确定 教学目的要求教学目的要求n【认知目标认知目标】n1. 理解抽样推断的概念、涵义和特点;n2. 熟悉各种抽样误差的概念、计算方法及各种误差之间的联系;n3. 掌握利用样本资料推算总体数量特征的原理和方法;n4. 掌握必要样本容量的确定方法。n【能力目标能力目标】n1. 能够针对某实际问题组织抽样调查;n2. 能够清楚地计算各种抽样误差;n3. 能够利用样本数据推断总体基本数据资料。 单元五单元五 抽样分析与应用抽样分析与应用 任务一任务一 抽样推断概述抽样推断概述 一、抽样推断的概念和特点一、抽样推断的概念和特点 二、抽

3、样推断的适用范围二、抽样推断的适用范围 三、抽样推断的有关概念三、抽样推断的有关概念 四、抽样方法四、抽样方法 五、抽样组织形式五、抽样组织形式任务一任务一 抽样推断概述抽样推断概述抽样推断抽样推断是在遵守随机原则的条件下,从总体中抽选样本,并且以样本指标推断总体指标的一种统计分析方法。 注意: 1.对随机原则的理解 2.抽样推断的目的(平均数和成数) 3.三、抽样推断的有关概念三、抽样推断的有关概念(一)全及总体和抽样总体(一)全及总体和抽样总体1、全及总体(总体 N):所要认识对象的全体。(1)有限总体 (2)无限总体 2、抽样总体(样本 n):所抽取的一部分单位。(1)大样本(n30)

4、(2)小样本(n30)三、抽样推断的有关概念三、抽样推断的有关概念(二)全及指标和抽样指标(二)全及指标和抽样指标1、全及指标:用来描述全及总体的指标2、抽样指标:根据样本单位计算的指标XPXPxpxSpS 全及指标 抽样指标 平均数成数 标准差NXXNNP1FFXX2)(nxxnnp1ffx- x2)(S)1 (PP)1 (pp四、抽样方法四、抽样方法(一一)按抽取样本单位的方法不同按抽取样本单位的方法不同 1、重复抽样、重复抽样 2、不重复抽样、不重复抽样注意: A、重复抽样和不重复抽样对抽样结果和误差的差异 B、理论上和实际中的认识和运作的差异四、抽样方法四、抽样方法(二)根据对样本的要

5、求不同(二)根据对样本的要求不同 1、考虑顺序的抽样、考虑顺序的抽样 ABBA 2、不考虑顺序的抽样、不考虑顺序的抽样 AB=BA (三)两种分类交叉(三)两种分类交叉 1、考虑顺序的不重复抽样、考虑顺序的不重复抽样 2、考虑顺序的重复抽样、考虑顺序的重复抽样 3、不考虑顺序的不重复抽样、不考虑顺序的不重复抽样 4、不考虑顺序的重复抽样、不考虑顺序的重复抽样五、抽样组织形式五、抽样组织形式 1、简单随机抽样简单随机抽样(基本) 也叫纯随机抽样,对总体单位不作任何分类或排队 简单随机抽样的具体做法主要有以下几种: (一)直接抽选法(一)直接抽选法 对于总体数不太多或比较集中,可以直接从调查对象中

6、随机选择。 如,从班级学生中随机选取几个学生调查消费情况;从某地区直接选择几片区域进行环境污染调查。 (二)抽签法(二)抽签法 将总体各单位按照某一自然顺序编号,形成“抽样框”,即总体单位的名单,然后用抽签、摇号等方式中从名单中随机抽取所需样本单位数。 如,将班级学生按照姓氏顺序编号,然后随机选样。该方法适合于总体单位数不太多的情况。 (三)随机数表法(三)随机数表法五、抽样组织形式五、抽样组织形式 2、类型抽样、类型抽样(误差最小) 样本单位数在各类型组中的分配方式: 等额分配:在各类型组中分配同等单位数。 等比例分配:按各类型组在总体中所占比例分配样本单位数。 最优分配:按各类型组的规模大

7、小和差异程度,确定各类型组的样本单位数。3、等距抽样、等距抽样 (1)将总体各单位标志值按某一标志顺序排队,然后按 一定的间隔抽取样本单位。 (2)排对的方法 无关标志排队 有关标志排队 (3)抽取样本单位的方法 按相等的距离取样 对称等距取样 (4)抽取第一个样本单位的方法 随机抽取 居中抽取4、整群抽样、整群抽样 概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。 另外,阶段抽样另外,阶段抽样是对以上4种抽样方式的应用。 抽样时,先抽总体中较大范围的单位,再从中选的较大范围的单位中抽取较小范围的单位,依此类推,最后得到样本的基本单位。 如:整个国家省县乡村 任务

8、二任务二 抽样误差抽样误差 一、抽样误差一、抽样误差 二、抽样平均误差二、抽样平均误差 (一)概念(一)概念 (二)计算(二)计算 三、影响抽样平均误差的因素三、影响抽样平均误差的因素 四、抽样极限误差四、抽样极限误差 五、抽样极限误差与抽样平均误差的关系五、抽样极限误差与抽样平均误差的关系一、抽样误差一、抽样误差 (一)抽样误差的含义(一)抽样误差的含义 抽样误差抽样误差是指样本指标值与被推断的总体指标值之差。 主要包括: 样本平均数与总体平均数之差 样本成数与总体成数之差一、抽样误差一、抽样误差 (二)(二)抽样误差的来源抽样误差的来源 登记误差登记误差 抽样抽样 系统性误差系统性误差 误

9、差误差 代表性误差代表性误差 (偏差(偏差) ) 随机误差随机误差 ( (偶然性误差偶然性误差) ) 注意:抽样误差特指随机误差二、抽样平均误差二、抽样平均误差(一)抽样平均误差的概念(一)抽样平均误差的概念1、登记汇总性误差、登记汇总性误差2、代表性误差、代表性误差(1 1)偏差)偏差Pp 1(2)(2)随机误差随机误差实际误差实际误差 平均误差平均误差Pp 2MXxux2)(MPpup 2)((二)抽样平均误差的计算(二)抽样平均误差的计算 前提:前提:简单随机抽样条件下抽样平均误差的计算公式抽样平均误差的计算公式平均数的抽样平均误差平均数的抽样平均误差成数的抽样平均误差成数的抽样平均误差

10、)(重重复复nux )( )1(2不不重重复复Nnnux )()1(重复重复nPPup )( )1 ()1 (不重复NnnPPup总体方差的来源总体方差的来源 1. 以往资料 2. 小型实验 3. 用样本方差代替例题例题某冷库冻鸡平均每只重某冷库冻鸡平均每只重12001200克,标准差克,标准差7070克,克,如果重复随机抽取如果重复随机抽取100100只和只和200200只,分别计算只,分别计算抽样平抽样平均误差。均误差。)(710070克克 nuxx)95420070(克克 xu例题例题该该冷库冻鸡合格率为冷库冻鸡合格率为97%97%,如果重复随机抽取,如果重复随机抽取100100只和只和

11、200200只,分别计算只,分别计算抽样平均误差。抽样平均误差。%71100%)971%(971( nPPup)%21200%)971%(97 pu 某玻璃器皿厂某日生产某玻璃器皿厂某日生产1500015000只印花只印花玻璃杯,现按重复抽样方式从中抽取玻璃杯,现按重复抽样方式从中抽取150150只进行质量检验,结果有只进行质量检验,结果有147147只合格,其只合格,其余余3 3只为不合格品,试求这批印花玻璃杯只为不合格品,试求这批印花玻璃杯合格率合格率( (成数成数) )的抽样平均误差。的抽样平均误差。例题例题%1374. 1)150001501 (150)98. 01 (98. 0)1

12、()1 ( %14. 1150)98. 01 (98. 0)1 (%98150147 150 15000NnnppnpppnNpp若按不重复抽样方式:解:解: 由于总体方差未知,故用样本方差代替。则:由于总体方差未知,故用样本方差代替。则:三、影响抽样平均误差的因素三、影响抽样平均误差的因素 1 、总体标准差的大小、总体标准差的大小 2、样本单位数的多少、样本单位数的多少 3、抽样方法的不同、抽样方法的不同 4、抽样组织方式的差别、抽样组织方式的差别小结小结 任务一任务一 抽样推断概述抽样推断概述 一、抽样推断的含义 二、抽样推断的特点 三、抽样推断的适用范围 四、抽样推断的有关概念 五、抽样

13、方法 六、抽样组织形式 任务二任务二 抽样误差抽样误差 一、抽样误差一、抽样误差 二、抽样平均误差二、抽样平均误差 三、影响抽样平均误差的因素三、影响抽样平均误差的因素抽样极限误差抽样极限误差 由于总体指标是一个确定的量,而样本指标是一个围绕着总体指标上下由于总体指标是一个确定的量,而样本指标是一个围绕着总体指标上下波动的随机变量,即它可能与总体指标发生波动的随机变量,即它可能与总体指标发生正、负离差正、负离差,这些离差均是,这些离差均是抽样指标的抽样指标的随机变量随机变量,因而难以避免,只能将其控制在,因而难以避免,只能将其控制在预先要求的误差预先要求的误差范围范围内,即可容忍的限度(极限)

14、范围之内,这就产生了抽样极限误差内,即可容忍的限度(极限)范围之内,这就产生了抽样极限误差(置信区间和抽样允许误差范围置信区间和抽样允许误差范围)的概念。)的概念。 含义:在一定推断可靠程度(概率保含义:在一定推断可靠程度(概率保证)条件下,样本指标(统计量)与证)条件下,样本指标(统计量)与全及指标(总体参数)之间抽样实际全及指标(总体参数)之间抽样实际误差的最大可能范围。误差的最大可能范围。 用符号表示。用符号表示。四、抽样极限误差四、抽样极限误差四、抽样极限误差四、抽样极限误差样本指标围绕总体指标左右两侧波动形成的一定范围。样本指标围绕总体指标左右两侧波动形成的一定范围。xxt*Ppp

15、Xxxppt*nt为概率度,其函数为概率度,其函数F(t)为概率,也叫概率保证程)为概率,也叫概率保证程度,把握程度,置信度。度,把握程度,置信度。xxX则有:ppP由此可推断出如下公式由此可推断出如下公式: :xxxXxpppPpn即根据即根据预先给定的预先给定的所允许的误差范围,所允许的误差范围,利用极限误差估计未知的全及指标的取利用极限误差估计未知的全及指标的取值可能的范围。值可能的范围。抽样估计的概率度抽样估计的概率度 抽样极限误差抽样极限误差是样本指标与总体指标值之间的绝对离差,而抽样平均误差是样本指标与总体指标值之间的绝对离差,而抽样平均误差是是所有可能样本指标与总体指标值之间的平

16、均离差,用抽样极限误差与抽样平均误差所有可能样本指标与总体指标值之间的平均离差,用抽样极限误差与抽样平均误差相比得到的相对数,称其为相比得到的相对数,称其为概率度概率度,用符号,用符号“t”来表示。来表示。 nPPPptnXxtppxx)1(/抽样估计的可靠程度抽样估计的可靠程度又称置信度。置信区间是以一定概率保证程度确定总体指标所在的区间。置又称置信度。置信区间是以一定概率保证程度确定总体指标所在的区间。置信度是总体指标落在某个区间内的信度是总体指标落在某个区间内的概率保证程度概率保证程度,用,用“F(t)”来表示。来表示。 确定抽样估计的可靠程度,就是要确定抽样平均数或抽样成数落在置信区确

17、定抽样估计的可靠程度,就是要确定抽样平均数或抽样成数落在置信区间的概率间的概率F(t) 。tF(t)tF(t),查正态分布表。,查正态分布表。t服从标准正态概率分布。服从标准正态概率分布。 常用的常用的F(t)值值 t=1, F(t)=65.28% t=1.65, F(t)=90% t=1.96, F(t)=95% t=2, F(t)=95.45% t=3, F(t)=99.73% t越大,越大,F(t)越大。)越大。例题例题 某保险公司从某保险公司从10000名投保人中随机重复抽取名投保人中随机重复抽取200名调查,得出该名调查,得出该200名名投保人的平均年龄为投保人的平均年龄为36.5岁

18、,年龄的标准差为岁,年龄的标准差为8.2岁,若要求推断的可靠岁,若要求推断的可靠程度为程度为99.73%,则在此条件下推断全部投保人平均年龄的最大可能误差,则在此条件下推断全部投保人平均年龄的最大可能误差是多少?是多少?解:xxt平平均均数数的的极极限限误误差差3%73.99t得得由由可可靠靠程程度度)(58. 02002 . 8岁岁nsx)(74. 158. 03岁岁xxt推断出总体推断出总体10000名投保人的平均年龄为名投保人的平均年龄为36.5岁,且平均年龄最大误差不超过岁,且平均年龄最大误差不超过1.74岁的可岁的可靠程度是靠程度是99.73%。任务三任务三 参数估计方法参数估计方法

19、 抽样估计的方法有两种抽样估计的方法有两种: 一、点估计一、点估计 二、区间估计二、区间估计 1、平均数的区间估计、平均数的区间估计 2、成数的区间估计、成数的区间估计一、点估计一、点估计就是用样本指标直接代替总体指标,而不考虑误差。就是用样本指标直接代替总体指标,而不考虑误差。xX pP nxxnnp1二、区间估计二、区间估计 是是根据样本指标和抽样误差去推断全及指标的根据样本指标和抽样误差去推断全及指标的可能范围。抽样估计的特点是,根据给定的概可能范围。抽样估计的特点是,根据给定的概率保证程度的要求,利用实际抽样资料,指出率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即

20、指出总体参数总体被估计值的上限和下限,即指出总体参数可能存在的区间范围。可能存在的区间范围。 区间估计必须同时具备三个要素:区间估计必须同时具备三个要素: 估估计值、计值、概概率保证程度和率保证程度和抽抽样误差范围,缺一样误差范围,缺一不可。不可。 1、平均数的区间估计、平均数的区间估计nux )1 (2NnnuxxxxXxxxt*)403.57( 43.39619. 13400 100003)99.73%(t (3)402.38( 62.39719. 12400 100002)95.45%(t )2()(19. 1)100001001 (10012)1 ( ) 1 (22千克亩产量的可能范围

21、为:亩小麦的平均保证,该农场若以概率千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克XxXNnnxx 例例1:某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。练习一练习一为了估计一分钟广告的平均费用,抽出为了估计一分钟广告的平均费用,抽出15个电视个电视台组成样本,得样本平均值台组成样本,得样本平均值10000元,标准差元,标准差2000元。在置信水平为元。在置信水平为95.45%的条件下建立广告平均的条件下建立广告平均费用的置信区间。费用的置信区间

22、。103310000152000210000nstx电视台一分钟广告的平均费用在电视台一分钟广告的平均费用在8967-11033之间之间.练习二练习二某制造厂质量管理部门希望估计本厂生产的某制造厂质量管理部门希望估计本厂生产的5500包原材料的平均重量,抽出包原材料的平均重量,抽出250包,测得平均重量包,测得平均重量65千克。总体标准差千克。总体标准差15千克。在置信水平为千克。在置信水平为95%的的条件下建立这种原材料平均重量的置信区间。条件下建立这种原材料平均重量的置信区间。86. 1652501596. 165ntx5500包原材料的平均重量在包原材料的平均重量在63.1466.86之

23、间。之间。练习三练习三某职业介绍所从申请某一职业的1000名申请者中采用不重复抽样方式随机抽取了200名,以此来估计1000名的平均成绩。200名的平均分数为78,由以往经验知总体方差90。在置信水平为90%的条件下建立1000名申请者平均成绩的置信区间.987. 078)10002001 (20090645. 178)1 (2Nnntx1000名申请者平均成绩在名申请者平均成绩在7779之间之间.2 2、成数的区间估计、成数的区间估计pppPpnppup)1( ppt*pp380p100%95%400P (1P )95% (195% )1.09%n40095.45%Pp95%21.09% 9

24、2.82% 97.18% 在 概 率的 保 证 下 , 全 及 一 级 品 率 : 例例1 1:某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率: 例例2: 某企业在一项关于职工流动原因的研究中,某企业在一项关于职工流动原因的研究中,从原职工中随机抽取了从原职工中随机抽取了200人访问,有人访问,有140人离人离开的原因是工资太低。以开的原因是工资太低。以95%的概率保证对该企的概率保证对该企业这种原因离开的人员比例进行区间

25、估计。业这种原因离开的人员比例进行区间估计。由于工资低离开的职工比例为由于工资低离开的职工比例为63.6% 与与76.4%之之间间064. 07 . 0200)7 . 01 (7 . 096. 17 . 0)1 (npptp例例3 3对一批灯泡抽取对一批灯泡抽取1%1%进行质量检验,结果为平均寿命进行质量检验,结果为平均寿命10101010小时,抽样平均误差小时,抽样平均误差5.65.6小时小时; ; 合格率合格率92%92%,抽,抽样平均误差样平均误差2.4%2.4%。要求在。要求在95%95%的可靠程度下,对该批的可靠程度下,对该批灯泡的平均寿命和合格率进行灯泡的平均寿命和合格率进行区间估

26、计。区间估计。976.1020024.9996 . 596. 110106 . 596. 11010XX%7 .96%3 .87%4 . 296. 1%92%4 . 296. 1%92PP练习练习 某储蓄所6月份共有存单3000张,为了解存款数量情况,现随机抽取200张进行调查,得结果如下表: 试在重复抽样条件下求:该储蓄所本月存单在1000元以上所占比重的范围(概率保证程度0.9545);练习练习 存款额分组(元)存款单(张) 100以下 15 100200 40 200500 70 5001000 35 10002000 25 20005000 10 5000以上 5 合计 200 求该储

27、蓄所本月存款额在1000元以上存单所占比重范围(概率保证程度0. 9545)。小结小结 三、抽样极限误差三、抽样极限误差 任务三任务三 抽样估计抽样估计 一、点估计一、点估计 二、区间估计二、区间估计 xxxXxpppPp作业作业某市2012年为了调查刚毕业1年大学生的收入水平,调查了10000名毕业生,计算得月平均收入为2000元,标准差为600元。要求:计算95.45%(t=2)的概率保证程度下,2012年毕业生的平均收入的范围。任务四任务四 必要样本单位数的确定必要样本单位数的确定 一、必要样本单位数的确定一、必要样本单位数的确定 二、影响必要抽样单位数大小的因素二、影响必要抽样单位数大

28、小的因素任务四任务四 必要样本单位数的确定必要样本单位数的确定一、一、必要必要样本单位数的确定样本单位数的确定 1 1、必要样本单位数的概念、必要样本单位数的概念 必要样本单位数是指在一定概率保证下要使必要样本单位数是指在一定概率保证下要使抽样误差不超过某一给定范围所必须的样本抽样误差不超过某一给定范围所必须的样本单位数。单位数。简单随机抽样条件下简单随机抽样条件下: :: 重重复复抽抽样样222t n 22t P(1P)n 不不重重复复抽抽样样:22222Nt nNt 2 2、确定必要抽样数的计算公式、确定必要抽样数的计算公式222N P(1P)tnNt P(1P) 二、影响必要抽样单位数大小的因素二、影响必要抽样单位数大小的因素1.总总体各单位标志的变异程度(正比)体各单位标志的变异程度(正比)2.抽抽样极限误差值的大小(反比)样极限误差值的大小(反比)3.抽抽样推断把握程度(可靠性)高低(正比)样推断把握程度(可靠性)高低(正比)4.抽抽样方法和抽样组织方式样方法和抽样组织方式)(1344)5 . 1 (34000) 1 . 0(4000)5 . 1 (3 )1 . 0(21 )(450)5 . 1 (34000)2 . 0(4000)5 . 1 (3 5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论