




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、6 - 6 - 6 - 1 1 1 统计学 6 - 6 - 6 - 2 2 2 统计方法统计方法 描述统计描述统计推断统计推断统计 参数估计参数估计假设检验假设检验 6 - 6 - 6 - 3 3 3 6 - 6 - 6 - 4 4 4 一、抽样推断的意义 抽样推断是在抽样调查的基础上,运用数理统 计方法,根据样本的实际资料对总体作出具有一 定可靠程度推断的一种统计方法。 特点: 1 1由样本的已知资料去由样本的已知资料去估计估计未知的未知的总体总体数量数量特征特征。 2 2选取样本必须遵循选取样本必须遵循随机原则随机原则。 3 3抽样推断中产生的抽样推断中产生的误差误差可以事先可以事先控制控
2、制。 二、抽样推断的作用 1.对不可能进行全面调查的现象总体进行推断。 2. 对于某些不必要进行全面调查的总体进行推 断。 3. 可以对全面调查的数据进行补充或修正。 4. 可以用于大批量生产过程中产品的质量检验 和控制。 5. 可以对于某种总体的假设进行检验,来判断 这种假设的真伪,以决定取舍。 三、抽样推断中的几个基本概念 1 1全及总体全及总体是指所要研究对象的全部单位构成是指所要研究对象的全部单位构成 的整体,的整体,简称总体简称总体。单位数通常用。单位数通常用n n表示。表示。 2 2抽样总体抽样总体是指从全及总体中按照随机原则抽是指从全及总体中按照随机原则抽 取的那部分单位组成的整
3、体,取的那部分单位组成的整体,简称样本简称样本。 样本单位数也叫样本单位数也叫样本容量样本容量,用,用n n表示。表示。 全及总体是全及总体是唯一确定唯一确定的,而抽样总体是的,而抽样总体是随随 机的机的。从一个全及总体中可以抽取一个样本,。从一个全及总体中可以抽取一个样本, 也可以抽取多个样本。也可以抽取多个样本。 .,30n;,30n称为小样本称为大样本 1 1全及指标。全及指标。全及指标是根据全及总体各单 位标志值计算的综合指标,又称总体指标。 常用的全及指标常用的全及指标 : (1 1)全及平均数:)全及平均数:全及总体各单位标志值的平均数。 )(未分组资料 n x x )(分组资料
4、f xf x (2 2)全及成数:)全及成数:全及总体中具有某一相同 标志表现的单位数占全及总体单位数的比 重,用p或者q表示。 若以若以n n1 1代表具有某种相同标志表现的单位数,代表具有某种相同标志表现的单位数, n n0 0代表不具有某种相同标志表现的单位数,代表不具有某种相同标志表现的单位数, n=nn=n1 1+n+n0 0,则总体成数为:,则总体成数为: 成数是是非标志的平均数。所谓是非标志就成数是是非标志的平均数。所谓是非标志就 是指只能取两种标志表现的标志。假定具有某种是指只能取两种标志表现的标志。假定具有某种 相同标志表现的变量值记为相同标志表现的变量值记为1 1,不具备该
5、种标志表,不具备该种标志表 现的变量值记为现的变量值记为0 0,那么成数,那么成数 可以看作是这两个可以看作是这两个 变量的加权算术平均数,即变量的加权算术平均数,即 是是非标志的平均数:是是非标志的平均数: n n p 1 p n nn n n q 1 10 p n n nn n0n1 f xf x 1 01 01 p (3 3)总体数量标志标准差。)总体数量标志标准差。总体数量标志标准差 是指全及总体中根据各单位标志值计算的标准差。 总体标准差的平方叫做总体方差,记作总体标准差的平方叫做总体方差,记作 。 (4 4)总体是非标志标准差。)总体是非标志标准差。总体是非标志标准差 是指全及总体
6、中根据是非标志计算的标准差。 总体是非标志的标准差为 ,方差为 。 )( )( 2 总体资料未分组 n xx )( )( 2 总体资料已分组 f fxx 2 )1 ()( )1 ( )( 22 0 2 1 2 2 pppqqppq n qnppnq n npnp f fxx p )1 (pp )1 (pp 2 2抽样指标。抽样指标。抽样指标是根据抽样总体各单 位标志值计算的综合指标,也称样本指标。 抽样指标是一个随机变量。 常用的抽样指标:常用的抽样指标: (1 1)抽样平均数。)抽样平均数。抽样平均数是抽样总体 各单位标志值的平均数。 )(样本已分组 f xf x )(样本未分组 n x x
7、 (2 2)抽样成数。)抽样成数。抽样成数是样本中具有 某一相同标志表现的单位数占样本单位 数的比重,用p表示或者q表示。 若以若以n n1 1代表具有某种相同标志表现的单位数,代表具有某种相同标志表现的单位数, n n0 0代表不具有某种相同标志表现的单位数,代表不具有某种相同标志表现的单位数, n=nn=n1 1+n+n0 0,则抽样成数为:,则抽样成数为: 同理可知,p是样本是非标志的平均数。 n n p 1 p n nn n n q 1 10 (3 3)样本数量标志标准差。)样本数量标志标准差。样本数量标志标准差 是指样本中根据各单位标志值计算的标准差,记 作s。 样本标准差的平方叫做
8、样本方差,记作样本标准差的平方叫做样本方差,记作s2 。 (4 4)样本是非标志标准差。)样本是非标志标准差。样本是非标志标准差 是指样本中根据是非标志计算的标准差。 样本是非标志的标准差为 ,方差为 。 在抽样估计中,样本指标又称为统计量,总体 指标又称为参数 。 )( )( 2 样本未分组 n xx s )( )( 2 样本已分组 f fxx s )1 (pp )1 (pp 1抽样框 抽样之前,必须根据预定的要求将总体划分 成一个个抽样单位,这些单位互不重叠,原来的 总体单位只能属于某一个抽样单位。抽样单位可 以是原来的总体单位,也可以不是原来的总体单 位。 全部抽样单位所构成的名单称为抽
9、样框。全部抽样单位所构成的名单称为抽样框。 (1 1)易于贯彻随机原则和进行抽选工作,)易于贯彻随机原则和进行抽选工作,提高抽提高抽 样效率样效率。 (2 2)确定了调查对象确定了调查对象即全及总体的范围。即全及总体的范围。 2抽样方法 重复抽样:重复抽样:也称重置抽样或有放回抽样,是指从总 体中随机抽选第一个样本单位后,将它的标志记 录下来后放回总体再次参加抽选,重复这个步骤 ,直到抽满n个样本单位为止。 不重复抽样:不重复抽样:也称不重置抽样或无放回抽样,是指 从总体单位数为n的总体中随机抽选第一个样本 单位后,将它的标志记录下来后不放回总体,再 从n-1个单位中抽选第二个样本单位,将它的
10、标 志记录下来后也不放回总体,重复这个步骤,直 到抽满n个样本单位为止。 抽样方法特点比较抽样方法特点比较 重复抽样重复抽样不重复抽样不重复抽样 每次抽选时,总体单位数每次抽选时,总体单位数不变逐渐减少 各单位被抽中的可能性各单位被抽中的可能性前后相同前后不断变化 各单位有无重复抽中的可能各单位有无重复抽中的可能有没有 登记性误差登记性误差是指在登记汇总过程中由于测量、记录、转 抄、计算等错误而产生的误差。 代表性误差代表性误差是指排除登记性误差后,用样本指标推断总 体指标时所产生的误差。 由于没有遵循随机原则而产生的误差,称为偏差。偏差。 在没有登记性误差的前提下,又遵循了随机原则,纯粹 是
11、由样本指标推断总体指标时产生的误差,称为抽样抽样 误差误差。 抽样实际误差抽样实际误差是指样本指标与总体实际指标的差数。 抽样平均误差抽样平均误差是所有样本指标的标准差。 统计误差统计误差 抽样平均误差抽样平均误差 抽样实际误差抽样实际误差 抽样误差抽样误差 偏差偏差 代表性误差代表性误差 登记性误差登记性误差 (一)重复抽样的抽样平均误差 1. 1.抽样平均数的抽样平均误差抽样平均数的抽样平均误差 表示总体的标准差,n为样本容量。 2. 2.抽样成数的抽样平均误差抽样成数的抽样平均误差 p(1-p)表示总体是非标志的方差,n为样本容量。 nn x 2 n pp p )1 ( (二)不重复抽样
12、的抽样平均误差 1. 1.抽样平均数的抽样平均误差抽样平均数的抽样平均误差 表示总体的标准差,n为样本容量,n为总体单位 数。 2. 2.抽样成数的抽样平均误差抽样成数的抽样平均误差 p(1-p)表示总体是非标志的方差,n为样本容量,n为 总体单位数。 )1 () 1 ( 22 n n nn nn n x )1 ( )1 ( ) 1 ( )1 ( n n n pp n nn n pp p (1 1)样本容量。)样本容量。样本容量越小,抽样平均误差越大 ;样本容量越大,抽样平均误差越小。 (2 2)总体标志变异指标。)总体标志变异指标。总体标志变异指标越大, 抽样平均误差越大;总体标志变异指标越
13、小,抽 样平均误差也越小。当总体标志变异程度为零时 ,说明总体各单位之间无差异,此时,抽样平均 误差为零。 (3 3)抽样的方式方法。)抽样的方式方法。在其他条件相同的条件下, 重复抽样的抽样平均误差大于不重复抽样的抽样 平均误差。 抽样估计就是利用所取得的样本资料,采用抽样估计就是利用所取得的样本资料,采用 一定的估计方法,对总体进行估计和推断。一定的估计方法,对总体进行估计和推断。 (一)抽样估计的优良标准(一)抽样估计的优良标准 1 1无偏性。无偏性。用样本指标估计总体指标时,所有可能 样本指标的平均数等于被估计的总体指标。 2 2一致性。一致性。用样本指标估计总体指标时,若样本容 量充
14、分的大,则样本指标充分靠近总体指标,即 随着样本容量的无限增大。 3 3有效性。有效性。有效性要求样本指标估计总体指标时, 作为无偏估计量的方差比其他估计量的方差小。 (二)抽样估计的方法(二)抽样估计的方法 1 1点估计。点估计。点估计就是用实际样本指标数值代替总 体指标数值的一种估计方法。 2 2区间估计。区间估计。区间估计就是根据样本指标和抽样平 均误差估计总体指标的可能范围,并同时给出总 体指标落在该范围的可靠程度。 由于未知的全及指标是一个确定的量,而抽样 指标则是围绕着全及指标出现的随机变量,它与 全及指标可能产生正负离差,这种变动范围的最 大绝对值就是抽样极限误差,也称为允许误差
15、。 用 和 分别表示平均数和成数的抽样极限误差, 则有: 变换后,得: x p x xx p pp xx xxx pp ppp 抽样极限误差要用抽样平均误差为标准来衡量,抽样极限误差要用抽样平均误差为标准来衡量, 把抽样极限误差除以抽样平均误差,表示抽样极限误把抽样极限误差除以抽样平均误差,表示抽样极限误 差是抽样平均误差的倍数,它是测量抽样估计可靠程差是抽样平均误差的倍数,它是测量抽样估计可靠程 度的一个参数,称为概率度,通常用度的一个参数,称为概率度,通常用t t表示。表示。 上述公式表明,在一定抽样平均误差的条件下,概率 度越大,则抽样极限误差越大,总体指标落在误差范围内 的概率越大,从
16、而抽样估计的可靠程度也就越高;反之, 概率度越小,则抽样极限误差越小,总体指标落在误差范 围内的概率也越小,从而抽样估计的可靠程度也就越低。 x x t p p t 那么如何衡量总体指标落在误差范围内 的概率大小哪?数理统计证明,概率度 和概率之间存在一定的函数关系,若用 p表示概率,即表示抽样估计的可靠程 度或者概率保证程度,则其函数关系可 表示为: p与t的值是一一对应的。常用的p与 t的对应值如表8-1,其他概率与概率度 的对应关系可查正态分布概率表。 概率p(%)概率度 t概率p(%)概率度 t 68.271951.96 801.2895.452 901.6499.733 )(tfp
17、例:某企业对某批电子元件寿命进行检验,随机抽 取100只,测得平均耐用时间为1000小时,标准差 为50小时,合格率为94%,试计算:以耐用时间的 允许误差范围 小时,估计该批产品平均 耐用时间的区间及其概率保证程度。 解: 下限: 上限: 由 ,查概率表得 答:估计该批产品的平均耐用时间在9901010小 时之间,有95.45%的概率保证程度。 10 x (小时)990101000 x x (小时)1010101000 x x 2 5 10 x x t %45.95)(tf 1. 1.概念:概念:简单随机抽样也叫纯随机抽样,它是指在进 行抽样时,对全及总体不经过任何形式的处理, 不进行排队或
18、分类,按照随机原则从总体中抽取 样本单位的抽样方式。 2. 2.取样方法取样方法 a 直接抽选法 b 抽签法 c 随机数表法 d 计算取随机数法 3. 3.抽样平均误差的计算抽样平均误差的计算 估计总体平均数时 估计总体成数时 重复抽样 不重复抽样 n x n pp p )1 ( )1 ( 2 n n n x )1 ( )1 ( n n n pp p 1. 1.概念:概念:类型抽样也叫分层抽样,它是运用统计分组 法,把全及总体按主要标志划分为几个类型组, 然后在各组中再按随机原则抽取样本单位的组织 形式。 2. 2.分类分类 a 等比例类型抽样 b 不等比例类型抽样 3. 3.抽样平均误差的计
19、算抽样平均误差的计算 重复抽样重复抽样 估计总体平均数时 估计总体成数时 不重复抽样不重复抽样 估计总体平均数时 估计总体成数时 n n n n n nn i ii n n n n ii ii i n n n n n iiii i i x 22 2 2 , 或 n npp pp n pp iii p )1( )1(, )1( n n n n n n n iiii i i x 22 2 2 ,)1( 或 n npp pp n n n pp iii p )1( )1(,)1( )1( 例:某乡种小麦6000亩,其中平原3600亩,丘陵 2400亩,现采用等比例类型抽样抽查了100亩,资 料如表,试
20、在95.45%的概率保证程度下估计该乡 粮食亩产量的范围。 解: 概率保证程度为概率保证程度为95.45%95.45%时,对应的概率度时,对应的概率度t=1.64t=1.64,则抽样,则抽样 极限误差为:极限误差为: 总平均亩产的估计值为:总平均亩产的估计值为: 即小麦亩产量的估计值在即小麦亩产量的估计值在259.39259.39公斤公斤276.61276.61公斤之间。公斤之间。 按地形 分类 播种面积 (亩) 抽样面积 (亩) 抽样平均亩产 (公斤) 抽样标准差 (公斤) 平原 丘陵 3600 2400 60 40 280 250 60 40 合计6000100268 i n i n i
21、x i s )(862 100 2504028060 1 公斤 n xn x k i ii 2800 100 40406060 22 1 2 2 n sn k i ii i )(25. 5) 6000 100 1 ( 100 2800 )1 ( 2 公斤 n n n i x )1(8.6=5.25 1.64=公斤 xx t xx xxx 61.27661. 826861. 826839.259x 1. 1.概念:概念:等距抽样又称机械抽样,它先将总体单位按 一定标志排列起来,而后按固定顺序和一定距离 来抽取样本单位的抽样方式。 2. 2.分类分类 a 根据排队依据的标志标志不同,分为无关标志排
22、队无关标志排队和 有关标志排队有关标志排队。 b 按样本单位抽选的方法方法不同,分为随机起点等距随机起点等距 抽样抽样、半距起点等距抽样半距起点等距抽样和对称等距抽样对称等距抽样。 3. 3.抽样平均误差计算抽样平均误差计算 如果总体是按无关标志排队,抽样平均误差可如果总体是按无关标志排队,抽样平均误差可 采用简单随机不重复抽样公式去近似计算;采用简单随机不重复抽样公式去近似计算; 如果总体是按有关标志排队,则可用等比例类如果总体是按有关标志排队,则可用等比例类 型抽样的公式去近似计算。型抽样的公式去近似计算。 1. 1.概念:概念:整群抽样是将总体划分成由总体单位所组成 的若干群,然后以群作
23、为抽样单位,从中随机抽 取一些群,对中选群内的所有单位进行全面调查 的抽样方式。 2. 2.特点:特点:组织工作比较方便,但抽样误差较大,代表 性较低。 3. 3.抽样平均误差的计算抽样平均误差的计算 整群抽样均采用不重复抽样整群抽样均采用不重复抽样 抽样平均数的抽样误差: 抽样成数的抽样误差: )1() 1 ( 22 r r rr rr r xx x r xx r xx i x i x 2 2 2 2 )()( 或 )1() 1 ( 22 r r rr rr r pp p r pp r pp i p i p 2 2 2 2 )()( 或 1.总体标志的变异程度 2.允许误差 3.概率保证程度
24、 4.抽样的方法和方式 估计总体平均数时 估计总体成数时 重复抽样 不重复抽样 x t n 2 22 p ppt n 2 2 )1 ( )1 ( )1 ( 22 2 pptn ppnt n p 222 22 tn nt n x 1在实际的抽样调查时,可先进行小规模的试验调 查求得样本的方差和成数来代替总体的方差和成 数,也可用历史的资料来代替 2利用公式计算的样本容量不一定是整数,如果带 有小数,则用“只入不舍”的原则。 3如果进行抽样调查时,同时要对总体平均数和总 体成数进行样本容量估计,选择较大者为样本容 量。 4在对总体成数进行推断前,如果计算样本容量时 缺少成数的资料,则可以直接假定成
25、数p为0.5,这 样p(1-p)等于0.25为是非标志方差的最大值,这样 可以保证抽样估计的精确度。 5公式中的样本容量是最低的,也是最必要的样本 容量。 目的:用抽样指标去推断全及指标 (一)直接推算法(一)直接推算法 直接换算法是用样本指标值或者总体指标 (总体平均数或者总体成数)的区间估计值乘以 总体单位数来推算总量指标的方法。 例:某地在10万户居民中随机抽选500户居民,经调查有90%的 居民家中拥有两台以上的彩电。试以95.45%的概率保证程度 推断,该地区有多少户居民拥有两台以上的彩电? 解:已知 ,则 由 ,可得 该地有两台以上彩电的用户数在87320户到92680户之间 )(
26、 ,)()( ,)(npnpnxnx ppxx 或者 2%,90,500,100000tpnn %34. 1) 100000 500 1 ( 500 )9 . 01 (9 . 0 )1 ( )1 ( n n n pp p %68. 2%34. 12 pp t pp ppp %68. 2%90%68. 2%90p 100000%)68.2%90(100000%)68.2%90(np 9268087320 np (二)修正系数法(二)修正系数法 修正系数法是先将抽样调查资料与全面调查 资料对比计算差错比率,即修正系数,然后用差 错比率修正全面调查结果。 步骤:步骤:1. 1.计算差所比率计算差所比
27、率 2. 2.用差错比率修正全面调查结果用差错比率修正全面调查结果 抽样总体全面调查数 抽样总体全面调查数抽样复查数 差错比率 差错比率)(未修正的全面调查数修正后的全面调查数1 例8.10 某市人口普查结束后,过了一个月 后又对某区进行抽样复测。已知,该市普查 时的人口数为2005600人,所抽中的地区其 普查时的人口数为120253人,一个月后抽样 复测时,其人口数为120290人。如果在这一 个月中,该区出生人数为68人,死亡人数为 56人,试计算该市普查的人数。 解:先把某区的人口数还原到普查时点的人 数: 120290-68+56=120278(人) 修正后的该市人口数=200560
28、0(1+0.02%) =2006001(人) 所以,该市的普查人数为2006001人。 120253 120253120278 差错比率 6 - 6 - 6 - 353535 6 - 6 - 6 - 363636 6 - 6 - 6 - 373737 6 - 6 - 6 - 383838 6 - 6 - 6 - 393939 6 - 6 - 6 - 404040 6 - 6 - 6 - 414141 6 - 6 - 6 - 424242 6 - 6 - 6 - 434343 3,43,33,23,13 2,42,32,22,12 4,44,34,24,14 1,4 4 1,3 321 1,21
29、,11 第二个观察值第二个观察值第一个第一个 观察值观察值 6 - 6 - 6 - 444444 3.53.02.52.03 3.02.52.01.52 4.03.53.02.54 2.5 4 2.0 321 1.51.01 第二个观察值第二个观察值第一个第一个 观察值观察值 6 - 6 - 6 - 454545 6 - 6 - 6 - 464646 6 - 6 - 6 - 474747 x 6 - 6 - 6 - 484848 6 - 6 - 6 - 494949 6 - 6 - 6 - 505050 6 - 6 - 6 - 515151 选择容量为选择容量为n 的的 简单随机样本简单随机样
30、本 计算样本方差计算样本方差s2 计算卡方值计算卡方值 2 = (n-1)s2/2 计算出所有的计算出所有的 2值值 总体总体 6 - 6 - 6 - 525252 6 - 6 - 6 - 535353 6 - 6 - 6 - 545454 6 - 6 - 6 - 555555 6 - 6 - 6 - 565656 6 - 6 - 6 - 575757 6 - 6 - 6 - 585858 6 - 6 - 6 - 595959 估估 计计 方方 法法 点点 估估 计计区间估计区间估计 6 - 6 - 6 - 606060 6 - 6 - 6 - 616161 6 - 6 - 6 - 62626
31、2 6 - 6 - 6 - 636363 6 - 6 - 6 - 646464 6 - 6 - 6 - 656565 6 - 6 - 6 - 666666 6 - 6 - 6 - 676767 6 - 6 - 6 - 686868 6 - 6 - 6 - 696969 2 2 已知已知 2 2 未知未知 均均 值值方方 差差比比 例例 置置 信信 区区 间间 6 - 6 - 6 - 707070 6 - 6 - 6 - 717171 6 - 6 - 6 - 727272 6 - 6 - 6 - 737373 6 - 6 - 6 - 747474 6 - 6 - 6 - 757575 6 - 6 - 6 - 767676 6 - 6 - 6 - 777777
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一方婚前贷款买房合同标准文本
- 个人返协议合同样本
- 关于小区维修合同样本
- 与车辆有关合同样本
- 企业合作合同样本招生
- 50亿工程合同标准文本
- 个人租房半合同样本
- 上海建筑门窗合同样本
- 人大志编纂合同标准文本
- 个人申请贷款合同样本
- 24年10月自考14237手机媒体概论试题及答案
- 扬尘防治(治理)监理实施细则(范本)
- 华为智慧矿山解决方案
- 幼儿园办园行为督导评估指标体系表
- 房地产项目能源管理制度制定
- 核心素养下小学道德与法治实践性作业设计探究
- DB11∕T 161-2012 融雪剂 地方标准
- 会务活动质量保障措施
- 2024-2025学年广东省珠海市高三(上)第一次摸底考试物理试卷(含答案)
- 游轮产品相关项目实施方案
- 部编版小学语文五年级下册第5单元语文要素解读
评论
0/150
提交评论