第5章 抽样分布与参数估计幻灯片_第1页
第5章 抽样分布与参数估计幻灯片_第2页
第5章 抽样分布与参数估计幻灯片_第3页
第5章 抽样分布与参数估计幻灯片_第4页
第5章 抽样分布与参数估计幻灯片_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章 抽样分布与参数估计 5-2 第五章 抽样分布与参数估计 n 第一节 抽样的基本概念与数学原理 n 第二节 抽样分布 n 第三节 参数估计 n 第四节 样本容量的确定 n 第五节 EXCEL在参数估计中的应用 5-3 第一节 抽样的基本概念与数学原理 一、有关抽样的基本概念 二、大数定理与中心极限定理 5-4 一、有关抽样的基本概念 (一)样本容量与样本个数 1.样本容量 。样本是从总体中抽出的部分单位 的集合,这个集合的大小称为样本容量,一般用 n 表示,它表明一个样本中所包含的单位数。 一般地,样本单位数大于 30个的样本称为大 样本,不超过 30个的样本称为小样本。 2.样本个数 。样本个数又称样本可能数目,它 是指从一个总体中可能抽取多少个样本。 5-5 (二)总体参数与样本统计量 1.总体参数 。总体分布的数量特征就是总体的 参数,也是抽样统计推断的对象。 常见的 总体 参数有:总体的 平均数 指标,总体 成数 (比例 )指标,总体分布的 方差 、 标准差 等等。 它们都是反映总体分布特征的重要指标。 2.样本统计量 。样本统计量是样本的一个函数 。它们是随机变量。我们利用统计量来估计和推 断总体的有关参数。 常见的 样本 统计量有:样本 平均数 ,样本 比例 ,样本的 方差 、 标准差 。 5-6 (三)概率抽样及其组织形式 所谓 概率抽样 ,就是要求对总体的每一次 观察(每一次抽取)都是一次随机试验,并且有 和总体相同的分布。按这样的要求对总体观测( 抽取) n次,可得到容量为 n的样本。 5-7 显然,( 1)和( 2)的抽取行为都不是随机 试验。因而不属于概率抽样。只有( 3)的抽取行 为是随机试验。总体的分布可用表 5-1的分布列来 描述,而( 3)的随机试验中所观测的随机变量也 有与表 5-1有相同的分布。所以,( 3)的抽取行 为是概率抽样。 5-8 (四)放回抽样与不放回抽样 1.放回抽样 。 放回抽样的 具体做法 是:从总体中抽出一个样 本单位,记录其标志值后,又将其放回总体中继续 参加下一轮单位的抽取。 放回抽样的 特点 是: 一, n个单位的样本是由 n次试验的结果构成的。 二,每次试验是独立的,即其试验的结果与前次、 后次的结果无关。 三,每次试验是在相同条件下进行的,每个单位在 多次试验中选中的机会 (概率 )是相同的。 在放回抽样中,样本可能的个数是 , N为 总体单位数, n为样本容量。 5-9 不放回抽样的 具体做法 是:每次从总体抽取一个单 位,记录其标志值后不放回原总体,不参加下一轮抽样 。下一次继续从总体中余下的单位中抽取。 不放回抽样的 特点 是: 一, n个单位的样本由 n 次试验结果构成,但由于每次 抽出不放回,所以实质上相当于从总体中同时抽取 n个 样本单位。 二,每次试验结果不是独立的,上次中选情况影响下次 抽选结果。 三,每个单位在多次 (轮 )试验中中选的机会是不等的。 不放回抽样,如果考虑顺序,其样本可能个数为 如果不考虑顺序,其样本可能个数为 5-10 2.不放回抽样 。 5-11 (五)抽样分布 从总体中可以随机地抽取许多样本,由每一个 样本都可以计算样本统计量的观测值,所有可能的 样本观测值及其所对应的概率便是所谓的 抽样分布 。因此,抽样分布也可以称为样本统计量的 概率分 布 。 抽样分布可能是精确地服从某种已知分布(所谓 已知分布,例如我们在第四章介绍过的各种常见分 布),也可能是以某种已知分布为极限分布。在实 际应用中,后者更为多见。 5-12 5-13 5-14 第 二 次 抽 取 可 能 被 抽 中 的 人 员 1 2 3 4 5 6 7 8 9 10 第 一 次 抽 取 可 能 被 抽 中 的 人 员 1 1,1(1) 1,2(1.5) 1,3(2) 1,4(2.5) 1,5(3) 1,6(3.5) 1,7(4) 1,8(4.5) 1,9(5) 1,10(5.5) 2 2,1(1.5) 2,2(2) 2,3(2.5) 2,4(3) 2,5(3.5) 2,6(4) 2,7(4.5) 2,8(5) 2,9(5.5) 2,10(6) 3 3,1(2) 3,2(2.5) 3,3(3) 3,4(3.5) 3,5(4) 3,6(4.5) 3,7(5) 3,8(5.5) 3,9(6) 3,10(6.5) 4 4,1(2.5) 4,2(3) 4,3(3.5) 4,4(4) 4,5(4.5) 4,6(5) 4,7(5.5) 4,8(6) 4,9(6.5) 4,10(7) 5 5,1(3) 5,2(3.5) 5,3(4) 5,4(4.5) 5,5(5) 5,6(5.5) 5,7(6) 5,8(6.5) 5,9(7) 5,10(7.5) 6 6,1(3.5) 6,2(4) 6,3(4.5) 6,4(5) 6,5(5.5) 6,6(6) 6,7(6.5) 6,8(7) 6,9(7.5) 6,10(8) 7 7,1(4) 7,2(4.5) 7,3(5) 7,4(5.5) 7,5(6) 7,6(6.5) 7,7(7) 7,8(7.5) 7,9(8) 7,10(8.5) 8 8,1(4.5) 8,2(5) 8,3(5.5) 8,4(6) 8,5(6.5) 8,6(7) 8,7(7.5) 8,8(8) 8,9(8.5) 8,10(9) 9 9,1(5) 9,2(5.5) 9,3(6) 9,4(6.5) 9,5(7) 9,6(7.5) 9,7(8) 9,8(8.5) 9,9(9) 9,10(9.5) 10 10,1(5.5) 10,2(6) 10,3(6.5) 10,4(7) 10,5(7.5) 10,6(8) 10,7(8.5) 10,8(9) 10,9(9.5) 10,10(10) 表 5-3 10人中有放回抽二人的全部可能样本 5-15 表 5-4 任职年限样本均值分布数列 5-16 5-17 二、大数定理与中心极限定理 5-19 大数定理 表明表明 :尽管个别现象受偶然因素影 响,有各自不同的表现。但是,对总体的大量观察 后进行平均,就能使偶然因素的影响相互抵消,消 除由个别偶然因素引起的极端性影响,从而使总体 平均数稳定下来,反映出事物变化的一般规律。 5-20 5-21 从 正态分布的再生定理 可以 看出看出 :只要总体变 量服从正态分布,则从中抽取的样本,不管 n 是 多少,样本平均数都服从正态分布。 但是在客观实际中,总体并非都是正态分布。 对于从非正态分布的总体中抽取的样本平均数的分 布问题,需要由 中心极限定理 来解决。 5-22 5-23 5-24 第二节 抽样分布 一、样本平均数的抽样分布 二、样本比率的抽样分布 5-25 一、样本平均数的抽样分布 (一)样本平均数的期望值与方差 5-26 5-27 5-28 5-29 (二)样本平均数的分布规律 5-30 5-31 5-32 二、样本比率的抽样分布 (一 )样本比率的期望值与方差 5-33 5-34 5-35 5-36 (二)样本比率的分布规律 5-37 表 5-5 用正态分布来近似时对样本量的要求 总 体 参 数 0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 1 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 样 本量 至少 为 n 36 37 38 40 43 48 57 71 100 5-38 (三)样本方差的抽样分布 5-39 5-40 第三节 参数估计 一、参数估计概述 二、总体均值的估计 三、总体比率的估计 四、总体方差的估计 5-41 一、参数估计概述 (一)参数估计的定义与种类 所谓 参数估计 ,就是用样本统计量去估计总 体的未知参数(或参数的函数)。例如,估计总 体均值,估计总体比率和总体方差等等。 参数估计有 两种基本形式 : 点估计 和 区间估 计 。前者是用一个数值作为未知参数 的估计值 ,后者则是给出具体的上限和下限,把 包括在 这个区间内。下面分别介绍点估计与区间估计的 有关概念。 5-42 (二)点估计 点估计 ,主要有 矩估计法 和 最大似然估计法 。 矩估计 法是用样本矩去估计总体矩(或是用样 本矩的函数去估计总体矩的相应函数)的一种估计 方法,由此获得的估计量称作矩估计量; 最大似然估计 法是把待估计的总体参数看作一个 可以取不同数值的变量,计算当总体参数取上述不 同数值的时候,发生我们当前所得到的样本观测值 的不同概率,总体参数取哪一个数值的时候这种概 率最大,便把这个数值作为对总体参数的估计结果 。 5-43 (三)估计量的优良标准 2. 有效性 。又称最小方差性。 5-44 4. 充分性 。估计量包含了样本中关于 的全部 信息。 5-45 (四)区间估计与估计的精度和可靠性 5-46 5-47 5-48 二、总体均值的估计 5-49 5-50 5-51 5-52 5-53 5-54 5-56 (二)总体方差 2未知的情形 5-57 2. 区间估计 5-58 5-59 5-61 【 例 5-8】 在例 5-7中,若总体方差未知,但通过抽 取的 6个样本测得的样本方差为 0.0025,试在 0.95 的置信度下,求该产品直径的均值置信区间。 5-62 三、总体比率的估计 5-63 (二)区间估计 由于总体的分布是 0-1分布,只有在大样本的情况 下,才服从正态分布。总体比率可以看成是一种特殊 的平均数,类似于总体均值的区间估计,总体比率的 区间估计是: 5-64 【 例 5-9】 在某市区随机调查了 300个居民户,其中 6 户拥有等离子电视机。试求该区(按户计算的)等离 子电视机拥有率的 0.95置信区间。 解:本例总体单位数 N很大,故采用放回抽样的有关 公式计算。 n=300,p=0.02, n P=65, 可以认为户 数 n充分大, =0.05, 。 5-65 四、总体方差的估计 5-66 (二)区间估计 5-67 【 例 5-10】 某公司生 产 一种健康食品, 对 每罐食品 的重量有一定 规 定,不允 许 有 过 大的差异。 设 每罐 食品的重量服从正 态 分布。 现 从生 产线 上抽 查 了 10 个 样 本,求得其 样 本方差 为 9.2, 试对总 体方差 进 行置信度 为 0.90的区 间 估 计 。 解: , 置信度 为 0.90的置信区 间为 : = 5-68 第四节 样本容量的确定 一、问题的提出 二、估计总体均值时样本容量的确定 三、估计总体比例时样本容量的确定 四、使用上述公式应注意的问题 5-69 由前面的论述,我们已知参数估计中的精度 要求与可靠性要求常常是一对矛盾,但是,通过 增加样本容量 n有可能降低样本平均数的标准差, 从而实现既保证一定的估计精度,又具有较高的 置信度的目的。这时,需要考虑在给定的置信度 与极限误差的前提下,样本容量 n究竟取多大合适 ?这就是所谓样本容量的确定问题。 一、问题的提出 5-70 二、估计总体均值时样本容量的确定 5-71 5-72 5-73 三、估计总体比率时样本容量的确定 5-74 四、使用上述公式应注意的问题 1计算样本容量时,总体的方差与成数常常是 未知的,这时可用有关资料替代:一是用历史资料 已有的方差与成数代替;二是在进行正式抽样调查 前进行几次试验性调查,用试验中方差的最大值代 替总体方差;三是比率方差在完全缺乏资料的情况 下,就用比率方差的最大可能值 0.25代替。 2.如果进行一次抽样调查,需要同时估计总体 均值与比率,可用上面的公式同时计算出两个样本 容量,取其中较大的结果,同时满足两方面的需要 。 3.上面的公式计算结果如果带小数,这时样本 容量不按四舍五入法则取整数,取比这个数大的最 小整数代替。例如计算得到: n=56.03,那么,样本 容量取 57,而不是 56。 5-75 5-76 5-77 5-78 5-79 第五节 Excel在参数估计中的应用 【 例 5-13】 用 Excel完成本章思考与练习计算题的 第 1题。 解:操作步骤如下。 1构造工作表。如图 5-3所示, A、 B列为原始 输入数据, A2:A16存放的是关于最大飞行速度 的数据,图中未完全显示出来。 C、 D列为计算 结果,分别在 C2、 D2单元格存放置信下限和上 限。 2定义变量名。将 A列命名为 “x”,将 B2单元格 命名为 “置信水平 ”。 5-80 3计算置信上、下限。 分别在 C2、 D2中输入如下的公式: =AVERAGE(x)-TINV(1-置信水平 , COUNT(x)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论