7、抽样与参数估计.ppt_第1页
7、抽样与参数估计.ppt_第2页
7、抽样与参数估计.ppt_第3页
7、抽样与参数估计.ppt_第4页
7、抽样与参数估计.ppt_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 抽样与参数估计,参数估计在统计方法中的地位,统计方法,描述统计,推断统计,假设检验,统计推断的过程,第七章 抽样与参数估计,第一节 抽样与抽样分布 第二节 参数估计基本方法 第三节 总体均值和总体比例的区间估计 第四节 两个总体均值及两个总体比例之差的估计 第五节 正态总体方差及两正态总体方差比的区间估计,学习目标,了解抽样和抽样分布的基本概念 理解抽样分布与总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的区间估计,第一节 抽样与抽样分布,一. 总体、个体和样本 二. 关于抽样方法 样本均值的分布与中心极限定理 样本方差的分布 两个样本方差比的分布

2、 六. T 统计量的分布,总体、个体和样本,总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 样本容量(Sample size):样本中所包含个体的数量,抽样方法,概率抽样:根据已知的概率选取样本 简单随机抽样:完全随机地抽选样本 分层抽样:总体分成不同的“层”,然后在每一层内进行抽样 整群抽样:将一组被调查者(群)作为一个抽样单位 等距抽样:在样本框中每隔一定距离抽选一个被调查者 非概率抽样:不是完全按随机原则选取样本 非随机抽样:由调查人员自由选取被调查者 判断抽样:通过某些条件过滤来选

3、择被调查者 配额抽样:选择一群特定数目、满足特定条件的被调查者,样本均值的抽样分布,抽样分布,样本统计量(如均值、比例、方差及标准差等)是随机变量,它们的分布被称为抽样分布 是一种理论概率分布 样本统计量是随机变量 样本均值, 样本比例等 结果来自容量相同的所有可能样本,样本均值的抽样分布(一个例子),【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下,均值和方差,样本均值的抽样分布 (一个例子), 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16种结果。所有样本的结果如下表,样本

4、均值的抽样分布 (一个例子), 计算出各样本的均值,如下表。并给出样本均值的抽样分布,样本均值的均值和方差,式中:M为样本数目(例子中M=16) 比较及结论:1. 样本均值的均值(数学期望)等于总体 均值; 2. 样本均值的方差等于总体方差的1/n 。,样本均值的分布与总体分布的比较,抽样分布, = 2.5 2 =1.25,总体分布,样本均值的抽样分布与中心极限定理,当总体服从正态分布N (,2 )时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X 的数学期望为,方差为2/n。即XN(,2/n),中心极限定理,中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当

5、n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,样本方差的抽样分布,卡方 (c2) 分布,均值的标准误差,所有可能的样本均值的标准差,测量所有样本均值的离散程度,简称标准误;,样本方差的分布,小于总体标准差; 计算公式为: 设总体服从正态分布N (,2 ), X1,X2,Xn为来自该正态总体的样本,则样本方差 s2 的分布为,2(n 1)称为自由度为(n-1)的卡方分布。,两个样本方差比的抽样分布,两个样本方差比的抽样分布,设X1,X2, ,Xn1是来自正态总体N(1,12 )的一个样本, Y1,Y2, ,Yn2是来自正态总体N(2,22 )的一个样本,且Xi(i=1,

6、2,,n1),Yi(i=1,2, ,n2)相互独立,则,将F(n1-1 , n2-1 )称为第一自由度为(n1-1),第二自由度为(n2-1)的F分布,两个样本方差比的抽样分布, 不同样本容量(自由度)的抽样分布,T 统计量的分布,T 统计量的分布,设X1,X2,Xn1是来自正态总体N(1,12 )的一个样本, 称,为统计量,它服从自由度为(n-1)的t 分布,第二节 参数估计基本方法,一. 点估计 二. 点估计的优良性准则 区间估计,参数估计的方法,被估计的总体参数,点 估 计,点估计,从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 例如: 用样本均值作为总体未

7、知均值的估计值,就是一个点估计 2. 点估计没有给出估计值在多大程度上接近总体未知参数的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,估计量,1. 用于估计总体某一参数的随机变量 如样本均值,样本比例、样本中位数等 例如: 样本均值就是总体均值的一个估计量 如果样本均值 x = 3 ,则 3 就是 的估计值 理论基础是抽样分布,估计量好坏的判定标准(无偏性),1、无偏性:估计量的数学期望等于被估计的总体参数,估计量好坏的判定标准(有效性),2、有效性:一个方差较小的无偏估计量被称为一个更有效的估计量。例如与中位数估计量相比,样本均值是一个更有效的估计量,估计量好坏的判断

8、标准(一致性),3、一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数,区间估计,区间估计,1. 根据一个样本的观察值给出总体参数的估计范围 给出总体参数落在这一区间的概率 例如: 总体均值落在5070之间,置信度为 95%,置信区间估计,落在总体均值某一区间内的样本,置信水平,总体未知参数落在区间内的概率 表示为 (1 - ,又可称为置信度 称为显著性水平,是总体参数未在区间内的概率 常用的置信度为: 99%, 95%, 90% 相应的 为 0.01,0.05,0.10,区间与置信水平,均值的抽样分布,(1 - ) %个区间包含了 % 个区间未包含,影响置信区间宽度的因素,1. 数

9、据的离散程度,用 来测度 样本容量, 3. 置信水平 (1 - ),影响 Z 的大小,第三节 总体均值和总体比例 的区间估计,一. 总体均值的区间估计 二. 总体比例的区间估计 样本容量的确定,总体均值的区间估计 (已知),单总体均值的置信区间 ( 已知),1. 假定条件 总体服从正态分布,且总体方差已知 如果不是正态分布,大样本下(n 30)可以由正态分布来近似 选取正态分布统计量,总体均值 在1-置信水平下的置信区间为:,总体均值的区间估计(正态总体:实例),解:已知总体N(,0.152),x21.4, n=9, 1- = 0.95,/2=1.96 总体均值的置信区间为,我们可以95的概率

10、保证该种零件的平均长度在21.30221.498 mm之间,【例】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差 =0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。,总体均值的区间估计(非正态总体:实例),解:已知 x26, =6,n=100, 1- = 0.95,/2=1.96,我们可以95的概率保证平均每天参加锻炼的时间在24.82427.176 分钟之间,【例】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体

11、方差为36分钟)。,总体均值的区间估计 (未知),总体均值的置信区间 ( 未知),1.假定条件 总体方差()未知 总体必须服从正态分布 使用 t 分布统计量,3. 总体均值 在1-置信水平下的置信区间为,总体均值的区间估计(实例),解:已知N(,2),x=50, s=8, n=25, 1- = 0.95,t/2=2.0639。,我们可以95的概率保证总体均值在46.6953.30 之间,【例】从一个正态总体中抽取一个随机样本, n = 25 ,其均值x = 50 ,标准差 s = 8。 求总体均值m 的95%的置信区间。,总体比例(成数)的区间估计,总体比例的置信区间,1. 假定条件 两类结果

12、 总体服从二项分布,大样本 可以由正态分布来近似 使用正态分布统计量,3. 总体比例 的置信区间为,总体比例的置信区间(实例),我们可以95的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%76.4%之间,【例】某企业做一项关于职工流动原因的调查,从该企业前职工的总体中随机选取200人组成一个样本。在对其进行访问时,有140人说他们离开企业是由于同管理人员不能融洽相处。试对由于这种原因而离开企业的人员的真正比例计算95%的置信区间。,样本容量的确定,估计总体均值时样本容量的确定,根据均值区间估计公式可得样本容量n为,样本容量n与总体方差2、允许误差、可靠性系数Z之间的关系为

13、 与总体方差成正比 与允许误差成反比 与可靠性系数成正比,其中:,样本容量的确定(实例),解:已知2=1800000,=0.05, Z/2=1.96,=500,应抽取的样本容量为,【例】一家广告公想估计某类商店去年所花的平均广告费有多少。以往资料表明,总体方差约为1800000元。如置信度取95%,并要使估计处在总体平均值附近500元的范围内,这家广告公司应抽多大的样本?,估计总体比例时样本容量的确定,根据比例区间估计公式可得样本容量n为,其中:,样本容量的确定(实例),【例】一家市场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为

14、95%,应抽多大容量的样本(没有可利用的p估计值)。,应抽取的样本容量为,第四节 两个总体均值及两个 总体比例之差估计,一. 两个总体均值之差估计 二. 两个总体比例之差估计,两个总体均值差的区间估计,两个样本均值之差的抽样分布,两个总体均值之差的估计 (12、22 已知),1. 假定条件 两个样本是独立的随机样本 两个总体都服从正态分布 若不是正态分布, 可以用正态分布来近似(n130和n230) 两个独立样本均值之差的抽样分布服从正态分布,其期望值为,其标准误差为,两个总体均值差的区间估计 (12、22 已知),使用正态分布统计量Z,两个总体均值之差1-2在1- 置信水平下的置信区间为,两

15、个总体均值之差的估计(实例),【例】一个银行负责人想知道储户存入两家银行的钱数。他从两家银行各抽取了一个由25个储户组成的随机样本,样本均值如下:银行A:4500元;银行B:3250元。设已知两个总体服从方差分别为A2=2500和B2=3600的正态分布。试求A- B的区间估计 (1)置信度为95% (2)置信度为99%,B,A,两个总体均值之差的估计(计算结果),解:已知 XAN(A,2500) XB N(B,3600) xA=4500, xB=3250, A2 =2500 B2 =3600 nA= nB =25,(1) A- B置信度为95%的置信区间为,(2) A- B置信度为99%的置

16、信区间为,两个总体均值之差的估计 (12、22未知,但相等),假定条件 两个总体都服从正态分布 12、12未知,但1212(方差齐性) 总体方差2的联合估计量为,估计量x1-x2的标准差为,两个总体均值差的估计 (12、22未知,但相等),使用 t 分布统计量,两个总体均值之差1-2在1- 置信水平下的置信 区间为,两个总体均值差的估计(实例),【例】为比较两位银行职员为新顾客办理个人结算账目的平均时间,分别给他们随机安排了10位顾客,并记录下为每位顾客办理账单所需的时间(分钟),设相应样本均值和方差分别为:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位职员办

17、理账单所需时间X均服从正态分布,且方差相等。试求两位职员办理账单的服务时间之差的95%的区间估计。,两个总体均值差的区间估计(计算结果),解:已知 X1N(1,2) X2 N(2,2) x1=22.2, x2=28.5, s12=16.63 s22=18.92 n1= n2=10 12= 12,1- 2置信度为95%的置信区间为,两个总体均值之差的估计 ( 12 、 22未知,且不相等),假定条件 两个总体都服从正态分布 12 、 22未知,且 12 22 使用的统计量为,两个总体均值之差的估计 (12、22未知,且不相等), 两个总体均值之差1-2在1- 置信水平下的置信区间为,两个总体均值

18、之差的估计(续前例),【例】为比较两位银行职员为新顾客办理个人结算账目的平均时间长度,分别给两位职员随机安排了10位顾客,并记录下了为每位顾客办理账单所需的时间(分钟),相应样本均值和方差分别为:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位职员办理账单所需时间X服从正态分布,但方差不相等。试求两位职员办理账单的服务时间之差的95%的区间估计。,两个总体均值之差的估计(计算结果),自由度 f 为,1- 2置信度为95%的置信区间为,解:已知 X1N(1,2) X2 N(2, 2) x1=22.2, x2=28.5, s12=16.63 s22=18.92 n1

19、= n2=10 1212,两个总体比例差的区间估计,两个总体比例之差的区间估计,1. 假定条件 两个总体是独立的 两个总体服从二项分布 大样本下可用正态分布来近似 2. 两个总体比例之差P1-P2在1-置信水平下的置信区间为:,两个总体比例差的区间估计(实例),【例】某饮料公司对其所做的报纸广告在两个城市的效果进行了比较,它们从两个城市中分别随机地调查了1000个成年人,其中看过广告的比例分别为p1=0.18和p2=0.14。试求两城市成年人中看过广告的比例之差的95%的置信区间。,两个总体比例之差的估计(计算结果),P1- P2置信度为95%的置信区间为,我们有95%的把握估计两城市成年人中看过该广告的比例之差在0.79% 7.21%之间,第五节 正态总体方差及两正 态总体方差比的估计,一. 正态总体方差的区间估计 二. 两个正态总体方差比的区间估计,正态总体方差的区间估计,正态总体方差的区间估计,1. 估计一个总体的方差或标准差 2. 假设总体服从正态分布 总体方差 2 的点估计量为S2,且,4. 总体方差在1-置信水平下的置信区间为,正态总体方差的区间估计(实例),【例】对某种金属的10个样品

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论