估计量的评价及区间估计教学设计_第1页
估计量的评价及区间估计教学设计_第2页
估计量的评价及区间估计教学设计_第3页
估计量的评价及区间估计教学设计_第4页
估计量的评价及区间估计教学设计_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Administrator[日期]概率论与实用文档概率论与数理统计教学设计课程名称经济应用数学C课时50+50=100分钟任课教师蔡东平专业与班级市营B1601班人资B1601-02班课型新授课课题估计量评价准则区间估计学习目标知识与技能1.理解并掌握估计量评价的三个准则:无偏性、有效性、相合性;2.理解置信区间的概念;3.掌握一个总体参数均值、方差的区间估计.4.了解两个总体均值之差的区间估计5.了解两个总体均值之差的估计:匹配样本6.了解两个总体比例之差的区间估计过程与方法1.从上节课例子中引入新课。2.通过具体例子理解无偏性、有效性、相合性.3.通过具体的应用性例题,理解置信区间.4理解大样本的估计方。掌握一个总体参数均值、方差的区间估计。5.基于学生的基础状况,采用“交互探究式教学”,用直观的方式,引导学生了解两个总体均值之差的区间估计了解两个总体均值之差的估计:匹配样本;了解两个总体比例之差的区间估计。情感态度与价值观1.培养学生能够自觉地用统计的视角观察生活,发现规律,总结规律,将概率统计方法用于分析和探讨生活中的实际问题,提高认知能力和水平.2.让学生理解,一个真理的发现不是一蹴而就的,需要经过有简单到复杂,由具体到抽象的不断深入的过程.教学分析教学内容1.估计量评价的三个准则:无偏性、有效性、相合性;2.置信区间的概念;3.一个总体参数均值、方差的区间估计.4.两个总体均值之差的区间估计5.两个总体均值之差的估计:匹配样本6.两个总体比例之差的区间估计教学重点1.估计量评价的三个准则:无偏性、有效性、相合性;2.置信区间的概念;3.一个总体参数均值、方差的区间估计.教学难点1.相合性;2.置信区间的概念;3.一个总体参数方差的区间估计.4.两个总体均值之差的区间估计5.两个总体均值之差的估计:匹配样本6.两个总体比例之差的区间估计教学方法与策略课堂教学设计思路对于总体分布中一个未知参数,可提出不同的估计量θ的估计量,矩估计:极大似然估计:这就出现了比较好坏的问题,给出评定好坏标准。区间估计是在点估计基础上,给出总体参数估计的一个区间,由此可以衡量点估计值可靠性的度量。这个区间通常是由样本统计量加减抽样误差而得到。以样本均值的区间估计来说明区间估计原理:根据样本均值的抽样分布可知,重复抽样或无限总体抽样情况下,样本均值的数学期望值等于总体均值,样本均值的标准误差等于,由此可知,样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827,两个标准误差范围0.9545,三个标准误差范围0.9973,并可计算出样本均值落在的两侧任何一个标准误差范围内的概率(根据已知的,计算)。但实际估计时,是未知的,因而不再是估计样本均值落在某一范围内的概率,而只能根据已设定的概率计算这个范围的大小。例如:约有95%的样本均值会落在距的两个标准误差范围内,即约有95%的样本均值所构造的两个标准误差的区间会包括。在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,区间的最小值为置信下限,最大值为置信上限。例如,抽取了1000个样本,根据每个样本构造一个置信区间,其中有95%的区间包含了真实的总体参数,而5%的没有包括,则称95%为置信水平/置信系数。构造置信区间时,可以用所希望的值作为置信水平,常用的置信水平是90%,95%,99%,见下表:置信水平/2/290%0.100.051.64595%0.050.0251.9699%0.010.0052.58称为显著性水平,表示用置信区间估计的不可靠的概率,1-为置信水平。如何解释置信区间:如用95%的置信水平得到某班学生考试成绩的置信区间为(60,80),即在多次抽样中有95%的样本得到的区间包含了总体真实平均成绩,(60,80)这个区间有95%的可能性属于这些包括真实平均成绩的区间内的一个。板书设计1.估计量评价的三个准则:无偏性、有效性、相合性;2.置信区间的概念;3.一个总体参数均值、方差的区间估计.4.两个总体均值之差的区间估计5.两个总体均值之差的估计:匹配样本6.两个总体比例之差的区间估计教学进程1.无偏性(15分钟)教学意图教学内容教学环节累计15分钟通过上一节课学习,我们已经发现,点估计有各种不同的求法,为了在不同点估计间进行比较选择,就必须对各种点估计的好坏给出评价标准.对小样本而言,需要一些其他的评价标准,无偏性便是一个常用的评价标准.设为参数θ的一个估计量,若E()=θ,则称为θ的一个无偏估计量。称|E(-θ)|为系统误差。无偏性要求可以改写为,这表示无偏估计没有系统偏差.当我们使用估计时,由于样本的随机性,与总是有偏差的,这种偏差时而(对某些样本观测值)为正,时而(对另一些样本观测值)为负,时而大,时而小.无偏性表示,把这些偏差平均起来其值为0,这就是无偏估计的含义.而若估计不具有无偏性,则无论使用多少次,其平均也会与参数真值有一定距离,这个距离就是系统误差.例1对任一总体而言,样本均值是总体均值的无偏估计.当总体k阶矩存在时,样本k阶原点矩是总体k阶原点矩的无偏估计.但对k阶中心矩则不一样,譬如,样本方差就不是总体方差的无偏估计,因为在前面已经指出:.对此,有如下两点说明:当样本趋于无穷时,有,我们称为的渐近无偏估计,这表明当样本量较大时,可近似看作的无偏估计.若对作如下修正:,(6.2.5)则是总体方差的无偏估计.这种简单的修正方法在一些场合被采用.(6.2.5)定义的也称为样本方差,它比更常用.这是因为在时,<,因此用估计有偏小的倾向,特别在小样本场合要使用估计.无偏性不具有不变性.即若是的无偏估计,一般而言,不是的无偏估计,除非是的线性函数.譬如,是的无偏估计,但s不是的无偏估计.下面我们以正态分布为例加以说明.时间:15分钟对任一总体而言,样本均值是总体均值的无偏估计2.有效性:(15分钟)教学意图教学内容教学环节有效性累计30分钟设,同为θ的无偏估计,若D()≤D(),则认为更为有效。例2.总体X~π(λ),为来自总体的样本则,,,都是λ的无偏估计显然更有效例3.证明:与(=1)同为E(X)=μ的无偏估计,但更有效证明:E()=μ,E()==μD()=,D()=,进而也就是说D()≤D()时间:15分钟3.一致性(相合性)(20分钟)教学意图教学内容教学环节累计50分钟数理统计中给出了众多的估计量评价标准,对同一估计量实用不同的评价标准可能会得到完全不同的结论,因此在评价某一个估计好坏时首先要说明是在哪一个标准下,否则所论好坏则毫无意义.但不管怎么说,有一个基本标准时所有的估计都应该满足的,它是衡量一个估计是否可行的必要条件,这就是估计的相合性,我们就从相合性开始。若,,,则称为θ的一致估计量。如弱大数定理,,同理是总体均值μ的无偏,有效,一致估计量S2是总体方差σ2的无偏,有效,一致估计量在判断估计的相合性时下述两个定理是很有用的。定理6.2.1设是的一个估计量,若则是的相合估计。证明:对任意的,由切比雪夫不等式有另一方面,由可知,当充分大时有注意到此时如果,就有故由此即有定理得证。例设是来自均匀总体的样本,证明的最大似然估计是相合估计。证明在例6.1.8中我们已经给出的最大似然估计是。由次序统计量的分布,我们知道的分布密度函数为故有由定理6.2.1可知,是的相合估计。定理6.2.2若分别是的相合估计,是的连续函数,则是的相合估计。证明有函数的连续性,对任意给定的,存在一个,当,有(6.2.3)又由的相合性,对给定的,对任意给定的,存在正整数,使得时,.从而有根据(6.2.3),,故有,由的任意性,定理得证.由大数定律及定理6.2.2,我们可以看到,矩估计一般都具有相合性.比如:·样本均值是总体均值的相合估计;·样本标准差是总体标准差的相合估计;·样本变异系数是总体变异系数的相合估计.例设一个试验有三种可能结果,其发生概率分别为现做了次试验,观测到三种结果发生的次数分别为,可以采用频率替换方法估计.由于可以有三个不同的的表达式:从而可以给出三种不同的频率替换估计,它们分别是:由大数定律,分别是的相合估计,由定理6.2.2知,上述三个估计都是的相合估计.时间20分钟随着样本量的增大,点估计值越来越接近总体参数。以样本均值为例,抽样分布时,样本均之抽样分布的标准误差SE=/,样本量越大,SE越小。当n无限大时,样本均值称为总体均值的一致估计量。下课休息10分钟4.置信区间(10分钟)教学意图教学内容教学环节累计10分钟定义2.5.1设是总体的一个参数,其参数空间为,是来自该总体的样本,对给定的一个(0<<1),假设有两个统计量和,若对任意的,有则称随机区间是的的置信区间,和分别称为的置信下限和置信上限。置信区间的频率意义:置信水平1-:在大量重复使用的置信区间时,每次得到的样本观测值是不同的,从而每次得到的区间也不是不一样的,对每次具体的观测值而言,可能在内,也可能不在。平均而言,在大量的区间估计观测值中,至少有包含。它是在点估计基础上,给出总体参数估计的一个区间,由此可以衡量点估计值可靠性的度量。这个区间通常是由样本统计量加减抽样误差而得到。以样本均值的区间估计来说明区间估计原理:根据样本均值的抽样分布可知,重复抽样或无限总体抽样情况下,样本均值的数学期望值等于总体均值,样本均值的标准误差等于,由此可知,样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827,两个标准误差范围0.9545,三个标准误差范围0.9973,并可计算出样本均值落在的两侧任何一个标准误差范围内的概率(根据已知的,计算)。但实际估计时,是未知的,因而不再是估计样本均值落在某一范围内的概率,而只能根据已设定的概率计算这个范围的大小。例如:约有95%的样本均值会落在距的两个标准误差范围内,即约有95%的样本均值所构造的两个标准误差的区间会包括。在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,区间的最小值为置信下限,最大值为置信上限。例如,抽取了1000个样本,根据每个样本构造一个置信区间,其中有95%的区间包含了真实的总体参数,而5%的没有包括,则称95%为置信水平/置信系数。构造置信区间时,可以用所希望的值作为置信水平,常用的置信水平是90%,95%,99%,见下表:置信水平/2/290%0.100.051.64595%0.050.0251.9699%0.010.0052.58称为显著性水平,表示用置信区间估计的不可靠的概率,1-为置信水平。如何解释置信区间:如用95%的置信水平得到某班学生考试成绩的置信区间为(60,80),即在多次抽样中有95%的样本得到的区间包含了总体真实平均成绩,(60,80)这个区间有95%的可能性属于这些包括真实平均成绩的区间内的一个。时间10分钟5.一个总体参数的区间估计(20分钟)教学意图教学内容教学环节累计30分钟一、总体均值的的区间估计1、大样本的估计方法当总体服从正态分布且方差已知,或者总体不是正态分布但为大样本时,样本均值的抽样分布均为正态分布,其数学期望值等于总体均值,方差为/n。样本均值经过标准化以后的随即变量服从标准正态分布,Z=~N(0,1)对于的双侧置信区间,有P(<Z)=1-或P(-Z<Z<Z)=1-,将统计量Z代入上式,得:P(-Z<<Z)=1-,经整理有P(-<<+)=1-总体均值所在(1-)置信水平下的置信区间为:(公式1),为标准正态分布右侧面积为/2的z值,是估计总体均值时的允许误差。/21-=95%/2-0如果总体为正态分布但方差未知,或总体不服从正态分布,只要大样本条件下,公式2中的总体标准差可用样本标准差代替,公式2例1:一家食品厂每天产量8000克左右。每袋产品规定重量100克,企业质检部门为对产品质量进行监测,经常抽检分析每袋重量是否达标。先从某天生产的一批产品中随机抽取25袋,测得25袋平均重量为105.36克。已知产品重量分布呈正态分布,总体标准差为10克。试估计该批产品平均重量在95%的置信水平下的置信区间。解:已知=10,n=25,置信水平1-=95%,查标准正态分布表得=1.96。=105.361.96×10/=105.363.92即该批食品平均重量的95%的置信区间为(101.44,109.28)。例2:一家保险公司收集到由36个投保人组成的随机样本,36人的平均年龄为39.5岁,标准差为7.77岁。试确立该公司投保人平均年龄90%的置信区间。解:已知,n=36,s=7.77,1-=90%,=1.645。由于总体方差未知,但为大样本,可用样本方差代替总体方差。=39.51.645×7.77/=39.52.13投保人平均年龄的90%的置信区间为(37.37,41.63)。2、小样本的估计方法在总体为正态分布的情况下,抽取到小样本时,如果方差已知可以按照公1构造;如果方差未知,则样本均值经过标准化处理后的随机变量不再服从Z分布,而是服从自由度为n-1的t分布,用s2代替,t=需要用t分布来构造总体均值的置信区间。t分布是类似于正态分布的一种对称分布,通常其比正态分布平坦和分散,一个特定的t分布依赖于自由度。随着自由度的增大,t分布逐渐趋于正态分布。标准正态分布自由度为20的t分布自由度为10的t分布根据t分布建立的总体均值在1-置信水平下的置信区间为:公式3tα/2是自由度为n-1时,t分布中右面积为α/2时的t值,可通过查t分布表得。例3:已知某种灯泡的使用寿命服从正态分布,先从一批灯泡中随机挑出16只,测得平均使用寿命为1490小时,样本标准差为24.77小时,试确定该批灯泡平均寿命95%的置信区间。解:根据=0.05查表得,tα/2(n-1)=tα/2(15)=2.131。=14902.131×=149013.2该灯泡平均寿命的95%的置信区间为(1476.8,1503.2)。不同情况下总体均值的区间估计:总体分布样本量方差已知方差未知正态分布大样本(n≥30)小样本(n<30)非正态分布大样本(n≥30)二、总体比例(二项总体参数P)的区间估计根据中心极限定理,当大样本时,样本比例分布可近似看作正态分布,p的数学期望等于总体比例,E(p)=π,p的方差等于σ2p=π(1-π)/n。p经过标准化的随机变量服从标准正态分布,z=~N(0,1)可得大样本总体比例在1-α置信水平下的区间估计公式:=公式4是总体比例的点估计,是允许误差。例4:某城市希望了解下岗职工中女性的比例,随机抽取100个下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。解:已知n=100,zα/2=1.96,样本女性比例=65%,==65%1.96×=65%9.35%该城市下岗职工中女性比例的95%的置信区间是(55.65%,74.35%)。虽然样本比例p随着样本量增大而近似服从正态分布,但n应该多大才能使其呈正态分布呢?这与样本比例p的取值有关,当p接近0.5时,用较小的样本就可使其服从正态,而当p接近0或1时,则需要大样本。三、总体方差的区间估计样本方差服从于自由度为n-1的卡方分布,所以用卡方分布构造总体方差的置信区间。总体方差在1-α的置信区间1-α/2α/2建立总体方差的置信区间,就是要找到一个值,使其满足P(1-α/2≤≤α/2)=1-α由于=~(n-1),代入上式,有1-α/2≤≤α/2,可得总体方差在置信水平下的置信区间为:≤≤公式5例5:仍以例1为例,如不知道总体方差,抽查25袋食品的方差为93.21克。以95%的置信水平构造该厂食品重量方差的置信区间。解:根据显著性水平α=0.05,自由度n-1=24,查卡方分布表得,α/2(24)=39.364,1-α/2(24)=12.401。总体方差的置信区间为:≤≤该厂食品总体重量方差的95%的置信区间为(56.83,180.39)。时间20分钟6.两个参数的区间估计(18分钟)教学意图教学内容教学环节累计48分钟一、两个总体均值之差的区间估计1、两个总体均值之差的估计:独立样本(1)大样本的估计方法如果两个总体都为正态分布,或者都不是正态分布但都是样本都是大样本(n≥30),则(-)的抽样分布服从于期望值为(μ1-μ2),方差为σ12/n1+σ22/n2的正态分布。两个样本之差经过标准化后服从标准正态分布。当两个总体的方差已知,(μ1-μ2)在1-α下的置信区间为:(-)公式6当两个总体的方差未知,(μ1-μ2)在1-α下的置信区间为:(-)公式7例6:某地区教委想估计两所中学的学生高考英语平均成绩之差,现在两所中学独立抽取两个随机样本,见下表。确定两所中学高考英语平均分之差在95%的置信区间。中学1n1=46=86s1=5.8中学2n2=33=78S2=7.2解:(-)=(86-78)1.96×=82.97两所中学高考英语平均分之差在95%的置信区间为(5.03,10.97)(2)小样本估计方法两个样本都是小样本的情况下,为估计两个总体均值之差,需要作出以下假定:两个总体都服从正态分布;两个总体的方差相等;两个随机样本分别独立地抽自两个总体。在上述假定下,无论样本量大小,两样本均值之差都服从正态分布,当总体方差已知时,可用公式6计算。当两个总体方差未知但相等时,则需要用两个样本的方差来估计,需要将两个样本数据组合在一起,计算联合方差,用sp2表示,公式为:sp2=,公式8这样,两个样本均值之差经过标准化后服从自由度为n1+n2-2的t分布。因此,两总体均值之差在1-α下的置信区间:(-)公式9例7:为了估计两种方法组装产品所需时间的差异,分别对两种不同组装方法各随机安排12名工人,方法1组的工人平均耗时32.5分钟,方差为15.996分钟;方法2组的工人平均耗时28.8分钟,方差为19.358分钟。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平确定两种方法组装产品所需平均时间之差的置信区间。解:联合方差sp2===17.677根据α=0.05,自由度=12+12-2=22,查t分布表得tα/2(22)=2.074。(-)=(32.5-28.8)2.074=3.73.56两种方法组装产品所需平均时间之差的95%的置信区间为(0.14,7.26)。2、两个总体均值之差的估计:匹配样本两个独立样本存在潜在弊端,如例7当中如果存在样本指定不公平,则会掩盖两种方法的真实差异。对此,可以使用匹配样本,如例7可以选择12个工人先用方法一组装,再用方法二组装,这样得到匹配数据。使用匹配数据进行估计时,大样本条件下,两个总体均值之差μd=μ1-μ2在1-α置信水平下的置信区间:公式10(表示各差值的均值;表示各差值的标准差;当总体未知时则可用样本表示。)小样本公式为:(n-1)公式11例8:由10名学生组成一个随机样本,让他们分别采用AB两套试卷进行测试,结果如下表所示:试建立两种试卷平均分数之差在95%的置信区间。学生编号试卷A试卷B差值di17871726344193726111489845591741764951-27685513876601698577810553916解:=∑di/nd=110/10=11,sd==6.53根据自由度=9,查t分布表得(9)=2.262,(n-1)=112.262=114.67,得置信区间为(6.33,15.67)二、两个总体比例之差的区间估计两个二项总体中抽出两个独立样本,两个样本比例之差的抽样分布呈正态分布。由于两个总体比例π1π2通常是未知的,所以用样本比例p1、p2来代替。因此,根据正态分布建立的两个总体比例之差在1-α下的置信区间为:(p1-p2)公式12例9:针对某个电视节目做收视率调查,在农村随机调查400人,有32%的人收看了该节目;在城市中随机调查500人,有45%的人收看了该节目。试以95%置信水平估计城乡收视率差别的置信区间。解:城市收视率p1=45%,农村收视率p2=32%。当α=0.05时,=1.96。(p1-p2)=(45%-32%)1.96×=13%6.32%城乡收视率差别的95%的置信区间为(6.68%,19.32%)三、两个总体方差比的区间估计如相比较两总体某种特征的稳定性,须进行两总体方差比的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论