统计学第五章 参数估计_第1页
统计学第五章 参数估计_第2页
统计学第五章 参数估计_第3页
统计学第五章 参数估计_第4页
统计学第五章 参数估计_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第五章参数估计第一页,共一百二十八页,编辑于2023年,星期三“What!Youhavesolveditalready?”“Well,thatwouldbetoomuchtosay.Ihavediscoveredasuggestivefact,thatisall”Dr.WatsonandSherlockHolmesTheSignofFour第二页,共一百二十八页,编辑于2023年,星期三例:某大公司要整理2500个职工的档案。其中一项内容是考察这些职工的平均年薪及参加过公司培训计划的比例。总体:2500名职工(population),如果上述情况可由每个人的个人档案中得知,可容易地测出这2500名职工的平均年薪及标准差。已经得到了如下的结果:总体均值:

=51800(元)

总体标准差:=4000(元)参数估计的一般问题(例子)同时,有1500人参加了公司培训,则参加公司培训计划的比例为:

=1500/2500=0.60总体参数第三页,共一百二十八页,编辑于2023年,星期三

在上例中,假如随机抽取了一个容量为30的样本:

平均年薪是否参加培训

49094.3是

53263.9是

49643.5否

……

根据该样本求得样本年薪平均数、标准差及参加过培训计划人数的比例分别为:

则解决最初的问题,我们就涉及到总体参数的估计问题。(元)(元)第四页,共一百二十八页,编辑于2023年,星期三第5章参数估计§1.1参数估计的基本问题和概念§1.2简单随机抽样抽样误差的测定§1.3简单随机抽样的抽样估计第五页,共一百二十八页,编辑于2023年,星期三参数估计按照随机原则

从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法§1.1参数估计的基本问题和概念第六页,共一百二十八页,编辑于2023年,星期三统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)参数估计第七页,共一百二十八页,编辑于2023年,星期三按随机原则抽取样本单位目的是推断总体的数量特征抽样误差是不可避免的,但可以事先计算并加以控制抽样估计的特点第八页,共一百二十八页,编辑于2023年,星期三确定抽样方法重复抽样又被称作重置抽样、有放回抽样抽出个体登记特征放回总体继续抽取特点同一总体单位有可能被重复抽中,而且每次抽取都是独立进行第九页,共一百二十八页,编辑于2023年,星期三不重复抽样又被称作不重置抽样、不放回抽样抽出个体登记特征继续抽取特点同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。确定抽样方法第十页,共一百二十八页,编辑于2023年,星期三确定抽样组织方式1·简单随机抽样(纯随机抽样)——对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本应用仅适用于规模不大、内部各单位标志值差异较小的总体是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式第十一页,共一百二十八页,编辑于2023年,星期三2·类型抽样(分层抽样)——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。总体N样本n等额抽取等比例抽取······能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标确定抽样组织方式第十二页,共一百二十八页,编辑于2023年,星期三3·等距抽样(机械抽样或系统抽样)——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。······随机起点半距起点对称起点(总体单位按某一标志排序)确定抽样组织方式第十三页,共一百二十八页,编辑于2023年,星期三4·整群抽样(集团抽样)——将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差确定抽样组织方式第十四页,共一百二十八页,编辑于2023年,星期三5·多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单位的过程例:在某省100多万农户抽取1000户调查农户生产性投资情况。

第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡

第三阶段:从被抽中的20个乡中各抽5个村

第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)确定抽样组织方式第十五页,共一百二十八页,编辑于2023年,星期三调查对象的性质特点对调查对象的了解程度抽样误差的大小人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组织方式主要应考虑:确定抽样组织方式第十六页,共一百二十八页,编辑于2023年,星期三确定样本容量n≥30,为大样本;n<30,为小样本样本容量指样本中含有的总体单位的数目,通常用n来表示。确定适当样本容量的意义:若n过大,调查工作量增大,体现不出抽样调查的优越性;若n

过小,抽样误差会增大,抽样推断就会失去价值。第十七页,共一百二十八页,编辑于2023年,星期三样本的可能数目在考虑顺序的抽样条件下,从总体N中随机抽取n个样本单位共有多少种可能的抽选结果⒈不重复抽样的可能样本数目:⒉重复抽样的可能样本数目:确定样本容量第十八页,共一百二十八页,编辑于2023年,星期三一、抽样分布二、抽样误差的概念三、抽样平均误差§1.2简单随机抽样抽样误差的测定第十九页,共一百二十八页,编辑于2023年,星期三样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布是指样本统计量所有可能值的概率分布第二十页,共一百二十八页,编辑于2023年,星期三

样本平均数总体平均数μ样本平均数是一个随机变量,它的概率分布称为样本平均数的抽样分布。样本平均数的抽样分布是推断总体平均数的理论基础

样本平均数…样本平均数总体未知参数:平均数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本平均数第二十一页,共一百二十八页,编辑于2023年,星期三主要样本统计量平均数标准差比率(成数)第二十二页,共一百二十八页,编辑于2023年,星期三样本均值的抽样分布

(例题分析)【例】设5个职工的月奖金是研究的总体,分别为120,160,200,280,340,单位:元。如果我们随机抽取其中2个职工作为样本进行研究,试比较样本和总体的差异,并找出样本均值的特征。总体的平均数和方差第二十三页,共一百二十八页,编辑于2023年,星期三样本均值的抽样分布

(例题分析)

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有52=25个样本。所有样本的结果为第二十四页,共一百二十八页,编辑于2023年,星期三样本均值的抽样分布

(例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布第二十五页,共一百二十八页,编辑于2023年,星期三样本均值的分布与总体分布的比较

(例题分析)=220σ

=80总体分布抽样分布第二十六页,共一百二十八页,编辑于2023年,星期三样本均值的抽样分布

与中心极限定理=50

=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x

的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)第二十七页,共一百二十八页,编辑于2023年,星期三中心极限定理

(centrallimittheorem)当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布从均值为,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本平均数的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x第二十八页,共一百二十八页,编辑于2023年,星期三平均数的抽样分布全部可能样本平均数的均值等于总体均值,即:从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的第二十九页,共一百二十八页,编辑于2023年,星期三比率的抽样分布全部可能样本比率的均值等于总体比率,即:从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。样本比率的标准差为总体标准差的第三十页,共一百二十八页,编辑于2023年,星期三样本抽样分布原总体分布第三十一页,共一百二十八页,编辑于2023年,星期三一、抽样分布二、抽样误差的概念三、抽样平均误差§1.2简单随机抽样抽样误差的测定★★第三十二页,共一百二十八页,编辑于2023年,星期三说明对于任何一个样本,其抽样误差都不可能测量出来抽样误差的大小可以依据概率分布理论加以说明:指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差抽样误差第三十三页,共一百二十八页,编辑于2023年,星期三某个样本容量的抽样分布更大样本容量的抽样分布第三十四页,共一百二十八页,编辑于2023年,星期三一、抽样分布二、抽样误差的概念三、抽样平均误差§1.2简单随机抽样的抽样误差的测定★★★第三十五页,共一百二十八页,编辑于2023年,星期三抽样平均误差指每一个可能样本的估计值与总体指标值之间离差的平均数,即样本估计量的标准差式中:为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数注意:不要混淆抽样标准差与样本标准差!第三十六页,共一百二十八页,编辑于2023年,星期三抽样平均误差的计算公式⒈样本平均数的抽样平均误差当N≥500时,有重复抽样时:不重复抽样时:第三十七页,共一百二十八页,编辑于2023年,星期三⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:当N≥500时,有抽样平均误差的计算公式第三十八页,共一百二十八页,编辑于2023年,星期三关于总体方差的估计方法用过去同类问题全面调查或抽样调查的经验数据代替;用样本标准差代替总体标准差,用代替。抽样平均误差的计算公式第三十九页,共一百二十八页,编辑于2023年,星期三影响抽样误差的因素总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;样本单位数的多少:越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。第四十页,共一百二十八页,编辑于2023年,星期三第5章抽样推断★§1.1抽样方案的设计§1.2简单随机抽样的抽样误差的测定§1.3简单随机抽样的抽样估计★★第四十一页,共一百二十八页,编辑于2023年,星期三一、点估计二、区间估计三、样本数目的确定§1.3简单随机抽样的抽样估计★第四十二页,共一百二十八页,编辑于2023年,星期三点估计指直接以样本指标来估计总体指标,也叫定值估计简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况第四十三页,共一百二十八页,编辑于2023年,星期三无偏性

(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数P(

)BA无偏有偏第四十四页,共一百二十八页,编辑于2023年,星期三有效性

(efficiency)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效AB

的抽样分布

的抽样分布P(

)第四十五页,共一百二十八页,编辑于2023年,星期三一致性

(consistency)一致性:随着样本量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本量较大的样本量P(

)第四十六页,共一百二十八页,编辑于2023年,星期三一、点估计二、区间估计三、样本数目的确定§1.3简单随机抽样的抽样估计★★第四十七页,共一百二十八页,编辑于2023年,星期三二、区间估计㈠区间估计的定义和原理㈡总体平均数的区间估计㈢总体成数的区间估计第四十八页,共一百二十八页,编辑于2023年,星期三区间估计

(intervalestimate)在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量样本统计量

(点估计)置信下限置信上限第四十九页,共一百二十八页,编辑于2023年,星期三区间估计原理0.6827被包住的概率为68.27%样本抽样分布曲线原总体分布曲线第五十页,共一百二十八页,编辑于2023年,星期三区间估计原理0.9545被包住的概率为95.45%样本抽样分布曲线原总体分布曲线第五十一页,共一百二十八页,编辑于2023年,星期三区间估计原理0.9973被包住的概率为99.73%样本抽样分布曲线总体分布曲线第五十二页,共一百二十八页,编辑于2023年,星期三抽样极限误差指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作允许误差、误差范围、误差置信限等

由于提高可靠程度,会增大允许误差,使估计精度降低;而提高估计的精度,又会降低估计的可靠程度,所以在实际中应根据具体情况,先确定一个合理的可靠程度再求相应的允许误差或先确定一个允许误差范围再求相应的可靠程度。第五十三页,共一百二十八页,编辑于2023年,星期三抽样极限误差的计算公式(大样本条件下)样本平均数的极限误差:⒈样本成数的极限误差:⒉Z为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。第五十四页,共一百二十八页,编辑于2023年,星期三Z与相应的概率保证程度存在一一对应关系,常用Z值及相应的概率保证程度为:

z值概率保证程度

1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973抽样极限误差的计算公式(大样本条件下)第五十五页,共一百二十八页,编辑于2023年,星期三第五十六页,共一百二十八页,编辑于2023年,星期三标准正态分布函数值表第五十七页,共一百二十八页,编辑于2023年,星期三第五十八页,共一百二十八页,编辑于2023年,星期三置信区间

(95%的置信区间)重复构造出的20个置信区间点估计值第五十九页,共一百二十八页,编辑于2023年,星期三总体平均数的区间估计表达式其中,为极限误差第六十页,共一百二十八页,编辑于2023年,星期三步骤⒈计算样本平均数;⒉搜集总体方差的经验数据;或计算样本标准差,即总体平均数的区间估计第六十一页,共一百二十八页,编辑于2023年,星期三步骤⒊计算抽样平均误差:重复抽样时:

不重复抽样时:总体平均数的区间估计第六十二页,共一百二十八页,编辑于2023年,星期三步骤⒋计算抽样极限误差:⒌确定总体平均数的置信区间:总体平均数的区间估计第六十三页,共一百二十八页,编辑于2023年,星期三【例A】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。总体平均数的区间估计第六十四页,共一百二十八页,编辑于2023年,星期三按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计—100126004144100名工人的日产量分组资料第六十五页,共一百二十八页,编辑于2023年,星期三解:第六十六页,共一百二十八页,编辑于2023年,星期三则该企业工人人均产量及日总产量的置信区间为:即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95﹪。第六十七页,共一百二十八页,编辑于2023年,星期三总体成数的区间估计表达式其中,为极限误差第六十八页,共一百二十八页,编辑于2023年,星期三步骤⒈计算样本成数;⒉搜集总体方差的经验数据;⒊计算抽样平均误差:重复抽样条件下不重复抽样条件下总体成数的区间估计第六十九页,共一百二十八页,编辑于2023年,星期三步骤⒋计算抽样极限误差:⒌确定总体成数的置信区间:总体成数的区间估计第七十页,共一百二十八页,编辑于2023年,星期三【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。总体成数的区间估计第七十一页,共一百二十八页,编辑于2023年,星期三按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料完成定额的人数第七十二页,共一百二十八页,编辑于2023年,星期三解:第七十三页,共一百二十八页,编辑于2023年,星期三则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:即该企业工人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95﹪。第七十四页,共一百二十八页,编辑于2023年,星期三总体均值的区间估计

(正态总体、2未知、小样本)其他情况:CLT失效第七十五页,共一百二十八页,编辑于2023年,星期三总体均值的区间估计

(小样本)1. 假定条件总体服从正态分布,但方差(2)

未知小样本(n<30)使用t

分布统计量总体均值在1-置信水平下的置信区间为第七十六页,共一百二十八页,编辑于2023年,星期三t分布

t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z第七十七页,共一百二十八页,编辑于2023年,星期三总体方差的区间估计第七十八页,共一百二十八页,编辑于2023年,星期三总体方差的区间估计1.假设总体服从正态分布2.总体方差2

的点估计量为s2,且3.总体方差在1-置信水平下的置信区间为第七十九页,共一百二十八页,编辑于2023年,星期三总体方差的区间估计

(图示)221-2总体方差的1-的置信区间自由度为n-1的2第八十页,共一百二十八页,编辑于2023年,星期三总体方差的区间估计

(例题分析)【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第八十一页,共一百二十八页,编辑于2023年,星期三总体方差的区间估计

(例题分析)解:已知n=25,1-=95%,根据样本数据计算得

s2=93.21

2置信度为95%的置信区间为该企业生产的食品总体重量标准差的的置信区间为7.54g~13.43g第八十二页,共一百二十八页,编辑于2023年,星期三一个总体参数的区间估计

(小结)待估参数均值比例方差大样本小样本大样本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布参数区间估计的思路第八十三页,共一百二十八页,编辑于2023年,星期三两个总体参数的区间估计总体参数符号表示样本统计量均值差比例差方差比第八十四页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的区间估计

(独立,大样本)第八十五页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(大样本)1. 假定条件两个总体都服从正态分布,12、22已知若不是正态分布,可以用正态分布来近似(n130和n230)两个样本是独立的随机样本使用正态分布统计量z第八十六页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(大样本)

12,22已知时,两个总体均值之差1-2在1-置信水平下的置信区间为12、22未知时,两个总体均值之差1-2在1-置信水平下的置信区间为第八十七页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(例题分析)【例】某地区教育管理部门想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表。建立两所中学高考英语平均分数之差95%的置信区间

两个样本的有关数据

中学1中学2n1=46n2=33S1=5.8S2=7.2English第八十八页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(例题分析)解:两个总体均值之差在1-置信水平下的置信区间为两所中学高考英语平均分数之差的置信区间为5.03分~10.97分第八十九页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的区间估计

(独立,小样本)第九十页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(小样本:12=22

)1. 假定条件两个总体都服从正态分布两个总体方差未知但相等:12=22两个独立的小样本(n1<30和n2<30)采用如下统计量其中第九十一页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(小样本:12=22

)两个样本均值之差的标准化两个总体均值之差1-2在1-置信水平下的置信区间为第九十二页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(例题分析)【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(单位:min)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521第九十三页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(例题分析)解:根据样本数据计算得合并估计量为两种方法组装产品所需平均时间之差的置信区间为0.14min~7.26min第九十四页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(小样本:1222

)1. 假定条件两个总体都服从正态分布两个总体方差未知且不相等:1222两个独立的小样本(n1<30和n2<30)使用统计量第九十五页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(小样本:1222

)两个总体均值之差1-2在1-置信水平下的置信区间为自由度第九十六页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(例题分析)【例】沿用前例。假定第一种方法随机安排12名工人,第二种方法随机安排8名工人,即n1=12,n2=8,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221第九十七页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(例题分析)解:根据样本数据计算得自由度为两种方法组装产品所需平均时间之差的置信区间为0.192min~9.058min第九十八页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的区间估计

(匹配样本)第九十九页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(匹配大样本)假定条件两个匹配的大样本(n130和n230)两个总体各观察值的配对差服从正态分布两个总体均值之差d=1-2在1-置信水平下的置信区间为对应差值的均值对应差值的标准差第一百页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(匹配小样本)假定条件两个匹配的小样本(n1<30和n2<30)两个总体各观察值的配对差服从正态分布两个总体均值之差d=1-2在1-置信水平下的置信区间为第一百零一页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(例题分析)【例】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表。试建立两种试卷分数之差d=1-2

95%的置信区间

10名学生两套试卷的得分学生编号试卷A试卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916STATISTICS第一百零二页,共一百二十八页,编辑于2023年,星期三两个总体均值之差的估计

(例题分析)解:根据样本数据计算得两种试卷所产生的分数之差的置信区间为6.33分~15.67分第一百零三页,共一百二十八页,编辑于2023年,星期三两个总体比例之差区间的估计第一百零四页,共一百二十八页,编辑于2023年,星期三1. 假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的2. 两个总体比例之差1-2在1-置信水平下的置信区间为两个总体比例之差的区间估计第一百零五页,共一百二十八页,编辑于2023年,星期三两个总体比例之差的估计

(例题分析)【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计城市与农村收视率差别的置信区间12第一百零六页,共一百二十八页,编辑于2023年,星期三两个总体比例之差的估计

(例题分析)解:已知

n1=500,n2=400,p1=45%,p2=32%,

1-=95%,z/2=1.96

1-2置信度为95%的置信区间为城市与农村收视率差值的置信区间为6.68%~19.32%第一百零七页,共一百二十八页,编辑于2023年,星期三两个总体方差比的区间估计第一百零八页,共一百二十八页,编辑于2023年,星期三两个总体方差比的区间估计1. 比较两个总体的方差比用两个样本的方差比来判断如果S12/S22接近于1,说明两个总体方差很接近如果S12/S22远离1,说明两个总体方差之间存在差异总体方差比在1-置信水平下的置信区间为第一百零九页,共一百二十八页,编辑于2023年,星期三由统计学家费希尔(R.A.Fisher)

提出的,以其姓氏的第一个字母来命名设若U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为F分布

(F

distribution)第一百一十页,共一百二十八页,编辑于2023年,星期三F分布

(图示)

不同自由度的F分布F(1,10)(5,10)(10,10)第一百一十一页,共一百二十八页,编辑于2023年,星期三两个总体方差比的区间估计

(图示)FF1-F总体方差比的1-的置信区间方差比置信区间示意图第一百一十二页,共一百二十八页,编辑于2023年,星期三两个总体方差比的区间估计

(例题分析)【例】为了研究男女学生在生活费支出(单位:元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果男学生:女学生:试以90%置信水平估计男女学生生活费支出方差比的置信区间第一百一十三页,共一百二十八页,编辑于2023年,星期三两个总体方差比的区间估计

(例题分析)解:根据自由度

n1=25-1=24,n2=25-1=24,查得F/2(24,24)=1.98,F1-/2(24,24)=1/1.98=0.50512/22置信度为90%的置信区间为男女学生生活费支出方差比的置信区间为0.47~1.84

第一百一十四页,共一百二十八页,编辑于2023年,星期三两个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论