第3章参数估计_第1页
第3章参数估计_第2页
第3章参数估计_第3页
第3章参数估计_第4页
第3章参数估计_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学Statistics第3章参数估计参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计大学生每周上网花多少时间?为了解学生每周上网花费的时间,中国人民大学公共管理学院的4名本科生对全校部分本科生做了问卷调查。调查的对象为中国人民大学在校本科生,调查内容包括上网时间、途径、支出、目的、关心的校园网内容,以及学生对收费的态度,包括收费方式、价格等问卷调查由调查员直接到宿舍发放并当场回收。对四个年级中每年级各发60份问卷,其中男、女生各30份。共收回有效问卷共200份。其中有关上网时间方面的数据经整理如下表所示大学生每周上网花多少时间?回答类别人数(人)频率(%)3小时以下32163~6小时3517.56~9小时3316.59~12小时2914.512小时以上7135.5合计200100平均上网时间为8.58小时,标准差为0.69小时。全校学生每周的平均上网时间是多少?每周上网时间在12小时以上的学生比例是多少?参数估计大致判断出总体分布的类型后,用样本参数推断总体分布的相应参数。1.点估计不重复抽样2.区间估计重复抽样不同样本算得的的估计值不同,因此还希望根据所给的样本确定一个随机区间,使其包含参数真值的概率达到指定的要求。均值方差区间估计

(IntervalEstimate)在点估计的基础上,给出总体参数估计的一个估计区间,该区间由样本统计量加减估计误差而得到根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在75~85之间,置信水平是95%样本统计量

(点估计)置信区间置信下限置信上限区间估计的图示x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.65x+1.65x将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,也称置信度表示为(1-为是总体参数未在区间内的比例常用的置信水平值有

99%,95%,90%相应的为0.01,0.05,0.10置信水平

(ConfidenceLevel)

由样本估计量构造出的总体参数在一定置信水平下的估计区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间总体参数的真值是固定的,而用样本构造的区间则是不固定的,因此置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。置信区间的表述

(ConfidenceInterval)置信区间的表述

(95%的置信区间)从均值为185的总体中抽出n=10的20个样本构造出的20个置信区间我没有抓住参数!点估计值使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较大的样本则会得到一个较准确(较窄)的区间。直观地说,较宽的区间会有更大的可能性包含参数但实际应用中,过宽的区间往往没有实际意义比如,天气预报说“在一年内会下一场雨”,虽然这很有把握,但有什么意义呢?另一方面,要求过于准确(过窄)的区间同样不一定有意义,因为过窄的区间虽然看上去很准确,但把握性就会降低,除非无限制增加样本量,而现实中样本量总是有限的区间估计总是要给结论留点儿余地置信区间的表述

(ConfidenceInterval)置信区间与置信水平的关系

均值的抽样分布(1-)%区间包含了

%的区间未包含1–aa/2a/2区间估计的种类区间估计均值均值差一个总体两个总体方差方差比方差已知方差未知比率一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差

P(X﹥za)﹦a一个总体方差已知时均值的区间估计

P(X<-za)﹦a或的za或-za叫标准正态分布的单侧上a分位点。若

X

服从标准正态分布,则满足下式:需要的定义:

P(X﹥za/2)﹦a若

X

服从标准正态分布,则满足下式:的za/2叫标准正态分布的双侧上a分位点。不重复抽样条件下:若随机变量X则有如下定理成立:~~~重复抽样条件下:需要的定理:

P(

﹥za/2)﹦a因为服从标准正态分布,所以:

P(﹥za)﹦a或

P(﹤﹣za)﹦a重复抽样条件下均值的单侧区间估计:重复抽样条件下均值的双侧区间估计:因为服从标准正态分布,所以:单侧置信区间双侧置信区间:重复抽样条件下均值的置信区间:重复抽样(放回)不重复抽样均值的标准误差(抽样平均误差)均值的标准误差又称为抽样平均误差或均值标准误差、标准误差。若随机变量则有如下定理成立:~~一个总体方差未知时均值的区间估计需要的定义:需要的定理:自由度小于45时重复抽样条件下均值的两个的单侧置信区间为:

自由度大于45时重复抽样条件下均值的两个的单侧置信区间为:

【例1】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10克。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.5

95.0108.8115.6100.0123.5102.0101.6102.2116.6

95.4

97.8108.6105.0136.8102.8101.5

98.4

93.3【例2】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下。建立该批灯泡平均使用寿命95%的置信区间16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计【例3】一家保险公司收集到由66个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间66个投保人年龄的数据23353927364436424643313342534554472434283936444039493834485034394548…32【例4】对某型号飞机的最大飞行速度进行了16次试验,测得其平均最大飞行速度为425米/秒,已知最大飞行速度方差为81,根据经验知到最大飞行速度服从正态分布,以95%的置信度求平均最大飞行速度不低于多少?用SPSS求置信区间SPSS的输出结果

区间估计AnalyzeDescriptiveStatisticsExploreSpreadvs.LevelwithLeveneTest:输出散布——层次图,包括回归直线斜率及方差齐次性的Levene检验。若无分组变量,此选项无效。Transformed:对原始数据进行转换,有:三次方(Cube)、平方(Square)、平方根(1/Square

root)取对数(Logarithm)。Powerestimation:转换幂值估计,表示对每一组数据产生一个中位数范围的自然对数与四分位数范围的自然对数的散点图;None:不生成散布——层次图;Statistics的界面解释Descriptives:输出均值的95%置信区间、中位数、众数、均值标准差、方差、标准差、Min、Max、R、四分位距、峰度系数和斜度系数。M-estimators:做中心趋势的粗略最大似然确定,输出4个不同权重的最大似然确定数。当数据分布均匀且两尾巴较长或数据中存在极端值时,可以提供比较合理的估计。Outliers:输出5个最大值和最小值。Percentiles:输出第5%、10%、25%、50%、75%、90%和95%百分位数。大样本:np(成功次数)和n(1-p)(失败次数)均应该大于15使用正态分布统计量z或t分布统计量

一个总体比例的区间估计3.总体比例在1-置信水平下的置信区间为自一大批产品中抽取100个样品,其中有60个一级品,求这批产品的一级品率

p

的置信度为0.95的置信区间。总体比例的区间估计【例5-4】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知n=100,p=65%,1-=95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%~74.35%

练习某进出口公司,出口一种名茶,规定每包规格重量不低于150克,现抽取1%进行检验,结果如下:每包重量(克)包数

140——14910149——15020150——15150151——15220

合计100要求:以95%的概率推断这批茶叶包装合格率的置信区间。分位点定义分布单、双侧上

一个总体方差的区间估计需要的定义:需要的定理:若随机变量则有如下定理成立:~~总体方差的区间估计

(图示)221-2总体方差的1-的置信区间自由度为n-1的2

P(

)﹦a双侧置信区间为:

总体方差的区间估计

(例题分析)【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间25袋食品的重量112.5101.0103.0102.0100.5102.6107.5

95.0108.8115.6100.0123.5102.0101.6102.2116.6

95.4

97.8108.6105.0136.8102.8101.5

98.4

93.3练习

某工厂生产一批滚珠,其直径X服从正态分布N(

2),现从某天的产品中随机

(1)若

2=0.06,求

的置信区间

(2)

2未知,求

的置信区间

(3)求方差

2的置信区间。抽取

6

件,

测得直径为:15.1,14.8,15.2,14.9,14.9,15.1置信度均为0.95两个总体参数的区间估计总体参数符号表示样本统计量均值差比例差方差比

两个总体均值之差的区间估计两独立样本两配对样本★两独立样本已知总体方差,均值差的推算;~~若随机变量则:★未知总体方差,但=,均值差推断~~若随机变量则:需要的定理:★未知总体方差,但≠,均值差推断~~若随机变量则:需要的定理:两个总体方差比的置信区间(1,2未知)~~若随机变量则:需要的定理:因此,方差比的置信区间为:两个总体方差比的区间估计

(图示)FF1-F总体方差比的1-的置信区间方差比置信区间示意图【例】为了研究男女学生在生活费支出(单位:元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果男学生:女学生:试以90%置信水平估计男女学生生活费支出方差比的置信区间两个总体方差比的区间估计

(例题分析)两个总体方差比的区间估计

(例题分析)解:根据自由度

n1=25-1=24,n2=25-1=24,查得F/2(24)=1.98,F1-/2(24)=1/1.98=0.50512/22置信度为90%的置信区间为男女学生生活费支出方差比的置信区间为0.47~1.84

两个总体均值之差的估计

(独立大样本)【例5-6】某地区教育管理部门想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表。建立两所中学高考英语平均分数之差95%的置信区间

两个样本的有关数据

中学1中学2n1=46n1=33S1=5.8S2=7.2English

反映了估计的可靠度,越小,越可靠.置信区间的长度反映了估计精度越小,1-越大,估计的可靠度越高,但

确定后,置信区间的选取方法不唯一,

常选最小的一个.几点说明越小,估计精度越高.这时,往往增大,因而估计精度降低.★两配对样本大样本小样本两个总体均值之差的估计

(匹配小样本)【例5-9】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表。试建立两种试卷分数之差d=1-2

95%的置信区间

10名学生两套试卷的得分学生编号试卷A试卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916两个总体均值之差的估计

(匹配小样本)解:根据样本数据计算得两种试卷所产生的分数之差的置信区间为6.33分~15.67分两个总体均值之差的区间估计

(用SPSS进行估计—配对样本)用求置信区间SPSS第1步:选择【Analyze】下拉菜单,并选择【CompareMeans—Paired-SamplesTTest】选项,进入主对话框第2步:将两个样本同时选入【PairedVariables】第3步:点击【Options】,选择所需的置信水平(隐含值为95%)。点击【Continue】回到主对话框。点击【OK】用SPSS求配对小样本均值之差置信区间

(例题分析)SPSS的输出结果

(只截取估计的部分)两个总体比例之差的区间估计两个总体比例之差1-2在1-置信水平下的置信区间为两个总体比例之差的估计【例5-10】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论