




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第5章,第3节,参数估计,参数估计的一般问题,1。估计量和估计值2。点估计和区间估计。评估估计量、估计量和估计值的标准,估计量:用于估计总体参数的随机变量,如样本均值、样本比率、样本方差等。样本均值是总体均值的估计值,估计值是估计值:估计参数时计算的统计量的特定值。如果样本均值x=80,则80是估计值、估计值、点估计和区间估计。有两种常用的方法来估计样本总体的未知参数:点估计和区间估计。参数估计的基本方法是用样本统计量的值来估计相应总体参数的值,这种方法称为总体参数的点估计。以样本统计量的抽样分布(概率分布)为理论基础,根据一定的概率要求,由样本统计量的值来估计总体参数值的范围,称为总体参数的
2、区间估计。样本估计量直接用作总体参数的估计量,例如,样本均值直接用作总体均值的估计量,例如,两个样本均值之间的差值直接用作总体均值的估计量。优点:简单、具体、清晰。缺点:点估计不能给出估计值接近总体未知参数的信息。点估计的方法包括矩估计、序列统计、最大似然法、最小二乘法等。以点估计为例,只对一批10000个特定类型的电子元件进行耐久性时间检查,并随机选择其中的100个。测试的平均耐久性时间为1055小时,合格率为91%。我们推断10000个电子元件的平均耐久性时间为1055小时,所有电子元件的合格率也为91%。点估计(实例分析),为了调查师范院校男生的身高状况,随机抽取50人对师范院校男生的平
3、均身高和标准差进行估计。据估计,师范大学男生的平均身高是170厘米,但实际平均身高是170厘米吗?不一定,有错误。那么如何处理这个错误呢?点估计(示例分析),点估计值只是未知参数的近似值,它并不反映这个近似值的误差范围,所以不能确定使用它。区间估计正好弥补了点估计的缺陷。在点估计的基础上,给出了总体参数估计的区间范围,它是通过对样本统计量进行加、减抽样误差得到的。根据样本统计量的抽样分布,我们可以给出样本统计量与总体参数之间接近程度的概率度量。例如,一个班级的平均分数在7585分之间,置信度为95%。优点:考虑到估计量的分布,我们可以解释估计结果的可靠性,区间估计,区间估计图,例如,在估计湖中
4、鱼的数量的问题中,如果我们是基于一个实际的样本,如果我们可以给出一个区间(950,1050),在这个区间中我们合理地相信n的真实值是存在的,那么鱼的数量的估计将会更加确定。事实上,n的真值可能大于1000或小于1000。区间估计(示例分析),问题在于估计值1000可能在区间(950,1050)中,也可能不在区间(950,1050)中,并且构造置信区间的步骤被重复多次。置信区间包含总体参数真实值的次数比率称为置信水平,表示为(1-总体参数不在区间内的比率为99%,95%。90%是0.01,0.05,0.10,置信水平。该概率不是用来描述特定区间包含总体参数真值的可能性,而是指在多次采样得到的区间
5、中,有多少区间包含总体参数真值。由样本统计构建的总体参数的估计区间称为置信区间。统计学家在某种程度上确信,这个区间将包含真正的总体参数。因此,它被称为置信区间。由特定样本构造的区间是特定区间。我们无法知道这个样本生成的区间是否包含了所有参数的真实值。我们只能希望这个区间是包含总体参数真实值的大量区间之一,但它也可能是不包含参数真实值的少数区间之一,即置信区间。总体参数的真实值是固定的和未知的,而用不同样本构造的区间是不固定的。因此,置信区间是一个随机区间,它将随着不同的样本而变化。也就是说,我们想要确定一个区间,以便我们可以相信它包含具有相对较高可靠性的真实参数值。湖中鱼数量的真实价值。这里提
6、到的“可靠性”是用概率来衡量的。(1)区间估计就是简单地用一个区间来估计未知参数,并估计两个边界之间的未知参数。(2)置信区间根据给定的概率(1-)确定,该概率包括未知总体参数的可能范围。它受置信上限和置信下限的限制(L1、L2)。(3)置信概率,也称为置信水平或置信程度,是指区间估计中的预选(指定)概率。用1表示。通常取95%或99%。(4)估计显著性水平时,估计参数不在置信区间内的概率。用表示。一般来说,价值要求很小。总之,置信区间表示区间估计的准确性。置信水平(1-)表示区间估计的可靠性。这是区间估计的可靠概率。显著性水平表示区间估计的不可靠概率。关键点,估计量的评价标准,无偏性:估计量
7、的抽样分布的数学期望等于估计的总体参数,无偏性。在抽样分布中,样本均值、比率和方差分别是总体均值、比率和方差的无偏估计量。效率、有效性:对于同一总体参数的两个无偏点估计量,存在标准差较小的估计量。无偏估计量也必须比总体参数更少离散。一致性:随着样本量的增加,估计值越来越接近估计的总体参数,一致性,总体参数的区间估计,总体均值的区间估计,总体比率的区间估计,总体方差的区间估计,总体参数的区间估计,总体均值(大样本)的区间估计,1。假设条件总体服从正态分布,方差()是已知的。如果不是正态分布,可以用正态分布(n 30)来近似。使用正态分布统计量Z,总体均值的区间估计(大样本),总体均值在1置信水平
8、的置信区间为。在这种情况下,小样本群体也适用。人口平均数的区间估计(实例分析),一种食物。现在,从某一天生产的一批食品中随机选取25个袋子,每个袋子的重量如下表所示进行测量。众所周知,产品重量的分布服从正态分布,总体标准差为10g。试估计这批产品平均重量的置信区间,置信水平为95%,总体平均值的区间估计(实例分析)表明,n(,102),n=25,1-=95%,z/2=1.96是已知的。根据样本数据,计算出总体均值在1个置信水平下的置信区间为,食品平均重量的置信区间为101.44g109.28g,总体均值的区间估计(示例分析),示例一家保险公司收集了由36名被保险人组成的随机样本,并获得了下表中
9、每个被保险人的年龄(年龄)数据。尝试建立被保险人年龄90%的置信区间和总体均值的区间估计(示例分析)。该解已知为n=36,1-=90%,z/2=1.645。根据样本数据,总体均值在1个置信水平上的置信区间为0,被保险人平均年龄的置信区间为37.37岁和41.63岁。一所大学从该校随机抽取了100名学生,发现他们每天平均锻炼时间为26分钟。试着用95的置信水平来估计这所大学所有学生的平均每日体育锻炼时间(众所周知,总体方差为36分钟)。总体均值的区间估计(锻炼),总体均值的区间估计(示例分析),解:给定x26,=6,n=100,1-=0.95,/2=1.96,我们可以认为平均每天锻炼时间是在24
10、.82427.176分钟之间,即一个工厂生产的零件的长度。目前,从工厂随机选取六个零件,长度测量值如下(单位:mm): 14.6、15.1、14.9、14.8、15.2、15.1。置信系数为0.95。总体均值的区间估计(实践),总体均值的区间估计(实例分析),解:n=6,=0.05,z/2=z0.025=1.96,2=0.22。置信区间为,总体均值(小样本)的区间估计,1。假设条件服从正态分布和总体均值的方差区间估计(小样本),总体均值在1置信水平上的置信区间为,注意自由度,t分布,t分布是一个类似正态分布的对称分布,通常比正态分布更平坦、更分散。特定的分布取决于一个称为自由度的参数。随着自由
11、度的增加,分布逐渐趋于正态分布,总体均值的区间估计(示例分析),示例已知某个灯泡的寿命服从正态分布,现在从一批灯泡中随机选择16个灯泡,其使用寿命(小时)测量如下。确定这些灯泡平均使用寿命的95%的置信区间,并估计总体平均值的区间(示例分析)。解:n(,2),n=16,1-=95%,t/2=2.131根据样本数据计算。总体平均值在1置信水平下的置信区间为,此类灯泡平均使用寿命的置信区间为10。建立95%总体平均值的置信区间。总体平均值的区间估计(练习),总体平均值的区间估计(练习),解:已知n(,2),x=50,s=8,n=25,1-=0.95,t/2=2.0639。我们可以认为总体平均值在4
12、6.6953.30之间,概率为95。为了估计一个物体的重量,我们称它10次,得到重量的测量值(单位为:千克),如下所示:10。l,10.0,9.8,10.5,9.7,L0。l,9.9,10.2,9.9。获得置信系数为0.95的置信区间。人口平均数的区间估计(实践),解:n=10,=0.05,T9 (0.025)=2.2622,人口平均数的区间估计(实践),人口比率的区间估计,1。假设条件人口服从二项分布,并且样本量足够大,正态分布统计量Z可以用来近似人口比率。总体比率在1-置信水平下的置信区间是,参考书籍,总体比率的区间估计(示例分析),示例一个城市想要估计下岗工人中的妇女比率,并且随机选择1
13、00名下岗工人,其中65名是女工。试用95%的置信水平来估计这个城市下岗女工比例的置信区间。解:n=100,p65%,1-=95%,z/2=1.96,该市下岗职工女性比例的置信区间为55.65t.35%。【例】在一项关于员工离职原因的研究中,一家企业向这家企业了解到,在采访中,有140人表示,他们离开这家企业是因为他们与管理人员相处不好。试着计算出因为这个原因而离开企业的人的真实比例(95%的置信区间)。总体比率的区间估计(实践),我们可以保证,员工因不能与管理者相处融洽而离开企业的比例在63.6-63.4%之间,概率为95。解决方法:已知n=200,P0.7,=0.95,/2=1.96,总体
14、比率的区间估计(实践),和总体方差的区间估计。1.估计总体的方差或标准差。2.假设人口服从正态分布。3.总体方差2的点估计是s2,总体方差的区间估计是。4.1-置信水平的总体方差的置信区间是,见本书,总体方差的区间估计的置信区间(图示),2,21-,2,总体方差1-,自由度是n-。群体方差中的区间估计示例分析一家食品生产企业主要生产袋装食品,现在从某一天生产的一批食品中随机抽取25袋,每袋的重量如下表所示进行测量。众所周知,产品重量的分布服从正态分布。用95%的置信水平建立了该类食品重量变化的置信区间。总体方差的区间估计(示例分析)显示n25在:中是已知的,1-95%。根据样本数据计算出95%
15、置信区间s2=93.21 2。该企业生产的食品总重量标准偏差的置信区间为7.54g13.43g,并且有大量的糖果是从其中随机选取的。重量(以克为单位)如下: 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496让袋装糖果的重量近似服从正态分布,并尝试找出0.95的置信区间作为总体标准偏差。S=6.2022,总体方差的区间估计(实践),解:这里,总体方差的区间估计(实践),所以置信水平为0.95的置信区间如下:例2:为了估计一个物体的重量,称它10次,得到重量的测量值(单位:公斤)如下: 10.1,10.0,9.0找到置信
16、区间,其中2的置信系数为0.95。S2=0.0583,人口方差的区间估计(实践),解:n=10,=0.05,S2=0.0583,查附表,所以,人口方差的区间估计(实践),两个人口参数的区间估计(自学),一个和两个人口之间的差异的区间估计意味着两个或两个人口参数的区间估计,两个人口之间的差异的区间估计意味着(独立大样本),1。假设两个种群都服从正态分布,1。如果知道它不是正态分布,可以用正态分布(n130和n230)来近似。两个样本是独立的随机样本,使用正态分布统计量Z,估计两个总体均值之间的差异(大样本),1.1,2当已知时,两个总体均值之间的差异在1-置信水平上的1-2置信区间是两个总体均值之间的差异的估计(大样本)。当1和2未知时,两个总体平均值之间差异的1-2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村畜牧业生产与疫情防控责任合同
- 固定支架租赁合同
- 石油化工行业生产安全规范指南
- 药物治疗基础复习测试卷含答案
- 新能源汽车租凭合同协议书
- 3 《自己之歌》公开课一等奖创新教案统编版高中语文选择性必修中册
- 《世界经济的全球化》战后世界格局的演变课件-3
- 上海店铺合租合同范本
- 办公集装购买合同范本
- 房车大白转让合同范本
- 1000以内退位减法500道
- 制氧机实施方案
- 煤炭行业的信息化与智能化转型
- 医疗器械临床试验质量管理规范培训
- 中小学语文教师教学培训核心素养下的整本书阅读教学培训课件如何教好孩子阅读
- 《院感基本知识》课件
- 急诊科培训急性腰痛的鉴别与处理
- 血管外科疾病的诊断和治疗
- 酒店露营基地项目计划书
- 小学趣味科学 3D打印技术 课件
- DISC性格测试(40题标准版)
评论
0/150
提交评论