第九章 数据的统计描述和分析(2).ppt_第1页
第九章 数据的统计描述和分析(2).ppt_第2页
第九章 数据的统计描述和分析(2).ppt_第3页
第九章 数据的统计描述和分析(2).ppt_第4页
第九章 数据的统计描述和分析(2).ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,数学实验,2,数据的统计描述和分析,第九章,3,9. 3 参数估计,当样本观测值较多时,总体分布可以由经验分布近似;总体的分布密度,可以由直方图法来近似。 然而,在实际中常碰到的问题是总体分布函数已知而其中的若干参数未知;或者总体的分布函数的类型已知,而所关心的只是总体中某些数字特征。,参数估计问题就是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些函数。,4,9.3.1 参数估计问题的一般提法,在参数估计问题中,假定总体分布形式已知,未知的仅仅是一个或几个参数。 设有一个统计总体其分布函数为F(X,),其中为未知参数 (可以是向量) 。现从该总体抽样,得样本 X1, X2, ,

2、 Xn , 要依据该样本对参数作出估计,或估计的某个已知函数g()。这类问题称为参数估计。,根据样本的观测值给出总体中参数的估计值或参数的取值范围称为参数估计, 前者叫参数的点估计,后者叫参数的区间估计。,5,9.3.2 总体参数的点估计,样本特征数: 样本均值、方差、标准差都称为样本特征数 总体参数的点估计: 用样本的特征数来估计总体的数字特征 最常用的点估计是对总体均值和方差2(或标准差)做点估计。 估计的方法有矩法、极大似然法等。 评价点估计优劣的标准有无偏性、最小方差性、有效性等。,6,9.3.3 总体参数的区间估计,在用点估计来估计总体参数时,是用一个确定的值去估计未知的参数,看来似

3、乎精确,但实际上把握不大。 因为由于样本的随机性,从一个样本算得的估计值往往都不会恰好等于待估参数的真值,也就是说估计值与真值之间往往都存在一定的偏差。 因此还需要研究这些估计值的精确程度和可靠程度。这类问题,就是参数的区间估计问题。,7,参数的区间估计问题就是希望确定一个区间(置信区间),使我们能以比较高的可靠程度相信它包含真参数值。, ,这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平。,习惯上把置信水平记作1-,这里是一个在区间(0,1)内取值的小正数。,8,置信区间与显著性水平,设为总体X的一个未知参数,如果对于任意预先给定的(01),能找到两个定值1和2使 P(

4、1 2)=1- 则区间(1, 2)叫做参数的1-置信区间 1:置信下限 2:置信上限 1-:置信水平(或置信度) :显著性水平。,置信区间越小,估计的精度越高 置信水平越大,估计的可信程度越高,置信水平的大小是根据实际需要选定的。 通常可取置信水平1-=0.95或0.9等。,9,1、正态分布均值的区间估计,(1) 已知方差2,求均值的置信区间 假定总体服从正态分布N(,2),X1,X2,Xn是取自正态总体N(,2)的样本,根据样本均值分布定理,10,设N(0,1)的1-/2分位数为u1-/2. 由标准正态分布密度函数的对称性,11,因此置信水平1-下,均值的置信区间为,从中解得,12,注意:当

5、总体分布未知时,根据中心极限定理,只要样本容量n足够大,仍可用,作为均值的1-置信区间。,n的取值没有绝对的标准,一般n的取值不能小于50,最好大于100。,13,(2) 未知方差2,求均值的置信区间,由于t分布对称,取t(n-1)的1-/2分位数t1-/2, 则均值的1-置信区间为,用样本的标准差s代替总体的标准差,利用,14,2、正态分布方差的区间估计,选取 2(n-1) 的/2分位数 2/2 和1-/2分位数21-/2,满足,假定总体服从正态分布N(,2),X1,X2,Xn是取自正态总体N(,2)的样本,现在要用样本方差s2对总体方差2进行区间估计。由于,15,从中解得,所以方差2的1-

6、置信区间为,因为,16,3、其它分布总体参数的区间估计,对其它分布总体参数的区间估计,根据中心极限定理,只要样本容量取的充分大(n50),分布就近似于正态分布,因此可以用前面关于正态分布总体参数区间估计的结果。,17,9.3.4 有关参数估计的MATLAB命令,(1)正态总体的参数估计 如果总体服从正态分布,则计算其点估计与区间估计的MATLAB命令为normfit,格式:,uh, sigh, u, sig = normfit(x, a),18,(2)其它分布的参数估计,两种处理办法: 取容量充分大的样本(n50),按中心极限定理,它近似地服从正态分布; 使用MATLAB工具箱中具有特定分布总

7、体的估计命令: betafit binofit expfit gamfit poissfit unifit weibfit ,19,试求均值的置信水平为95%的置信区间。 解 输入程序 x=1050,1100,1080,1120,1200,1250,1040,1130, 1300,1200; uh,sigh,u,sig=normfit(x),例9.6 已知某灯泡厂生产的一批灯泡的使用寿命服从正态分布,测得其中10只灯泡的使用寿命(单位:h)如下:,1050,1100,1080,1120,1200, 1250,1040,1130,1300,1200,20,运行结果为,uh = 1147 sigh

8、 = 87.0568 u = 1.0e+003 * 1.0847 1.2093 sig = 59.8807 158.9318 故所求置信区间为(1084.7, 1209.3),即有95%的把握认为这批灯泡的使用寿命在1084.7小时至1209.3小时之间。,21,9. 4 假设检验,假设检验的概念 对总体的分布律或分布参数作某种假设,根据抽取的样本观测值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受或拒绝假设,这类统计推断问题称为假设检验问题。,以下只讨论正态总体均值的假设检验,22,9.4.1 假设检验的一般步骤,1. 根据实际问题提出检验假设H0与备选假设H1,即说明需要检验

9、的假设的具体内容; 2. 选取适当的统计量,并在H0成立的条件下确定该统计量的分布; 3. 按问题的具体要求,选取适当的显著性水平,并根据统计量的分布,确定对应于的临界值(分位数)。 4. 根据样本观测值计算出统计量的观测值,并与临界值进行比较,从而在检验水平条件下接受或拒绝原假设H0。,23,9.4.2 单个正态总体均值检验,取容量为n的样本,求出样本均值x和标准差s,对总体均值是否等于给定值0进行检验。记,H0: =0 H1: 0,称H0为原假设,H1为备选假设,两者择其一:接受H0 或者 拒绝H0,即接受H1. 假设检验就是根据样本对假设H0做出判断:接受还是拒绝。另外再选定一个常数(显

10、著性水平),作为H0成立但被错误拒绝的概率。,24,1、总体方差2已知,若H0成立,对给定常数,取N(0,1)的1-/2分位数u1-/2,|z|u1-/2 时接受H0,否则拒绝H0,实际常用的值是0.05或0.01,对应的u1-/2 值是1.96或2.575。,假设检验的规则(z检验):,25,2、 总体方差2未知,若H0成立,对给定常数,取t(n-1)的1/2分位数t1-/2,假设检验的规则(t检验),|t|t1-/2 时接受H0,否则拒绝H0,当n较大时(n30),t1-/2 u1-/2,26,2. 双侧检验与单侧检验,将假设H0的拒绝区间(域)放在两侧(例如|t|t1-/2),这样做对于

11、0形式的假设H1是合适的,这样的检验称为双侧检验。 但有的实际问题需要检验的是形如0 或0的假设,如对于一批灯泡的平均寿命,检验“不小于若干小时”比检验“等于若干小时”更合理。,27,设原假设H0:=0;备选假设H1:0;在总体方差2已知时,取N(0,1)的分位数u,即如果 zN(0,1),则,假设检验的规则为:z u 时拒绝H0. 总体方差2未知时有类似结果. 类似地可以讨论H0:=0;H1:0的情况. 这种将假设H0的拒绝区间(域)放在一侧的检验称为单侧检验.,或,28,单个正态总体均值检验一览表,29,3. 单个正态总体均值检验的MATLAB实现,(1) 总体方差2已知 总体方差2已知时

12、,总体均值的假设检验使用的MATLAB命令为ztest,格式:h,p,ci=ztest(x,u,sig,a,t),30,格式:h,p,ci=ztest(x,u,sig,a,t),输入参数意义: x 样本观测值; u 总体均值的假设值; sig 总体标准差; a 显著性水平(缺省值为0.05); t 假设检验参数(缺省值为0) t=0 H0:=0; H1:“总体均值不等于u”; t=1 H0:=0; H1:“总体均值大于u”; t=-1 H0:=0; H1: “总体均值小于u”.,31,格式:h,p,ci=ztest(x,u,sig,a,t),输出参数意义: h 是一个布尔值 h=0:不能拒绝原

13、假设H0 h=1:可以拒绝原假设H0 p 是假设H0成立的概率 ci 是均值的1-a置信区间,32,例9.7 已知美国某地1993年一月份汽油价格数据如下: 119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118,解 作假设u=115,输入程序 x=119,117,115,116,112,121,115,122,116,118,109,112,119,112,117,113,114,109,109,118; h,p,ci=ztest(x,115,4,0.05,0),假设一月份汽油价格的标准差

14、为=4,试检验一月份汽油价格的均值是否等于115。,33,运行结果为,h = 0 p = 0.8668 ci = 113.3970 116.9030 检验结果: (1)布尔变量h=0,不能拒绝接受u=115的假设; (2)p的值为0.8668,远超过0.5,即均值为115这个假设成立的概率是非常大的。 (3)u=115的95%的置信区间为(113.397,116.903),它完全包括了115,且精度很高。,34,总体方差2未知时,总体均值的假设检验使用的MATLAB命令为ttest 格式:h,p,ci=ztest(x,u,a,t) 输入输出变量的意义与ztest相同,仅是输入变量少了标准差.,

15、(2) 总体方差2未知,35,例9.8 已知美国某地1993年二月份汽油价格数据如下: 118 115 115 122 118 121 120 122 120 113 120 123 121 109 117 117 120 116 118 125,解 作假设u=115,输入程序 x=118,115,115,122,118,121,120,122,120,113,120,123,121,109,117,117,120,116,118,125; h,p,ci=ttest(x,115,0.05,0),试检验二月份汽油价格的均值是否等于115。,36,运行结果为,h = 1 p = 4.9517e-0

16、04 ci = 116.7521 120.2479 检验结果: (1)h=1,表示可以拒绝接受u=115的假设,即汽油价格的均值等于115的假设是不合理的; (2)p的值为4.9517e-004,远小于0.5,即均值为115这个假设成立的概率是非常小的。 (3) u=115的95%的置信区间为(116.7521,120.2479),它不包括115。,37,4. 两个正态总体均值检验,设已知两总体XN(1,12),YN(2,22). 分别取容量为n1, n2的样本,由其确定的均值分别为x1,x2,标准差分别为s1, s2. 要作的假设检验为 H0:1=2 ; H1:12(12, 12),取N(0

17、,1)的1-/2分位数u1-/2,假设检验的规则(z检验)为:|z|u1-/2 时接受H0,否则拒绝H0。,当1,2已知时,若H0成立,则,38,当1,2未知,但可以假定1=2时,若H0成立,则,取t(n1+n2-2)的1-/2分位数t1-/2,即假设检验的规则(t检验)为:|t|t1-/2 时接受H0,否则拒绝H0。,对假设检验 H0:1=2 ; H1:12或 12 有类似的结果,39,两个正态总体均值检验一览表,40,两总体均值假设检验的MATLAB实现,两总体均值的假设检验用t检验 格式:h,p,ci=ttest2(x,y,a,t),检验两组数据x,y关于均值的某一假设是否成立,其中a为

18、显著性水平,究竟检验什么假设取决于t的取值: t=0,检验假设“x的均值等于y的均值” t=1,检验假设“x的均值大于y的均值” t=-1,检验假设“x的均值小于y的均值” t的缺省值为0, a的缺省值为0.05.,41,两总体均值假设检验的MATLAB实现,两总体均值的假设检验用t检验 格式:h,p,ci=ttest2(x,y,a,t),输出参数意义: 返回值h为一个布尔值 h=0 表示不能拒绝假设 h=1 表示可以拒绝假设 p为假设成立的概率 ci为x与y均值差的1-a置信区间,42,例9.9 试检验例9.7和例9.8中美国某地1993年一、二月份油价的均值是否相同。,解:输入并运行以下命令,x=119,117,115,116,112,121,115,122,116,118,109,112,119,112,117,113,114,109,109,118; y=118,115,115,122,118,121,120

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论