教程参数估计及假设检验详解演示文稿_第1页
教程参数估计及假设检验详解演示文稿_第2页
教程参数估计及假设检验详解演示文稿_第3页
教程参数估计及假设检验详解演示文稿_第4页
教程参数估计及假设检验详解演示文稿_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教程参数估计及假设检验详解演示文稿目前一页\总数五十二页\编于点优选教程参数估计及假设检验目前二页\总数五十二页\编于点一、参数估计参数估计问题的一般提法设有一个统计总体,总体分布函数为F(x,),

其中是未知参数,现从该总体抽样,得样本目前三页\总数五十二页\编于点参数估计点估计区间估计点估计

——

估计未知参数的值。区间估计——

根据样本构造出适当的区间,使它以一定的概率包含未知参数或未知参数的已知函数的真值。目前四页\总数五十二页\编于点(一)点估计的求法1、矩估计法

基本思想是用样本矩估计总体矩

.设总体分布含有个k未知参数

1

,…,k计算总体的前k阶矩l=1,...,k阶矩目前五页\总数五十二页\编于点解此方程组得其根为

分别估计参数i,i=1,...,k,并称其为i的矩估计。由于样本的l阶矩依概率收敛到总体的l阶矩l。所以令目前六页\总数五十二页\编于点2、最大似然估计法设总体X有概率密度f(x;)(或分布律

p(x;)),=(1,...,k)。设X1,...,Xn是来自总体的简单随机样本,x1,...,xn是样本观测值。最大似然估计的想法是选取参数i,i=1,...,k,使样本X1,...,Xn在样本值x1,...,xn附近取值的概率达到最大。即构造似然函数或目前七页\总数五十二页\编于点若有参数=(1,...,k)的取值,使得似然函数L(1,...,k)达到最大,则称它为参数1,...,k的最大似然估计。目前八页\总数五十二页\编于点(二)区间估计目前九页\总数五十二页\编于点置信区间的意义枢轴量目前十页\总数五十二页\编于点1、数学期望的置信区间设样本

来自正态母体X~N(,2)(1)方差

2已知,

的置信区间(2)方差2

未知

,

的置信区间

目前十一页\总数五十二页\编于点2、方差的区间估计

未知时,

方差2

的置信区间为目前十二页\总数五十二页\编于点(三)参数估计的命令1、正态总体的参数估计

设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:

[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令以alpha为显著性水平,在数据X下,对参数进行估计。(alpha缺省时设定为0.05),返回值muhat是正态分布的均值的点估计值,sigmahat是标准差的点估计值,

muci是均值的区间估计,sigmaci是标准差的区间估计.X为矩阵(列为变量)时,输出行变量。目前十三页\总数五十二页\编于点例1.给出容量为50的正态分布N(10,22)的随机数,并以此为样本值,给出

的点估计和区间估计;给出容量为100的正态分布N(10,

22)的随机数,并以此为样本值,给出

的点估计和区间估计;给出容量为1000的正态分布N(10,22)的随机数,并以此为样本值,给出和

的点估计和区间估计.命令:X1=normrnd(10,2,50,1);[mu1,sigm1,muci1,sigmci1]=normfit(X1)X2=normrnd(10,2,100,1);[mu2,sigm2,muci2,sigmci2]=normfit(X2)X3=normrnd(10,2,1000,1);[mu3,sigm3,muci3,sigmci3]=normfit(X3)目前十四页\总数五十二页\编于点例2.中国改革开放30年来的经济发展使人民的生活得到了很大的提高,不少家长都觉得这一代孩子的身高比上一代有了明显变化。下面数据是近期在一个经济比较发达的城市中学收集的17岁的男生身高(单位:cm),若数据来自正态分布,计算学生身高的均值和标准差的点估计和置信水平为0.95的区间估计。170.1,179,171.5,173.1,174.1,177.2,170.3,176.2,175.4,163.3,179.0,176.5,178.4,165.1,179.4,176.3,179.0,173.9,173.7173.2,172.3,169.3,172.8,176.4,163.7,177.0,165.9,166.6,167.4174.0,174.3,184.5,171.9,181.4,164.6,176.4,172.4,180.3,160.5166.2,173.5,171.7,167.9,168.7,175.6,179.6,171.6,168.1,172.2目前十五页\总数五十二页\编于点例3.产生正态分布随机数作为样本值,计算区间估计的覆盖率。写出fugailv.m文件。functionfugailv(mu,sigm,n,m,alpha)X=normrnd(mu,sigm,m,1);[Mu,Sigm,Muci,Sigmci]=normfit(X,alpha);muratio=0;sigmratio=0;fori=1:nX=normrnd(mu,sigm,m,1);[Mu(i),Sigm(i),muci,sigmci]=normfit(X,alpha);endforj=1:nif(Mu(j)>=Muci(1))&&(Mu(j)<=Muci(2))muratio=muratio+1;endif(Sigm(j)>=Sigmci(1))&&(Mu(j)<=Sigmci(2))sigmratio=sigmratio+1;endendmuratio=muratio/nsigmratio=sigmratio/n目前十六页\总数五十二页\编于点[muratio,sgmratio]=fugailv(0,1,1000,200,0.05)[muratio,sgmratio]=fugailv(10,2,2000,500,0.01)[muratio,sgmratio]=fugailv(4,6,5000,400,0.025)目前十七页\总数五十二页\编于点2、其它分布的参数估计(1).取容量充分大的样本(n>50),按中心极限定理,它近似地服从正态分布;(2).使用Matlab工具箱中具有特定分布总体的估计命令.10[muhat,muci]=expfit(X,alpha)-----

在显著性水平alpha下,求指数分布的数据X的均值的点估计及其区间估计.20[lambdahat,lambdaci]=

poissfit(X,alpha)-----

在显著性水平alpha下,求泊松分布的数据X的参数的点估计及其区间估计.30[phat,pci]=weibfit(X,alpha)-----

在显著性水平alpha下,求Weibull分布的数据X的参数的点估计及其区间估计.目前十八页\总数五十二页\编于点函数名参数估计对应的参数调用格式mle极大似然估计phat=mle(‘dist’,data)[phat,pci]=mle(‘dist’,data)[phat,pci]=mle(‘dist’,data,alpha)[phat,pci]=mle(‘dist’,data,alpha,pl)normlike对数正态似然函数L=normlike(params,data)normfit正态分布

[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)目前十九页\总数五十二页\编于点函数名参数估计对应的参数调用格式poissfit泊松分布lambdahat=poissfit(X)[lambdahat,lambdaci]=poissfit(X)unifit均匀分布[ahat,bhat]=unifit(X)[ahat,bhat,ACI,BCI]=unifit(X)[ahat,bhat,ACI,BCI]=unifit(X,alpha)[lambdahat,lambdaci]=poissfit(X,alpha)目前二十页\总数五十二页\编于点函数名参数估计对应的参数调用格式weibfit威布尔分布weiblike威布尔对数似然函数logL=weiblike(params,data)[logL,info]=weiblike(params,data)phat=weibfit(X)[phat,pci]=weibfit(X)[phat,pci]=weibfit(X,alpha)目前二十一页\总数五十二页\编于点说明:命令mle的调用格式中:[phat,pci]=mle(‘dist’,data,alpha,p1)只用于二项分布,其中p1为试验次数例4.rv=binornd(20,0.75,1,10)%产生10个二项分布随机数参数为20和0.75[p,pci]=mle('binomial',rv,0.05,20)rv=12141813121416151816p=0.7400pci=[0.6734,0.7993]目前二十二页\总数五十二页\编于点例5.生成指数分布随机数100个,假设均值参数真值为0.5,以此为样本值,给出参数的点估计和区间估计命令:r=exprnd(0.5,100,1);[lamta,lamtaci]=expfit(r);[lamta,lamtaci]=expfit(r,0.01);结果:lamta=0.4579lamtaci=0.3799,0.5627lamta=0.4579lamtaci=0.3587,0.6015目前二十三页\总数五十二页\编于点3.不常用分布的参数估计(极大似然估计)此类问题一般归结为无约束最优化问题。无约束最优化问题的一般形式:参数的极大似然估计就是取目标函数为的无约束最优化问题。目前二十四页\总数五十二页\编于点方法:①最速下降法②Newton(牛顿)法及其修正的方法。③共轭方向法和共轭梯度法④变尺度法(拟牛顿法)等等详见北京大学出版社高惠璇编著《统计计算》P359------P379目前二十五页\总数五十二页\编于点二、假设检验

对总体X的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设.统计推断的另一类重要问题是假设检验问题。在总体的分布函数完全未知或只知其形式,但不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设。目前二十六页\总数五十二页\编于点1.参数检验:如果总体的分布函数类型已知,这时构造出的统计量依赖于总体的分布函数,这种检验称为参数检验.参数检验的目的往往是对总体的参数及其有关性质出明确的判断.2.非参数检验:如果所检验的假设并非是对某个分布的参数作出明确的判断,检验统计量的分布函数不依赖于总体的分布类型,这种检验叫非参数检验.如判断总体分布类型的检验就是非参数检验.目前二十七页\总数五十二页\编于点假设检验的一般步骤是:①根据实际问题提出原假设H0与备择假设H1,即说明需要检验的假设的具体内容。②选择适当的统计量,构造恰当的拒绝域.③根据样本观测值计算统计量的观测值,看其是否落入拒绝域中,从而在检验水平条件下对拒绝或接受原假设H0作出判断

.目前二十八页\总数五十二页\编于点(一)参数检验1、单个正态总体X~N(,2)均值检验--------方差

2已知时采用

z检验------方差

2未知,采用t

检验目前二十九页\总数五十二页\编于点目前三十页\总数五十二页\编于点2、单个正态总体方差检验------2目前三十一页\总数五十二页\编于点3、两个正态总体N(1,12)和N(2,22)均值检验(1)已知选取统计量(2)方差未知,检验选取统计量目前三十二页\总数五十二页\编于点(2)方差未知,检验选取统计量当|t|>t

1/2(n1+n2-2)时拒绝原假设,否则接受原假设。-----t

1/2

(n1+n2-2)为t分布t

(n1+n2-2)的下测1/2分位数,n1为来自总体N(1,12)

的样本的容量,n2是来自总体N(2,22)的样本的容量。目前三十三页\总数五十二页\编于点4、两个正态总体方差检验目前三十四页\总数五十二页\编于点5、参数检验的计算机命令10z检验(1)

命令ztest函数(2)功能:给定方差条件下进行正态总体均值得检验(3)语法:h=ztest(x,m,sigm);h=ztest(x,m,sigm,alpha);[h,sig,ci]=ztest(x,m,sigm,alpha,tail);h=1,则拒绝原假设,h=0,则接收原假设(4)描述:ztest(x,m,sigm)在0.05水平下进行Z检验,以确定服从正态分布的样本均值是否为m,sigm为给定的标准差h=ztest(x,m,sigm,alpha)给出显著水平控制参数alpha,[h,sig,ci]=ztest(x,m,sigm,alpha,tail)允许指定是进行单侧检验还是双侧检验。目前三十五页\总数五十二页\编于点tail参数可以有下面几个取值:•tail=0(为默认设置)指定备择假设•tail=1指定备择假设•tail=-1指定备择假设sig为与Z统计量相关的p值。ci为均值真值的1-alpha置信区间。(5)应用实例目前三十六页\总数五十二页\编于点例6、生成100个标准正态分布的随机数,假设均值和标准差的观测值与真值之间没有差异,进行检验。过程如下:x=normrnd(0,1,1,100);[h,sig,ci]=ztest(x,0,1)结果:h=0sig=0.6317ci=[-0.14810.2439]目前三十七页\总数五十二页\编于点例7、某批矿砂的5个样品中的镍含量,经测定为(%)

3.253.273.243.263.24设测定值总体服从正态分布,标准差为0.04,问在0.01水平上能否接受假设:这批镍含量的均值为3.25。过程如下:x=[3.253.273.243.263.24];[h,sig,ci]=ztest(x,3.25,0.04,0.01)结果:h=0sig=0.9110ci=[3.20593.298]目前三十八页\总数五十二页\编于点例8、下面列出的是某工厂随机选取的20只部件的装配时间

9.810.410.69.69.79.910.911.19.610.210.39.69.911.210.69.810.510.110.59.7设总体服从正态分布,标准差为0.4,问在0.05水平上能否认为装配时间的均值显著的大于10。

需检验H0:

10,H1:>10过程如下:x=[9.810.410.69.69.79.910.911.19.610.210.39.69.911.210.69.810.510.110.59.7];[h,sig,ci]=ztest(x,10,0.4,0.05,1)结果:h=1sig=0.0127ci=[10.0529inf]拒绝原假设目前三十九页\总数五十二页\编于点20单个样本的t检验(1)

命令ttest函数(2)功能:未知方差条件下进行正态总体均值得检验(3)语法:h=ttest(x,m);h=ttest(x,m,alpha);[h,sig,ci]=ttest(x,m,alpha,tail);h=1,则拒绝原假设,h=0,则接收原假设(4)格式的使用和参数的取值含义与ztest大致相同(5)应用实例目前四十页\总数五十二页\编于点例9、测得一批刚件20个样品的屈服点(单位:T/mm2)为:

4.985.115.205.115.005.614.885.275.385.205.465.275.234.965.355.155.354.775.335.54设屈服点服从正态分布,在0.05水平上,检验该样本的均值是否为5.20,的假设检验。

需检验H0:

=5.20,H1:5.20过程如下:x=[4.985.115.205.115.005.614.885.275.385.205.465.275.234.965.355.155.354.775.335.54];m=mean(x)[h,sig,ci]=ttest(x,5.20,0.05)结果:m=5.2075h=0sig=0.8796ci=[5.10525.3098]目前四十一页\总数五十二页\编于点30两个样本的t检验(1)

命令ttest2函数(2)功能:两个样本均值差异的t检验(3)语法:[h,significance,ci]=ttest2(x,y);[h,significance,ci]=ttest2(x,y,alpha);[h,significance,ci]=ttest2(x,y,alpha,tail);h=1,则拒绝原假设,h=0,则接收原假设(4)格式的使用和参数的取值含义与ttest大致相同(5)应用实例目前四十二页\总数五十二页\编于点例10、对两种不同的水稻品种A,B分别统计了8个地区的单位面积产量(单位:kg)品种A:8687569384937579

品种B:8079589177827666要求检验两个水稻品种的单位面积产量之间是否有显著差异?过程如下:x=[8687569384937579];y=[8079589177827666];[h,significance,ci]=ttest2(x,y)结果:h=0significance=0.3393ci=-6.423617.4236目前四十三页\总数五十二页\编于点(二)非参数检验1.Jarque-Bera检验(1)

数学原理:

Jarque-Bera检验是评价X服从正态分布的假设是否成立。该检验基于样本偏度和峰度,样本偏度接近于0,样本峰度接近于3。基于此构造一个包含2

统计量:

JB=n(g1^2+(g2-3)^2/4)/6(n为样本容量)

Jarque和Bera证明了在正态性假定下,JB渐进的服从自由度为2的2分布,若JB超过了12(2),即2(2)的下测1分位数,则拒绝正态分布零假设,反之,接受零假设。目前四十四页\总数五十二页\编于点(2)函数名称:jbtest(3)语法:H=jbtest(x);H=jbtest(x,alpha);[H,p,jbstat,cv]=jbtest(x,alpha);H=1,则拒绝服从正态,H=0,则接收服从正态(4)alpha为显著水平,p为p值,jbstat为检验统计量的值,cv为确定是否拒绝原假设的的临界值。目前四十五页\总数五十二页\编于点(5)应用实例例11、对下列数据确定其是否服从正态分布。459362624542509584433748815505

612452434982640742565706593680

9266531644877346084281153593844

527552513781474388824538862659

77585975549697515628954771609

402960885610292837473677358638

699634555570844166061062484120

447654564339280246687539790581

621724531512577496468499544645

764558378765666763217715310851目前四十六页\总数五十二页\编于点2.总体分布的χ2检验法总体X的样本观测值为x1,x2,…,xn,考虑如下检验问题:H0:X的分布函数为F(x),这里F(x)为已知的分布函数在实数轴上取k个分点t1,t2,…,tk,得到互不相交的区间设样本观测值为x1,x2,…,xn落入第i个区间的个数为vi,其频率为vi/n.目前四十七页\总数五十二页\编于点如果H0成立,由给定的分布函数F(x),可以计算X落在每个小区间的概率为:其中考虑统计量目前四十八页\总数五十二页\编于点Pearson在1900年证明了如下定理:设F(x)是随机变量X的分布函数,当H

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论