




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第十一章随机变量模型的确定11.1随机变量模型的确定三种情形:.随机变量分布的类型已知,需要由观测数据确定该分布的参数.由观测数据确定随机变量概率分布类型,并在此基础上确定其参数.由已有的观测数据难以确定该随机变量的理论分布形式,则定义一个实验分布图11.1均匀分布U(a,b)其它其中参数a定义为位置参数,当a改变时(保持ba不变),f(x)向左或向右移动。(2)比例参数(记为0):决定分布函数在其取值范围内取值的比例尺。0的改变只压缩或扩张分布函数而不会改变其基本形状。例如,指数分布函数EXPO(0),其密度函数为:00.51.0 x图11.2指数分布EXPO(0)1ex/0f(x)十0
2、x0其它a0例如,韦伯分布Weibull(以,0),其密度函数为:axa1e1(x/0)a0 x0其它形状参数(记为a):确定分布函数的形状,从而改变分布函数的性质,当-改变时,其形状发生很大的变化。随机变量X,Y,如果存在一个实数数,使X与Y具有相同的分布,则称X与Y仅仅是位置上不同变量;如果对于某个正实数0,使得0X与Y具有相同的分布,则称X与Y仅仅是比例尺不同的随机变量;如果丫+0X与Y具有相同的分布,则称X与Y仅在位置与比例上不同。2.分布参数的估计最大似然估计:设参数,观测数据为X1,x2,,xn在离散分布情形,可令P(x)为该分布的概率质量函数定义似然函数L()为:L()二P(x)
3、P(x).P(x)12n则L()是联合质量函数,的最大似然估计值是使L()取最大值的,即对于所有可能的值,(L(&)L(0)。在连续分布情形,令f0(x)为该分布的概率密度函数其似然函数定义为L(0):L(0)=f0(x)f0(x).f0(x)01020n例:指数分布,被估计的参数0=B(B0),其分布密度函数为fb(x)=丄e-x/%L(卩)=,exi/卩1)ex/BB2丿为求使L(B)取最大值的B,先对L(B)取自然对数:/卩二nexp-(1n.1工i=11R(B)=lnL(%)=-nInR-工由于R(卩)=lnL(卩)是严格递增的,L(B)取最大值等价于R(B)取最大值,为此,对R(B)
4、求极值:dRdBn1vn+vBB2i=1可得nB=vx/n=x(n)ii=1又由d2Rp2n-?/p2p3d2R当0二x(n)时,由于xi为正,可见-d-20,因而0=x(n)为最大值,从而得到参数0的最大似然估计值为an0=x(n)=工i=111.2分布类型的假设由观测数据来确定随机变量的分布类型对观测数据进行适当的预处理,然后根据预处理的结果对分布类型进行假设。1.连续分布类型的假设预处理方法有三种,即点统计法、直方图法及概率图法。点统计法:基于连续分布的变异系数特征来进行分布类型的假设。变异系数的定义是:5二JVar(x)/E(x)其中Var(x)与E(x)分别为分布的方差与均值。点统计
5、法对观测数据进行如下预处理:5=.JS2(n)/x(n)tx-x(n)2/(n-1)inx(n)=工x/nii=l则5的似然估计为:然后根据5值并参照各类分布的变异数据5来假设观测数据的分布类型粗(2)直方图法将观测数据x1,&,xn的取值范围分成k个断开的相邻区间tb0,b)q),bk-i,bk),每个区间宽度相等,记为Ab=jj(j二1,2,k)o对任意j,设ni为第j个区间上观测点的个数记g=nj/n(j=1,2,k)0 xbo定义函数h(x)=gbxbij-1i0XXk做出h(x)的直方图,再将该图与基本理论分布的密度函数图形进行比较(先忽略位置及比例尺的差别),观察何种分布与h(x)
6、的图形类似,则可假设观测数据x1,x2,xn服从该类型分布,然后再采用前面介绍的方法确定其参数。在实际使用时,可能需要增加一些其值特别大或特别小的观测数据,以便与理论分布进行比较。使用直方图法的困难在于如何确定区间长度b。Ab太大,将丢失信息,Ab太小,则观测数据中的噪声滤除得不够(一般观测数据中总是存在一定的噪声)。概率图法直方图法:将观测数据的直方图与理论分布的密度函数进行比较概率图法:将观测数据定义成一个实验分布函数,然后将它与理论分布函数进行比较后再进行假设设观测数据,x2,xn共有m个取值(mn,因为可能存在取值相同的观测点),分别记为x(1),(2),x(m),实验分布函定义为:F
7、lx(i)Ln/n(/=1,2,m)其中“i表示小于或等于X(1)的观测数据的个数,且nm=n。为了避免由有限个观测数据得到的实验分布函数值等于1,对上式可略加修正,可采用下式来定义:F(i)=(n-5)/nni概率图法采用所谓“分位点”比较法:定义:分布函数的分位点为:设g1,则xg二F-1(g)称为F(x)的分位点。如果F(x)与G(y)都是分布函数,分别取不同的g值,相应得到不同的(xg,yg),若F(x)与G(y)是相同的分布函数则由(xg,yg)形成的轨迹是斜率为45。的直线。反过来说,如果由两个分布函数f(x)与G(y)按相同的一组g值求得各自的分位点xg,yg,在xoy平面上确定
8、(xg,yg)的轨迹,若该轨迹是一条斜率为45。的直线,则可以确认F(x)与G(y)的分布是相同的。为了假设戸L(i)=(n.-05)/n=g.的分布类型,可取戸的分位点为x(i),分别对应FL(i)的值为g.,iii然后从基本理论分布中选择一种,按g.分别求得其分位点y.,然后在xoy平面上画出C(i),y.J的轨迹,观察.是否是斜率为45。的直线,若比较接近,则可假设观测数据的分布类型与所选分布的类型相同。有时,G(i),y.)的轨迹虽然呈直线形状,但斜率却不是45。,这说明这两个分布的类型是相同的,只是位置参数和(或)比例参数不同,那么可对x(i)进行如下下变换:y二丫+卩兀(.)().
9、得到的),y.丿的轨迹必然是斜率为45啲直线。这就说明,只要分位点(x(i),y.)的轨迹接近直线,不管其II斜率如何,观测数据的分布与所选分布的类型是相同的。概率图法只需要判断分位点轨迹偏离线性度的程度,不会对观测数据造成信息丢失。 3实验分布难以由观测数据确定一个理论分布原始观测数据为单个数据:X2,,Xn,先将该“个数据按递增顺序排列。由于可能有相同值的数据,经排序后得到x(1),x,x(m),(mn),该观测数据的实验分布可由下式来定义:1x-x(j)n1x(j+1)x(j)xx(1)x(j)xxn观测数据是分组数据:即不知道观测数据的数值,而仅知道该n个数据分布在m个相邻区间ao,a
10、1),5,aj,,am-1,am)上及每个区间上数据的个数。记第j个区间上的个数为n.(j=12.m),则n+n2+n=n,实验分布函数的表达式为:12m0k-1工naj-1-Xajj=1,2,minx一aF(x)=+丄dnna一ajj-111.3拟合优良度检验由观测数据假设了其分布的类型并估计出其参数以后,一般需要检验该分布与这些观测数据吻合的程度,即进行拟合优良度检验。将该拟合分布的取值范围分为k个相等子区间ao,a1),a1,僞),ak-1,ak),其中可能a0=-3,或/Paf(x)dxjaj-1j-1(j-1,2,,K),其中f(x)是拟合的分布密度函数。对离散情形,Pj=工P(xi
11、)(j=12,K),其中P(x.)是拟合分布的质量函数。1:aj-1-x5,以提高检验的有效性。在离散分布的情形下,不可能保证p.完全相等,但应使p.的值尽可能接近。2柯尔莫哥洛夫-斯米尔洛夫(KS检验)、入兀2检验的困难:按Pj相等来确定aa时要对F(x)进行逆运算,而在某些情况下,求F(x)的逆运算JJ一1J比较困难,或者F(x)无封闭形式无法求F(x)的逆运算;当n较小时,pj5/n的值较大,从而得到的区间过大,结果造成观测数据的信息丢失。K-S检验:将拟合的分布函数戶(x)与由观测数据定义的实验分布函数F(x丿进行比较。设观测数据为xi,x2,,xn,观测数据的实验分布函数F(x丿采用
12、如下定义:参(xx)数据的个数卄缶若Fn(x)二n(对所有x)这样,F(x)是右连续的阶跃函数。K-S检验规则:根据F(x丿与F(x)的接近程度来决定是否拒绝原假设h0。评价接近程度的指标是采用F(x)与F(x)之间的最大距离DnD=supF(x)-F(x)nnx若Dn超过规定的常数d1(其中是要求的检验水平),则拒绝H0,否则不拒绝H0。n,1-问题:对于不同的分布,dn的值是不同的;即使是同一分布,不同的。下d1-也不相同,而且尚无通用的表n,1-可查。1-指数分布EXPO(:lD”-铝F+26+埠d若成立,则拒绝Ho,其中d1-a的值为;a0.1500.1000.0500.250.10d
13、Uo0.9260.9901.09411901.3082.正态分布N(&2)$-001+尸ndi-a若成立,则拒绝H0,其中d“的值为:a0.1500.1000.0500.250.10d1o0.7750.8190.8950.9551.035习题(1)利用K-S检验法检验下列样本是否符合均值为00、方差为2.5的正态分布。检验水平为a=005。1.5494222.444344-1.356287-1.1584681.9862881.3176501.203433-2.405187-0.983101-0.9424572.6272022.2951940.2535010.256372-1.2214262.8192772.7292911.374238-0.0286060.9402191.100076-2.032944-1.1056791.6949560.019935(2)若有一批样本数为50的三极管,其放大倍数p值分别为:34.756.238.454.157.451.760.667.778.138.249.242.845.253.480
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小肠减压管的临床护理
- 围手术期护理全流程管理
- 矿山劳务合同范本
- 二零二五版房屋厂房租赁合同
- 轮岗完的述职报告
- 物业维修电缆合同范本
- 汽车维修工安全教育培训
- 原煤运输合同范本
- 运用中医思维指导临床护理
- 板材油漆采购合同范本
- 发展全过程人民民主发展全过程人民民主
- (2023年度)中央厨房、集体供餐配送单位食品安全全项目自查记录表
- 【企业精益生产分析国内外文献综述3000字】
- 猕猴桃果酱制作方法
- 逆变器行业营销策略方案
- 国民经济行业分类与代码
- 网络互连技术-管控IP数据通信ACL(访问控制列表)
- 线性光耦隔离检测电压电路
- 材料封样清单土建安装
- 免疫比浊分析(免疫学检验课件)
- XXX中学“生本课堂”实施方案
评论
0/150
提交评论