版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、卡方分布一、卡方分布的定义:若 n 个相互独立的随机变量 1, 2, n ,均服从标准正态分布(也称独立同分布于标准正态分布),则这 n 个服从标准正态分布的随机变量的平方和 i 2 构 成 一 新 的 随 机 变 量 , 其 分 布 规 律 称 为 2(n) 分 布 ( chi-squaredistribution),其中参数n称为自由度。二、 卡方分布的性质 ::(1) ( 可加性 )设 Yi 2ni , i , i1, k,且相互独立,则这里 nni,i .( 2)E(2)n,Var(2) 2n4 .n,n ,证明(1)根据定义易得。( 2)设 Y n2, , 则依定义,Y可表示为其中
2、X i N (0,1), i1, n1,X n N (,1), 且相互独立,于是因为代入( 1),第一条结论可得证。直接计算可得于是代入( 2)便证明了第二条结论。三、卡方分布的概率密度函数:其中Dx 为n 维x 空间内由不等式x12xn2z所定的区域。即, Dz 为n 维x 空间内以坐标原点为球心、z 为半径的球面所围成的区域(边界不在内)可以利用极坐标来计算这积分。令与这变换相应的函数行列式为:其中括号和都表示1,n 1 的函数。因此。当z0 时,C 是常数。为了定出 C, 在上述等式的两端令r, 得到从而,在 分 母 内 的积 分 中 令 1 r 21, 即 , 用 r2 2 作代换,那
3、么,这个积分等于2n -1n11nnn dnn2 22212 d2 2212 21102022n因此,C2n 1n2 22从而,当 z0 时,即,2的密度函数为称这个密度函数所定的分布为自由度为n 的2 分布,记作( n)2 。它的图像如下:图(一)2 分布密度函数图四、卡方分布的累积分布函数为:Fk xk 2, x2 ,k2其中 (k,z) 为不完全 Gamma函数。其图像如下:图(二)2 分布的分布函数图五、 卡方分布的特征函数及其推导:特征函数:(t)()=f(x)dx=dx=六、 论证过程中的心得体会:首先通过对卡方的研究和证明,提高了我们对数学的兴趣。其次,通过这次的推导和搜索资料进
4、行分析,大大提高了我们的独立思考的能力,我们当中很多同学之前都很害怕类似的证明题,这一次的合力解决难题使我们信心倍增。当然同时,这个合作锻炼了我们团队合作的能力,分工合作解决问题,有的人负责收集资料,有点人负责推导公式,有的人负责输入文章,整理公式,等等。这让大家明白了团结的力量。做出合理的时间安排, 做任何事情,合理的时间安排非常重要,多元课程设计也是一样,事先要做好一个规 划,课程设计一共分 5 个板块(定义,性质,特征函数,密度函数,分布函数,心得体会)。你每 天要做完哪几个板块事先要确定好,这样做才会使自己游刃有余,保证在 2 周时间内内完成论文,以避免由于时间上的不妥,以致于最后无法
5、完成论文。另外,写论文的过程中也使我们对论文的格式有了一个了解,更规范更具体,为以后的学业报告做了一次很好的准备。论文属于科学性的文章,它有严格的书写格式规范,因此一篇好的论文一定 要有正确的格式,论文格式错误就不能得到好成绩,因此我们写论文时要端正态度,注意书写格式。多元课程的设计更加是丰富了我们的业余生活, 让大家聚在一起讨论题目, 其乐融融。这样的课程设计也能使我们找到志同道合的朋友,发现生活中的点滴数学趣事,从实际出发思考题目,同时我们对计算机的知识也有了一定的加深, matlab 的使用等等。t 分布的有关知识t 分布的概述及其历史在概率论和统计学中,学生t - 分布( Studen
6、tst -distribution)应用在当对呈正态分布的母群体的均值进行估计。它是对两个样本均值差异进行显着性测试的学生t 测定的基础。t 检定改进了Z 检定,不论样本数量大或小皆可应用。在样本数量大(超过120 等)时,可以应用Z 检定,但Z 检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t 检定。在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t 检定。当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t - 分布。学生 t - 分布可简称为t 分布。其推导由威廉戈塞于1908 年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的
7、名义发表,所以论文使用了学生( Student )这一笔名。之后t检验以及相关理论经由罗纳德费雪的工作发扬光大,而正是他将此分布称为学生分布由于在实际工作中,往往 是未知的,常用s 作为 的估计值,为了与u 变换区别,称为 t 变换 t = xu ,统计量 t 值的分布称为 t 分布。sxt 分布的分布函数及证明用 T (x; n) 表示 tn 分布的分布函数,则证明 根据分布函数的定义有当 x 0时,上式为由于t ( y; n)dy1 ,故立即可得A11/ 2 ,为了计算A2 ,我们做变换ty2 /( ny 2 ) 则dy (n y2 )2 /(2ny) dt13t 2(1t) 22dt ,
8、因此故 T (x; n) A1 A211 IX 2 /( n x2 )( 1 , 1 n)2222而当 x0 时,我们有然后利用刚刚的讨论可知综上所述便得我们所要的结论。t 分布的密度函数及证明设, z 为相互独立随机变量,服从正态 N (0,1), z 服从自由度为 n 的 2 分布,则t=z的密度函数为n称 f t ( x) 是自由度为 n 的 t 分布(或 Student 分布)的密度函数,证:首先,易知 与 zn 相互独立,事实上,故得证 与 zn是相互独立的 . (其实,由商的密度函数为证明过程用到公式t 分布的 w特征函为:t 分布有如下特征:1、 t 分布是对称分布,且其均值为0
9、2 分布是一簇曲线, 其形态变化与 (确切地说与自由度)大小有关。自由度越小,tnt 分布曲线越低平;自由度 越大, t 分布曲线越接近标准正态分布( u 分布)曲线,如图1。3、 t 分布是一个分布族,对于不同的样本容量都对应不同的分布,且其均值都为0。4、与标准正态分布相比,t 分布的中心部分较低,2 个尾部较高。5、变量 t 的取值范围在到之间图 1 自由度为1、 5、 的 t 分布t 分布有如下性质:性质 1令 g( x)(1x2) (n 1) / 2n则 g ( x)n 1 (1x 2 ) ( n 3 ) / 2xnng (x)n1(1x2)(n5)/2 (1x2n3 x2 ) 故
10、g( x) 0 的解为 xn /(n 2) ,即分nnnn布密度在 xn /(n2) 处有拐点。性质 211x2lim t( x; n)e 22n性质 3设 X t n,若 rn ,则 E( X r ) 存在;若 rn ,则 E(X r ) 不存在。此点由微积分中判别积分收敛的法则很容易看出。若 rn ,且 r 为奇数,由于函数 xr(1x2/ n)(n1) / 2 是 x 的奇函数,因此,r 0 ;若 rn 且 r 为 偶 数 , 可 以 算 得rrnr / 21 3 5 (r 1)特 别(n2)(n 4) (n r )E(X)0,Va( Xr )n, n 3,4,r1 0, r2n6, n
11、5,6,n24性质 4 t n 分布由于只有 n1阶矩存在,故没有矩母函数存在。性质 5如 X1和 X 2 独立同分布于2n ,则随机变量 Y1( X 2 X 1 ) / X 1 X 2 t n 。2t 分布的分位数t 分布的分位数记作 t n . 如图所示,当 Xt n 时, P X t n=. 给出概率和自由度 n , 可从 t 分布的分为表中查出 tn . 与标准正态分布相类似 ,根据 t 分布密度曲线的对称性 , 也有 t nt1 n , 论述同 uu1 . 如果在 t 分布的分为表中没有负的分位, 则先查出 t1n , 然后得到 t nt 1 n .例如 ,t 0.95 4 2.13
12、2, t 0.9754 2.776,t 0.995 44.604,t 0.005 44.604, t 0 .025 42.776,t 0.02542.132另外 , 当 n30 时,在比较简略的表中查不到t n , 可用 u 作为 t n 的近似值 .t 分布的分位数t 分布表n0.250.20.150.10.050.0250.010.0050.00250.0010.000511.0001.3761.9633.0786.31412.70631.82163.657127.32318.31636.6220.8161.0611.3861.8862.9204.3036.9659.92514.08923
13、.32631.59830.7650.9781.2501.6382.3533.1824.5415.8417.45310.21312.92440.7410.9411.1901.5332.1322.7763.7474.6045.5987.1738.6150.7270.9201.1561.4762.0152.5713.3654.0324.7735.8936.86960.7180.9061.1341.4401.9432.4473.1433.7074.3175.2085.95970.7110.8961.1191.4151.8952.3652.9983.4994.0294.7855.40880.7060.8
14、891.1081.3971.8602.3062.8963.3553.8334.5015.04190.7030.8831.1001.3831.8332.2622.8213.2503.6904.2974.781100.700.8791.0931.3721.8122.2282.7643.1693.5814.1444.587110.6970.8761.0881.3631.7962.2012.7183.1063.4974.0254.437120.6950.8731.0831.3561.7822.1792.6813.0553.4283.9304.318130.6940.8701.0791.3501.771
15、2.1602.6503.0123.3723.8524.221140.6920.8681.0761.3451.7612.1452.6242.9773.3263.7874.14150.6910.8661.0741.3411.7532.1312.6022.9473.2863.7334.073160.6900.8651.0711.3371.7462.1202.5832.9213.2523.6864.015170.6890.8631.0691.3331.7402.1102.5672.8983.2223.6463.965180.6880.8621.0671.3301.7342.1012.5522.8783
16、.1973.6103.922190.6880.8611.0661.3281.7292.0932.5392.8613.1743.5793.883200.6870.8601.0641.3251.7252.0862.5282.8453.1533.5523.85210.6860.8591.0631.3231.7212.0802.5182.8313.1353.5273.819220.6860.8581.0611.3211.7172.0742.5082.8193.1193.5053.792230.6850.8581.0601.3191.7142.0692.5002.8073.1043.4853.76724
17、0.6850.8571.0591.3181.7112.0642.4922.7973.0913.4673.745250.6840.8561.0581.3161.7082.0602.4852.7873.0783.4503.725260.6840.8561.0581.3151.7062.0562.4792.7793.0673.4353.707270.6840.8551.0571.3141.7032.0522.4732.7713.0573.4213.69280.6830.8551.0561.3131.7012.0482.4672.7633.0473.4083.674290.6830.8541.0551
18、.3111.6992.0452.4622.7563.0383.3963.659300.6830.8541.0551.3101.6972.0422.4572.7503.0303.3853.646400.6810.8511.0501.3031.6842.0212.4232.7042.9713.3073.551600.6790.8481.0451.2961.6712.0002.3902.6602.9153.2323.461200.6770.8451.0411.2891.6581.982.3582.6172.8603.1603.3730.6740.8421.0361.2821.6451.962.326
19、2.5762.8073.093.291广义非中心 t 分布定义:1设xx1其中x( 2): n 1且 (,0,)。(*)x( 2) ECn 1 ( , I n 1, ),0t称为广义非中心 t 分布,记为t Gt n (, ) 或 t Gt n (, f ) 。定理 1:设 t Gt n ( , f ) ,则 t的密度是( *1)1n1 (n 1)2 )y n dy ,2(n) 2(n t 2 ) 2f ( y221 y10(n)21n 2 X 11 的分布( x( 2) x( 2) ) 2t ,其中1t /( nt 2 ) 2 。证:设 x ECn 1 (, I n 1 , f ) ,其中(
20、 ,0,0)且 h() 是 Borel函数使得 E(h(t )。1mm1 m 11 mx2i )dx1 , , dx m( )21 m)1 I 1 ( f 1 m) 对 于利 用f (y 2f ( y)dy( ) 2(11022(m)21n122X 2 , X n1 ,则我们有 E (h(t)h( n 2 x1 / r ) f ( x1)2r2 ) rn1drdx 1( 1 n)0221 n12( *2)10h(t) f (tr / n 2) 2r 2 )r n drdt( 1 n)n 22因此, t 的密度是1 n122f (t2n)r2n12t rn22)rndr ,1( 1 n)0n 2
21、21令 y(t 2n) / n) 2 r ,我们立得( * )。当0 时,( *1 )成为我们熟悉的密度 t 。1 n推论 1:设 t Gt n ( , f ), E h(t ),则( *3 )E(h(t)2 2M ( ) n f ( 2 )d , 其中( *4 )10()21M ( )x(h( n 20cos ) /(sin ) sin n 1 d。证:做变换x1推论 2:设 E tkcos , rsin ,则由( *2 )结论得证。1 k( 1 ( n k )k! k 21n 2k 2 j2( k 2 j ),则( *5 ) E(t k )222 jj! (k 2 j )! cn k 2
22、j 11n)j 0(21l )(其中 x 表示 x 的整数部分, 且 c 由 cl 1 l2定义。特别(注意 cn 11)r l 1f (r 2 )dr2 20E(t)(*6 )E(t 2 )var(t )1( 1 (n(n ) 21)2n1(1 n)cn2n2 2 21n2ncn1n221n2cn1n2 ( (1 ( n 1) /( ( 1 n)cn 1 ) 222由( *3 ),( *4 )和 Legendre 倍量公式 (2a)22 a 11 ) ,结论得证。1(a) (a22分布一、定义如果随机变量的密度函数为则称随机变量服从第一自由度为,第二自由度为的 分布,记为。二、性质1、设随机
23、变量 与 相互独立, 且 , ,则随机变量证明: 因为随机变量 与 分别 分布,所以其密度函数分别为。,由商的密度函数公式,故得令,得,其中所以,随机变量。2、设随机变量,则, D。解:令,得令,得同理可得,D3、设随机变量证明: 因为随机变量,则。,所以其密度函数为。则的密度函数为所以,。4、若随机变量,则。证明: 因为随机变量,所以其密度函数为的密度函数为所以,。三、非中心分布设,且 与 相互独立,令,则称 服从自由度为,非中心参数为的非中心分布,记为。随机变量的密度函数为证明:的联合分布为作变换则的联合分布为的边沿分布为将 改为,即为所证。二次型的分布一 Wishart分布设 x1 ,
24、xn 相互独立同标准正态N(0,1)分布,令X(x , x ),则1nY XXnxi2 2 (n)i 1其密度函数为:n1y , y2n /2y n /21 exp0,22而在 x1, xn 相互独立同正态 N (0,2) 分布时, Y 2 2n ,其密度函数为:1yn/2nn n /2122yexp22 , y0,下面将上述结果推广至多元正态分布的情况。二 Wishart 分布的定义假设 Y 1 ,Y 2 ,., Y m 相互独立,0 , Y Y 1 , Y 2 ,., Y mmY a Y a ,则称随机阵 U 服从自由其中:p m , UYY 1度为 m ,非中心参数为 Mu 1 , u2
25、 ,., u mp m=E Y的非中心wishart分布,记为u Wp m,; M ,特别地,当 M0,0,.,0时,则称之为中心wishart分布,记为:u Wp m,,其概率密度为:1nppn p 1f W ,2 2np 1200, 其它N P 11 t1W,W 0W 2 expn22其中 Waijpp 为对称阵,是随机矩阵 U 的观测值矩阵。三 Wishart 分布的特征函数定理:如果 S Wp m,,(0 已蕴含在 W 分布的定义中),则 sTI P2i Tm2 ,其中 Ttijpp 为实变元对称阵。证明: 因为 S Wp m,,所以 S 可表示为 fm,其中Y1,Y 2 ,., Y
26、mYY独立同1分布与 N p 0,0。有随机矩阵特征函数的定义可知s TEeitT S,且T T,因此有:m TmTmmTYtr T StrTStrSTtrYYtrY YtrYTYY从 而111mTYiYmTYs TEe1E eiY LEeiY TY m ,其中 Y NP0, 由对角定理,对1于对称阵 T 及正定阵1 ,必存在奇异阵 B 使得 :B 1BI P ,即 1B1a10B1Y, 反之B1,BB , B TBa , 做 变 换 X0a nY B X,则 :X N p 0, B 1 ( B 1 ) 1由于BB,所以 X NP 0, 。记 XX1,X2, , XP,则有 X1, X PN1
27、 0,1 , 故有 XK2 X12, K1, P .p11iY TYiX B TBXik X k2p2I p 2iE ei 11 2i k2从而 E eE ek 1而 I p 2iB1B12iTB =12iTI P2iTB 2iBTBm因此有 s TI P2iT 2 。反之,若是对称阵 S 的特征函数s TI P2iTm2 ,则 S WP m, 。四 Wishart 分布的性质性质 1:设总体 XNPu, 则样本离差阵 S服从自由度为 n-1的 wishart分布,即 :n_SX iX XiXWPn 1,i 1n_1II,由H2证明: SX iX XiXXHX ,且HIH 和 rk ( H )
28、n1 ,i 1n由定理: X 为 N p0,的 np 阶数据阵, rkAr , A 为 n n 对称阵,且 A2A ,则X AX WPr ,,则 XHX n1,。性质 2:(可加性)设W1 WP n2 P2,且 W1 ,W2相互独立,则1 , W, W n2 Pn 12。W1W Wn ,证:(用特征函数)由 W1WPn1,W2WPn2 ,,可知其特征函数分别为m1m21 TI p2iT2 , 2TI p2iT2 ,又由 W1, W2 相互独立,可推之 W1 W2的特征函mm21数为T1T2 TI p2i T2 ,由定理 1 之逆可知,1 2P1 2成WW Wnn ,立。性质 3:设WWPn,,
29、对 任意 m p 阶常数矩 阵 C, 有 CWC Wmn, C C , 特别 的有,aW WP n, a( a0 ,为常数)。证明 : 由 W WP n,N,其中X1, ,XN,可知WX X相互独立,且1X N p u , , 0,1, ,N,Mu 1 , u N ,故 CWCNC 1, ,CXN 也相互独立,CXCX,而CX N PCu ,C,且 CX1则 CWC Wm n,C C 。同理得:WP,,为常数)。aWn a( a 0关于 p阶 wishart 分布密度函数有以下说明:( 1)、 W 是 p阶对称阵 ,(3)式是 W 的 p( p 1) / 2 个变量,11, 1p , 22 , 2 p ,pp的密度函数,而积分区域是使得 W 0 的这些变量所构成的区域。( 2)、为了使得 p阶 wishart分布有密度函数,除了0 ,为什么还要求 n p ?这是因为 p阶矩阵 W以概率 1 为正定矩阵的充要条件是 np 。证:由于 WXX ,X 是 np 阶矩阵,所以 np 时, p 阶矩阵 W不可能是正定矩阵。 此外,np在 np 时, WX Xxi xixi xi, 所以欲证W 以概率 1 为正定矩阵的充要条件是i1i 1np ,仅需要证明在 np 时, p(W 0)1。在 np 时,由于 W XX ,所以W不是正定矩阵X0 。令
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 策划公司前台工作总结
- 运输物流行业顾问工作总结
- 2024新年寄语汇编(32篇)
- 制冷技术转让协议书(2篇)
- 创业合作投资协议书(2篇)
- 2024年计算机专业实习心得体会
- 易错点08 中国近代史时间问题-备战2023年中考历史考试易错题(解析版)
- 地理中国的世界遗产课件中图版选修
- 2025届陕西省咸阳市武功县中考生物全真模拟试题含解析
- 《公共政策过程》课件
- 2025年中国烟草总公司湖北省公司校园招聘227人高频重点提升(共500题)附带答案详解
- 2024版带货主播电商平台合作服务合同范本3篇
- 2025公司资产划转合同
- 2024-2030年中国铝汽车紧固件行业销售规模与盈利前景预测报告
- 广东省清远市2023-2024学年高一上学期期末质量检测物理试题(解析版)
- 2024-2025学年人教版数学五年级上册期末检测试卷(含答案)
- 《外盘期货常识》课件
- 【MOOC】土力学-西安交通大学 中国大学慕课MOOC答案
- 医院医保科工作总结
- 2024-2025学年译林版八年级英语上学期重点词汇短语句子归纳【考点清单】
- 2024年企业采购部年终总结及今后计划(3篇)
评论
0/150
提交评论