数理统计总复习_第1页
数理统计总复习_第2页
数理统计总复习_第3页
数理统计总复习_第4页
数理统计总复习_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计方法与计算总复习授课人:刘玉婷1 复习章节:n1 概率论复习与补充概率论复习与补充n2 数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布n3 参数估计参数估计n4 假设检验假设检验n5 回归分析回归分析n6 方差分析方差分析2 在前面我们曾经定义过事件的条件概率,在前面我们曾经定义过事件的条件概率,同样也可以考虑一个随机变量的条件分布,其条件同样也可以考虑一个随机变量的条件分布,其条件与另一随机变量的取值有关。与另一随机变量的取值有关。离散型离散型的联合分布为的联合分布为是离散型随机向量,它是离散型随机向量,它设设),( , 0).,( iiiijxPyxPp 若已知若已知 的条件

2、概率为的条件概率为下,事件下,事件则在则在jiyx jijijijiijppxPyxPxyP ,条件分布条件分布的条件分布。的条件分布。关于随机变量关于随机变量称它为随机变量称它为随机变量 时时同样,当同样,当, 0 jyP iijijjjijippyPyxPyxP ,的条件分布。的条件分布。关于随机变量关于随机变量称它为随机变量称它为随机变量 连续型连续型.故只能借助于密度函数故只能借助于密度函数 , 0, xPx 对任何对任何在连续型的情况,因为在连续型的情况,因为定义定义的联合分布密度为的联合分布密度为是连续型随机向量,它是连续型随机向量,它设设),( 则称则称且且, 0)(),(1 x

3、pyxp dvxpvxpxpdvvxpxyPxyFyy )(),()(),()(11 的条件分布函数。的条件分布函数。下下为在为在 x ),(xypx的条件分布密度为的条件分布密度为给定的条件下,给定的条件下,记在记在 则由上式得则由上式得).0)()(),()(11 xpxpyxpxyp),(yxpy的条件分布密度为的条件分布密度为条件下,条件下,同理,给定同理,给定 ).0)()(),()(22 ypypyxpyxp例例 ).(),B, a(),(xypN求求服从正态分布服从正态分布设随机向量设随机向量 ).0)()(),()(11 xpxpyxpxyp 21222222)()1(21ex

4、p121axrbyrr 分布分布的条件分布仍然是正态的条件分布仍然是正态的条件下,的条件下,可见,在可见,在 x )1(),(22212raxrbN 也有类似的结论。也有类似的结论。同样同样)(yxp其中第一个参数是其中第一个参数是x x的线性函数,第二个参数与的线性函数,第二个参数与x x无关,此无关,此结论在一些统计问题中很重要。结论在一些统计问题中很重要。),(YX 其它其它, 0,0 ,10,3),(xyxxyxf例例1 1 设设 的联合分布密度为的联合分布密度为 41|81 XYP求求 解解 关于关于 的边缘密度为的边缘密度为 X 其它其它,0, 10,3),()(0 xxdydyy

5、xfxfxX 其其它它,0, 10,32xx 其它其它, 0, 10,133)(),()|(2|xyxxxxfyxfxyfXXY于是于是214)41|(41|8181810| dydyxyfXYPXY 复习章节:n1 概率论复习与补充概率论复习与补充n2 数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布n3 参数估计参数估计n4 假设检验假设检验n5 回归分析回归分析n6 方差分析方差分析10总总 体体个个 体体样本样本常用统计量的分布常用统计量的分布分位点分位点概率密度函数概率密度函数一、主要内容统计量统计量常用统计量常用统计量性质性质 t 分布分布 F 分布分布 分布分布2 关于样

6、本和方差的定理关于样本和方差的定理0.01. , ,),( ),( ),( 2222111211221的概率大约为的概率大约为过过差超差超使得这两个样本均值之使得这两个样本均值之试确定试确定的样本均值的样本均值和和的两样本的两样本为为的容量的容量是来自正态总体是来自正态总体和和设设 nXXXXXXnNXXnn解解,21 nNX ,22 nNX ,2, 0 221 nNXX 则则 21 XXP 2/221nnXXP 例例1 1 2/2121nnXXP 221nn 222n ,01. 0 ,995. 02 n 有有查标准正态分布表知查标准正态分布表知,58. 22 n .14 n于是于是 复习章节

7、:n1 概率论复习与补充概率论复习与补充n2 数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布n3 参数估计参数估计n4 假设检验假设检验n5 回归分析回归分析n6 方差分析方差分析14矩估计量矩估计量估计量的评选估计量的评选一、主要内容一、主要内容最大似然最大似然估计量估计量似然函数似然函数无偏性无偏性正态总正态总体均值体均值方差的方差的置信区置信区间与上间与上下限下限有效性有效性置信区间置信区间和上下限和上下限求置信区间求置信区间的步骤的步骤相合性相合性0-1分布分布参数的区参数的区间估计间估计二、典型例题解解. , )10(,21的无偏估计量的无偏估计量并验证它是达到方差界并验证

8、它是达到方差界的最大似然估计量的最大似然估计量求参数求参数分布的一个样本分布的一个样本的的是来自参数为是来自参数为设设pppXXXn ,1, 0,)1();(1 xpppxfxx);()(1pxfpLnii ,)1(11 niiniixnxpp )(lnpL),1ln(ln11pxnpxniinii 例例1 ppLd)(lnd,111pxnpxniinii , 0d)(lnd ppL由由,)1( 11 niiniixnpxp得得 的最大似然估计值为的最大似然估计值为故参数故参数 p,11 niixnp 的最大似然估计量为的最大似然估计量为参数参数 p,11XXnpnii )()(XEpE ni

9、iXnE11,)(11pXEnnii . 的无偏估计量的无偏估计量是是所以所以pp, 1, 0,)1();( 1 xpppxfxx又因为又因为),1ln()1(ln);(lnpxpxpxf ppxf);(ln,11pxpx 2);(lnppxfE 1 ,012)1(11xxxpppxpxpppp 221)1()1(1,)1(1pp 都满足不等式都满足不等式的任何一个无偏估计量的任何一个无偏估计量的参数的参数因为因为 ),( );( 21nXXXpppxf,)1();(ln)(2nppppxfEnpD 的无偏估计量的无偏估计量对于参数对于参数 p,11 niiXnXp niiXnDpD11)(

10、niiXDn12)(1)1(12ppnn ),1(1ppn . 偏估计量偏估计量的无的无的达到方差界的达到方差界是总体分布参数是总体分布参数故故pXp 解解?)05. 0( ,0025. 0 ,7 .12 ,16,0.01, , ),( 22 问此仪器工作是否稳定问此仪器工作是否稳定算得算得个点个点今抽测今抽测超过超过按仪器规定其方差不得按仪器规定其方差不得现对该区进行磁测现对该区进行磁测从正态分布从正态分布设某异常区磁场强度服设某异常区磁场强度服sxN,05. 0,16 n, 5 .27)15(2025. 0 置信区间为置信区间为的的 1 2 ,26. 6)15(2975. 0 )1()1(

11、,)1()1(22/1222/2nSnnSn ),00599. 0,00136. 0( .,0.012故此仪器工作稳定故此仪器工作稳定不超过不超过由于方差由于方差 例例2例例3解解. 2 (2) . ),;( , 05. 0)d,;(1) , , , . , ), ,( 222122的最大似然估计的最大似然估计求求的概率密度的概率密度是是其中其中估计估计的最大似然的最大似然的点的点求使得求使得的样本的样本是来自是来自未知未知设总体设总体 XPXxfaxxfXXXXNXan , 的最大似然估计分别为的最大似然估计分别为已知已知 ,x .)(121xxnnii axxf)d,;()1(2 ),;(

12、),;(22 aFF ,1 a ) (的分布函数的分布函数为为 XF,05. 01 a要使要使95. 0 a),645. 1( ,645. 1 a.645. 1 a由最大似然估计的不变性由最大似然估计的不变性,的最大似然估计是的最大似然估计是a. 645. 1 a2 (2) XP,21 由最大似然估计的不变性由最大似然估计的不变性, 2 的最大似然估计为的最大似然估计为知知 XP.212 XP例例题题 设设X X服服从从泊泊松松分分布布 ( , )0,1,2!x-xf xexx 2200ln ( , )( )( )( 1)( )xxp xxIp xp x ln ( , )lnln !1p xx

13、xx 2202(1) ( )xxxp x 1 克克来来美美下下界界 1InIn 是是 的的最最优优无无偏偏估估计计量量X 2 2例例题题 试试问问 分分别别是是 , ,2*2( ,),XNX S 的的优优效效估估计计吗吗? ?对对于于 + +- -2ln( )()( )f xf x dx + +- -22()221ln2()( )xef x dx + +- -222()2()( )xf x dx 24()( )xf x dx 24 所所以以 2RIn 设灯泡寿命服从正态分布设灯泡寿命服从正态分布. . 求灯泡寿命均值求灯泡寿命均值 的置信水平为的置信水平为0.950.95的单侧置信下限的单侧置

14、信下限. .例例4 4 从一批灯泡中随机抽取从一批灯泡中随机抽取5 5只作寿命试验,测只作寿命试验,测得寿命得寿命X X(单位:小时)如下:(单位:小时)如下:10501050,11001100,11201120,12501250,12801280 ) 1(ntnSX 由于方差由于方差 未知,未知,2 解:解: 的点估计取为样本均值的点估计取为样本均值 X选取统计量为选取统计量为 对给定的置信水平对给定的置信水平 ,确定分位数,确定分位数) 1( nt 1 1)1(ntnSXP使使即即 1) 1(nSntXP于是得到于是得到 的置信水平为的置信水平为 的单侧置信区的单侧置信区间为间为 1,)

15、1(nSntX 将样本值代入得将样本值代入得 的置信水平为的置信水平为0.950.95的单侧置信下限是的单侧置信下限是10651065小时小时 的置信水平为的置信水平为 的单侧置信下限为的单侧置信下限为 1即即nSntX) 1( 例例5 5 为估计制造某种产品所需要的单件平均为估计制造某种产品所需要的单件平均工时(单位:小时),现制造工时(单位:小时),现制造5 5件,记录每件件,记录每件所需工时如下所需工时如下 10.5 11.0 11.2 12.5 12.8假设制造单位产品所需工时假设制造单位产品所需工时),(2 NX试求平均工时的置信水平为试求平均工时的置信水平为0.950.95的单侧置

16、信上限的单侧置信上限. .),(2 NX2 )1(/ ntnSXt 解解 由于由于, ,其中其中未知未知, ,因此因此t )1(1 nt 1)1(/1ntnSXP)1()1(1 ntnt 1)1(/ntnSXP对于给定的对于给定的, ,由由分布的上分布的上分位点的定义分位点的定义, ,存在存在, ,使得使得而而, , 所以所以, , 1)1(ntnSXP )1(,ntnSX )1( ntnSX 即即 故故的单侧置信区间为的单侧置信区间为单侧置信上限为单侧置信上限为5 n6 .11 x995. 02 s95. 01 05. 0 1318. 2)4()1(05. 0 tnt 55.121318.

17、25995. 06 .11) 1( ntnSX , , 经计算得经计算得, , 由由, , 得得从而可得单侧置信上限从而可得单侧置信上限因此因此, , 加工这种产品的平均工时不超过加工这种产品的平均工时不超过12.5512.55小时小时的可靠程度是的可靠程度是95%.95%. 复习章节:n1 概率论复习与补充概率论复习与补充n2 数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布n3 参数估计参数估计n4 假设检验假设检验n5 回归分析回归分析n6 方差分析方差分析34原假设与备原假设与备择假设择假设常见的假设检验常见的假设检验单边检验拒单边检验拒绝域绝域单边、双边检验单边、双边检验一、

18、主要内容检验统计量检验统计量拒绝域与临拒绝域与临界点界点两类错误两类错误正态总体均值的检验正态总体均值的检验正态总体均值差的检验正态总体均值差的检验正态总体方差(比)正态总体方差(比)的检验的检验置信区间置信区间分布拟合检验分布拟合检验二、典型例题解解 设某次考试的考生成绩服从正态分布设某次考试的考生成绩服从正态分布, 从中从中随机地抽取随机地抽取36位考生的成绩位考生的成绩, 算得平均成绩为算得平均成绩为66.5分分, 标准差为标准差为15分分, 问在显著性水平问在显著性水平0.05下下, 是否可以认为这次考试全体考生的平均成绩为是否可以认为这次考试全体考生的平均成绩为70分分? 并给出检验

19、过程并给出检验过程. , X为为设该次考试的学生成绩设该次考试的学生成绩),( 2 NX则则, , SX 样本标准差为样本标准差为样本均值为样本均值为需检验假设需检验假设:.70:,70:10 HH,05. 0 例例1, 2未知未知因为因为 , 检验法检验法故采用故采用t, 0为真时为真时当当H),1(/70/0 ntnSXnSXt 统计量统计量拒绝域为拒绝域为),1(/702/ ntnSXt ,0301. 2)35(,15, 5 .66,36 025. 0 tSXn由由4 . 136/15705 .66/70 nSXt得得,0301. 2 .70 , 0分分绩是绩是认为全体考生的平均成认为全

20、体考生的平均成所以接受所以接受 H解解 某砖厂制成两批机制红砖某砖厂制成两批机制红砖, 抽样检查测量砖抽样检查测量砖的抗折强度的抗折强度(千克千克), 得到结果如下得到结果如下:; 8 . 3, 5 .30, 8 :; 4 . 6, 3 .27,10 :2211 SynSxn第二批第二批第一批第一批已知砖的抗折强度服从正态分布已知砖的抗折强度服从正态分布, 试检验试检验:(1)两批红砖的抗折强度的方差是否有显著差异两批红砖的抗折强度的方差是否有显著差异? (2)两批红砖的抗折强度的数学期望是否有显著差两批红砖的抗折强度的数学期望是否有显著差异异?)05. 0( 均取均取(1) 检验假设检验假设

21、:.:,:2221122210 HH例例2, 检验法检验法用用F, 0为真时为真时当当H),1, 1( 212221 nnFSSF统计量统计量拒绝域为拒绝域为)1, 1(212/ nnFF ),1, 1( 212/1 nnFF 或或,44.14,96.40, 8,10 222121 SSnn由由,82. 4)7 , 9(025. 0 F,283. 0)9 , 7(1)7 , 9(025. 0975. 0 FF,837. 244.1496.40 F得得,82. 4837. 2283. 0 显然显然. , 0有显著差异有显著差异认为抗折强度的方差没认为抗折强度的方差没所以接受所以接受 H(2) 检

22、验假设检验假设:,:,:211210 HH, 检验法检验法用用t, 0为真时为真时当当H),2(11 2121 nntnnSYXtw统计量统计量.2)1()1( 212222112 nnSnSnSw其中其中拒绝域为拒绝域为).2(212/ nntt ,1199. 2)16()2810( 025. 0025. 0 tt由由,418. 5,3575.291644.14796.4092 wwSS245. 1474. 0418. 55 .303 .2711 21 nnSYXtw得得,1199. 2 . , 0显著差异显著差异认为抗折强度的期望无认为抗折强度的期望无所以接受所以接受 H例例3 随机地选了

23、随机地选了8个人个人, 分别测量了他们在早分别测量了他们在早晨起床时和晚上就寝时的身高晨起床时和晚上就寝时的身高(cm),得到以下数得到以下数据据:21212310175166161159179177167172)(177165163160181180168172)(87654321 iiiiiyxdyx晚上晚上早上早上序号序号 ?) 05. 0 ( . , , ),( )8 , 2 , 1( 22 取取身高比晚上的身高要高身高比晚上的身高要高问是否可以认为早晨的问是否可以认为早晨的均为未知均为未知是样本是样本自正态总体自正态总体是来是来设个对数据的差设个对数据的差DDDDiiiNiYXD解解

24、 本题属于逐对比较法本题属于逐对比较法, , 05. 0下下即在水平即在水平 . 0:, 0: 10 DDHH 检验假设检验假设 , )1(/0 ntnsdtD 拒绝域为拒绝域为 , 8 n由由,8946. 1)7(05. 0 t,25. 18181 iidd,2817. 1 Ds758. 28/2817. 125. 1 t可知可知,8946. 1 . , 0的高的高认为早晨身高要比晚上认为早晨身高要比晚上所以拒绝所以拒绝 H例例4解解(续例续例3) . ,3的置信区间的置信区间还可求还可求的成对数据的成对数据对于例对于例D , ),( )8 , 2 , 1( 2DDiiiNiYXD 来自正态

25、总体来自正态总体因为各对数据的差因为各对数据的差 .)1(2/ ntnSDD 0.95 的置信区间为的置信区间为的置信水平为的置信水平为D ,25. 18181 iidd,2817. 1 Ds , 8 n由由,3646. 2)7()7(025. 02/ tt )1( 2/ntnSDD 则则 )1(2/ntnsdD )07. 125. 1( ),32. 2,18. 0( 所得置信区间的下限大于零所得置信区间的下限大于零, 在实际中就认为在实际中就认为早晨的身高平均来说高于晚上的身高早晨的身高平均来说高于晚上的身高.例例5 5 某种产品在通常情况下次品率为某种产品在通常情况下次品率为5%. 5%.

26、 现在从现在从生产出的一批产品中随机地抽取生产出的一批产品中随机地抽取5050件进行检验件进行检验, , 发现有发现有4 4件次品件次品. . 问能否认为这批产品的次品率为问能否认为这批产品的次品率为5%? (5%? (=0.05)0.05)解解 设这批产品的次品率为设这批产品的次品率为 p p. . 在这批产品中任在这批产品中任 任意取一件产品,定义随机变量任意取一件产品,定义随机变量 X X 如下如下 .0, 1该产品为合格品该产品为合格品,该产品为次品该产品为次品X), 1(pbX 检验假设检验假设 ,05. 0:0 pH05. 0:1 pH该假设检验问题的拒绝域为该假设检验问题的拒绝域

27、为 2/ )05. 01(05. 005. 0 unxu 现在现在 ,50 n,08. 0504 x96. 1025. 02/ uu 统计量统计量U U 的值为的值为 0306. 050/05. 0105. 005. 008. 0 u96. 1 =接受假设接受假设 0H=可以认为这批产品的次品率为可以认为这批产品的次品率为5% 5% 复习章节:n1 概率论复习与补充概率论复习与补充n2 数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布n3 参数估计参数估计n4 假设检验假设检验n5 回归分析回归分析n6 方差分析方差分析48一、主要内容回归分析回归分析一元线性回归分析一元线性回归分析多

28、元线性回归分析多元线性回归分析非线性回归分析非线性回归分析回归模型参数估计回归模型参数估计显著性检验显著性检验参数区间估计参数区间估计例得到以下的数据得到以下的数据试验试验作作只只每组每组取多组老鼠取多组老鼠与老鼠死亡之间的关系与老鼠死亡之间的关系单位容量计单位容量计以以剂量剂量为考察某种毒药的为考察某种毒药的,)25(,)/mg(2120161486311816141210864yx死亡的老鼠数死亡的老鼠数剂量剂量. ,)1(xbayxY 的线性回归方程的线性回归方程对对并求并求画出散点图画出散点图., 7 )2(死亡的老鼠数死亡的老鼠数时时估计当剂量为估计当剂量为. )3(2的无偏估计的无

29、偏估计的方差的方差求求 二、典型例题.05. 0,0:,0:)4(10 取取检验假设检验假设bHbH. 99. 0 ,)5(的置信区间的置信区间的置信水平为的置信水平为求求若回归效果显著若回归效果显著b. 99. 0 )( 9 )6(区间区间的置信的置信的置信水平为的置信水平为处处求求xx . 95. 0 9 )7(预测区间预测区间的的的置信水平为的置信水平为处观察值处观察值求求Yx 解.)1( 散点图如下散点图如下:数据计算数据计算124014031136898837844132421183204002562016224256196161416819614414128064100810483

30、66468189363641161422 xyyxyx,168888111362 xxl,2618988811240 xyl,875.412898114032 yyl,571553. 1/ xxxyllb,281964. 5571553. 188818981 a.554. 1964. 5 xy 因此线性回归方程为因此线性回归方程为.914. 4)2(7 xy.1801232. 121)3(22 xxyylbln ,4469. 2)6(141.18)4(025. 02 tlbtxx ., 0认为回归效果显著认为回归效果显著拒绝拒绝 H,7074. 3)6()2(,99. 01 )5(005. 0

31、2 tnt 99. 0 的置信区间为的置信区间为的置信水平为的置信水平为b).318. 0554. 1()1687027110. 17074. 3571553. 1( ,022. 89554. 1964. 5)6(90 xYY).588. 1022. 8( 168/)119(817074. 3022. 8 99. 0 )(2 的置信区间为的置信区间为的置信水平为的置信水平为x).411. 4022. 8( 168/)119(8117074. 3022. 8 99. 0 9)7(2 测区间为测区间为的预的预的置信水平为的置信水平为处观察值处观察值Yx 复习章节:n1 概率论复习与补充概率论复习与补充n2 数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布n3 参数估计参数估计n4 假设检验假设检验n5 回归分析回归分析n6 方差分析方差分析57一、主要内容方差分析方差分析单因素试验单因素试验双因素试验双因素试验重复重复试验试验无重复无重复试验试验例:,.,其成绩如下其成绩如下记录记录取了一些学生取了一些学生现从各个班级随机地抽现从各个班级随机地抽考试考试他们进行了一次数学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论