数理统计知识点学习教案_第1页
数理统计知识点学习教案_第2页
数理统计知识点学习教案_第3页
数理统计知识点学习教案_第4页
数理统计知识点学习教案_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数理统计数理统计(sh l tn j)知识点知识点第一页,共53页。1、 表示位置的统计量平均值和中位数 平平均均值值(或均值,数学期望) :niiXnX11 中中位位数数:将数据由小到大排序后位于中间位置的那个数值.2、 表示变异程度的统计量标准差、方差和极差 标标准准差差:2112)(11niiXXns 它是各个数据与均值偏离程度的度量. 方方差差:标准差的平方. 极极差差:样本中最大值与最小值之差.一、统计一、统计(tngj)(tngj)量量第1页/共53页第二页,共53页。 3. 表示分布形状的统计量偏度和峰度偏度偏度:niiXXsg1331)(1 峰度峰度:niiXXsg1442)(

2、1 偏度反映分布的对称性,g1 0 称为右偏态,此时数据位于均值右边的比位于左边的多;g1 0 称为左偏态,情况相反;而 g1接近 0则可认为分布是对称的. 峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2比 3大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一. 4. k 阶原点矩阶原点矩:nikikXnV11 k 阶中心矩阶中心矩:nikikXXnU1)(1第2页/共53页第三页,共53页。二、分布二、分布(fnb)的近似求法的近似求法-频率直方频率直方图法图法1、 整理资料整理资料: 把样本值 x1,x2,xn进行分组,先将

3、它们依大小次序排列,得*2*1nxxx.在包含,*1nxx的区间a,b内插入一些等分点:,21bxxxan注意要使每一个区间,(1iixx(i=1,2,n-1)内都有样本观测值 xi(i=1,2,n-1)落入其中.2、求出各组的频数和频率、求出各组的频数和频率:统计出样本观测值在每个区间,(1iixx中出现的次数in,它就是这区间或这组的频数.计算频率nnfii.3、作作频频率率直直方方图图:在直角坐标系的横轴上,标出21,nxxx各点,分别以,(1iixx为底边,作高为iixf的矩形,1, 2 , 1,1nixxxiii,即得频率直方图.第3页/共53页第四页,共53页。三、几个在统计三、几

4、个在统计(tngj)(tngj)中常用的概率分布中常用的概率分布-4-2024600.050.10.150.20.250.30.350.41、正态分布正态分布),(2smN密度(md)函数:222)(21)(smspxexp分布(fnb)函数:dyexFyx222)(21)(smsp其中m为均值,2s为方差,x.标准正态分布:N(0,1)密度函数2221)(xexpjdyexyx2221)(Fp, 分布函数第4页/共53页第五页,共53页。第5页/共53页第六页,共53页。第6页/共53页第七页,共53页。返回返回(fnhu)F分布(fnb)F(10,50)的密度函数曲线第7页/共53页第八页

5、,共53页。第8页/共53页第九页,共53页。一、点估计的求法一、点估计的求法(一)矩估计(gj)法第9页/共53页第十页,共53页。(二)极大(j d)似然估计法第10页/共53页第十一页,共53页。二、区间二、区间(q jin)估估计的求法计的求法第11页/共53页第十二页,共53页。设样本(X1,X2,Xn)来自正态母体 X,已知方差2sDX,EX 在置信水平 1-下的置信区间为,2121nuXnuXss.1、已知、已知DX,求,求EX的置信区间的置信区间2 未知方差未知方差(fn ch)DX,求,求EX的置信区间的置信区间EX 在置信水平 1-下的置信区间为,2121nstXnstX.

6、(一一)数学数学(shxu)期望的置信区间期望的置信区间(二)方差的区间(二)方差的区间(q jin)估计估计返回返回第12页/共53页第十三页,共53页。2.两个正态总体均值(jn zh)差和方差比的置信区间12222212121222211221212122111122xyznnnsnsxy tnnnnnnmmssss 的1- 置信区间方差, 已知时为方差未知时为如果置信区间包含原点,说明这两个总体均值没有(mi yu)显著差别第13页/共53页第十四页,共53页。212222112221221212211,1,11,1sss Fnns Fnnss两个总体方差比的1- 置信区间如果置信区间

7、包含1,认为两个总体方差没有(mi yu)显著差别第14页/共53页第十五页,共53页。1.参数检验:如果观测的分布函数类型已知,这时构造出的参数检验:如果观测的分布函数类型已知,这时构造出的 统计量依赖于总体的分布函数,这种检验称为参数检验统计量依赖于总体的分布函数,这种检验称为参数检验. 参数检验的目的参数检验的目的(md)往往是对总体的参数及其有关性质作出明往往是对总体的参数及其有关性质作出明 确的判断确的判断. 对总体对总体X的分布律或分布参数作某种假设,的分布律或分布参数作某种假设,根据抽取根据抽取(chu q)的样本观察值,运用数理统的样本观察值,运用数理统计的分析方法,检验这种假

8、设是否正确,从而决计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设定接受假设或拒绝假设.2.非参数检验:如果所检验的假设并非是对某个参数作出明非参数检验:如果所检验的假设并非是对某个参数作出明 确的判断,因而必须要求构造确的判断,因而必须要求构造(guzo)出的检验统计量的分布函数出的检验统计量的分布函数 不依赖于观测值的分布函数类型,这种检验叫非参数检验不依赖于观测值的分布函数类型,这种检验叫非参数检验. 如要求判断总体分布类型的检验就是非参数检验如要求判断总体分布类型的检验就是非参数检验.第15页/共53页第十六页,共53页。假设检验的一般假设检验的一般(ybn)步骤是:步骤

9、是:第16页/共53页第十七页,共53页。(一)单个正态总体(一)单个正态总体(zngt)均值检验均值检验一、参数检验一、参数检验设取出一容量为 n 的样本,得到均值X和标准差 s,现要对总体均值m是否等于某给定值0m进行检验.记00:mmH; 01:mmH称 H0为原原假假设设,H1为备备择择假假设设,两者择其一:接受 H0;拒绝 H0,即接受 H1.第17页/共53页第十八页,共53页。 用 u检检验验,检验的拒绝域为21uzW 即 2121uzuzW或 用样本方差2s代替总体方差2s,这种检验叫 t检检验验.总体方差2s已知统计量 z=nXsm0总体方差2s未知统计量tnsX0mH0H1

10、在显著水平下拒绝 H0,若0mm0mm21 uz) 1(21ntt0mm0mm1uz) 1(1ntt0mm0mm1uz) 1(1ntt1、总总体体方方差差2s已已知知2总总体体方方差差2s未未知知第18页/共53页第十九页,共53页。(二)单个正态总体(二)单个正态总体(zngt)方差检验方差检验设 X1,X2,Xn是来自正态总体),(2smN的样本,欲检验假设:2020:ssH 2021:ssH(或 202ss 或 202ss)这叫2检验检验.均值m已知统计量212202)(1msniiX均值m未知统计量212202)(1XXniisH0H1在显著水平下拒绝 H0,若202ss202ss)(

11、222n或)(2212n) 1(222n或) 1(2212n202ss202ss)(212n) 1(212n202ss202ss)(22n) 1(22n第19页/共53页第二十页,共53页。(三)两个(三)两个(lin )正态总体均值检验正态总体均值检验2、21s与与22s未未知知但但相相等等时时第20页/共53页第二十一页,共53页。例 在平炉上进行一项试验,以确定改变操作方法是否会增加(zngji)钢的得率,试验是在同一只平炉上进行的。每炼一炉钢时,除操作方法外,其他条件都尽可能做到相同。先用标准方法炼一炉,然后用新方法炼一炉,以后交替进行,各炼了10炉,其得率分别为(1)标准方法 78.

12、1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3(2)新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1解:检验假设 012:Hmm1:Hmm12第21页/共53页第二十二页,共53页。2112220.051 2120.0522121122010,76.3,3.325,10,79.43,2.225,0.05(18) 1.7341(2)4.295(18)1.7341(1)(1)nxsnystnn nnX YttnnnsnsHmm12取,带入所以拒绝 ,认为,新操作方法较原来方法为优。第22页/共5

13、3页第二十三页,共53页。(四)两个正态总体方差(四)两个正态总体方差(fn ch)检验检验设样本 X1,X2,Xn1与 Y1,Y2,Yn2分别来自正态总体),(211smN与),(222smN,检验假设: 22210:ssH 22211:ssH(或2221ss或2221ss)21122212110)(1)(1niiniiYnXnFmm, 2221ssF (设2221ss )第23页/共53页第二十四页,共53页。对上例中的数据,检验两种炼钢方法得钢率的波动性是否存在(cnzi)显著差异?22012:Hss221:Hss122112220.0050.005210.0050.00520.0052

14、010,76.3,3.325,10,79.43,2.225,0.01(9,9)(9,9)6.541(9,9)0.1531.49(9,9)6.54(9,9)nxsnysFFSFFFSH取,所以接受,认为两总体方差相等,即两总体具有方差齐性。第24页/共53页第二十五页,共53页。2二、非参数检验二、非参数检验12,(2)kfffk PSHPSH不来自来自:,:102221() (1)kiiiifnpkpn22(1)Wk12,nx xx12,KA AAiAiipp A50n 221kiiifnn p22(1)Wkr pii为p 的极大似然估计,r为估计的参数个数第25页/共53页第二十六页,共53

15、页。(二)概率(二)概率(gil)纸检验法纸检验法 概率纸是一种判断总体分布的简便工具.使用它们(t men),可以很快地判断总体分布的类型.概率纸的种类很多.返回返回(fnhu)第26页/共53页第二十七页,共53页。 *1*1*0,1,nkknxxkFxxxxnxx以下内容课后自己(zj)练习第27页/共53页第二十八页,共53页。统计工具箱中的基本统计工具箱中的基本(jbn)统计命令统计命令1.数据数据(shj)的录入、保存和调用的录入、保存和调用2.基本基本(jbn)统计量统计量3.常见概率分布的函数常见概率分布的函数4.4.频频 数数 直直 方方 图图 的的 描描 绘绘5.参数估计参

16、数估计6.假设检验假设检验7.综合实例综合实例返回返回第28页/共53页第二十九页,共53页。一、数据的录入一、数据的录入(l r)、保存和调用、保存和调用 例例1 上海市区社会商品上海市区社会商品(shngpn)零售总额和全民所有制职工工资总额的数据如下零售总额和全民所有制职工工资总额的数据如下年份78798081828284858687职工工资总额(亿元)23.827.631.632.433.734.943.252.863.873.4商品零售总额(亿元)41.451.861.767.968.777.595.9137.4155.0175.0统计统计(tngj)工具箱中的基本统计工具箱中的基本

17、统计(tngj)命令命令第29页/共53页第三十页,共53页。1、年份数据以1为增量,用产生向量的方法输入(shr)。 命令格式: x=a:h:b t=78:872、分别以x和y代表变量(binling)职工工资总额和商品零售总额。 x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.03、将变量t、x、y的数据(shj)保存在文件data中。 save data t x y 4、进行统计分析时,调用数据文件data中的数据。 load

18、dataTo MATLAB(txy)第30页/共53页第三十一页,共53页。1、输入(shr)矩阵:data=78,79,80,81,82,83,84,85,86,87,88; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.02、将矩阵(j zhn)data的数据保存在文件data1中:save data1 data3 3、进行统计分析时,先用命令:、进行统计分析时,先用命令: load data1 load data1 调用数据文件调用

19、数据文件data1data1中的数据,再用以下命令分别将矩阵中的数据,再用以下命令分别将矩阵datadata的第一的第一(dy)(dy)、二、三行的数据赋给变量、二、三行的数据赋给变量t t、x x、y y: t=data(1,:) t=data(1,:) x=data(2,:) x=data(2,:) y=data(3,:) y=data(3,:)若要调用矩阵若要调用矩阵datadata的第的第j j列的数据,可用命令:列的数据,可用命令: data(:,j) data(:,j)To MATLAB(data)返回返回第31页/共53页第三十二页,共53页。二、基本二、基本(jbn)统计量统计

20、量对随机变量x,计算其基本统计量的命令(mng lng)如下:均值:mean(x)中位数:median(x)标准差:std(x) 方差:var(x)偏度:skewness(x) 峰度:kurtosis(x)例例 对例对例1中的职工工资总额中的职工工资总额(n z zn )x,可计算上述基本统计量。,可计算上述基本统计量。To MATLAB(tjl)返回返回第32页/共53页第三十三页,共53页。三、常见三、常见(chn jin)概率分布的函数概率分布的函数常见的几种分布的命令字符为:正态分布:norm 指数分布:exp帕松分布:poiss 分布:beta威布尔分布:weib 2分布:chi2

21、t 分布:t F 分布:FMatlab工具箱对每一种分布都提供五类函数,其命令字符为:概率密度:pdf 概率分布:cdf逆概率分布:inv 均值(jn zh)与方差:stat随机数生成:rnd (当需要一种分布的某一类函数时,将以上所列的分布命令(mng lng)字符与函数命令(mng lng)字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.)第33页/共53页第三十四页,共53页。例例 2 画出正态分布) 1 , 0(N和)2 , 0(2N的概率密度函数图形.在Matlab中输入以下(yxi)命令:x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0

22、,2);plot(x,y,x,z)1、密度、密度(md)函数:函数:p=normpdf(x,mu,sigma) (当当mu=0,sigma=1时可缺省时可缺省)To MATLAB(liti2)如对均值(jn zh)为mu、标准差为sigma的正态分布,举例如下:第34页/共53页第三十五页,共53页。例例 3 3 计算标准正态分布的概率 P-1X1. 命令为:P=normcdf(1)-normcdf(-1) 结果为:P =0.6827To MATLAB(liti3)3、逆概率分布:、逆概率分布:x=norminv(P,mu,sigma). 即求出即求出x ,使得,使得(sh de)PXx=P.

23、此命令可用来求分位数此命令可用来求分位数.2、概率分布、概率分布:P=normcdf(x,mu,sigma)例例 4 取05. 0,求21u 21u的含义是:) 1 , 0( NX,PX50),按中心极限定理,它近似地 服从正态分布;二.使用Matlab工具箱中具有特定分布总体的估计命令.(1)muhat, muci = expfit(X,alpha)- 在显著性水平alpha下,求指数分布的数据X的均值的点估计(gj)及其区间估计(gj).(2)lambdahat, lambdaci = poissfit(X,alpha)- 在显著性水平alpha下,求泊松分布的数据X 的参数的点估计(gj

24、)及其区间估计(gj).(3)phat, pci = weibfit(X,alpha)- 在显著性水平alpha下,求Weibull分布的数据X 的参数的点估计(gj)及其区间估计(gj).返回返回第39页/共53页第四十页,共53页。六、假设检验六、假设检验 在总体(zngt)服从正态分布的情况下,可用以下命令进行假设检验.1、总体(zngt)方差sigma2已知时,总体(zngt)均值的检验使用 z-检验 h,sig,ci = ztest(x,m,sigma,alpha,tail)检验数据检验数据 x 的关于均值的某一假设的关于均值的某一假设(jish)是否成立,其中是否成立,其中sigm

25、a 为已知方差,为已知方差, alpha 为显著性水平,究竟检验什么假设为显著性水平,究竟检验什么假设(jish)取决于取决于 tail 的取值:的取值:tail = 0,检验假设,检验假设(jish)“x 的均值等于的均值等于 m ”tail = 1,检验假设,检验假设(jish)“x 的均值大于的均值大于 m ”tail =-1,检验假设,检验假设(jish)“x 的均值小于的均值小于 m ”tail的缺省值为的缺省值为 0, alpha的缺省值为的缺省值为 0.05. 返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的

26、 1-alpha 置信区间.第40页/共53页第四十一页,共53页。 例7 Matlab统计工具箱中的数据文件gas.mat.中提供了美国1993年一月份和二月份的汽油平均价格(price1,price2分别(fnbi)是一,二月份的油价,单位为美分),它是容量为20的双样本.假设一月份油价的标准偏差是一加仑四分币(=4),试检验一月份油价的均值是否等于115.解解 作假设:作假设:m = 115.首先取出数据,用以下首先取出数据,用以下(yxi)命令:命令: load gas然后用以下然后用以下(yxi)命令检验命令检验 h,sig,ci = ztest(price1,115,4)返回(fn

27、hu):h = 0,sig = 0.8668,ci = 113.3970 116.9030.检验结果: 1. 布尔变量h=0, 表示不拒绝零假设. 说明提出的假设均值115 是合理的. 2. sig-值为0.8668, 远超过0.5, 不能拒绝零假设 3. 95%的置信区间为113.4, 116.9, 它完全包括115, 且精度很 高. To MATLAB(liti7)第41页/共53页第四十二页,共53页。2、总体方差sigma2未知时,总体均值的检验(jinyn)使用t-检验(jinyn) h,sig,ci = ttest(x,m,alpha,tail)检验数据 x 的关于均值的某一假设是

28、否成立,其中alpha 为显著性水平,究竟(jijng)检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 m ”tail = 1,检验假设“x 的均值大于 m ”tail =-1,检验假设“x 的均值小于 m ”tail的缺省值为 0, alpha的缺省值为 0.05. 返回值 h 为一个(y )布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.第42页/共53页第四十三页,共53页。返回(fnhu):h = 1,sig = 4.9517e-004,ci =116.8 120.2.检

29、验(jinyn)结果: 1. 布尔变量h=1, 表示拒绝零假设. 说明提出的假 设油价均值115是不合理的. 2. 95%的置信区间为116.8 120.2, 它不包括 115, 故不能接受假设. 3. sig-值为4.9517e-004, 远小于0.5, 不能接受零 假设. To MATLAB(liti8)例例8 试检验试检验(jinyn)例例8中二月份油价中二月份油价 Price2的均值是否等于的均值是否等于115.解解 作假设:m = 115,price2为二月份的油价,不知其方差,故用以下命令检验h,sig,ci = ttest( price2 ,115)第43页/共53页第四十四页,

30、共53页。3、两总体均值(jn zh)的假设检验使用 t-检验 h,sig,ci = ttest2(x,y,alpha,tail)检验数据 x ,y 的关于均值的某一假设是否成立,其中(qzhng)alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 y 的均值 ”tail = 1,检验假设“x 的均值大于 y 的均值 ”tail =-1,检验假设“x 的均值小于 y 的均值 ”tail的缺省值为 0, alpha的缺省值为 0.05. 返回值 h 为一个布尔值,h=1 表示可以(ky)拒绝假设,h=0 表示不可以(ky)拒绝假设,si

31、g 为假设成立的概率,ci 为与x与y均值差的的 1-alpha 置信区间.第44页/共53页第四十五页,共53页。返回(fnhu):h = 1,sig = 0.0083,ci =-5.8,-0.9.检验结果:1. 布尔变量h=1, 表示拒绝零假设. 说明提出的 假设“油价均值(jn zh)相同”是不合理的. 2. 95%的置信区间为-5.8,-0.9,说明一月份油 价比二月份油价约低1至6分. 3. sig-值为0.0083, 远小于0.5, 不能接受“油价均 相同”假设. To MATLAB(liti9)例例9 试检验例试检验例8中一月份油价中一月份油价Price1与二月份的油价与二月份的

32、油价Price2均值均值(jn zh)是否相同是否相同.解解 用以下命令检验h,sig,ci = ttest2(price1,price2)第45页/共53页第四十六页,共53页。4、非参数检验:总体(zngt)分布的检验Matlab工具箱提供了两个对总体分布进行检验(jinyn)的命令:(1)h = normplot(x)(2)h = weibplot(x) 此命令显示数据(shj)矩阵x的正态概率图.如果数据(shj)来自于正态分布,则图形显示出直线性形态.而其它概率分布函数显示出曲线形态. 此命令显示数据矩阵x的Weibull概率图.如果数据来自于Weibull分布,则图形将显示出直线性

33、形态.而其它概率分布函数将显示出曲线形态.返回返回第46页/共53页第四十七页,共53页。例10 一道(ydo)工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下: 459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 5

34、13 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851试观察该刀具出现故障时完成的零件数属于哪种分布.第47页/共53页第四十八页,共53页。解解 1、数据、数据(shj)输入输入To MATLAB(liti101)2、作频数(pn sh)直方图 hist(x,10) 3、分布(fnb)的正态性检验 normplot(x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论