matlab数据的统计分析_第1页
matlab数据的统计分析_第2页
matlab数据的统计分析_第3页
matlab数据的统计分析_第4页
matlab数据的统计分析_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、q 现实生活中的许多数据都是随机产生的,如考试现实生活中的许多数据都是随机产生的,如考试分数、月降雨量、灯泡寿命等。分数、月降雨量、灯泡寿命等。q 从数理统计角度来看,这些数据其实都是符合某种从数理统计角度来看,这些数据其实都是符合某种分布的,这种规律就是统计规律。分布的,这种规律就是统计规律。q 本实验主要通过对概率密度函数曲线的直观认识和本实验主要通过对概率密度函数曲线的直观认识和数据分布的形态猜测,以及密度函数的参数估计,进数据分布的形态猜测,以及密度函数的参数估计,进行简单的正态假设检验,揭示日常生活中随机数据的行简单的正态假设检验,揭示日常生活中随机数据的一些统计规律。一些统计规律。

2、问题背景和实验目的问题背景和实验目的Matlab相关命令介绍相关命令介绍q pdf 概率密度函数概率密度函数y=pdf(name,x,A)y=pdf(name,x,A,B) 或或 y=pdf(name,x,A,B,C)l 返回由返回由 name 指定的单参数分布的概率密度,指定的单参数分布的概率密度,x为样本数据为样本数据n name 用来指定分布类型,其取值可以是:用来指定分布类型,其取值可以是: beta、bino、chi2、exp、ev、f 、 gam、gev、gp、geo、hyge、logn、 nbin、ncf、nct、ncx2、norm、 poiss、rayl、t、unif、unid

3、、wbl。l 返回由返回由 name 指定的双参数或三参数分布的概率密度指定的双参数或三参数分布的概率密度Matlab相关命令介绍相关命令介绍例:例:x=-8:0.1:8;y=pdf(norm,x,0,1);y1=pdf(norm,x,1,2);plot(x,y,x,y1,:)n 注:注: y=pdf(norm,x,0,1) y=normpdf(x,0,1)相类似地,相类似地, y=pdf(beta,x,A,B) y=betapdf(x,A,B) y=pdf(bino,x,N,p) y=binopdf(x,N,p) Matlab相关命令介绍相关命令介绍q normfit 正态分布中的参数估计正

4、态分布中的参数估计muhat,sigmahat,muci,sigmaci=normfit(x,alpha)l 对样本数据对样本数据 x 进行参数估计,并计算置信度为进行参数估计,并计算置信度为 1-alpha 的置信区间的置信区间l alpha 可以省略,缺省值为可以省略,缺省值为 0.05,即置信度为,即置信度为 95%q load 从从matlab数据文件中载入数据数据文件中载入数据S=load(数据文件名数据文件名)q hist 绘制给定数据的直方图绘制给定数据的直方图hist(x,m)Matlab相关命令介绍相关命令介绍table=tabulate(x)l 绘制频数表,返回值绘制频数表

5、,返回值 table 中,第一列为中,第一列为x的值,第二列的值,第二列为该值出现的次数,最后一列包含每个值的百分比。为该值出现的次数,最后一列包含每个值的百分比。ttest(x,m,alpha)l 假设检验函数。此函数对样本数据假设检验函数。此函数对样本数据 x 进行显著性水平为进行显著性水平为 alpha 的的 t 假设检验,以检验正态分布样本假设检验,以检验正态分布样本 x(标准差未知)(标准差未知)的均值是否为的均值是否为 m。Matlab相关命令介绍相关命令介绍normplot(x)l 统计绘图函数,进行正态分布检验。研究表明:统计绘图函数,进行正态分布检验。研究表明:如果数据如果数

6、据是来自一个正态分布,则该线为一直线形态;如果它是来自是来自一个正态分布,则该线为一直线形态;如果它是来自其他分布,则为曲线形态。其他分布,则为曲线形态。wblplot(x)l 统计绘图函数,进行统计绘图函数,进行 Weibull 分布检验。分布检验。Matlab相关命令介绍相关命令介绍q 其它函数其它函数l cdf 系列函数:累积分布函数系列函数:累积分布函数l inv 系列函数:逆累积分布函数系列函数:逆累积分布函数l rnd 系列函数:随机数发生函数系列函数:随机数发生函数l stat 系列函数:均值与方差函数系列函数:均值与方差函数例:例:p=normcdf(-2:2,0,1)x=no

7、rminv(0.025 0.975,0,1)n=normrnd(0,1,1 5)n=1:5; m,v=normstat(n*n,n*n)常见的概率分布常见的概率分布二项式分布Binomialbino卡方分布Chisquarechi2指数分布ExponentialexpF分布Ff几何分布Geometricgeo正态分布Normalnorm泊松分布PoissonpoissT分布Tt均匀分布Uniformunif离散均匀分布Discrete Uniformunid连续分布:正态分布连续分布:正态分布q 正态分布正态分布(连续分布)(连续分布)l 如果随机变量如果随机变量 X 的密度函数为:的密度函数

8、为:22X 2e()2(1)f x 0,x 则称则称 X 服从正态分布。记做:服从正态分布。记做:2( ,)XN l 标准正态分布:标准正态分布:N (0, 1)l 正态分布也称高斯分布,是概率论中最重要的一个分布。正态分布也称高斯分布,是概率论中最重要的一个分布。l 如果如果一个变量一个变量是是大量微小、独立的随机因素大量微小、独立的随机因素的的叠加,那么叠加,那么它它一定一定满足满足正态正态分布。分布。如测量误差、产品质量、月降雨量等如测量误差、产品质量、月降雨量等正态分布举例正态分布举例x=-8:0.1:8;y=normpdf(x,0,1);y1=normpdf(x,1,2);plot(

9、x,y,x,y1,:)例:例:标准正态分布和非标准正态分布密度函数图形标准正态分布和非标准正态分布密度函数图形连续分布:均匀分布连续分布:均匀分布q 均匀分布均匀分布(连续分布)(连续分布)l 如果随机变量如果随机变量 X 的密度函数为:的密度函数为:则称则称 X 服从均匀分布。记做:服从均匀分布。记做: , XU a bl 均匀分布在实际中经常使用,譬如一个半径为均匀分布在实际中经常使用,譬如一个半径为 r 的汽车轮的汽车轮胎,因为轮胎上的任一点接触地面的可能性是相同的,所以胎,因为轮胎上的任一点接触地面的可能性是相同的,所以轮胎圆周接触地面的位置轮胎圆周接触地面的位置 X 是服从是服从 0

10、,2 r 上的均匀分布上的均匀分布。 1)0,(, axbf xba 其其他他均匀分布举例均匀分布举例x=-10:0.01:10;r=1;y=unifpdf(x,0,2*pi*r);plot(x,y);连续分布:指数分布连续分布:指数分布q 指数分布指数分布(连续分布)(连续分布)l 如果随机变量如果随机变量 X 的密度函数为:的密度函数为:则称则称 X 服从参数为服从参数为 的指数分布。记做:的指数分布。记做: Exp( )X l 在实际应用问题中,等待某特定事物发生所需要的时间往在实际应用问题中,等待某特定事物发生所需要的时间往往服从指数分布往服从指数分布。如某些元件的寿命;随机服务系统中

11、的服如某些元件的寿命;随机服务系统中的服务时间;动物的寿命等都常务时间;动物的寿命等都常常常假定服从指数分布假定服从指数分布。 ,00,0( )xf xexx 0 l 指数分布具有无记忆性:指数分布具有无记忆性:|P Xst XsP Xt 指数分布举例指数分布举例x=0:0.1:30;y=exppdf(x,4);plot(x,y)例:例: =4 时的指数分布密度函数图时的指数分布密度函数图离散分布:几何分布离散分布:几何分布q 几何分布几何分布是一种常见的是一种常见的离散分布离散分布l 在贝努里实验中,每次试验成功的概率为在贝努里实验中,每次试验成功的概率为 p,设试验进行,设试验进行到第到第

12、 次才出现成功,则次才出现成功,则 的分布满足:的分布满足:其右端项其右端项是几何级数是几何级数 的一般项,于是人们称它为的一般项,于是人们称它为几何分布几何分布。11kkpq 1()1,2,kpqPkk x=0:30; y=geopdf(x,0.5); plot(x,y)例:例: p=0.5 时的几何分布密度函数图时的几何分布密度函数图离散分布:二项式分布离散分布:二项式分布q 二项式分布二项式分布属于离散分布属于离散分布l 如果随机变量如果随机变量 X 的分布列为:的分布列为:则称这种分布为二项式分布。记做:则称这种分布为二项式分布。记做: ( ,)Xb n p (1()0,1,)kn k

13、nppP Xkkkn x=0:50;y=binopdf(x,500,0.05);plot(x,y)例:例: n=500,p=0.05 时的二项式分布密度函数图时的二项式分布密度函数图离散分布:离散分布: Poisson 分布分布q 泊松分布泊松分布也属于离散分布,是也属于离散分布,是1837年由发个数年由发个数学家学家 Poisson 首次提出,其概率分布列为:首次提出,其概率分布列为:记做:记做:( )XP !()0, 1, 2,0kPekkXk l 泊松分布是一种常用的离散分布,它与单位时间(或单泊松分布是一种常用的离散分布,它与单位时间(或单位面积、单位产品等)上的计数过程相联系位面积、

14、单位产品等)上的计数过程相联系。如:单位时如:单位时间内,电话总机接到用户呼唤次数;间内,电话总机接到用户呼唤次数;1 平方米内,玻璃上的平方米内,玻璃上的气泡数等气泡数等。Poisson 分布举例分布举例x=0:50;y=poisspdf(x,25);plot(x,y)例:例: =25 时的泊松分布密度函数图时的泊松分布密度函数图离散分布:均匀分布离散分布:均匀分布q 如果随机变量如果随机变量 X 的分布列为:的分布列为: 2 1()1,P Xkknn则称这种分布为则称这种分布为离散均匀分布离散均匀分布。记做:。记做: 1,2, XUnn=20;x=1:n;y=unidpdf(x,n);pl

15、ot(x,y,o-)例:例: n=20 时的离散均匀分布密度函数图时的离散均匀分布密度函数图抽样分布:抽样分布: 2分布分布q 设随机变量设随机变量 X1, X2, , Xn 相互独立,且同服从正态相互独立,且同服从正态分布分布 N(0,1),则称随机变量,则称随机变量 n2= X12+X22+ +Xn2服从服从自由度为自由度为 n 的的 2 分布,记作分布,记作 ,亦称随,亦称随机变量机变量 n2 为为 2 变量。变量。22( )nn x=0:0.1:20; y=chi2pdf(x,4); plot(x,y)例:例: n=4 和和 n=10 时的时的 2 分布密度函数图分布密度函数图x=0:

16、0.1:20; y=chi2pdf(x,10); plot(x,y)抽样分布:抽样分布: F 分布分布q 设随机变量设随机变量 ,且,且 X 与与 Y 相相互独立,则称随机变量互独立,则称随机变量 22(),( )XmYnx=0.01:0.1:8.01;y=fpdf(x,4,10);plot(x,y)例:例: F(4,10) 的分布密度函数图的分布密度函数图/FX mY n 为服从自由度为服从自由度 (m, n) 的的 F 分布。记做:分布。记做:(, )FF m n抽样分布:抽样分布: t 分布分布q 设随机变量设随机变量 ,且,且 X 与与 Y 相相互独立,则称随机变量互独立,则称随机变量

17、 2(0,1),( )XNYn x=-6:0.01:6;y=tpdf(x,4);plot(x,y)例:例: t (4) 的分布密度函数图的分布密度函数图/TXY n 为服从自由度为服从自由度 n 的的 t 分布。记做:分布。记做: ( )Tt n频数直方图或频数表频数直方图或频数表q 对于给定的数据集,假设它们满足以上十种分布之对于给定的数据集,假设它们满足以上十种分布之一,如何确定属于哪种分布?一,如何确定属于哪种分布?x=load(data1.txt); x=x(:);hist(x)例例 1:某次某次笔试的分数见笔试的分数见 data1.txt,试画出频数直方图,试画出频数直方图绘制绘制频

18、数频数直方图,或列出频数表直方图,或列出频数表n 从图形上看,笔试成绩较为接近正态分布从图形上看,笔试成绩较为接近正态分布频数直方图或频数表频数直方图或频数表x=load(data2.txt); x=x(:);hist(x)例例 2:某次某次上机考试的分数见上机考试的分数见 data2.txt,试画出频数直方图,试画出频数直方图n 从图形上看,上机考试成绩较为接近离散均匀分布从图形上看,上机考试成绩较为接近离散均匀分布x=load(data3.txt); x=x(:);hist(x)例例 3:上海上海1998年来的月降雨量的数据年来的月降雨量的数据见见 data3.txt , 试画出频数直方图

19、试画出频数直方图n 从图形上看,月降雨量较为接近从图形上看,月降雨量较为接近 2 分布分布频数直方图或频数表频数直方图或频数表q 在重复数据较多的情况下,我们也可以利用在重复数据较多的情况下,我们也可以利用Matlab自带的自带的 tabulate 函数生成频数表,并以频数表的形函数生成频数表,并以频数表的形式来发掘数据分布的规律。式来发掘数据分布的规律。x=load(data4.txt); x=x(:);tabulate(x)hist(x)例例 4:给出数据给出数据 data4.txt,试画出其直方图,并生成频数表,试画出其直方图,并生成频数表频数直方图或频数表频数直方图或频数表x=load

20、(data5.txt); x=x(:);hist(x)fiugrehistfit(x) % 加入较接近的正态分布密度曲线加入较接近的正态分布密度曲线例例 5:现累积有现累积有100次刀具故障记录,当故障出现时该批刀具完次刀具故障记录,当故障出现时该批刀具完成的零件数成的零件数见见 data5.txt,试画出其直方图。,试画出其直方图。 n 从图形上看,较为接近正态分布从图形上看,较为接近正态分布参数估计参数估计q 当我们可以基本确定数据集当我们可以基本确定数据集 X 符合某种分布后,我符合某种分布后,我们还需要确定这个分布的参数。们还需要确定这个分布的参数。q 由于正态分布情况发生的比较多,故

21、我们主要考由于正态分布情况发生的比较多,故我们主要考虑正态分布的情形。虑正态分布的情形。q 对于未知参数的估计,可分两种情况:对于未知参数的估计,可分两种情况:l 点估计点估计l 区间估计区间估计参数估计:点估计参数估计:点估计q 构造样本构造样本 X 与某个统计量有关的一个函数,作为与某个统计量有关的一个函数,作为该统计量的一个估计,称为该统计量的一个估计,称为点估计点估计。q Matlab 统计工具箱中,一般采用最大似然估计法统计工具箱中,一般采用最大似然估计法给出参数的点估计。给出参数的点估计。n 泊松分布泊松分布 P ( ) 的的 最大似然估计是最大似然估计是X n 指数分布指数分布

22、Exp ( ) 的的 最大似然估计是最大似然估计是1X 点估计举例点估计举例n 正态分布正态分布 N ( , 2) 中,中, 最大似然估计是最大似然估计是 , 2 的最大似然估计是的最大似然估计是X 2211niiXXn x=load(data1.txt);x=x(:);mu,sigma=normfit(x)例例 6:已知例已知例 1 中的数据服从正态分布中的数据服从正态分布 N ( , 2) ,试求其参,试求其参数数 和和 的值。的值。使用使用 normfit 函数函数参数估计:区间估计参数估计:区间估计q 构造样本构造样本 X 与某个统计量有关的两个函数,作为与某个统计量有关的两个函数,作

23、为该统计量的下限估计与上限估计,下限与上限构成该统计量的下限估计与上限估计,下限与上限构成一个区间,这个区间作为该统计量的估计,称为一个区间,这个区间作为该统计量的估计,称为区区间估计间估计。q Matlab 统计工具箱中,一般也采用最大似然估计统计工具箱中,一般也采用最大似然估计法给出参数的区间估计。法给出参数的区间估计。区间估计举例区间估计举例x=load(data1.txt); x=x(:);mu,sigma,muci,sigmaci=normfit(x)例例 7:已知例已知例 1 中的数据服从正态分布中的数据服从正态分布 N ( , 2) ,试求出,试求出 和和 2 的置信度为的置信度

24、为 95% 的区间估计。的区间估计。x=load(data6.txt); x=x(:);mu,sigma,muci,sigmaci=normfit(x,0.01)例例 8:从自动机床加工的同类零件中抽取从自动机床加工的同类零件中抽取16件,测得长度值件,测得长度值见见 data6.txt,已知零件长度服从正态分布,已知零件长度服从正态分布 N ( , 2) ,试求零,试求零件长度均值件长度均值 和标准差和标准差 的置信度为的置信度为 99% 的置信区间。的置信区间。假设检验假设检验q 对总体的分布律或分布参数作某种假设,根据抽取对总体的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理

25、统计的分析方法,检验这种的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设,这就假设是否正确,从而决定接受假设或拒绝假设,这就是是假设检验假设检验问题。问题。q 以正态假设检验为例,来说明假设检验的基本过程以正态假设检验为例,来说明假设检验的基本过程。正态假设检验正态假设检验q 正态假设检验的一般过程:正态假设检验的一般过程:l 假设检验:利用假设检验:利用 Matlab 统计工具箱给出的常用的假设检验统计工具箱给出的常用的假设检验方法的函数方法的函数 ttest,进行显著性水平为,进行显著性水平为 alpha 的的 t 假设检验,假设检验,以检验正态分布样本以检验正态分布样本 x(标准差未知

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论