版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教材目前一页\总数六十六页\编于十四点主要内容常见分布的参数估计正态总体参数的检验分布的拟合与检验核密度估计目前二页\总数六十六页\编于十四点第一节常见分布的参数估计目前三页\总数六十六页\编于十四点一、分布参数估计的MATLAB函数目前四页\总数六十六页\编于十四点%定义样本观测值向量>>x=[15.1414.8115.1115.2615.0815.1715.1214.9515.0514.87];%调用normfit函数求正态总体参数的最大似然估计和置信区间%返回总体均值的最大似然估计muhat和90%置信区间muci,%还返回总体标准差的最大似然估计sigmahat和90%置信区间sigmaci>>[muhat,sigmahat,muci,sigmaci]=normfit(x,0.1)目前五页\总数六十六页\编于十四点>>x=normrnd(10,4,100,1);>>[phat,pci]=mle(x)>>[phat,pci]=mle(x,'distribution','normal')>>[phat,pci]=mle(x,'pdf',@normpdf,'start',[0,1])>>[phat,pci]=mle(x,'cdf',@normcdf,'start',[0,1])【例5.1-2】调用normrnd函数生成100个服从均值为10,标准差为4的正态分布的随机数,然后调用mle函数求均值和标准差的最大似然估计。目前六页\总数六十六页\编于十四点phat=mle(data)[phat,pci]=mle(data)[...]=mle(data,'distribution',dist)[...]=mle(data,...,name1,val1,name2,val2,...)[...]=mle(data,'pdf',pdf,'cdf',cdf,'start',start,...)[...]=mle(data,'logpdf',logpdf,'logsf',logsf,'start',start,...)[...]=mle(data,'nloglf',nloglf,'start',start,...)补充:mle函数的调用格式:目前七页\总数六十六页\编于十四点第二节正态总体参数的检验目前八页\总数六十六页\编于十四点一、总体标准差已知时的单个正态总体均值的U检验调用格式:h=ztest(x,m,sigma)h=ztest(...,alpha)h=ztest(...,alpha,tail)h=ztest(...,alpha,tail,dim)[h,p]=ztest(...)[h,p,ci]=ztest(...)[h,p,ci,zval]=ztest(...)ztest函数目前九页\总数六十六页\编于十四点>>x=[9710210511299103102941009510598102100103];%调用ztest函数作总体均值的双侧检验,%返回变量h,检验的p值,均值的置信区间muci,检验统计量的观测值zval>>[h,p,muci,zval]=ztest(x,100,2,0.05)%调用ztest函数作总体均值的单侧检验>>[h,p,muci,zval]=ztest(x,100,2,0.05,'right')目前十页\总数六十六页\编于十四点二、总体标准差未知时的单个正态总体均值的t检验调用格式:h=ttest(x)h=ttest(x,m)h=ttest(x,y)h=ttest(...,alpha)h=ttest(...,alpha,tail)h=ttest(...,alpha,tail,dim)[h,p]=ttest(...)[h,p,ci]=ttest(...)[h,p,ci,stats]=ttest(...)ttest函数目前十一页\总数六十六页\编于十四点%定义样本观测值向量>>x=[49.450.550.751.749.847.949.251.448.9];%调用ttest函数作总体均值的双侧检验,%返回变量h,检验的p值,均值的置信区间muci,结构体变量stats>>[h,p,muci,stats]=ttest(x,50,0.05)目前十二页\总数六十六页\编于十四点三、总体标准差未知时的两个正态总体均值的比较t检验调用格式:h=ttest2(x,y)h=ttest2(x,y,alpha)h=ttest2(x,y,alpha,tail)h=ttest2(x,y,alpha,tail,vartype)h=ttest2(x,y,alpha,tail,vartype,dim)[h,p]=ttest2(...)[h,p,ci]=ttest2(...)[h,p,ci,stats]=ttest2(...)ttest2函数目前十三页\总数六十六页\编于十四点目前十四页\总数六十六页\编于十四点%定义甲机床对应的样本观测值向量>>x=[20.1,20.0,19.3,20.6,20.2,19.9,20.0,19.9,19.1,19.9];%定义乙机床对应的样本观测值向量>>y=[18.6,19.1,20.0,20.0,20.0,19.7,19.9,19.6,20.2];>>alpha=0.05;%显著性水平为0.05>>tail='both';%尾部类型为双侧>>vartype='equal';%方差类型为等方差%调用ttest2函数作两个正态总体均值的比较检验,%返回变量h,检验的p值,均值差的置信区间muci,结构体变量stats>>[h,p,muci,stats]=ttest2(x,y,alpha,tail,vartype)目前十五页\总数六十六页\编于十四点四、总体均值未知时的单个正态总体方差的卡方检验调用格式:H=vartest(X,V)H=vartest(X,V,alpha)H=vartest(X,V,alpha,tail)[H,P]=vartest(...)[H,P,CI]=vartest(...)[H,P,CI,STATS]=vartest(...)[...]=vartest(X,V,alpha,tail,dim)vartest函数目前十六页\总数六十六页\编于十四点%定义样本观测值向量>>x=[49.450.550.751.749.847.949.251.448.9];>>var0=1.5;%原假设中的常数>>alpha=0.05;%显著性水平为0.05>>tail='both';%尾部类型为双侧%调用vartest函数作单个正态总体方差的双侧检验,%返回变量h,检验的p值,方差的置信区间varci,结构体变量stats>>[h,p,varci,stats]=vartest(x,var0,alpha,tail)目前十七页\总数六十六页\编于十四点五、总体均值未知时的两个正态总体方差的比较F检验调用格式:H=vartest2(X,Y)H=vartest2(X,Y,alpha)H=vartest2(X,Y,alpha,tail)[H,P]=vartest2(...)[H,P,CI]=vartest2(...)[H,P,CI,STATS]=vartest2(...)[...]=vartest2(X,Y,alpha,tail,dim)vartest2函数目前十八页\总数六十六页\编于十四点%定义甲机床对应的样本观测值向量>>x=[20.1,20.0,19.3,20.6,20.2,19.9,20.0,19.9,19.1,19.9];%定义乙机床对应的样本观测值向量>>y=[18.6,19.1,20.0,20.0,20.0,19.7,19.9,19.6,20.2];>>alpha=0.05;%显著性水平为0.05>>tail='both';%尾部类型为双侧%调用vartest2函数作两个正态总体方差的比较检验,%返回变量h,检验的p值,方差之比的置信区间varci,结构体变量stats>>[h,p,varci,stats]=vartest2(x,y,alpha,tail)目前十九页\总数六十六页\编于十四点第三节分布的拟合与检验目前二十页\总数六十六页\编于十四点一、案例描述现有某两个班的某门课程的考试成绩,如下表试根据以上数据,推断总成绩数据所服从的分布。目前二十一页\总数六十六页\编于十四点二、描述性统计量1.均值:2.方差:3.标准差:目前二十二页\总数六十六页\编于十四点4.最大值和最小值:5.极差:6.p分位数:目前二十三页\总数六十六页\编于十四点7.k阶原点矩:8.k阶中心矩:9.偏度:10.峰度:目前二十四页\总数六十六页\编于十四点三、统计图1.样本的频数分布与频率分布将样本观测值从小到大排列得:,列出样本频率分布表如下目前二十五页\总数六十六页\编于十四点(1)称函数为样本分布函数(或经验分布函数)。它满足分布函数所具有的性质。2.样本经验分布函数图目前二十六页\总数六十六页\编于十四点(2)格里汶科定理设总体X的分布函数为F(x),样本此定理表明:当样本容量n相当大时,经验分布函数是总体分布函数的一个良好的近似。的经验分布函数为Fn(x),则有目前二十七页\总数六十六页\编于十四点(1)找出样本观测值的最小值x(1)和最大值x(l);(2)取a≤x(1)和b≥x(l),将区间[a,b]分成k个子区间;(3)计算样本观测值落入各子区间内的频数ni和频率;(4)在x轴上以各子区间为底边,以ni(或)为高作小矩形即得频数(或频率)直方图。3.频数与频率直方图目前二十八页\总数六十六页\编于十四点4.箱线图设为总体X的一个样本,样本观测值则可得出如下箱线图。为:Matlab命令boxplot(x)目前二十九页\总数六十六页\编于十四点5.正态概率图正态概率图用于正态分布的检验,实际上就是纵坐标经过变换后的正态分布的分布函数图,正常情况下,正态分布的分布函数曲线是一条S形曲线,而在正态概率图上描绘的则是一条直线。如果采用手工绘制正态概率图的话,可以在正态概率纸上描绘,正态概率纸上有根据正态分布构造的坐标系,其横坐标是均匀的,纵坐标是不均匀的,以保证正态分布的分布函数图形是一条直线。目前三十页\总数六十六页\编于十四点目前三十一页\总数六十六页\编于十四点四、卡方拟合优度检验1.简单假设检验问题目前三十二页\总数六十六页\编于十四点目前三十三页\总数六十六页\编于十四点目前三十四页\总数六十六页\编于十四点2.复合假设检验问题目前三十五页\总数六十六页\编于十四点检验统计量拒绝域目前三十六页\总数六十六页\编于十四点3.chi2gof函数调用格式:h=chi2gof(x)[h,p]=chi2gof(...)[h,p,stats]=chi2gof(...)[...]=chi2gof(X,'Name',value)目前三十七页\总数六十六页\编于十四点五、Kolmogorov-Smirnov检验1.Kolmogorov检验检验统计量拒绝域目前三十八页\总数六十六页\编于十四点2.Lilliefors检验检验统计量拒绝域目前三十九页\总数六十六页\编于十四点3.Smirnov检验检验统计量拒绝域目前四十页\总数六十六页\编于十四点4.kstest函数调用格式:h=kstest(x)h=kstest(x,CDF)h=kstest(x,CDF,alpha)h=kstest(x,CDF,alpha,type)[h,p,ksstat,cv]=kstest(...)目前四十一页\总数六十六页\编于十四点5.kstest2函数调用格式:h=kstest2(x1,x2)h=kstest2(x1,x2,alpha,type)[h,p]=kstest2(...)[h,p,ks2stat]=kstest2(...)目前四十二页\总数六十六页\编于十四点6.lillietest函数调用格式:h=lillietest(x)h=lillietest(x,alpha)h=lillietest(x,alpha,distr)[h,p]=lillietest(...)[h,p,kstat]=lillietest(...)[h,p,kstat,critval]=lillietest(...)[h,p,...]=lillietest(x,alpha,distr,mctol)目前四十三页\总数六十六页\编于十四点%读取文件examp02_14.xls的第1个工作表中的G2:G52中的数据,即总成绩数据score=xlsread('examp02_14.xls','Sheet1','G2:G52');%去掉总成绩中的0,即缺考成绩score=score(score>0);%**********计算描述性统计量*******************score_mean=mean(score)%计算平均成绩s1=std(score)%计算(5.1)式的标准差s1=std(score,0)%也是计算(5.1)式的标准差s2=std(score,1)%计算(5.2)式的标准差score_max=max(score)%计算样本最大值score_min=min(score)%计算样本最小值score_range=range(score)%计算样本极差score_median=median(score)%计算样本中位数score_mode=mode(score)%计算样本众数score_cvar=std(score)/mean(score)%计算变异系数score_skewness=skewness(score)%计算样本偏度score_kurtosis=kurtosis(score)%计算样本峰度目前四十四页\总数六十六页\编于十四点%*******************绘制箱线图************************figure;%新建图形窗口boxlabel={'考试成绩箱线图'};%箱线图的标签%绘制带有刻槽的水平箱线图boxplot(score,boxlabel,'notch','on','orientation','horizontal')xlabel('考试成绩');%为X轴加标签%*****************绘制频率直方图*********************%调用ecdf函数计算xc处的经验分布函数值f[f,xc]=ecdf(score);figure;%新建图形窗口%绘制频率直方图ecdfhist(f,xc,7);xlabel('考试成绩');%为X轴加标签ylabel('f(x)');%为Y轴加标签目前四十五页\总数六十六页\编于十四点%**************绘制理论正态分布密度函数图*******************%产生一个新的横坐标向量xx=40:0.5:100;%计算均值为mean(score),标准差为std(score)的正态分布在向量x处的密度函数值y=normpdf(x,mean(score),std(score));holdon%绘制正态分布的密度函数曲线,并设置线条为黑色实线,线宽为2plot(x,y,'k','LineWidth',2)%添加标注框,并设置标注框的位置在图形窗口的左上角legend('频率直方图','正态分布密度曲线','Location','NorthWest');%*****************绘制经验分布函数图************************figure;%新建图形窗口%绘制经验分布函数图,并返回图形句柄h和结构体变量stats,%stats有5个字段,分别对应最小值、最大值、平均值、中位数和标准差[h,stats]=cdfplot(score)set(h,'color','k','LineWidth',2);%设置线条颜色为黑色,线宽为2目前四十六页\总数六十六页\编于十四点%****************绘制理论正态分布函数图**********************x=40:0.5:100;%产生一个新的横坐标向量x%计算均值为stats.mean,标准差为stats.std的正态分布在向量x处的分布函数值y=normcdf(x,stats.mean,stats.std);holdon%绘制正态分布的分布函数曲线,并设置线条为品红色虚线,线宽为2plot(x,y,':k','LineWidth',2);%添加标注框,并设置标注框的位置在图形窗口的左上角legend('经验分布函数','理论正态分布','Location','NorthWest');%*******************绘制正态概率图**************************figure;%新建图形窗口normplot(score);%绘制正态概率图目前四十七页\总数六十六页\编于十四点%------------------------分布的检验----------------------%*********调用chi2gof函数进行卡方拟合优度检验***********[h,p,stats]=chi2gof(score)%指定分布为默认的正态分布,分布参数由x进行估计[h,p,stats]=chi2gof(score,'nbins',6);%求平均成绩ms和标准差ssms=mean(score);ss=std(score);%参数'cdf'的值是由函数句柄与函数中所含参数的参数值构成的元胞数组[h,p,stats]=chi2gof(score,'nbins',6,'cdf',{@normcdf,ms,ss});%指定初始分组数为6,最小理论频数为3,检验总成绩数据是否服从正态分布h=chi2gof(score,'nbins',6,'cdf',{@normcdf,ms,ss},'emin',3)目前四十八页\总数六十六页\编于十四点%***********调用kstest函数进行正态性检验*************%生成cdf矩阵,用来指定分布:均值为79,标准差为10.1489的正态分布cdf=[score,normcdf(score,79,10.1489)];%调用kstest函数,检验总成绩是否服从由cdf指定的分布[h,p,ksstat,cv]=kstest(score,cdf)%********调用kstest2函数检验两个班的总成绩是否服从相同的分布*********%读取文件examp02_14.xls的第1个工作表中的B2:B52中的数据,即班级数据banji=xlsread('examp02_14.xls','Sheet1','B2:B52');%读取文件examp02_14.xls的第1个工作表中的G2:G52中的数据,即总成绩数据score=xlsread('examp02_14.xls','Sheet1','G2:G52');%去除缺考数据score=score(score>0);banji=banji(score>0);%分别提取60101和60102班的总成绩score1=score(banji==60101);score2=score(banji==60102);%调用kstest2函数检验两个班的总成绩是否服从相同的分布[h,p,ks2stat]=kstest2(score1,score2)目前四十九页\总数六十六页\编于十四点%*********分别绘制两个班的总成绩的经验分布图***************figure;%新建图形窗口F1=cdfplot(score1);%绘制60101班总成绩的经验分布函数图set(F1,'LineWidth',2,'Color','r')%设置线宽为2,颜色为红色holdonF2=cdfplot(score2);%绘制60102班总成绩的经验分布函数图%设置线型为点划线,线宽为2,颜色为黑色set(F2,'LineStyle','-.','LineWidth',2,'Color','k')%为图形加标注框,标注框的位置在坐标系的左上角legend('60101班总成绩的经验分布函数','60102班总成绩的经验分布函数',...'Location','NorthWest')%**********调用lillietest函数进行分布的检验*************%调用lillietest函数进行Lilliefors检验,检验总成绩数据是否服从正态分布[h,p,kstat,critval]=lillietest(score)%调用lillietest函数进行Lilliefors检验,检验总成绩数据是否服从指数分布[h,p]=lillietest(score,0.05,'exp')目前五十页\总数六十六页\编于十四点第四节核密度估计目前五十一页\总数六十六页\编于十四点一、经验密度函数1.经验密度函数目前五十二页\总数六十六页\编于十四点目前五十三页\总数六十六页\编于十四点二、核密度估计1.Parzen窗密度估计法目前五十四页\总数六十六页\编于十四点目前五十五页\总数六十六页\编于十四点2.核密度估计的一般定义目前五十六页\总数六十六页\编于十四点3.常用核函数目前五十七页\总数六十六页\编于十四点4.窗宽对核密度估计的影响目前五十八页\总数六十六页\编于十四点5.如何选择最佳窗宽MISE(meanintegratedsquarederror)是关于窗宽h的函数,求它的最小值点,可以得出最佳窗宽的估计值。目前五十九页\总数六十六页\编于十四点调用格式:[f,xi]=ksdensity(x)f=ksdensity(x,xi)ksdensity(…)ksdensity(ax,…)[f,xi,u]=ksdensity(…)[…]=ksdensity(…,param1,val1,param2,val2,…)参数与参数值列表见下一页。三、ksdensity函数目前六十页\总数六十六页\编于十四点ksdensity函数支持的参数名与参数值列表目前六十一页\总数六十六页\编于十四点四、核密度估计的案例分析1.总成绩数据的核密度估计>>score=xlsread('examp02_14.xls','Sheet1','G2:G52');>>score=score(score>0);%调用ecdf函数计算xc处的经验分布函数值f_ecdf>>[f_ecdf,xc]=ecdf(score);%新建图形窗口,然后绘制频率直方图,直方图对应7个小区间>>figure;>>ecdfhist(f_ecdf,xc,7);>>holdon;>>xlabel('考试成绩');ylabel('f(x)');%为X,Y轴加标签%调用ksdensity函数进行核密度估计>>[f_ks1,xi1,u1]=ksdensity(score);%绘制核密度估计图,并设置线条为黑色实线,线宽为3>>plot(xi1,f_ks1,'k','linewidth',3)目前六十二页\总数六十六页\编于十四点目前六十三页\总数六十六页\编
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论