实验三:-数据的简单统计分析和推断_第1页
实验三:-数据的简单统计分析和推断_第2页
实验三:-数据的简单统计分析和推断_第3页
实验三:-数据的简单统计分析和推断_第4页
实验三:-数据的简单统计分析和推断_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验三 数据的简单统计分析与推断 对采集数据利用数理统计的知识,辅以 matlab 进行估计、分析和推断,即进行推测性的判断。1. 掌握参数估计和假设检验的基本理论模型与分类;2. 了解方差分析和线性回归模型的 matlab 解决方案;3. 根据问题的要求建立模型;4. 针对已经建立的模型,确定参数,通过 Matlab 求解; 1. 参数估计:利用样本统计量对总体(服从正态分布)参数进行估计:点估计、区间估计;2. 3. 方差分析:背景:事件的发生往往与多个因素有关,但各个因素对事件发生的影响可能是不一样的,而且同一因素的不同水平对事件发生的影响也是不同的。通过方差分析,可以研究不同因素以及因

2、素的不同水平对事件发生的影响程度。根据自变量个数的不同,方差分析可以分为单因子方差分析和多因子方差分析。数学原理:一个实验有多个影响因素,如果只有一个在发生变化,则称为单因子分析。假设某一实验有s 个不同条件,则在每个条件(或称1/X, X X,s 12s , 个总体的平均数表示为,各总体的方差表示为12s s。现在,在这 个总体服从正态分布且方差相等的22212s情况下检查各总体的平均数是否相等,若相等则认为因素对实验结果之间没有显著影响。双因子方差分析,因素水平的改变所造成的实验结果的改变,称为主效应。当某一因素的效应随另一因素的水平不同而不同,则称这两个因素之间存在交互作用。由于交互作用

3、引起的实验结果的改变称为交互效应。4. 线性回归:背景:实际生活中,某个现象的发生或某种结果的出现往往与其他的某个或某些因素有关,但这种关系又是不确定的,只是从数据上可以看出有关的趋势。回归分析就是用来研究具有这种特征的变量之间的相关关系的。线性回归假设因变量与自变量之间为线性关5. 参数估计、假设检验、方差分析和回归分析的 matlab 实现;6. 用 matlab 进行基本统计分析:1 基本统计量:均值:mean(x):平均值或数学期望;中位数:median(x):将数据由小到大排序后中间位置的数据;标准差:std(x):各个数据与均值偏离程度的度量;方差:var(x):标准差的平方;2/

4、偏度:skewness(x):反映分布的对称性,大于零:此时数据位于均值右边的比位于左边的多;等于零,对称分布;小于零,偏向均值的左侧。峰度:kurtosis(x):用于衡量偏离正态分布尺度的统计量之一。正态分布的峰度为3,若2 比3 大得多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可以用作衡量偏离正态分布的尺度之一。参数估计:1、正态总体的参数估计得:muhat,sigmahat,muci,sigmaci=normfit(DATA,alpha)参数说明:DATA为样本、alpha为显著性水平(缺省时默认为 0.05)muhat:均值 的点估计;sigmahat:标准差

5、的点估计muci:针对于均值的置信水平为 1-alpha的区间估计;sigmaci:针对于标准差的置信水平为 1-alpha的区间估计;2、其他分布的参数估计n50面的估计公式计算;二是使用 matlab 工具箱中具有特定总体分布的估计3/命令,常见命令:( )=:E 计( )= p = = =假设检验:在总体服从正态分布的情况下,可以用以下命令进行检验。1) 、总体方差已知,总体均值的检验(z-检验)h,sig,ci =ztest(x,m,sigma,alpha,tail)检验数据 x的关于均值的某一假设是否成立,其中sigma为已知4/方差,alpha为显著性水平tail =0 x m;t

6、ail =1 x m;tail =-1h=0:接受假设;h=1:拒绝假设( h:bullsig:假设成立的概率;x m;ci:均值的 1-alpha置信区间;2) 、总体方差未知,总体均值的假设检验(t-检验)h,p,ci= ttest(x,m,alpha,tail)检验数据 x 的关于均值的某一假设是否成立,其它参数说明同上述 z-检验的参数说明相一致。3) 、两总体均值的假设检验(t-检验)h,p,ci= ttest2(x,y,alpha,tail)检验数据 x,y 的关于均值的某一假设是否成立,其它参数说明同上述 z-检验的参数说明相一致。41h=normplot(x)图形显示出直线性形

7、态,而其他概率分布函数显示出曲线形态。方差分析:1 anoval函数进行单因子方差分析:p=anova1(X)比较样本n的矩阵 Xm5/ X 大的差异对应较大的 F 值和较小的 p 值。一般当 p 值小于 0.05 时认为结果是显著的。方差分析一般用的显著性水平是:取,拒绝 ,称因素 Aa =01H0 A ,a =01H0但取,拒绝 ,称因素 A 的影响显著;取a=05,不拒Ha =050绝 ,称因素 A 无显著影响。H02 anova2 函数进行双因子方差分析:P=anova2(X,reps)进行平衡双因子方差分析,以比较样本 X 中两一个因子 A B reps代表每一个单元格中观测值的个数

8、,当 reps=1 返回两个 p 值,当reps1 时返回 3 个 p值。线性回归:1 regress 进行线性回归b,bint,r,rint=regress(y,X,alpha)2 rcoplot 会残差图Reoplot(r,rint)6/1、综合示例:一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障 .故障是完全随机的,并假定生产任一零件时出现故障机会均相同 .工作人员是通过检查零件来确定工序是否出现故障的.现积累有 100 次故障纪录,故障出现时该刀具完成的零件数如下: 试观察该刀具出现故障时完成的零件数属于哪种分布.%x1=459 362 624 542 509 584

9、433 748 815 505;x2=612 452 434 982 640 742 565 706 593 680;x3=926 653 164 487 734 608 428 1153 593 844;x4=527 552 513 781 474 388 824 538 862 659;x5=775 859 755 49697 515 628 954771 609;x6=402 960 885 610 292 837 473 677 358 638;x7=699 634 555 570 84416 606 1062 484 120;7/x8=447 654 564 339 280 246

10、687 539 790 581;x9=621 724 531 512 577 496 468 499 544 645;x10=764 558 378 765 666 763 217 715 310 851;x=x1 x2 x3 x4 x5 x6 x7 x8 x9 x10;%绘制频率直方图figure(1)hist(x,10)%分布的正态性检验figure(2)normplot(x)%参数估计muhat,sugmuhat,muci,sigmuci=normfit(x,0.05)%假设检验h,sig,ci=ttest(x,594)运行结果:muhat =594sugmuhat =204.1301m

11、uci =553.4962634.5038sigmuci =179.2276237.1329h =0sig =1ci =553.4962 634.50388/9/2、一位教师想要检查 3 种不同教学方法的效果,为此随机的选取了水平相等的 15位学生。把他们分为3组,每组5人,每一组用一种教学方法,一段时间以后,这位教师给这 15位学生进行统考,统考成绩如下表。要求检验这 3种教学方法的效果有没有显著差异。甲乙丙758173628579716860589275739081score=75 81 73;62 85 79;71 68 60;58 92 75;73 90 81;p=anova1(sco

12、re)p =0.0401/3、设火箭的射程在其他条件基本相同时与燃料种类和推进器型号有关。现在考虑四中不同的燃料及 3 种不同的推进器,对于每种搭配各发射了火箭两次,测得数据如表,要求检验各自变量和自变量的交互效应是否对火箭的射程有显著影响。推进器 1推进器 2推进器 3/582526491428601583758715562412541505709732582510653608516484392407487414disp2=58.2 52.6 49.1 42.8 60.1 58.3 75.8 71.5;56.2 41.2 54.1 50.5 70.9 73.2 58.2 51;65.3 60

13、.8 51.6 48.4 39.2 40.7 48.7 41.4;p=anova2(disp2,2)p =0.00350.02600.0001/4、y10 x )NIX = ones(10,1) (1:10);y = X * 10;1 + normrnd(0,0.1,10,1);b,bint,r,rint = regress(y,X,0.05)rcoplot(r,rint)b =10.03370.9943bint =/9.8369 10.23040.96261.0260r =0.0014-0.15600.05470.1513-0.07450.08610.1314-0.1477-0.12680.

14、0801rint =-0.24760.25050.07370.3302-0.3856-0.2207/-0.1042-0.3588-0.1957-0.1325-0.3958-0.3697-0.15900.40690.20970.36790.39520.10030.11610.3192 1、从一批火箭推力装置中抽取 10 个进行试验,测得燃烧时间如下:50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5设燃烧时间服从正态分布,求燃烧时间的均值和方差,其中置信水平为90%。2、某种元件,要求其使用寿命不得低于 1000 小时,现在随机的从这批元件中抽取 25 件测得其寿命分别为:/906.7 783.4 962.5 978.8 835.4 1068.9 946.2 982.7 967.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论