北京科技大学概率论与数理统计上机报告3_第1页
北京科技大学概率论与数理统计上机报告3_第2页
北京科技大学概率论与数理统计上机报告3_第3页
北京科技大学概率论与数理统计上机报告3_第4页
北京科技大学概率论与数理统计上机报告3_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率论与数理统计第三次上机报告专信息与计算科学业班级学生姓名指导教师张志冈U完成时间信计1502 (35组)吕瑞杰 陈炎睿 何芝芝2020年1月16日UniversiiyScience cind TechnDbogy BeijingMatlab概率论与数理统计上机练习(3)五、假设检验【例】(离散型分布检验)某工厂近五年发生了 63起事故,按星期几可以分为 9 10 11 8 13 12,问该厂发生的事故数是有与星期几有关?clear allmi=9 10 11 8 13 12; %周一到周六的事故数 n=sum(mi); %总的事故数r=0; %总体中没有未知参数 k=length(mi);

2、 % 天数 pii=1/6; %事故的概率 kai2=0;kai2=sum(mi -n*pii).A2)./(n*pii);% k2 统计量的值alpha1=0.05; %显著性水平 alpha2=0.01; %显著性水平 alpha3=0.001; %显著性水平 la1=chi2i nv(1 -alpha1,k-r-1); % kai2 la2=chi2i nv(1 -alpha2,k-r-1); % kai2 la3=chi2i nv(1 -alpha3,k-r-1); % kai2 pz=1-chi2cdf(kai2,k -r-1);%右侧概率 if kai2la2xzx=*;分布的累计

3、概率,即临界值 分布的累计概率,即临界值 分布的累计概率,即临界值elseif kai2la1xzx=*;elsexzx=-;endx=0:0.1:la3; y=chi2pdf(x,k -r-1); plot(x,y);x1=kai2:0.1:la3; y1=chi2pdf(x1,k -r-1); hold onif kai2=60);se6=le ngth(fi nd(se=60);%及格人数sy7=le ngth(fi nd(sy=80);se7=le ngth(fi nd(se=80);%优秀人数sy8=sy6/sy1;se8=se6/se1;% 及格率sy9=sy7/sy1;se9=s

4、e7/se1;% 优秀率fprintf(t人数t 平均分t 最小值t最大值 t极差tt标准差tt及格人数及格率t优秀人数优秀率n);fprintf(n);fprintf(数学 4dt%10.4ft%4dtt%4dtt%4dtt%10.4ft%4dt%10.4ft%4dt%10.4fn,sy1,sy4,sy2min,sy2max,sy3,sy5,sy6,sy8,sy7,sy9)fprintf(信计 %4dt%10.4ft%4dtt%4dtt%4dtt%10.4ft%4dt%10.4ft%4dt%10.4fn,se1,se4,se2min,se2max,se3,se5,sy6,sy8,se7,se

5、9)fprin tf(n);%方法一fprintf(检验数学和信计的方差是否相等n);h1,p1,varci1,stats1=vartest2(sy,se,alpha,both);if(h仁=0)disp(结果:方差相等);elsedisp(结果:方差不相等);endfprin tf(n);% %方法二% F=sy5A2/se5A2;%统计量F,满足F分布% alpha=0.05;%取显著水平为 0.05% Fla1=finv(alpha/2,sy1 -1,se1-1);Fla2=finv(1 -alpha/2,sy1-1,se1-1);% 求 F 的临界值% if (FFla1 & FFla

6、2)% MM=数学分析1和数学分析2的方差无显著差异;% else% MM=数学分析1和数学分析2的方差有显著差异;% end% fprintf(检验数学分析1和数学分析2的方差是否相等n);% fprintf(统计量F的值ttt显著性水平tt临界值ttttt检验结果n);% fprintf( %.4ftttt%.4fttt%.4fttt%15sn,F,alpha,Fla1,MM);% fprin tf(nn);%方法一fprintf(检验数学和信计的平均分是否相等n);h2,p2,muci2,stats2=ttest2(sy,se,alpha,both);if(h2=0)disp(结果:平均

7、分相等);elsedisp(结果:平均分不相等);endfprin tf(n);%方法二% %方法三% sw=(sy1 -1)*sy5A2+(se1 -1)*se5A2)/(sy1+se1 -2);% T=(sy4-se4)/sw/sqrt(1/sy1+1/se1);% 统计量 T,满 T 分布% Tla1=tinv(alpha/2,sy1+se1 -2);Tla2=tinv(1 -alpha/2,sy1+se1-2);% 求出 T 的临界值% if (abs(T)Ua)disp(优秀率无显著差异);elsedisp(优秀率有显著差异);endP=(sy6+se6)/(sy1+se1);U=(

8、sy8 -se8)/sqrt(sy8+se8)*p*(1 -p);Ua=norminv(1 -alpha/2);if(abs(U)Ua)disp(及格率无显著差异);elsedisp(及格率有显著差异);endh3,p3,kstat3,critval3=lillietest(sy,alpha); if(h3=1)disp(数学不是正态分布)elsedisp(数学是正态分布) endh4,p4,kstat4,critval4=lillietest(se,alpha); if(h4=1)disp(信计不是正态分布)elsedisp(信计是正态分布)end%hist(sy)% 直方图%h5,p5,s

9、tats5=chi2gof(sy)% 可以检验分布%cdf=sy ,no rmcdf(sy,sy4,sy5)%h5,p5,ksstat,cv5=kstest(sy,cdf)% a=0:1:100;% a=a;% CDF=a,cdf(a,sy4,sy5);% h = kstest(sy,CDF,0.05);S=6565688174766869827774667372776062816668766074809069606368676962606060676077676060607172606661866460608973744340619569706266636278746050766265847

10、06983734371707371697460616070747848936461797153606052636061656278606560858589696660;h,p,jbstat,critval=jbtest(S,alpha);if(h=0)disp(服从正态分布);else disp(不服从正态分布);endsavg=mea n( S);svar=var(S);x=20:130;y=no rmpdf(x,savg,sqrt(svar);d=5;a=20:d:130;pdf=hist(S,a)./le ngth(S)./d;plot(x,y,r);hold onscatter(a,p

11、df,filled);hold off输出: Ix3_1_lrj_41521335人数平均分 最小值 最大值极差标准差及格人数及格率优秀人数优秀率数学 5470.666740955510.0885530.981590.16679.2313530.9815信计 6065.516743894650.0833检验数学和信计的方差是否相等结果:方差相等检验数学和信计的平均分是否相等结果:平均分不相等优秀率有显著差异及格率有显著差异数学不是正态分布Warning: P is less than the smallest tabulated value, returning 0.001. In lilli

12、etest (line 206)In Ix3_1_lrj_41521335 (line 99)信计不是正态分布服从正态分布逼 Figure 1一 XFile Edit View jnstrl Tools Desktop Wi ndcw M*lp a jT 謠,s a六、方差分析【例1】(单因素方差分析)考虑温度对某化工产品得率的影响,选择五种不同温度进行试验,每一温度各做三次试验。 方法一:自编程序clear allX=90,92,88;97,93,92;96,96,93;84,83,88;84,86,82;a=5;ni=3,3,3,3,3;%每个因素的样本数n=sum( ni);%样本总数%

13、T=sum(sum(X); %先求每列的和,再求总和%求所有样本的和 T,平方和,及ST,SA,SET=0; ST=0; SA=0; SE=0;for i=1:aTi=0;forj=1: ni (i)T=T+X(i,j);Ti=Ti+X(i,j);ST=ST+X(i,j)A2; endSA=SA+T22/ni(i);%总偏差平方和%效应平方和%误差平方和endST=ST-TA2/n;SA=SA-TA2/n;SE=ST-SA;F=(SA/(a-1)/(SE/( n-a); alpha1=0.05;%显著性水平la1=fi nv(1-alpha1,a-1, n-a); alpha2=0.01;%显

14、著性水平la2=fi nv(1-alpha2,a-1, n-a);%由卩分布的累积概率,求临界值,PFla2%由卩分布的累积概率,求临界值,%计算F比值做为临界点的右侧概率p=1-PXFPFla1xzx=elsexzx=endfprintf( fprintf( fprintf( fprintf(来源tt 平方和tt 自由度tt 均方和ttF效应 Att%.2ftt%4dtt%.2ftt%.2ftt%.4fn误差 tt%.2ftt%4dtt%.2ftttt%4sn总和 tt%.2ftt%4dtt临界值比tt 显著性n);,SA,a-1,SA/(a-1),F,p);,SE ,n-a,SE/( n-

15、a),xzx);=%.2f(%.2f),%.2f(%.2f)n,ST ,n-1,la1,alpha1,la2,alpha2);fprintf( nn);运行结果为:来源平方和自由度均方和F比显著性效应A303.60475.9015.18*误差50.00105.000.000299总和353.6014临界值=3.48(0.05),5.99(0.01)方法二:调用 matlab工具anoval(X),其中矩阵 X表示X的转置,即该函数每一列为一个因素。 运行结果为【例7.2(没有交互作用的多因素方差分析)一火箭使用了四种燃料,三种推进器,作射程试验。X=58.2,56.2,65.3;49.1,54

16、.1,51.6;60.1,70.9,39.2;75.8,58.2,48.7;方法一:自编程序,运行结果为58.200056.200065.300049.100054.100051.600060.100070.900039.200075.800058.200048.7000来源平方和自由度均方和F比显著性效应A157.59352.530.4306X (0.738747)效应B223.852111.920.9174X (0.449118)误差731.986122.00总和1113.4211临界值=4.76(0.05),5.14(0.05)方法二:调用 matlab工具anova2(X)Matlab

17、程序实现:X=60,60,63,63,40,69,65,60,72,67,62,78,82,90,69,60,72,76,78,93,69,68,95,71,83,60; 73,73,60,74,77,71,85,70,89,60,61,77,62,68,60,70,66,84,74,69,61,60,86,73,69,74;50,81,67,65,77,71,76,62,89,65,65,62,62,60,78,81,66,70,80,53,69,66,61,48,156,69;6i8,60,74,60,62,43,61,60,60,64,70,74,65,7379,60,43,76,66,

18、63,60,60,68,60,60,60;ano val(X)a=4;ni=26,26,26,26;%每个因素的样本数n=sum( ni);%样本总数%T=sum(sum(X);%先求每列的和,再求总和%求所有样本的和 T,平方和,及 ST,SA,SET=0; ST=0; SA=0; SE=0;for i=1:a nTi=0;for j=1: ni (i)T=T+X(i,j);Ti=Ti+X(i,j);ST=ST+X(i,j)A2;endSA=SA+TiA2/ni(i);endST=ST-TA2/n; %总偏差平方和SA=SA -TA2/n;%效应平方和SE=ST-SA; %误差平方和F=(S

19、A/(a -1)/(SE/(n-a);% F 比alpha1=0.05; %显著性水平Ia1=finv(1 -alpha1,a-1,n-a); % 由 F 分布的累积概率,求临界值,PFla=1 -alphaalpha2=0.01; %显著性水平la2=finv(1 -alpha2,a-1,n-a); % 由 F 分布的累积概率,求临界值,PFla=1 -alphap=1-fcdf(F,a-1,n-a);%计算F比值做为临界点的右侧概率p=1 -PXla2xzx=*;elseif Fla1xzx=*;elsexzx=-;endfprintf(ttt对四个班的数学分析一nn)fprintf(来源

20、tt平方和ttt自由度ttt均方和tttF比tt显著性n);fprintf(效应 Att%.2ftttt%4dtt%.2ftt%.2ftt%.4fn,SA,a-1,SA/(a-1),F,p);fprintf(误差 tt%.2ftt%4dtt%.2fttttt%4sn,SE,n -a,SE/(n-a),xzx);fprintf(总和 tt%.2ftt%4dtt 临界值=%.2f(%.2f),%.2f(%.2f)n,ST,n -1,la1,alpha1,la2,alpha2); fprin tf(nn);x=6060747275 6481607673767873956373818485958563

21、486674605074404032462554396996988477919365617270606073607673897580677287898794979467858490859493628078646780787810096939297978289888090909290879485939785697679698186856061827460716572718170666778766083806351847885837884928393999784908596696075776772726861637274858595998491879589719493819487968377777

22、585908660637768687985739288758288797385848788909660787880768889749991879092927796929091949671728787858088859998969594977084878381838989918290919196606977896073826172818575928877808475868591627177736680876888828289818960606669665073706071807292906664708671789384100848790959474878185918481698181828878

23、926164606370817360656573616674861009887969088736477818683926960727375787874748685959091717375838280787471787776769350626770687874819094869190916790918588859065524356656276779993909095967145647263836676739388927490628577778787898994939391929565523985688260656140857674686237455364557162856391779188604

24、939685071497892809193789281999888959199668783938285917071828378879080998992969496536675746962786981789191759466778582849579616044616061664834636441666066503672607163696363726660716149327253786060606379607081607167898368828586808060826552364553464852687189696186836045458339756074608083889081608775899

25、390896250307364767143606568627060616869727679776064678670777960867875758383646067714673607069677964778074697666658068657980878380857392898486849679748382748590606062837387734360678380907076779689969196666070726174726377898877928760486856687171606163666560636876827581847760516367397369606782837886866

26、0647379728186678789878788977473698690959564626482799185;X=x:a=7;ni=114,114,114,114,114,114,114;% 每个因素的样本数n=sum( ni); %样本总数%T=sum(sum(X);%先求每列的和,再求总和%求所有样本的和 T,平方和,及 ST,SA,SET=0; ST=0; SA=0; SE=0;for i=1:aTi=0;for j=1: ni (i)T=T+X(i,j);Ti=Ti+X(i,j);ST=ST+X(i,j)A2;endSA=SA+TiA2/ni(i);endST=ST-TA2/n; %

27、总偏差平方和SA=SA -TA2/n;%效应平方和SE=ST-SA; %误差平方和F=(SA/(a -1)/(SE/(n-a);% F 比alpha1=0.05; %显著性水平Ia1=finv(1 -alpha1,a-1,n-a); % 由 F 分布的累积概率,求临界值,PFla=1 -alphaalpha2=0.01; %显著性水平la2=finv(1 -alpha2,a-1,n-a); % 由 F 分布的累积概率,求临界值,PFla=1 -alphap=1-fcdf(F,a-1,n-a);%计算F比值做为临界点的右侧概率p=1 -PXla2xzx=*;elseif Fla1xzx=*;el

28、sexzx=-;endfprintf(ttt 全体数学课程 nn)fprintf(来源tt平方和ttt自由度tt均方和tttF比tt显著性n);fprintf(效应 Att%.2ftt%4dtt%.2ftt%.2ftt%.4fn,SA,a-1,SA/(a-1),F,p);fprintf(误差 tt%.2ftt%4dtt%.2fttttt%4sn,SE,n-a,SE/(n-a),xzx);fprintf(总和 tt%.2ftt%4dtt 临界值=%.2f(%.2f),%.2f(%.2f)n,ST,n -1,la1,alpha1,la2,alpha2); fprin tf(nn);输出:方法一:对

29、四个班的数学分析一来源平方和自由度均方和F比显著性效应A906.263302.093.130.0289误差9636.2710096.36*总和10542.53103临界值=2.70(0.05),3.98(0.01)全体数学课程来源平方和自由度均方和F比显著性效应A15804.9362634.1515.340.0000误差135824.95791171.71*总和151629.87797临界值=2.11(0.05),2.82(0.01)方法* Figure 1: One-way ANOVA XFile drt view nsert Tools 卫专号 ktop Wi ndow Help四ANOV

30、A TableScure tssdf监FFrcbFCaluanj;屈.3-S73. LB. 0289Erzor9E36. 3iaa9fi 3 83Total:32石 Figure 2-口XFile Edit View nsert Tools DesktopWi ndew Help1已il给 Q七、回归分析【例1】(一元线性回归)以三口之家为单位,某食品在某年中平均月消费量(kg)与其价格(元/kg)之间的关系。方法一:自编程序clear allx=2,2,2.4,2.7,3,3,3.5,3.6,3.8,4,4.5,5;y=3,3.6,2.8,2.8,2.3,2.9,1.9,2.1,1.9,1.

31、3,1.5,1;运行结果为回归直线方程为y=4.8256+ -0.7799 x来源平方和自由度均方和F比显著性回归R6.040016.040090.2608*误差0.6692100.06690.000003总和6.709211临界值=4.9646(0.05),10.0443(0.01)【练习3.3回归分析(1) 对全体学生的“基础外语一”和“基础外语二”进行回归分析;(2) 对全体学生的“数学分析一”和“体育一”进行回归分析。“基础外语一”和“基础外语二”回归直线方程为y=(11.8263)+(0.8605)x来源平方和自由度均方和F比显著性回归 R 6613.480016613.480024

32、9.1623误差2972.800711226.5429p=0.000000总和9586.2807113 临界值=3.9258(0.05),6.8667(0.01)Figure 1匚1 迂|反File Edit View Ins ert呂 曲疲 t 町 Tiaiiw Jfelp S A畋匡1H H回归直线方程为 y=(92.6417)+( -0.0551)x来源平方和自由度均方和F比显著性回归 R34.5457134.54570.5277总和7366.7368113临界值=3.9258(0.05),6.8667(0.01)Matlab程序实现:基础外语I和基础外语IIx=7783 78 87 7

33、5 81 83 67 74 83 81 82 74 74 94 65 81 77 80 87 8376 85 87 76 79 83 75 89 87 69 95 80 65 69 84 74 70 87 607089837160556671736369706752737172826964626865697167537270646867866473647877787873787968687268768983668175738772728160698460706076806574867885637258;y=8076 728977878466798980817980937587888984817

34、78692808581758994719070576788797887616988856863566575776872737060796169837366706672727670607381726173868075768481708266757869677078758982656364789475748262628563686271776969828687697756;n=len gth(x);X=ones(n,1) x;alpha=0.05;b,b in t,r,ri nt,stats=regress(y,X,alpha);ahat=b(1);bhat=b(2);hold ontitle($

35、haty=hat11.8263+hat 0.8605x$,i nterpreter,latex,fo ntsize,20) yhat=b(1)+b(2).*x; scatter(x,y,filled); plot(x,yhat,k);for i=1: n;a=x(i) x(i); c=yhat(i) y(i); plot(a,c,r-);end sxx=sum(x.A2)-(sum(x)A2/n;t=bhat*sqrt(sxx)/sqrt(stats(4);p=(1-tcdf(abs(t),n-2)*2;se1= stats(4);sr=sum(yhatmea n(y)42);st=sum(y

36、-mea n( y)42);se=sum(yhat-y).A2);disp(stats(4);for i=1: n;y1(i)=yhat(i)-(-tinv(0.025,n-2)*sqrt(1+1/n+(x(i) -mean(x).A2/sxx)*sqrt(se/(n-2);y2(i)=yhat(i)+( -tinv(0.025,n-2)*sqrt(1+1/n+(x(i) -mean(x).A2/sxx)*sqrt(se/(n-2); end yleft=y1;yright=y2;Y=yleft yright;plot(x,yleft,g,x,yright,g)hold offf=sr/(se

37、/( n-2);lamda1=fi nv(0.95,1, n-2);lamda2=fi nv(0.99,1, n-2);p=1-fcdf(f,2-1,n-2);%计算F比值做为临界点的右侧概率p=1-PXlamda1)a=;endif(flamda2&flamda1)a= endif(flamda2) a=-;end fprintf(来源tt平方和tt自由度tt均方和ttF比tt显著性n)fprintf(回归 tt%.4ft%.ftt%.4ft%.4ftt%sn,sr,1,sr,f,a)fprintf(误差tt%.4ft%.ftt%.4ftp=%.8fn,se,n -2,se/(n-2),p)

38、fprintf(总和 tt%.4ft%.f临界值=%.4f(0.05),%.4f(0.01)n,st,n-1,lamda1,lamda2)输出:来源平方和自由度均方和F比显著性回归6613.480016613.4800 249.1623*误差2972.800711226.5429p=0.00000000总和9586.2807113临界值=3.9258(0.05),6.8667(0.01)凱 Figure 1一 XFile Edit View nstrt Tools Desktop Wi ndcw N*lp、勺=11.8263 + 0.8605110 -100 -50 -4011111115055606570750085 盹 95数学分析I和体育Ix=656568817476686982777466737277606281666876607480906960636867696260606067607767606

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论