版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2015 年数学建模B 作业(全部,共23 题)作业要求1.作业解答写在实验报告纸上,无需抄题,但要写题号。2.实验报告纸上要写程序,程序中可不抄数据。3.将程序运行的重要结果有选择 的展示在实验报告纸上,并做结果分析。4.从第三周开始,每周要交1 次作业。每次作业的题目根据进度由老师安排。如老师未作说明,那就是:课讲到哪里作业就做到哪里。5.如何收作业,听任课老师安排。6.不收作业的打印版、电子版。第一部分多元统计2015-1回归分析某种水泥在凝固时放出的热量y(k/g) 与水泥中的3CaOAl 2O3 的成分( %),3CaOSiO 2的成分 x2(% ),4CaOAl 2O3Fe2O3
2、的成分 x3( %),2CaOSiO 2 的成分 x4( %)的观测值如下表,试以 y 为因变量,以 x1 ,x2, x3, x4 为自变量建立多元回归方程并作显著性检验。样本点x1x2x3x4y172666078.52129155274.331156820104.34113184787.6575263395.961155922109.27371176102.78131224472.59254182293.1102147426115.911140233483.8121166912113.3131068812109.4解:考虑到变量间可能存在多重共线性,采用逐步回归,程序如下:dataex;in
3、putx1-x4 y ;cards ;72666078.5129155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182293.12147426115.9140233483.81166912113.31068812109.4;procreg ;modely=x1-x4/selection=stepwise;run;程序运行最终结果如下:线性回归方程为: y 52.58 1.47 x1 0.66 x2 ,由于几处 pr>F的值均小于0.0001 ,故回归方程的线性性及各参数的显著性检验
4、均通过,且拟合优度达到R2=0.9787。2015-2 聚类分析DNA 是由 A ,T ,C,G 这 4 种碱基按一定顺序排成的序列,长短不一,其中碱基含量的百分比不同通常能揭示该序列的一些规律,试根据下表所给出的20 条 DNA 序列的碱基含量百分比对其20 条 DNA 序列进行分类。(注,计算式下面的数据需要转置)1234567891111111111201234567890A3334233322332334332230076991309683209242T117311221155557525665722411755575119522C112121112353190921119842641
5、83017369G4452444444111171118746007401851643050解:依题意,首先将原始数据进行处理,转化成百分比,程序如下:dataex;inputa t c g;cards;0.29730.13510.17120.39640.27030.15320.16220.41440.27030.06310.21620.45050.42340.28830.10810.18020.23420.10810.23420.42340.35140.12610.12610.39640.35140.18920.09910.36040.27930.18920.16220.36940.2072
6、0.15320.20720.43240.18180.13640.27270.40910.35450.50000.04550.10000.32730.50000.02730.14550.25450.51820.10000.12730.30000.50000.08180.11820.29090.645500.06360.36360.46360.08180.09090.35450.26360.24550.13640.29090.50000.11820.09090.21820.56360.14550.07270.20000.56360.17270.0636;procclustermethod =sin
7、gle;/* 最短距离法 */proctree; run;聚类图如下, 根据动态聚类图可以看出,此处 20 个 DNA 序列分成三类较为合适,具体情况如下:第一类: 4,17 ;第二类: 1,2, 3,5,6,7,8,9,10 ;第三类: 11 ,12 ,13 ,14 ,15 , 16 ,18 ,19 ,202015-3 判别分析观测 3 名健康人和4 名心肌梗塞病人心电图的3 项指标 x1,x2,x3 所得观测值如下表,试判别心电图 3 项指标为( 400.72, 49.46,2.25)的人属于两类中的哪一类,并指出哪个指标在判别分析中占有最重要的地位。类病人编号x1x2x31436.704
8、9.592.32健康人2290.6730.022.463352.5336.262.361510.4767.641.73心肌梗塞病人2510.4162.711.583470.3054.4.1.684364.1246.262.09解:根据判别分析编写程序如下:dataex;inputleibie x1 x2 x3;cards;1436.7049.592.321290.6730.022.461352.5336.262.362510.4767.641.732510.4162.711.582470.3054.4.1.682364.1246.262.09;dataex1;inputx1 x2 x3;car
9、ds;400.72 49.46 2.25;procdiscrimdata=extestdata=ex1anovamanovasimplelisttestout=ex2;classleibie;procprintdata =ex2;run;根据运行结果知,所建立的判别规则误判率为0:最终判别结果为该人属于第一类:2015-4 主成分分析某市为全面分析机械类各企业的经济效益,选择了8 个不同的利润指标,14 个企业关于这 8 个指标的统计数据如下表,试进行主成分分析并将14 个企业的经济效益进行排序。企净产值固定资产总产值销售收入产品成本物耗利人均利流动资金业利润率利润率利润率利润率利润率润率润率
10、利润率140.424.77.26.18.38.72.44220.0225.012.711.211.012.920.23.5429.1313.23.33.94.34.45.50.5783.6422.36.75.63.76.07.40.1767.3534.311.87.17.18.08.91.72627.5635.612.516.416.722.829.33.01726.6722.07.89.910.212.617.60.84710.6848.413.410.99.910.913.91.77217.8940.619.119.819.029.739.62.44935.81024.88.09.88.9
11、11.916.20.78913.71112.59.74.24.24.66.50.8743.9121.80.60.70.70.81.10.0561.01332.313.99.48.39.813.32.12617.11438.59.111.39.512.216.41.32711.6解:编写主成分分析的程序如下:dataex;inputx1-x8;cards;40.424.77.26.18.38.72.44220.025.012.711.211.012.920.23.5429.113.23.33.94.34.45.50.5783.622.36.75.63.76.07.40.1767.334.311.
12、87.17.18.08.91.72627.535.612.516.416.722.829.33.01726.622.07.89.910.212.617.60.84710.648.413.410.99.910.913.91.77217.840.619.119.819.029.739.62.44935.824.88.09.88.911.916.20.78913.712.59.74.24.24.66.50.8743.91.80.60.70.70.81.10.0561.032.313.99.48.39.813.32.12617.138.59.111.39.512.216.41.32711.6;proc
13、princompout =prin;varx1-x8;procprintdata =prin;varPrin1-prin8;run ;根据运行结果,以累积贡献率超过90%为标准,可选择三个主成分:根据特征向量可以写出主成分表达式:如第一主成分可写为如下,其它类似:prin10.32x10.30x20.39x30.38x40.38x50.37x60.32x70.36x8由变量前的系数大小可见, 第一主成分主要是反映总产值利润率、 销售收入利润率和产品成本利润率的,是用来衡量企业经营状况的一个综合指标,其它可类似分析。另外,还可进行主成分得分分析,主成分得分的结果如下:可见,在第一主成分上得分最高
14、的是企业9 ,在第二主成分上得分最高的是企业1 ,在第三主成分上得分最高的是企业2 。2015-5 因子分析有 10 例患者的 4 项肝功能指标的观测数据如下表, 试作这 4 项指标的因子分析并对病人进行病情分析。患者转氨酶量肝大指数硫酸锌浊度胎甲球1402.05202101.553031203.0135042504.518051203.59506101.512507401.0194082704.0136091703.0960101302.03050解:编写因子分析程序如下:dataex;inputa b c d;cards ;402.0520101.55301203.013502504.51
15、801203.5950101.51250401.019402704.013601703.09601302.03050;proccorrout=ex1;procfactordata=ex1outstat=ex2method =prinpriors=onerotate=orthomaxscore;procscoredata=ex score=ex2 out=ex3;procprint; run ;根据程序结果,按累积贡献率超过90%,选择三个公因子:为了便于解释,旋转过后的因子模式为:由此可写出:a0.96F10.22F20.1F3 ,其它类似。标准化因子得分系数如下:由此有 F10.50 a0.
16、54b0.07c0.02d ,其它类似。根据上式有因子得分结果如下:在三个公因子上得分最高的患者依次是:4,10,8。2015-6 典型相关分析棉花红铃虫第一代发蛾高峰日 y1(元月 1 日到发蛾高峰日的天数) 、第一代累计百株卵量 y2、发蛾高峰日百株卵量 y3 及 2 月下旬到 3 月中旬的平均气温 x1 、1 月下旬到 3 月上旬的日照小时累计数的常用对数 x2 的 10 组观测数据如下表, 试作气象指标与虫情指标间的典型相关分析。样本点x1x2y1y2y319.22.0118646.314.329.12.216930.714.038.62.3171144.669.3410.22.217
17、169.222.755.62.118116.07.366.12.21742.71.378.22.117226.37.988.81.9186247.185.299.72.117653.625.31010.32.216162.729.3解:编写程序如下:dataex;inputx1-x2 y1-y3;cards ;9.22.0118646.314.39.12.216930.714.08.62.3171144.669.310.22.217169.222.75.62.118116.07.36.12.21742.71.38.22.117226.37.98.81.9186247.185.29.72.117
18、653.625.310.32.216162.729.3;proccancorr;varx1-x2;withy1-y3;run ;根据运行结果,按累计贡献率达到90%及显著性的要求,选定典型变量:典型变量的表达式子可以根据以下结果写出:V1 0.12x1 8.51x2 , W10.08 y1 0.03y2 0.07 y3可见 V1 主要反映的是 x2,W1 主要反映的是 y3, 由于 V1 和 W1是关系最强的一对典型变量,也意味着 x2 对 y3 有着最重要的影响。从下面还可以看出各单个变量与典型变量间的关系强弱:第二部分非参数统计2015-7方法比较某制造商想要比较两种不同的生产方法所花费的
19、生产时间是否有差异。随机地选取了11个工人, 每一个工人都分别使用两种不同的生产方法来完成一项相同的任务,在样本中的每一个工人都做了观察。数据见表,试用Wilcoxon 秩和检验这两种方法有无差异?工人编号1234567891011方法 110.29.69.210.69.910.210.610.011.210.710.6方法 29.59.88.810.110.39.310.510.010.610.29.8解:提出原假设,这两组方法没有显著性差异,用配对实验的符号检验法,相应代码如下:dataex;inputx1 x2;y=x1-x2;cards;10.29.59.69.89.28.810.61
20、0.19.910.310.29.310.610.5101011.210.610.710.210.69.8;procunivariate;vary;run ;运行结果如下:从结果中可以看出, sign 统计量为 3,其显著性为 0.1094,大于 0.05,故接受原假设,认为这两组方法没有显著性差异。2015-8培训方案选择为培训大学生志愿者为社区服务,设计了 4 种培训方案,记作为 A,B,C,D. 将报名的 30 名大学生随机地分为 4 组,分别接受不同培训。训练一周后, 按规定的要求考试, 评定的成绩如下,试用非参数检验方法检验这四种培训方案的有效性是否存在显著差异?培训方案A60,75,
21、62,76,73,98,86培训方案B72,52,68,82,74,64,87培训方案C61,85,78,66,70,59,69,79培训方案 D63,58,65,71,84,77,80,89解:提出原假设,这四种培训方案方法没有显著性差异,相应代码如下:dataex;do a= 1to4 ; inputn;do i=1ton;inputx;output; end ; end ;cards;76075627673988677252688274648786358657184778089;procnpar1waywilcoxon; classa;varx;run ;运行结果如下:从结果中可以看出,
22、 Chi-Square 统计量为 0.5537,其显著性为 0.9069,大于 0.05,故接受原假设,认为四种培训方案方法没有显著性差异。2015-9 双胞胎智力的相关分析某研究所对10 对双胞胎儿童的智力进行调查,试计算其 Pearson、Spearman 和 Kendall相关系数并对其进行相关性检验。双胞胎编号先出生儿童 X后出生儿童 Y19.07.8216.619.3316.220.1411.37.1516.213.067.14.877.88.984.07.4911.210.0101.31.5解:求其 Pearson , Spearman 和Kendall相关系数,代码如下:DATA
23、 new;INPUT x y;CARDS;9.07.816.619.316.220.111.37.116.213.07.14.87.88.94.07.411.210.01.31.5;PROC CORR pearsonspearmankendall;VAR x y;RUN;结果如下:Pearson Correlation Coefficients, N = 10Prob > |r| under H0: Rho=0xyx1.000000.880810.0008y0.880811.000000.0008Spearman Correlation Coefficients, N = 10Prob
24、> |r| under H0: Rho=0xyx1.000000.820670.0036y0.820671.000000.0036Kendall Tau b Correlation Coefficients, N = 10Prob > |r| under H0: Rho=0xyx1.000000.674200.0071y0.674201.000000.0071可见, x 与 y 的 Pearson相关系数为0.88081 ,概率为 0.0008 ,达到极显著水平; Spearman相关系数为0.82067 ,概率为 0.0036,达到极显著水平;Kendall相关系数0.67420
25、 ,概率为 0.0071达到极显著水平;故,x 与 y 显著相关。第三部分预测预报2015-10 灰色预测陕西省农业总产值数据如下:年份1985198619871888198919901991199219931994总产值62.958.861.487.2104.9124.8110.7129.0155.3219.03请建立灰色系统GM ( 1,1)模型,并预测 1995-1997 三年的农业总产值。解:有原始时间1985-1994 序列 x( 0)( k ) ,对 x ( 0 )( k ) 生成 1-AGO 序列 x( 1)( k ) 另外可得 Yn见表:( 0)( 1)nx( k ) 、1-A
26、GO序列 x( k ) 、 Yk12345678910x ( 0 )( k )62.958.861.487.2104.9124.8110.7129155.3219.03x ( 1)( k )62.9121.7183.1270.3375.2500610.7739.78951114.03Yn58.861.487.2104.9124.8110.7129155.3219.03利用 MATLAB编程得:function X,c,error1,error2=example9_11()%利用 MATLAB编程预测2003 年中国蔬菜产量,%并对预测结果做残差检验和后验差检验,程序如下:X0=62.958.8
27、61.487.2104.9124.8110.7129.0155.3219.03;k=3;X,c,error1,error2=GM11(X0,k)plot(1985:1994,X0,'g*-')hold onplot(1985:1997,X)%function X,c,error1,error2=GM11(X0,k)% 建立函数 X,c,error1,error2=example9_3_2_3(X0,k)% 其中 X0 为输入序列, k 为预测长度,% X为预测输出序列, c 为后验差检验数, error1 为残差, error2 为相对误差format long;n=lengt
28、h(X0);X1=;X1(1)=X0(1);for i=2:nX1(i)=X1(i-1)+X0(i); % 计算累加生成序列 endfor i=1:n-1B(i,1)=-0.5*(X1(i)+X1(i+1); %计算 B, YnB(i,2)=1;Y(i)=X0(i+1);endalpha=(B'*B)(-1)*B'*Y'%做最小二乘估计a=alpha(1,1);b=alpha(2,1);d=b/a;%计算时间响应函数参数c=X1(1)-d;X2(1)=X0(1);X(1)=X0(1);for i=1:n-1X2(i+1)=c*exp(-a*i)+d;X(i+1)=X2(
29、i+1)-X2(i);%计算预测序列endfor i=(n+1):(n+k)X2(i)=c*exp(-a*(i-1)+d;%计算预测序列X(i)=X2(i)-X2(i-1);endfor i=1:nerror(i)=X(i)-X0(i);error1(i)=abs(error(i);%计算残差error2(i)=error1(i)/X0(i);%计算相对误差endc=std(error1)/std(X0);%计算后验差检验数运行结果见表格:年份1985198619871888198919901991199219931994199519961997总产62.958.861.487.2104.12
30、4.110.129155.219.值987303预测62.958.568.179.292.2107.124.145.169.196.228.266.309.值83265687949953293292868827480154635776971556498残差0.216.757.9012.617.414.116.213.722.30654767196相对0.000.110.090.120.130.120.120.080.10误差0000976823画出预测与实际值变化曲线,如图所示:预测与实际值变化曲线350300250200150100501986198819901992199419961998
31、1984实验模型以及结果检验:由表与图的结果可见,预测值与实际值偏离不大,其后验残差检验数 C=0.1475 小于 0.35 ,所以模型精度为优。2015-11序列预测某车站 1993-1997 年各月的列车运行数量数据如下表,试用时间序列建立合适的模型。并预测1998 年 1 月的数值1196.81181.31222.61229.31221.51148.41250.21174.41234.51209.71206.51204.01234.11146.01304.91221.91244.11194.41281.51277.31238.91267.51200.91245.51249.91220.1
32、1267.41182.31221.71178.11261.61274.51196.41222.61174.71212.61215.01191.01179.01224.01183.01288.01274.01218.01263.01205.01210.01243.01266.01200.01306.01209.01248.01208.01231.01244.01296.01221.01287.01191.0解:(1)首先进行平稳性检验:data a;/*a 为数据名 */input lieche;/*lieche为变量名 */month=intnx('month','1j
33、an1993'd,_n_-1);/*intnx间隔取时间变量*/format month date.;/* 月按? */cards;1196.81181.31222.61229.31221.51148.41250.21174.41234.51209.71206.51204.01234.11146.01304.91221.91244.11194.41281.51277.31238.91267.51200.91245.51249.91220.11267.41182.31221.71178.11261.61274.51196.41222.61174.71212.61215.01191.01179.01224.01183.01288.01274.01218.01263.01205.01210.01243.01266.01200.01306.01209.01248.01208.01231.01244.01296.01221.01287.01191.0;run ;proc gplot;/* 画图 */plot lieche*month;/*纵轴为 liech
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地方公务员广东申论74
- 2016年6月18日下午山东省公务员面试真题
- 小学三年级心理健康教育上册教案
- 2018年6月9日天津市法检系统公务员考试面试真题
- 安徽公务员面试模拟32
- 2024年健身房会员会籍升级合同
- 2010年4月15日渝中区事业单位面试真题
- 建筑工程支模施工方法及措施专项方案
- 建筑工程木门窗安装施工工艺质量管理标准化指导图示
- 2024年门市 租赁协议样本
- 泰安新泰旅游PPT介绍新泰幻灯片模板
- 土壤学-土壤分类和调查课件
- 孕期常见问题及处理(课件)
- 高中生物-特异性免疫(一)教学课件设计
- GB/T 42631-2023近岸海洋生态健康评价指南
- 酒旅餐饮商家直播间通用话术大全10-46-16
- 王阳明心学及其影响-王阳明心学及其当代意义共93课件
- 2023高一上学期班主任工作计划范文(3篇)
- 自治区级实验教学示范中心申请书
- 违法建筑处置法律解读培训PPT
- 《加氢裂化工艺》加氢裂化技术讲义
评论
0/150
提交评论