数学模型数学建模第七次作业数理统计实验_第1页
数学模型数学建模第七次作业数理统计实验_第2页
数学模型数学建模第七次作业数理统计实验_第3页
数学模型数学建模第七次作业数理统计实验_第4页
数学模型数学建模第七次作业数理统计实验_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学模型第七次作业 数理统计实验71实验目的与要求学会对数据的参数进行估计和作相应的假设检验学会对分布进行检验和数据的秩检验建立相应的统计模型,并用R软件求解7.2基本实验 1.区间估计已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡屮随机抽 取10只,测得其寿命(单位:小时)为1067 919 1196 785 1126 936 918 1156 920 948(1) 试问这批灯泡中大约95%的灯泡至少使用多少小时;(2) 求这批灯泡能够使用1000小时以上的概率。解:(1)根据题意,使用R软件求解,编辑程序如下:> X<-c(l 067,919,1196,785,1126,

2、936,918,1156,920,948)> ttest(X,al=" g)得到如下结果:One Sanp let-testdata: Xt = 23.9693, df=9, p-value = 9.148e-10alternative hypothesis true mean is greater than 095 pei'cent confidence inteival920.8443 Infsample estimatesmean of x997 1由此知道这批灯泡中大约95%的灯泡至少使用920.8443小时。> x<-c(l 067,919,119

3、6,785,1126.936,918,1156,920,948)>x1 1067 919 1196 785 1126 936 918 1156 920 948> pnoiTn(l 000>mean(x),sd(x)1 0 5087941由此知道求这批灯泡能够使用1000小时以上的概率为50.87941%假设检验I正常男子血小板计数均值为225x109/L,今测得20名男性油漆作业工人的血小板计数值(单位:10九)220188162230145160238188247113126245164231256183190158224175问油漆工人的血小板计数与正常成年男子有无差异,

4、并说明油漆作业 对人体血小板计数是否有影响。解:根据题意,设原假设为H0:与正常男子血小板计数无差异,对立假设H1:与正常男子血小板计数有差异。可以使用R软件求解此问题,>x<-c(220, 188,162, 230, 145, 160, 238, 188, 247, 113,126, 245, 164, 231, 256, 183, 190, 158,224,175)> t test(x>mu=225,alternative less11)得到如下结果:One Sample t-testdata: xt =3 4783, df= 19, p-value = 0 001

5、258alteinaUve hypothesis true mean is less tlian 22595 percent confidence inteival-Inf 208.4806sample estimates:mean of x19115做出原假设:油漆工人的血小板计数与正常成年男子无差异;做出备 择假设:油漆工人的血小板计数与正常成年男子有差异。此时的P值为0.002516小于0.05,拒绝原假设,因此认为油漆工人的 血小板计数与正常成年男子有差异。3假设检验II为研究国产四类新药阿卡波糖胶囊效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试

6、验 组(阿卡波糖胶囊组)和对照组(拜唐苹胶囊),分别测得试验开始前和8 周后的空腹血糖,算得空腹血糖下降值如表下:试验组-0.70-5.60 2.002.800.703.50 4.005.807.10-0.502.50 -1.601.703.000.404.504.602.506.00-1.40对照组3.706.505.005.200.800.200.603.406.60-1.106.003.802.001.602.002.201.203.101.70-2.00(1) 假设数据服从正态分布,试用t检验(讨论方差相同和方差不同两 种情况)和成对t检验来判断:国产四类新药阿卡波糖胶囊拜唐苹胶 囊对

7、空腹血糖的降糖效果是否相同?并分析三种检验方法各自的优 越性。(2) 检验试验组和对照组的数据的方差是否相同?解:(1)根据题总:建立检验假设,确定检验水准:H0: ,11=)12即阿卡波 糖胶囊组与拜糖平胶囊组空腹血糖下降值总体均数相等;H1: 口工 2即阿卡波糖胶囊组与拜糖平胶囊组空腹血糖下降值总体均数不相 等;ol=0.05。使用t检验,若两组数据方差相同时,编辑R软件程序如下:>x<-c(-060,250,4 00,5.«,7 10,-0 50,2.50,-1 60,1 70,3 00,0 40,4.50,4 60,2.50,6 00,-1 40)>y<

8、;-c(3.70>6 50,5 00,5.20,0 80,0.20,0 60,3 40,6 60,-1 10;6 00 80,2 00,1 60 00,2.20,1 20,3 10,1 70,-2.00)> t test(x,y,var equal=TRUE)得到如下结果:Two Sample t-testdata: x and yt = -0.6419r df = 38, p-vaiue = 0.5248alternative hypothesis: true difference in means is not equal to 095 percent confidence i

9、nterval:-2.3261791.206179sample estimates:mean of x mean of y2.0652.625分析结果,p-value=0.5248>0.05,所以接受原假设HO,即试验组与对照组没有显著差异。根据题意,若两组数据方差不同时,利用R软件进行t检验:> ttest(x,y)得到如下结果Welch Two Sample t-testdata: x and yt = -0.6419, df = 36.086, p-value = 0.525alternative hypothesis: true difference in means is

10、 not equal to 095 percent confidence interval:-2.329261.20926sample estimates:mean of x mean of y2.0652.625因此试验组与对照组的没有显著差异。进行成对t检验:> t test(xypaired=TRUE)得到如卜结果:Paired t-testdata: x and yt = -0.6464f df = 19r p-vaiue = 0.5257alternative hypothesis: true difference in means is not equal to 095 pe

11、rcent confidence interval:-2.3731461.253146sample estimates:mean of the differences-0.56即试验组与对照组的结果也没有显著差异。故三中检验的结果都显示两组数据均值无差异。对比三种检验方式,如果两个样本是成对的,应该使用成对的t检验,如果不使用成对t检验,t值会变小,p值会变大,准确性差了很多。(2)方差检验:> var test(x,y)得到如下结果:F test to compare two variancesdata: x and yF = 1.5984, num df = 19r denom df

12、 = 19, p-value = 0.3153 alternative hypothesis: true ratio of variances is not equal to 1 55 percent confidence interval:0.6326505 4.0381795sample estimates:ratio of variances1.598361故两组数据方差相同。某医院研究乳腺癌家族史对于乳腺癌发病率的影响。假设调查了 10000名50-54岁的妇女,她们的母亲曾患有乳腺癌。发现她们在那 个生存期的某个时刻有400例乳腺癌,而全国在该年龄段的妇女乳腺 癌的患病率为2%,这组

13、数据能否说明乳腺癌的患病率与家族遗传有 关。解:根据题意提出假设:建立检验假设,确定检验水准:H0:円0=2%即 患病率相符;Hl: pHpO即患病率不符;a=0.05o使用R软件进行校验:> binom. test (400, 10000, p=0. 002)得到如下结果:Exact binomial testdata:400 and 10000number of successes = 400, number of trials = 10000r p-value <2.2e-16alternative hypothesis: true probability of succes

14、s is not equal to0.00295 percent confidence interval:0.03624378 0.04402702sample estimates:probability of success0.04检验岀P值<0.05,因此不符合原假设,即这组数据不能说明乳腺癌的患病 率与家族遗传有关。5.分布检验IMendel用豌豆的两对相对性状进行朵交实验,黄色圆滑种子与绿色皱 缩种子的豌豆杂交后,第二代根据自由组合规律,理论分离比为黄圆: 黄皱:绿圆:绿皱秒圧:£。实际实验值为潢圆315粒,黄皱101 16 16 16 16粒,绿圆108粒,绿皱32粒

15、,共556粒,问此结果是否符合自由组合规 律?解:根据题意提岀假设:建立检验假设,确定检验水准:H0:结果符合自由组合规律;H1:结果不符合自由组合规律;a=0.05o使用R软件进行校验,利用pearson卡方检验是否符合特定分布:> chisq. test (c (315, 101, 108, 32), p=c (9, 3, 3, 1)/16)得到如下结果:Chi-squared test for given probabilitiesdata: c(315, 101, 108, 32)X-squared = 0.47r df = 3r p-value = 0.9254分析结果结果p值

16、为0.9254>0.05,所以接受原假设,即此结果符合自由组合规律。6.分布检验II观察每分钟进入某商店的人数X,任取200分钟,所得数据表7.1所 示。试分析,能否认为每分钟顾客数X服从Poisson分布(a=0.1).表7.1数据表顾客人数012345频数9268281110解:根据题总提出假设:建立检验假设,确定检验水准:H0:每分 钟顾客数X服从Poisson分布;H1:每分钟顾客数X不服从Poisson分布; oc=0.1。使用R软件进行校验:首先利用peaison卡方检验是否符合泊松分布:> X<-0:5;Y<-c (92, 68,28, 11, 1, 0)

17、> q<-ppois (X, mean (rep (X, Y);> n<length(Y)> p<numeric (n);> pl<ql;> pn<-l-qn-l;> for (i in 2: (nl)+ pi<-qi-qi-l> chisq. test (Y, p=p)得到如下结果:Chi-squared test for given probabilitiesdata: YX-squared = 2.1596, df = 5, p-value = D.8267警告信息:In chisq .test (Yz p =

18、 p) : Chi-squared近似算法有可能不准得到警告,因为PeaisonX2检验要求在分组后,至少要人于等于5,而后两组中出现的顾客数是1, 0,均小于5,重新分组,合并频数小 于5的组:> Z<-c (92, 68, 28, 12)> n<"length(Z); p<n)l:n*l ; pn<*l*qn*l> chisq test(Z, p=p)得到如下结果:Chi-squared test for given probabilitiesdata: ZX-squared = 0.5113r df = 3, p-value = D.8

19、227分析结果,p值为0.8227>0.1,因此接受原假设,即每分钟顾客数X服从Poisson分布。7.分布检验III一般认为长途电话通过电话总机的过程是一个随机过程,其间打进电 话的时间间隔服从指数分布,某个星期下午1: 00以后最先打进的10 个电话的时间为1:06 1:08 1:16 1:22 1:23 1:34 1:44 1:47 1:51 1:57试用Kolmogorov-Sniimov检验分析打进电话的时间间隔是否服从指 数分布。解:根据打进的电话时间算出时间间隔:1:001:061:081:161:221:231:341:441:471:511:57628611110346

20、建立检验假设,确定检验水准:H0:打进电话的时间间隔服从指数 分布;H1:打进电话的时间间隔不服从指数分布;a=0.05o假设指 数分布的参数入为Ao.l,利用R软件进行检验:10x<-c (6, 2, 8, 6, 1,11, 10, 3, 4, 6)ks test (x. "pexp", 0 1)得到如下结果:One-sample Kolmogorov-Smirnov testdata: xD = 0.3329 r p-value = 0.2178alternative hypothesis: two-sided因此P值为0.2178>0.05,因此接受原假设

21、,即打进电话的时间间隔是否服从指数分布。8列联表检验I向120名女性和120名男性做调查,了解他们关于给谁买节日礼物最难 的看法,调查结果如表7.2所示。试分析:女性和男性在关于给谁买节 H礼物最难的看法上有没有显著差界。表72关于给谁买节日礼物最难的看法性別给i隹买节H礼物最难配偶父僚了女兄弟姐妹姻亲其他亲属女性283423一1315男性423191120解:根据题意,利用R软件输入数据,使用cliisq.testO作检验。> compare<matr ix (c (28, 42, 34, 31, 23, 9, 7, 11, 13, 7, 15, 20), nr =2, dimn

22、ames=list (c (“ 女性","男性"),C (配偶","父母,"子女",兄弟姐妹","姻亲","其他亲属")> chisqtest(compare, correct二TRUE)得到如下结果:Pearson fs Chi-squared testdata: compareX-squared = 12.4666f df = 5 r p-value = 0.02892由于p值为0.02892<0.05,因此拒绝原假设,认为女性和男性在关于 给谁买节日礼物最难

23、的看法上是有显著差异的。9 列联表检验II为研究人脑的左右半球恶性肿瘤的发病率是否有显著差界,对人脑恶 性肿瘤和良性肿瘤的发病情况做了调查,调查结果如表7.3所示.试进 行分析。表7.3人脑左右半球恶性肿瘤和良性肿瘤的发病情况良性恶性合计左半球9312右半球134合计10616解:根据题意,其所给数据不满足x 2检验条件,固使用Fisher精确检验。> x<-matrix(c (9, 1, 3, 3), nc=2)> fisher test (x)得到如下结果:Fisher fs Exact Test for Count Datadata: xp-value = 0.1181

24、alte匸native hypothesis: true odds ratio is not equal to 155 percent confidence interval:0.4313171 521.0928115sample estimates:odds ratio7.63506由此计算出的p 值=0.1181>0.05,并且区间估计得到的区间包含有1,因此说明两个变量是独立的,即认为左右半球恶性肿瘤的发病率并无显著差异。10. Wilcoxon秩和检验I(1) 为了了解新的数学教学方法的效果是否比原来方法的效果有所提 高,从水平相当的10名学生中随机地各选5名接受新方法和原方法的

25、 教学试验。专家对10名学生的数学能力予以综合评估,并按其数学能 力由弱到强排序如下新方法357910原方法 12468对(尸0.05,检验新方法是否比原方法显著地提高了教学效果。(2) 若新方法与原方法得到排序结果改为新方法467910原方法 12358能否说明新方法比原方法显著提高了教学效果?解:(1)因为WUCOXOI1秩和检验本质只需排出样本的秩次,而且题冃中的数 据本身就是一个排序,因此可直接使用,编写R程序如下:> X<-C (3, 5, 7, 9, 10)> y<-c (1, 2, 4, 6, 8)> wilcox test (x, y, alter

26、native二"greater")得到如下结果:Wilcoxon rank sum testdata: x and yW = 19, p-value = 0.1111alternative hypothesis: true location shift is greater than 0 得到的p 值为0.1111>0.05,因此接受原假设,即并不能认为新的教学效 果显著优于原方法。同第一问,编写R程序如卜:> X<-C (4, 6, 7, 9, 10)> y<c (1, 2, 3, 5, 8)> wilcox test (x, y, a

27、lternative二"greater")得到如下结果:Wilcoxon rank sum testdata: x and yW = 21, p-value = 0.04762alternative hypothesis: true location shift is greater than 0得到的p值为0.0.04762<0.05,因此拒绝原假设,即认为新方法比原方 法显著提高了教学效果。11. Wilcoxon秩和检验II为比较一种新疗法对某种疾病的治疗效果,将40名患者随机地分为两 组,每组20人,一组采用新疗法,另一组用原标准疗法.经过一段时 间的治疗后,

28、对每个患者的疗效作仔细的评估,并划分为差、较差、 一般、较好和好五个等级.两组中处于不同等级的患者人数如表7.4 所示。试分析,由此结果能否认为新方法的疗效显著地优于原疗法(a =0.05)o表7.4不同方法治疗后的结果等级差较差一般较好好新疗法组01973原疗法组221141解:根据题意,可以将不同方法治疗后的结果用5个不同的值表示,1表示 最差,5表示最好,这样就可以为这些病人排序,因此,可用Wilcoxon 秩和检验来分析问题。编写R程序:> x<rep (1:5, c (0, 1, 9, 7, 3)> y<"rep (1:5, c (2, 2, 11,

29、 4, 1)> wilcox test (x, y, exact二F)得到如下结果:Wilcoxon rank sum test with continuity correctiondata: x and yW = 266, p-value = 0.05509alternative hypothesis: true location shift is not equal to 0由计算结果知道p的值为0.05509人于0.05,不能拒绝原假设,尚不能 认为新方法的疗效显著优于原疗法。7.3加分实验(产品装箱问题)A厂把加工好的螺母封装成盒,标准为200个/盒。封装好的产品卖 给用户。如果

30、盒屮的螺母个数少于200,会造成用户的生产线停顿, 用户会因此向该厂索赔。(1)封装生产线采用称重计数的方式。已知螺母的重量XN(100,4)(单 位:克),封装时电脑自动称量盒中螺母的重量,并由此估计螺母的 个数,显示在屏幕上。控制人员通过终端设定每盒屮应该装填的螺母 数,就可以开动由电脑控制的封装线了。为了尽量避免出现不足的情 况,控制人员设定的装填个数一般比200大一些。假定盒了及其误差 可以忽略不计,电子称称量重量为卩克的物体所得读数服从均值为卩, 标准差为3的正态分布。(1) 试问:设定的个数至少为多少时,才能保证盒中实际螺母数少于200 的概率不大于0.0001?(ii)设每个螺母

31、成本为1元钱,用户每天需要200盒螺母,用户的生产 线每停顿一次损失5000元,这些损失全部由A厂承担。问设置数为多 少时该厂的平均损失最少?(2) 若螺母重量分布的方差未知,采用下列方法:开始时放5个在盒中 并从控制终端输入盒中个数为5,如此直至盒中有20个。在此过程中, 电脑会自动称量盒中螺母并记录下每5个螺母的重量。然后,可以开 始上述的封装过程。此时,试回答上述两个问题。解:(1)使用Matlab和R软件两种方法求解(两种思路)第一问使用两种方法求解(Matlab和R软件)使用Matlab求解:对题目意思的理解说明:1) 题目中的正态分布N(100,4)中的4看做标准差,若为方差,可以

32、 在程序中将sigma改为2即可。2) 电脑根据称重情况T判断是否符合设定个数n的原则: rowid(T/100)=ii就表示满足要求。应用MC方法对系统进行模拟,系统模拟封装100万盒螺母,源程序 如下:»function y=test2(n)%该程序计算一直终端控制个数时,求P(m<200),即实际个数小于200的个数%采用MC算法%输入参数:n表示终端控制个数,输出为概率ymax=210;mu=100;sigma=4;T=0;ail=1000000;out=0;D=tril (ones (max,max) , 0) ; % F三角矩阵for t=l:allif mod(t

33、rall/100)=0disp (正在计算次数,,num2str (t)剩余次数,numZstr (all-t) , *请等待.);endTO = normrnd (mur sigmarmaxr 1) ; % 生成一扌比螺母T0=D*T0; %累加螺母重量T=nonnrnd(T0,3);场机器称重T=round (T/1UU);彳机器估算个数if find (T=n) <200%实际个数小于200就计数out = out +1;endend h for t y=out/all;end得到设定202个可以满足要求。具体结果如下衣所示:设定个数实际个数少于Z00个的概率2000.176720

34、10.00362025.00E-062030使用R软件求解:若使用R软件进行求解,可套用现成的函数,题目可以理解为当测 量总重量W>= N*100的时候装盒结束,N为电脑设置的。盒了中实 际的螺母数量是随机的,可能比N大也可能比N小。冃的是当W刚 好大于NFOO的时候,实际螺母数量<=199的概率小于O.OOOlo 这个条件可以认为等价于装到199个的时候,总重量W199 >= N*100的概率小于O.OOOloW_199等于199个螺母重量加上秤的误差,所以分布为N(199*100, sqit( 199*4A2+3A2)从N=200开始增加,直到P(W_199>=N*100)小于0.0001编程如卜:> sim <

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论