统计计算课程设计报告书_第1页
统计计算课程设计报告书_第2页
统计计算课程设计报告书_第3页
统计计算课程设计报告书_第4页
统计计算课程设计报告书_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

..《统计计算》课程设计报告学院专业姓名学号评语:分数题型一:1、某医生随机抽取正常人和脑病病人各11例,测定尿中类固醇排出量〔mg/dl,结果如表1。该医生根据此资料算得正常人尿中类固醇排出量的均数=4.266mg/dl,标准差S1=0.985mg/dl;脑病病人尿中类固醇排出量的均数=5.732mg/dl,标准差S2=1.626mg/dl,配对t检验结果,t=–3.098,P<0.05,故认为脑病病人尿中类固醇排出量高于正常人。表1正常人和脑病病人尿中类固醇排出量〔mg/dl测定结果分组尿中类固醇排出量〔mg/dl正常人2.905.415.484.604.035.104.974.244.373.052.78脑病病人5.288.793.846.463.796.645.894.577.716.024.06[问题1]1、该资料属于何种设计方案?2、该医生的统计处理是否正确?为什么?请用SAS程序和SAS结果解释原因。答:1、该资料属于完全随机设计2、不正确;因为成对组数据的比较是指在某个观察值内部进行"以前"和"以后"情况的对比,而上述数据不符合这个要求,所以我们可以认为该医生的统计处理是不正确的,应该采用独立组两样本T检验。SAS源程序:datatk1;dop=1to2;don=1to11;inputy;output;end;end;cards;2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.37 3.05 2.785.28 8.79 3.84 6.46 3.79 6.64 5.89 4.57 7.71 6.02 4.06;procprint;run;procmeansnoprintdata=tk1;vary;byp;outputout=ty1css=ssn=nstd=s;run;dataty2;setty1;f=n-1;u=1/f;_type_=1;logs=2*f*log<s>;run;procmeansnoprintdata=ty2;varssnfulogs_type_;outputout=mx3sum=t_sst_nt_ft_ut_logsk;dataresult;setmx3;sc2=t_ss/t_f;fz=t_f*log<sc2>-t_logs;fm=1+1/3/<k-1>*<t_u-1/t_f>;df=k-1;chisqr=fz/fm;prob=1-probchi<chisqr,df>;procprintnoobs;varchisqrdfprob;run;procunivariatedata=tk1normal;vary;byp;run;procnpar1waydata=tk1wilcoxon;classp;run;SAS结果及分析:录入数据:变量解释:P=1为正常人,P=2为脑病病人;y为尿中类固醇排出量方差齐性检验:输出结果中,统计量的p值=0.12975>0.05,所以我们可以认为正常人和脑病病人的尿中类固醇排出量方差齐性。正态性检验的结果如下:p=1p=2因为是小样本,所以观察Shapiro-Wilk检验结果:说明在0.05水平下,正常人的尿中类固醇排出量的正态性统计量W的P值为:0.2259>0.05,脑病病人的尿中类固醇排出量的正态性统计量W的P值为:0.5404>0.05,所以正常人和脑病病人的尿中类固醇排出量都通过正态性检验,即正常人和脑病病人的尿中类固醇排出量的分布都服从正态分布。所以选择采用独立组两样本T检验,输出结果如下:结果表明:正常人和脑病病人的尿中类固醇排出量数据是方差齐性的〔Equal,所以观察相应Pooled方法的检验统计量的P值=0.0188<0.05,结论为正常人和脑病病人的尿中类固醇排出量有显著差异。2、某研究者为研究核黄素缺乏对尿中氨基氮的影响,将60只Wistar大白鼠随机分为核黄素缺乏、限食量、不限食量三组不同饲料组。每组20只大白鼠。一周后测尿中氨基氮的三天排出量,结果如表2。该研究者对上述资料采用了两样本均数t检验进行两两比较,得出结论:三组之间均数差异均有统计学意义〔P<0.05。检验进行两两比较,得出结论:三组之间均数差异均有统计学意义〔P<0.05。表2

3组大白鼠在进食一周后尿中氨基氮的三天排出量〔mg核黄素缺乏组6.023.702.464.713.827.044.734.773.936.568.693.445.963.602.364.653.776.944.624.63限食量组3.233.472.593.302.604.993.204.273.148.427.142.493.133.262.503.212.614.903.234.07不限食量组8.215.665.347.366.845.205.114.699.3311.559.984.048.065.485.197.306.765.085.054.61[问题2]1、这是什么资料?2、该资料属于何种设计方案?3、该研究者处理方法是否正确?为什么?请用SAS程序和SAS结果解释原因。答:1、这是一个单因素三水平的方差分析资料。2、该资料属于单因素三个水平的均衡设计。3、研究者的处理方法不正确;因为两独立组样本均数t检验要求每组观察值是来自正态分布的总体的,而经检验证明,上述的三组数据并不服从正态分布,所以不可以采用两独立组样本均数t检验;而且对多个总体的均值进行比较,应用方差分析是更加常用的方法,所以此研究应该考虑采用非参数方差分析。SAS程序:datatk12;dop=1to3;don=1to20;inputy;output;end;end;cards;6.02 3.70 2.46 4.71 3.82 7.04 4.73 4.77 3.93 6.568.69 3.44 5.96 3.60 2.36 4.65 3.77 6.94 4.62 4.633.23 3.47 2.59 3.30 2.60 4.99 3.20 4.27 3.14 8.427.14 2.49 3.13 3.26 2.50 3.21 2.61 4.90 3.23 4.078.21 5.66 5.34 7.36 6.84 5.20 5.11 4.69 9.33 11.559.98 4.04 8.06 5.48 5.19 7.30 6.76 5.08 5.05 4.61;procprint;run;procmeansnoprintdata=tk12;vary;byp;outputout=ty1css=ssn=nstd=s;run;dataty2;setty1;f=n-1;u=1/f;_type_=1;logs=2*f*log<s>;run;procmeansnoprintdata=ty2;varssnfulogs_type_;outputout=mx3sum=t_sst_nt_ft_ut_logsk;dataresult;setmx3;sc2=t_ss/t_f;fz=t_f*log<sc2>-t_logs;fm=1+1/3/<k-1>*<t_u-1/t_f>;df=k-1;chisqr=fz/fm;prob=1-probchi<chisqr,df>;procprintnoobs;varchisqrdfprob;run;procunivariatedata=tk12normal;vary;byp;run;procnpar1waydata=tk12wilcoxon;classp;run;procrankdata=tk12out=tsy3;vary;ranksr;procanovadata=tsy3;classp;modelr=p;meansp/bon;run;SAS结果及分析:〔1录入数据:……变量解释:P=1为核黄素缺乏饲料组,P=2为限食量饲料组,P=3为不限食量饲料组;y为进食一周后尿中氨基氮的三天排出量〔mg方差齐性检验:输出结果中,统计量的p值=0.45370>0.05,所以我们可以认为三组不同饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg的方差是齐性的。正态性检验的结果如下:p=1p=2p=3因为是小样本,所以观察Shapiro-Wilk检验结果:说明在0.05水平下,核黄素缺乏饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg的正态性统计量W的P值为:0.2526>0.05;限食量饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg的正态性统计量W的P值为:0.0001<0.05;不限食量饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg的正态性统计量W的P值为:0.0256<0.05。所以除核黄素缺乏饲料组外,限食量饲料组和不限食量饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg都不通过正态性检验,即核黄素缺乏饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg是服从正态分布的,而限食量饲料组和不限食量饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg的分布不是正态分布。所以选择采用非参数方差分析,输出结果如下:三组不同饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg的均值分别为:29.500,17.950和44.050,可以初步看出三组不同饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg是存在差异的。用Bonferroni法进行多重比较,输出结果说明:三组不同饲料组的大白鼠进食一周后尿中氨基氮的三天排出量〔mg之间有显著差异。3、某医师用改良的Seldinger’s插管技术对8例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中的HCG含量如表3。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较的t检验,得t=2.460,P<0.05,差异有统计学意义,故认为治疗前后血中HCG的含量有差别。表3灌注化疗前后HCG含量测定结果〔pmol/L病例号灌注前〔X1灌注后〔X2lgX1lgX2112800002100006.10725.322227550033004.87793.518531245022104.09523.3444415000009.36.17610.968551000025004.00003.39796970012033.98683.080371558848254.19283.6835842239143.62562.9609[问题3]1、这是什么资料?2、该实验属于何种设计方案?3、该医师统计方法是否正确?为什么?请用SAS程序和SAS结果解释原因。答:1、这是成对组〔配对数据的资料。2、该实验属于配对比较设计方案。3、该医师统计方法不正确;因为两独立组样本均数t检验要求每组观察值是来自正态分布的总体的,而经检验证明,上述的两组数据并不都服从正态分布,所以不可以采用两独立组样本均数t检验,而应考虑采用非参数检验;而且上述数据的内部有明显地进行了"以前"和"以后"情况的对比,所以不应该采用简单的两样本均数比较的t检验,而应考虑采用成对组〔配对检验,所以综上所述:上述数据的统计分析应考虑采用成对组Wilcoxon符号秩检验。SAS源程序:datatk13;inputxy;diff=x-y;cards;6.1072 5.32224.8779 3.51854.0952 3.34446.1761 0.96854 3.39793.9868 3.08034.1928 3.68353.6256 2.9609;procprint;run;procunivariatedata=tk13normal;vardiff;run;SAS结果及分析:〔1因为两组数据相差较大,所以首先对数据进行对数变换,来保证两组数据的方差齐性,然后再对对数变换后的数据进行相关的检验分析。原数据的方差齐性检验:输出结果中,统计量的p值=0.000011015<0.05,所以我们可以认为为对数化前的灌注化疗前后HCG含量测定结果〔pmol/L的方差是非齐性的。对数变换后的方差齐性检验:输出结果中,统计量的p值=0.65009>0.05,所以我们可以认为为对数化后的灌注化疗前后HCG含量测定结果〔pmol/L的方差是齐性的。〔2录入数据:变量解释:x为灌注前HCG含量测定结果的对数化结果〔pmol/L;y为灌注后HCG含量测定结果的对数化结果〔pmol/L;diff为灌注前后HCG含量测定结果的对数化结果的差值。因为是小样本,所以观察Shapiro-Wilk检验结果:正态性检验的结果来看,P值<0.0001<0.05,所以在0.05显著性水平下拒绝灌注化疗前后HCG含量测定结果的差值服从正态分布,故可采用非参数的符号检验和符号秩和检验。而从符号检验统计量M=4,P=0.0078<0.05来看,在0.05显著性水平下,我们可以认为灌注化疗前后HCG含量的测定结果有差异。题型二:设有一个由两个服务台串联组成的服务机构〔双服务太串联排队系统。顾客在第一个服务台接受服务后进入第二个服务台,服务完毕后离开。假定顾客达到第一个服务台的时间间隔是均值为1分钟的指数分布,顾客在第一个和第二个服务台的服务时间分别是均值为0.7分和0.9分的指数分布。请模拟这种双服务台串联排队系统〔分别模拟600分和1000分的系统;并估计出顾客在两个服务台的平均逗留时间和排队中的顾客平均数。答:SAS源程序:datatk2;seed=123;dok=1to100;t=0;w1=0;w2=0;d=0;c1=0;c2=0;n=0;;dountil<tge600>;ct=ranexp<seed>/1;t=t+ct; fs=ranexp<seed>*0.7;ift>c1thendo; w1=0; c1=t+fs+w1;end;elsedo;w1=c1-t; c1=t+fs+w1;n=n+1;end;ss=ranexp<seed>*0.9;ifc1>c2thendo; w2=0; c2=c1+w2+ss;end;ifc1<c2&&t>c1thendo;w2=c2-c1; c2=c1+w2+ss;n=n+1;end;ifc1<c2&&t<c1thendo;w2=c2-c1; c2=c1+w2+ss;end;wz=c2-t;output;end;np=n/40;end;procprint;run;procmeansmean;varw1fsw2sswznp;run;SAS结果及分析:系统模拟结果输出:……估计结果的统计输出:当t=600时:这种双服务台串联排队系统的600分钟情况下,模拟估计出每名顾客在第一服务台的平均排队时间为:1.7266942,在第一服务台的平均接受服务时间为:0.7032195;每名顾客在第二服务台的平均排队时间为:8.3409665,在第二服务台的平均接受服务时间为:0.9071757,所以平均顾客在两个服务台的总逗留时间为:11.6780558,每15分钟排队中的顾客平均数为:10.5662692。当t=1000时:这种双服务台串联排队系统的1000分钟情况下,模拟估计出每名顾客在第一服务台的平均排队时间为:1.6781667,在第一服务台的平均接受服务时间为:0.7003800;每名顾客在第二服务台的平均排队时间为:8.8269871,在第二服务台的平均接受服务时间为:0.9020444,所以平均顾客在两个服务台的总逗留时间为:12.1075782,每15分钟排队中的顾客平均数为:17.5060748。开始流程图:开始t>c1否是否是否计算该顾客在两服务台的总逗留时间:wz=c2-t计算该顾客离开第二个服务台的时间:c2=w2+t+ss计算在第二个服务台前的等待时间:w2=0队列中的等待人数:n=n+1计算在第一个服务台前的等待时间:w1=0c1>c2计算并输出服务台服务系统的主要指标,如顾客在两服务台的总逗留时间,排队中的顾客人数;并计算顾客在两服务台的平均总逗留时间和排队中的顾客平均数模拟时钟t>600〔或1000计算在第一个服务台前的等待时间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论