版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、用于指定随机抽样的方法,srs表示单纯随机抽样;“ n=”用于指定抽样大小(此处可以用抽样,并指定一些抽样选项,其中“data= ”指定输入数据集,用于指定抽样框;“ method=”各种常见随机化的SAS实现在前两期的讲座中我们介绍了实验设计的三要素与四原则1,本期将结合实例重点阐述实验设计中如何实现各种常见的随机化。随机化体现在如下三个方面2:抽样随机:每一个符合条件的实验对象参加实验的机会相同,即总体中每个个体有相同的机会被抽到进入样本之中。它保证所得到的样本具有代表性,使实验结论具有普遍意义;分组随机:每个实验对象分配到不同组 (通常为对照组、不同处理组)的机会相同。它保证大量难以控制
2、的非处理因素在对比组间尽可能均衡一致,以提高各组间的可比性;实验顺序随机:每个受试对象先后接受处理的机会相等,它使实验顺序的影响也达到均衡。本期主要就如何用SAS实现随机抽样和随机分组进行阐述。已知编号为1-20的20例病人的基本信息见表 1。本文将以表1数据为例,阐述随机化 的SAS实现。表1 20例病人的基本信息病人编号12345678910性别FFMFFFMMMM年龄60643757413160645816病人编号11121314151617181920性别MMFFFFFMFF年龄586323372033394049421.随机抽样目前在SAS/STAT模块中,有一个与调查设计有关的SU
3、RVEYSELECT过程。该过程可用来实现各种随机抽样,包括:单纯随机抽样、系统随机抽样、分层抽样、无限随机抽样(有替换)、序贯随机抽样、以及按规模大小成比例概率抽样(PPS)等。1.1简单随机抽样的实现简单随机抽样,就是从总体中不加任何分组、划类、排队等,完全随机地抽取受试对象。 特点是每个个体(样品)被抽中的概率相等, 各样品之间完全独立,彼此间无一定的关联性 和排斥性。简单随机抽样是其他各种抽样形式的基础。通常只是在总体样品之间差异程度较小和数目较少时,采用这种方法。例1 :从编号为1到20的人中用简单随机化的方法抽取10名作为受试者。用SAS9.1.3实现简单随机抽样的程序如下:dat
4、a a;ods html;in put id sex$ age;proc surveyselect data=acards;method=srs n=10 out=b;1 F 60fun;2 F 64 |proc print data=b;J55run;20 F42|ods html close;run;程序说明:首先,创建 SAS数据集名为a。然后,调用SURVEYSELECT过程进行随机“rate=”来替换,用于指定抽样率);“ out=”用于指定输出数据集,它包含所有被抽到的 样本(可以添加选项“rep= number”来规定重复抽样的次数,如“rep=2”命令系统同时抽取2份样本)。最
5、后用PROC PRINT把输出数据集b在输出窗口中显示出来。 命令ods html 和ods html close用于把程序运行结果以网页格式保存下来。输出结果如下:Selectio n Method Simple Ran dom Sampli ng TOC o 1-5 h z Input Data SetARan dom Number Seed 937359000Sample Size10Selectio n Probability0.5Sampli ng Weight2Output Data SetB以上是本次单纯随机抽样的基本信息,抽样方法是简单随机抽样(Simple RandomSam
6、pling )。由于未指定 SEED=选项来规定初始种子,来产生随机数字流。系统使用默认 种子作为初始种子(SEED=937359000),如果将来想重新抽取与本次完全相同的样本,可 以在抽样时指定同一种子。抽取的样本大小是10。抽样概率(Selection Probability )是指样本被抽中的概率,此处为0.5。对于无分层的单纯随机抽样,样本的抽样概率是一致的。抽样权重(Sampling Weight)是抽样概率的倒数,反映样本信息量的大小。Obsidsexage15F4126F31310M16411M58512M63613F23715F20816F33919F491020F42以上是
7、PROC PRINT命令显示的输出数据集,包括所有被抽中的样本。第二列 id显示 了被抽中的病人的编号。|1.2分层随机抽样的实现分层抽样,先依据一种或几种特征将总体分为若干个子总体,每个子总体称作一个层, 然后从每层中随机抽取一个子样本,这些子样本合起来就是总体的样本。分层抽样所得的样本具有较好的代表性,抽样误差较小。例2 :将表1中的20例病人以性别为分层因素,抽取10名受试者。用SAS9.1.3实现分层随机抽样的程序如下:ods html;strata sex;proc sort data=a;run;by sex; run;surveyselectdata=a method=srspr
8、oc print data=b; run; | ods html close;n=(6 4) out=b;程序说明:数据步与例 1相同,此处省略。过程步,SORT过程用于将数据集 a排序,by语句指明按性别进行排序, 此处排序方式为先 F后M。SURVEYSELECT过程与例1的不 同之处在于选项 n=(6 4),规定每层中得抽样大小,若每层抽样大小相同,可写为门二门!的形式。此外,还多了一个 STRATA语句,该语句用于指定分层变量。1N相继编号,并计算抽样距主要SAS输出结果如下:离K=N/n。式中N为总体样品总数,n为样本容量。然后在1K中抽一随机数i,作为样ObssexidageSel
9、ectionProbSamplingweight1F4570.522F6310.523F13230.524F15200.525F19490.526F20420.527M3370.528M8640.529M11580.5210M18400.521.3系统随机抽样的实现系统抽样,先按照某种顺序将总体中的个体(样品)从本的第一个被抽样品,接着取i+K , i+ 2K, , , i+(n-1)K,直至抽够n个样品为止。值得注意的是,当总体的被观察样品按顺序有周期趋势或增加(减少)趋势时,容易产生偏倚。例3:将表1中的20例病人按系统随机抽样的方法抽取5名受试者。用SAS9.1.3实现系统随机抽样的程序
10、如下:ods html;run;proc surveyselectdata=a method=sysproc print data=b;n=5 out=b;run;con trol id;ods html close;程序说明:数据步与例1相冋,此处省略。SURVEYSELECT过程与例1的不冋之处在于选项method=sys,规定抽样方法为系统随机抽样法。此外,还多了一个control语句,该语句用于指定排序的变量。SAS输出结果如下: TOC o 1-5 h z ObssexageidF574Ml648M6312F3316F 42201.4整群抽样的实现整群抽样是先将总体分成若干群,从中随
11、机抽取几个群;抽中群内的全部个体(样品) 组成样本。可将整群抽样转化为简单随机抽样。例如,从10班随机抽取5个班作为受试对象,可看做从10个个体中随机抽取 5个,即为简单随机抽样。2.随机分组利用SAS软件实现随机分组的途径有很多,目前比较常用的是 SAS/STAT模块的PLAN过程,它可用于构建各种常见的试验设计并对设计方案进行随机化,也可用于产生数字的排列组合表。笔者将介绍如何利用PLAN过程来实现两组和多组的随机分组。2.1完全随机化的实现完全随机化,直接对受试对象进行随机化分组, 常通过掷硬币或随机数字表, 或用计算 机产生随机数来进行随机化,在事先或者实施过程中不作任何限制和干预或调
12、整。分组后各组受试对象的例数不一定相等。例4 :将表1中的20例病人随机分为2组。data e;/*第四步 */set c;group2=group;patie nt2=patie nt;keep group2 patie nt2;run;data f;/*第五步 */merge d e;run;ods html; |proc print noobs; /*第六步 */run;ods html close;用SAS9.1.3实现简单随机分组的程序如下:output out=sheji;run;data b c;/*第二步 */set sheji;patie nt=_n_;factors a=2
13、0;proc plan seed=20101216; /*第一步 */if a=10 the n do; group=A:output b; end;else do; group=B;output c;end;run;data d;/*第三步 */set b; |group仁group;patie nt1=patie nt;keep group1 patie nt1;run;程序说明:第一步,调用PLAN过程产生20个随机排列数,并把结果输出至数据集sheji中,选项seed=,规定产生随机数的种子。第二步,对数据集sheji进行操作,把病人按随机排列数进行分组,随机数小于等于10的进入A组,
14、其余进入B组,并将结果分别保存至数据集b和c中。第三步和第四步,分别将数据集b、c中的group改为group1、group2,将patient改为patient1和patient2,生成新的数据集 d和e。最后把数据集d和e合并为新的数 据集f ,并通过PRINT过程将随机分组的结果展现出来。SAS输出结果如下:grouplpatientlgroup2patient2A4B1A5B2A7B3A8B6grouplpatientlgroup2patient2A10B9A11B14A12B15A13B16A17B18A19B20例5将这20例病人随机分为4组。用SAS9.1.3实现简单随机分组的程
15、序如下3proc plan seed=20101216;factors a=20;output out=sheji;run;data b1 b2 b3 b4;|set sheji;patie nt=n;if a=5 then do; group=A; output b1; end;if 6=a=10 the n do; group=B;output b2; end;if 11=a=15 then do; group=C;output b3; end;if 16=a then do;group=D; output b4;e nd;run;data d1;set b1;group仁group;pa
16、tie nt仁patie nt;keep group1 patie nt1;data d3;set b3; group3=group;patie nt3=patie nt;keep group3 patie nt3; run;data d4;set b4;group4=group;patie nt4=patie nt;keep group4 patie nt4; run;data f;merge d1 d2 d3 d4; run;ods html; | proc print no obs; run;ods html close;(如年龄、性别、病情、run;grouplpatientlgrou
17、p2patient2group3patient3group4patient4A5B4C1D2A7B8C6D3A10B11C9D14A13B12C15D18A19B17C16D20SAS输出结果如下:2.2分层随机化的实现分层随机化,首先对可能影响实验过程和结果的主要混杂因素疾病分期等)进行分层,然后在每一层内进行完全随机化分组,最后分别合并为实验组和对 照组。配对随机化和区组随机化可看成是分层随机化的实际应用。例6将表1中的20例病人以性别为区组因素,随机分为2组。将20例病人中的12名女性,编号为1-12,按例4中的程序分为2组;8名为男性,编 号为1-8,按例4中的程序分为2组,可以实现对
18、这 20例病人的区组随机化。例7现有来自3个窝别的24只大鼠,以窝别为区组因素,随机为4组,每组6只。对大鼠进行编号,第一窝编号为用SAS9.1.3实现区组随机化的程序如下 proc plan seed=201200505;factors block=3 len gth=8; output out=sheji; |run;data a b c d; set sheji; mouse= n; if len gth=2 the n do;group=A;output a;e nd; else if 3=le ngth=4 the n do;group=B;output b;e nd; else i
19、f 5=le ngth=6 the n do;group=C;output c;end; else do;group=D;output d;e nd; run;data aa;set a; | group仁group; mouse仁mouse;keep group1 mouse1;run;8,第二窝编号为 916,第三窝编号为1724。3 , 4data bb;set b;group2=group;mouse2=mouse;keep group2 mouse2;run;data cc;set c;group3=group;mouse3=mouse; keep group3 mouse3;run;data dd;set d;group4=group;mouse4=mouse;keep group4 mouse4;run;data e;merge aa bb cc dd;run;ods htm
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《文科综合能力培养》课件
- 神经内科护师工作计划
- 如何评估个人工作计划的效果
- 关爱留守学生工作计划中心幼儿园关爱留守幼儿工作计划
- 餐饮部2024年工作总结及2024年工作计划
- 2024年学生管理处下半年工作计划示范文本参考
- 浙江省宁波市慈溪市2024-2025学年高三数学上学期期末试题含解析
- 2024年下半年学校工作计划
- 2024年医院体检中心人员工作计划书工作计划书
- 统考版2025届高考语文全程一轮复习第三部分论述类文本阅读专题六论述类文本阅读学案一感知高考试题明确考试方向
- 2024年资格考试-WSET二级认证考试近5年真题附答案
- 12J201平屋面建筑构造图集(完整版)
- 22-深化设计方案
- 循证护理学(理论部分)智慧树知到答案2024年复旦大学
- 20以内的加法口算练习题4000题 284
- 高中历史选择性必修2知识点总结归纳
- 一例急性阑尾炎伴局限性腹膜炎患儿的护理查房
- 湖南省2024年对口升学考试计算机应用类试题(含参考答案)
- 城管责令停工通知书
- YD-T 2664-2024 公用电信设施保护安全等级要求
- 定向穿越机合同范本
评论
0/150
提交评论