医学统计学1、第2次课_第1页
医学统计学1、第2次课_第2页
医学统计学1、第2次课_第3页
医学统计学1、第2次课_第4页
医学统计学1、第2次课_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1上节课课后思考:1、抽样研究中为何要进行假设检验?对样本有何要求? 因为抽样误差始终存在。 样本必须是随机样本,代表性要好 还要有一定的样本容量2、是否P值越小,意味着总体差别越大?那么P值大小由哪些因素决定呢? 不是,其大小由H0,样本量,抽样误差,允许误差所决定3、H0是如何设置的? 根据反证法思想 零假设:“相等”意味着差为0 无效假设:研究者希望否定的现象设为H0,希望肯定的设 为H1第四章 多个样本均数比较的方差分析试验设计不同,方差分析的形式也有差异本学期要学习完全随机设计,随机区组设计,拉丁方设计,两阶段交叉设计,析因设计,正交设计,嵌套设计,裂区设计基本思想是一样的:线性模型

2、,对总变异进行分解,对自由度进行分解。 方差分析的基本思想(复习)P57,120obs应变量自变量:处理因素为降血脂新药,4水平 方差分析的模型思想 :i=1,2,,g;j=1,2,ni 是所有处理的总均值i为因素在第i个水平对应变量的附加效应, 并假设所有i之和为0ij是随机误差,N(0,2)假设检验实际上就是检验各个i是否均为0若是,则XijN(,2)一、完全随机设计的方差分析 例4.2 120名高血脂患者随机分为4组。随机化分组方法:P57甲130 乙3160 丙6190 丁91120120名高血脂患者同质性要好!随机化程序proc plan seed=621105;factors un

3、it=120;output out=a;run;data b;set a;if _n_31 then group=1;else if 30_n_61 then group=2;else if 60_n_ F Model 6 0.45636000 0.07606000 7.96 0.0050 Error 8 0.07640000 0.00955000 Corrected Total 14 0.53276000 R-Square Coeff Var Root MSE x Mean 0.856596 21.52513 0.097724 0.454000 Source DF Anova SS Mean

4、 Square F Value Pr F drug 2 0.22800000 0.11400000 11.94 0.0040 block 4 0.22836000 0.05709000 5.98 0.0158SPSS数据格式例04_04.savDrug,block均为固定效应下面是block为随机效应的输出形式,F值不变区组因素是对试验结果有影响的非 处理因素每个区组的例数等于处理的水平数区组间试验对象差异较大均衡设计不能分析交互作用(没有重复)多重比较:对显著的固定效应可用多重比较实际应用(Assumption)单因素方差分析,都要考虑:独立的随机样本正态性检验:样本含量小难于检验,凭借经验

5、;样本大,中心极限定理又保证了抽样的正态性方差齐性检验:样本量差不多,稳健的。配伍设计、交叉设计、正交设计分析时一般不考虑上述正态性与方差齐性检验,如要分析,要进行残差分析(线性模型角度)正态分布的特征:对称性,正态峰 检验方法:图示法和计算法1 图示法:P-P图和Q-Q图箱式图 minP25P50P75max1.5Q茎叶图x Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 163 . 2 3.00 164 . 128 13.00 165 . 1155666667799 19.00 166 . 9 23.00 167 . 78899 19.00 16

6、8 . 0023444445666667888 14.00 169 . 00111233456789 4.00 170 . 2335 3.00 171 . 122 1.00 Extremes (=172.6) Stem width: 1.00 Each leaf: 1 case(s)偏度系数skewness g1=峰度系数Kurtosisg2=Skewness 0.14454799 Kurtosis 0.11041642该系数是由样本算得,还需要计算标准误,公式见P46综合评定指标:W检验和D检验W检验: Shapiro-Wilk法样本含量 ChiSq g 3 5.2192 0.1564 该检

7、验方法要求资料服从正态分布,而当资料方差不齐时常常也不满足正态分布的要求多组方差齐性检验Levenes test是一种更为稳键且不依赖总体分布的具体形式的一种检验方法(SPSS)数据变换data transformation()观察值的分布已知场合观察值是计数数据:Z=sqrt(y)观察值用分数表达的比率Z=arcsin(sqrt(y)观察值服从对数正态分布Z=lny,Z=log10y()观察值分布未知的场合lny, Z=1/y, Z=sqrt(y)比较有效(3)一般场合ox-Cox变换残差分析UNIANOVA weight BY group treat /METHOD = SSTYPE(3)

8、 /INTERCEPT = INCLUDE /PRINT = HOMOGENEITY /PLOT = RESIDUALS /CRITERIA = ALPHA(.05) /DESIGN = group treat .第三节 拉丁方设计资料的 方差分析问题引入:如果考虑的处理因素为一个,但区组因素不是一个,而是二个,且各因素的水平数相等,此时可用拉丁方设计(Latin square design)6种药物,注射于6只兔子身上6个部位,观察药物引起的疱疹大小SS总=SS处理+SS行区组+SS列区组+SS误差例04_05.sav六种药物所致疱疹大小一、何谓拉丁方 拉丁方是指p个字母排成pp的方阵,使得

9、每一行、每一列中p个字母都同时各出现一次。 行和列各代表一个区组因素,增加处理组间的均衡性,减少误差,提高效率。二、拉丁方表的随机化 2,1行对调 3,5行对调 4,6行对调 2,1列对调 6,5列对调 4,3列对调字母DECABF放处理甲乙丙丁戊已行22,06,34,72,52,82;列27,29,99,72,68,53;字母35,56,27,09,24,86三、拉丁方资料的方差分析SS总=SS处理+SS行区组+SS列区组+SS误差例04_05.sav六种药物所致疱疹大小计算公式例4-5 程序data p81;do j=1 to 6;do i=1 to 6;input treat$ x;ou

10、tput;end;end;cards;C 87 B 75 E 81 D 75 A 84 F 66B 73 A 81 D 87 C 85 F 64 E 79F 73 E 73 B 74 A 78 D 73 C 77A 77 F 68 C 69 B 74 E 76 D 73D 64 C 64 F 72 E 76 B 70 A 81E 75 D 77 A 82 F 61 C 82 B 61;run;proc anova; class treat i j;model x=treat j i;run; Sum of Source DF Squares Mean Square F Value Pr F M

11、odel 15 1003.083333 66.872222 1.96 0.08 Error 20 683.222222 34.161111Corrected Total 35 1686.305556 R-Square Coeff Var Root MSE x Mean 0.594841 7.830704 5.844751 74.63889 Source DF Anova SS Mean Square F Value Pr F treat 5 667.1388889 133.4277778 3.91 0.0124 j 5 250.4722222 50.0944444 1.47 0.2447 i

12、5 85.4722222 17.0944444 0.50 0.7723例04_05.savUNIANOVA 实验结果 BY 处理组 行区组 列区组 /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /CRITERIA = ALPHA(.05) /DESIGN = 处理组 行区组 列区组 .Analyze general linear model univariate解释:皮肤疱疹大小与六种注射药物有关,与不同家兔间及不同注射部位无关五、应用注意事项1、单个拉丁方试验由于在因素(三因素)及水平上(各因素水平数相等)有严格的限制,又不能显示因素间的交互作用,所以在应

13、用上受到了一定的限制。2、拉丁方的重复:小的拉丁方的缺点是误差自由度相对较小,重复使用可增加误差自由度。ABCBCACABABCBCACAB123456 1 2 31、用相同的批(行)与操作人员(列)总=Rp2 -1,行=p-1,列=p-1,处理=p-1 重复=R-1=2-1SS总=SS行+SS列+SS处+SS重复+SS误差误差自由度=Rp2-1-3(p-1)-(R-1)2、不同的批相同的操作人员总=Rp2 -1,行=R(p-1),列=p-1,处理=p-1 重复=R-13、不同的批和不同的操作人员总=Rp2 -1,行=R(p-1),列= R(p-1),处理=p-1 重复=R-1实验设计与分析3

14、、拉丁方缺失值的估计:拉丁方撇号表示有缺失值的行、列和处理的总和,y是有缺失值时全部观察值的总和第五节两阶段交叉设计资料的方差分析一、何谓两阶段交叉设计 (two stage cross over design) 阶段 洗脱期 wash outABBA两种闪烁液测定血浆中3H-cGMP交叉试验处理因素、试验阶段和个体差别 二、设计方法2*2拉丁方设计2*2交叉设计两个时期、两个处理的交叉试验设计,称2*2交叉设计 三、优缺点优点: 1由于交叉试验处理间的差别是在受试者内进行比较的,允许受试者之间有较大的个体差异,特别适用于不易控制个体差异的临床试验。 2每个实验对象可安排多个时期,即可实施多个

15、处理(以下为三个处理),节约样本 时期1 时期2 时期3 准备阶段 处理A 洗脱 处理B 洗脱 处理C 缺点:1 需要在同一实验对象上进行多次处理,要求每次时间不能长,否则有时不能进行到底。2安排洗脱阶段,如果处理的作用不能彻底清除,则无法用此试验3变化:当试验对象在过程中发生变化如死亡,治愈,则下一步处理无法进行。4退出试验:一旦在某一时期退出了试验,造成数据缺失,增加统计分析的困难。5交叉试验只适用于病情较稳定、病程可分阶段、短期治疗可见疗效的疾病的疗效比较(高血压病,止痛药,安眠药)四、统计分析方法:t检验法和方差分析法,也可以用非参数秩和检验方法2*2交叉设计数据录入格式DATASET ACTIVATE DataSet4.UNIANOVA y BY phase treat obs /RANDOM=obs

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论