研究生统计学讲义中医临床实验设计与统计分析实用课件_第1页
研究生统计学讲义中医临床实验设计与统计分析实用课件_第2页
研究生统计学讲义中医临床实验设计与统计分析实用课件_第3页
研究生统计学讲义中医临床实验设计与统计分析实用课件_第4页
研究生统计学讲义中医临床实验设计与统计分析实用课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 国际或行标规定的主要症状都具备(如果无主要症状,则要求任意三项症状)+舌苔+脉象. 合计至少5项阳性才能辩为某证候 . 根据此项规定可以计算出每个证候 诊断的最低加权积分临界值 . 优点:宏观辩证统一化、规范化、量化。 现场调查证候 加权积分步骤: 每项症状按严重程度或频次制定0、2、4、6分的得分量表 . 分别对应无 、轻、中、重症状;使用文字进行描述得分具体内容. 是症状和体征(四诊)的定量方法. 舌和脉象如果不容易打分 , 也可按照无=0分,有=1分. 证候加权积分(计量资料)=每项四诊得分*每项四诊对证候的权重.(=同一证候中每项四诊中出现频率的百分构成比 , 可根据文献或现场调查计

2、算) 国际或行标规定的主要症状都具备(如果无主要症状,则要求任 证候加权积分作为证候疗效评价的定量依据. 若再将证候加权积分转化为证候分级值, 则可以把证候分级为0、1、2、3级, 分别代表某证候的无、轻、中、重 .2. 利用古今传统文献统计法:因为四诊资料和证候在原始文献 (医案) 中没有定量值 , 只能查到有或无的记载 . 因此可以统计各种证候的每项四诊资料发生的频数, 换算成为频率(条件概率) , 再用对数转换为诊断概率指数,从而制定出计量诊断与鉴别诊断表来 .3. 只按照现代流行病学调查和统计分析特点:不受现有证候诊断(宏观辩证)标准的限制, 完全按照无偏的自然人群样本调查收集到的四诊

3、资料进行团结分析. 证候加权积分作为证候疗效评价的定量依据. 若再将证候加优点:不仅可以筛选出某证主要四诊资料(指标) ,而且可以得到每个指标对证候的权重 .例如主成分及因子分析和指标聚类分析 . 问题: 对证候的重新分类可能与现有辩证体系不全吻合上述第 1 种方法可做暂行“金”标准, 其最大优点是:1. 辩证统一; 2. 辩证结果可以重复 , 即重测信度(retest reliability)好 .3. 症状和证候可定量 , 均可作为症状和证候疗效评价的依据.第三节 制定方法举例以中医内科学(张伯臾)对胃痛的辩证分型和四诊资料项目作为基础 . 再按照四诊资料的严重程度或发生频次评定得分 ,

4、拟定四诊资料表 , 称为四诊资料得分优点:不仅可以筛选出某证主要四诊资料(指标) ,而且可以得到证候加权积分=各项四诊资料得分*各项四诊项目权重的积和(代数和) .加权方法: 某一证候中 , 每一项四诊资料出现频率的百分构成比(根据临床流行病学调查数据计算) .上述四诊资料得分为等级资料 , 证候加权积分是计量资料 .表1 胃痛各证候的宏观辩证量表(金标准)症状 | 得分 0 分 2 分 4 分 6 分 权重 1. 寒邪客胃 1.1 胃脘疼痛 无 轻微 较痛能忍 不能忍 0.3 1.2 得温痛减 从不 偶尔 经常 总是 0.3 遇寒痛增证候加权积分=各项四诊资料得分*各项四诊项目权重的积和(代

5、数1.3 口和不渴 非常渴 很渴 有点渴 不渴 0.31.4 喜热饮 从不 偶尔 经常 总是 0.11.5 舌苔白 不是 是 0.11.6 脉弦紧 不是 是 0.12.饮食停滞.3. 肝气犯胃4.肝胃郁热5. 瘀血停滞1.3 口和不渴 非常渴 很渴 有点渴 不渴6.胃阴亏虚7.脾胃虚寒.参考文献: 中医内科学张伯臾主编,第1版 上海科技出版社 ,1986年临床流行病学王家良主编 ,第2版 ,上海科技出版社 , 2001 , 437页 临床流行病学在中医药研究中的应用:赖世隆第二章 中医证候宏观辩证量表 的表面效度评价第一节 Kappa检验的原理6.胃阴亏虚参考文献: 中医内科学张伯臾主编,第1

6、版 上在诊断检验中, 对水平数3的配伍设计问题. 通常进行一致性(intraobserver aggrement)检验,可使用McNemar检验和Kappa检验. 1.Kappa检验的意义 Kappa检验(Kappa test)或称一致性(intraobserver agreement) 检验,包括 同一医药工作者对同一受试对象进行两次以上观察作出判断的一致性。例如:同一临床医师对同一患者的两次胃镜检查的结论、两次阅读同一X光片的诊断结论,病理学医师两次阅读同一张切片的诊断结论,同一医药工作者两次测定同一药材某特征物含量的结论,都可能产生不一致的情况。 两个及两个以上的医药工作者对同一对象进行

7、观察作出判断的一致性。 在诊断检验中, 对水平数3的配伍设计问题. 通常进行一致性例如:两个或更多的医药工作者检查同一患者、阅读同一X光片、同一病理切片也可能发生判断的不一致。因此在临床实际工作中,特别是临床试验研究中,有必要对判断的一致性作出估计。例如,在利用胃镜检查结果作慢性胃炎的诊断之前,研究者很有必要了解重复检查的一致程度,若一致性较差,说明诊断结果的可靠性受到重复检查结果判断不一致的影响;若一致性较好,说明重复检查结果是可信的。由于实际工作中重复观察造成的判断不一致很难避免,只能尽量采取措施控制在最低限度,同时,选用适当的统计方法评价其判断的一致性。 2Kappa检验的统计量 为Ka

8、ppa值,简记为K,计算公式为: 例如:两个或更多的医药工作者检查同一患者、阅读同一X光片、同式中PA为实际观察到的一致率;Pe为期望一致率,简称期望率,即两次检查结果由于偶然机会所造成的一致率。PA和Pe的计算公式分别为: 式中PA为实际观察到的一致率;Pe为期望一致率,简称期望率,下面介绍使用组内相关可靠性系数( intra-class correlation coeficient of reliability, R值) 对中医证候宏观辩证量表进行重测信度评价的方法和反应度评价的方法.H1:两者不吻合,一致性不好。设计例题6 某市欲抽样调查乙肝感染率。Pe =(a+b) (a+c)/n+

9、(b+d) (c+d)/ n / n特点:不受现有证候诊断(宏观辩证)标准的限制, 完全按照无偏的自然人群样本调查收集到的四诊资料进行团结分析.研究项目:凡是可疑的病或证的一切相关因素,而且打算统计分析的,都不应遗漏;据预调查计算的样本均数为170cm,样本标准差为30cm,设计者要求容许差值d=总体均数(用样本均数代替)的1/100=170cm/100=1.若一致性较好,说明重复检查结果是可信的。 两个及两个以上的医药工作者对同一对象进行观察作出判断的一致性。可用McNemar检验与Kappa检验。各种项目都要写明计算机编码:三分类名义变量如男和女,编码为1和2;4 喜热饮 从不 偶尔 经常

10、 总是 0.设计例题5 江南某地区欲用抽样调查了解该地区居民血吸虫感染率。合计 42 48 48 36 174只按照现代流行病学调查和统计分析H1:两者不吻合,一致性不好。sav以后,分析如下:是 a b a+b优点:不仅可以筛选出某证主要四诊资料(指标) ,而且可以得到每个指标对证候的权重 .可见,K值实际为两个差值之比,分母为(1期望率),即非偶然机会造成的一致率;分子称为校正后的一致率,它是实际观察到的一致率和可能由于偶然机会造成的期望率之差值,差值越大,说明实际观察到的一致率远比由于机会造成的期望一致率高。K值为经校正后一致率与非机会造成一致率的比值。配对四格表资料的期望率Pe 、实际

11、观察一致率PA分别为: Pe =(a+b) (a+c)/n+ (b+d) (c+d)/ n / n = (a+b) (a+c)+ (b+d) (c+d) / n2 ( 10.15) PA = (a+d)/n ( 10.14)配对四格表资料的Kappa值可简化为式(10.16): K = 2(adbc) / (a+b) (a+c) +(b+d) (c+d) (10.16 下面介绍使用组内相关可靠性系数( intra-class cKappa的取值范围在-1至+1之间,K值愈接近+1,表明一致程度愈好,K值+1,说明两次判断的结果完全一致;K值1,表示二者完全相反,说明两次判断的结果完全不一致;若

12、K值0,表示一致率完全由机会引起,说明两次检查结果很不一致。在实际运用中,只有K值在0到+1区间时,对判断一致性才有意义。K值越大说明二者的一致性越好。一般认为,若K值0.75,可说明已经达到相当满意的一致程度;若小于0.4,则可说明一致程度不够理想。Landis和Koch对四格表资料提出判断一致性程度的Kappa量判断表,见表10-15。 Kappa的取值范围在-1至+1之间,K值愈接近+1,表明一表10-15 一致性程度的Kappa量判断表*Kappa值一致性程度Kappa值一致性程度0弱0.410.60中度0.000.20轻0.610.80高度0.210.40尚好0.811.00极强*

13、Kappa值0.4,Kappa值的标准误=0.049,近似概率P=0.000。说明样本Kappa值来自总体Kappa值为0的概率近似0.000,故可认为两者辩证结果的一致性较好。 第三节 定性观察(二分类变量)的一致性评价方法如果将证候分度简化为二分类变量 , 则资料整理成表 乙辩证例数 是 非 合计甲辩证例数 是 a b a+b 非 c d c+d 合计 a+c b+d nKappa检验统计量Kappa值=0.5290.4,Kap例10.14 湖南中医学院研究的血吸虫病肝纤维化气虚血瘀证判别模型回代检验结果见表10-17,用Kappa值评价该判别模型诊断的吻合性与一致性。 乙辩证例数 是 非

14、 合计甲辩证例数 是 36 5 41 非 3 40 43 合计 39 45 84H0:两者吻合。H1:两者不吻合。 例10.14 湖南中医学院研究的血吸虫病肝纤维化气虚血瘀证2 ( xji-xij)2/( xji + xij)= (5-3)2/ (5+3) =0.5, 自由度df=k (k -1)/2=2 (2-1)/21 , 查2界值表得P0.05K = 2(adbc) / (a+b) (a+c) +(b+d) (c+d) 2(3640-53)/(4145+3943)=0.81,按表10-15的一致性程度的Kappa量判断表,可认为该判别模型诊断的吻合性极强。 第三章 中医证候宏观辩证量表的

15、重测信度评价 (R值法)及反应度评价 信度又称为可靠性(reliability): 指在相同条件下, 对同一客观事件重复测量若干次 , 测量结果相互符合的程度 ; 说明数据的可靠性 . 常用信度评价的方法有四种:2 ( xji-xij)2/( xji + xij)1. 客观信度(objectivity reliability)2. 精确程度(precision reliability)3. 和谐程度(congruence reliablity)4. 重测信度(re-test reliability) :用同样测量方法对同一批对象在不同时间段进行重复测量, 目的是考核测量工具的可靠性 . 下面介

16、绍使用组内相关可靠性系数( intra-class correlation coeficient of reliability, R值) 对中医证候宏观辩证量表进行重测信度评价的方法和反应度评价的方法.第一节 R 的设计计算和统计分析一、例1 某研究者使用中医证候宏观辩证量表对同一批受测者(10例)在上, 下午两次盲法观测证候的直接积分1. 客观信度(objectivity reliabilit2、证候的辩证标准:笔者建议制定“统一的辩证用四诊量表”作为目前阶段统一的辩证标准,即暂行“金”标准。这是是双向有序且属性相同的33方表资料.第六节 横断面调查资料的SAS程序统计分析其科学价值可参考加

17、拿大MCMaster大学的四级分类方法,属于第三级(较低一级)研究设计方案,论证强度较弱。是 非 合计优点:不仅可以筛选出某证主要四诊资料(指标) ,而且可以得到每个指标对证候的权重 .理想的人群样本来自自然人群(人群各种特征的比例符合所在的市或县最近一次人口普查的特征比例)。配对四格表资料的Kappa值可简化为式(10.将数据代入公式4-5得:n=(1.控制措施:盲法收集资料。8之间,所以可以假定p0.8之间,所以可以假定p0.5统计软件,建立数据文件E1.再计算样本量,得出平均需要多少个居委会作为样本,(样本量计算方法见本章第五节), 假定需要抽出50个居委会。再计算样本量,得出平均需要多

18、少个居委会作为样本,(样本量计算方法见本章第五节), 假定需要抽出50个居委会。又可根据专业知识提出一个容许差d,通常用后者。要求了解总体率的真值。(1)无限总体抽样误差:要求样本得出的现患率与总体现患率真值之间的差距不超过总体率的1/10;(四诊资料总得分) , 资料见下表:受试编号 1 2 3 4 5 6 7 8 9 10第1次积分 5 4 5 3 12 7 9 15 8 6 第2次积分 6 4 4 4 10 5 8 18 7 8 二、计算组内相关可靠性系数: 可使用SPSS统计分析0.7R 0.4 , 可靠性较好, R0.7 可靠性甚佳 . 这里 R=0.92 可靠性好 . 第二节 量表

19、反应度的评价 量表不但要评价其真实性 (效度) 和可靠度, 还要评价反应度 .一、反应度的概念2、证候的辩证标准:笔者建议制定“统一的辩证用四诊量表”作为 反应度(responsibility to change):反应内外环境和受试者有一定变化 (例如中医四诊资料的严重度或频度有所变化)的情况下该量表的应变能力.二、 反应度指标1. 实施干预措施后 , 量表两次得分的差别有无统计学意义的假设检验:既可以按照计量资料进行假设检验 ,如 t 检验(正态性 , 方差齐性) 或 t 检验(方差不齐) .也可以进行非参数检验 .2. 效应尺度统计量(effect size statistics):除开

20、假设检验外 , 还可以把实施干预措施前后 , 量表两次得分转换为 “效应尺度” 统计量来评价量表的反应度.效应尺度=(干预得分-干预后得分)/干预前得分的标准差 反应度(responsibility to ch一般认为 , 效应尺度小于0.2 , 则反应度甚差 ;0.20.50之间反应度较小 ; 0.510.80为反应度较大 . 如果量表在干预前后两次得分的假设检验有统计学意义的差别,而效应尺度却小于0.20 , 则显示该量表的反应度甚差 .第四章病证结合的观察性描述研究:横断面调查分析 观察性描述性研究主要包括横断面调查、诊断试验评价与筛查、生态学研究、临床医疗调查报告、病例总结分析,专家述

21、评等,属于观察性描述性研究。其科学价值可参考加拿大MCMaster大学的四级分类方法,属于第三级(较低一级)研究设计方案,论证强度较弱。 第一节横断面调查的概念和特点 一般认为 , 效应尺度小于0.2 , 则反应度甚差 ;0.2 横断面调查又称现况调查(cross-sectional survey)或患病率(现患病,prevalence rate)调查。是在某个时点或较短时段内(看成一个时点,一般在一个月内完成调查),调查一个特定人群样本中医证候的分布频率以及与某些因素的相关关系,可以得到证候的现患率(prevalence rate)和一些可疑的影响因素。 现况调查可以将证候按人群各种特征间、

22、时间、地区间(合称“三间”)的横断面分布频率显示出来,而且可以获得影响证候“三间”分布频率的相关因素信息。 由于证候与相关因素是在同一次调查中得到的,即果与因同时存在,无法判断发生时间的先后顺序,除非一些持续不变的因素如家族史、性别、血型、基因型外,不能推断证候与相关因素之间存在因果联系,即不能确定病因或危险因子。 横断面调查又称现况调查(cross-section 尽管不能进行病因推断,但却是病因研究必须的第一步,能为病或证候的病因(或危险因子)研究提供工作假设的线索,为第二步观察性分析性研究(包括回顾性病例对照研究和前瞻性的队列研究)以及第三步的干预研究(包括治疗性临床试验、预防性临床试验

23、、以群体为单位的社区试验)提供基础。 第二节 横断面调查的目的和用途 1. 证候按人群各种特征的分布频率:年龄、性别、种族、基因型、经济收入、职业、婚姻、家庭状况等一切可能影响证候的分布频率。 一、了解证候人群人中的现况和描述证候按“三间”的分布频率 尽管不能进行病因推断,但却是病因研究必须的第一步3. 证候按地区的分布频率:不同地理区域可能影响证候的分布频率。 二、了解影响证候“三间”分布频率的相关因素 2. 证候按时间的分布频率:人群抽样调查时间的不同(例如季节和年份)可能影响证候的分布频率。 1. 证候按人群各种特征的分布频率:年龄、性别、种族、基因型、经济收入、职业、婚姻、家庭状况等一

24、切可能影响证候的分布频率。 2. 证候按时间的分布频率:人群抽样调查时间的不同(例如季节和年份)可能影响证候的分布频率。 3. 证候按地区的分布频率:不同地理区域可能影响证候的分布频率。 3. 证候按地区的分布频率:不同地理区域可能影响证候的分布频三、了解影响证候“三间”分布频率的相关因素 如果是病证结合研究,影响病的患病率的相关因素,也可能是证候影响因素。例如:软水质使冠心病高发,硬水质使龋齿高发,黄曲霉素B在食品中的浓度与肝癌患病率呈正相关,吸烟与支气管肺癌,某些地区的民族某种病低发和高发,即使移民到某国几代人后仍与该国居民的患病率(或发病率)水平有显著差别。所有这些相关因素都可能影响证候

25、的分布频率,因为证候与病都是反映疾病和健康状况的概念。 四、了解证候分布频率的动态变化 如果能像全球疾病监测那样,在监测点同样可以做到证候的监测,在同监测的相同人群样本中2次以上的调查,就可以提供时间动态变化。三、了解影响证候“三间”分布频率的相关因素 如第三节 人群抽样调查设计及随机抽样的SAS程序 一、目标明确1、主要了解某病的证候分布频率:使用医院确诊为某病的连续病例,直到满足样本含量为止。医院病例的缺点:不能计算病或证候的患病率(时点患病率某时点新老病例数之和/该时点平均人口数),只能计算某病的某证候分布 频率。因为医院的病例不能包含各年龄组、各职业、各病期、种种病情(轻、中、重、并发

26、症)的全部病例,所以医院病例是该病的有偏样本。理想的人群样本来自自然人群(人群各种特征的比例符合所在的市或县最近一次人口普查的特征比例)。 第三节 人群抽样调查设计及随机抽样的SAS程序 一、目标明确2、了解某病及证候的患病率及其影响因子(相关因素):来自自然人群的样本。城镇的居民委员会或农村的行政村均为自然人群。 二、统一诊断标准 1、病的诊断标准:国际标准或国家标准。2、证候的辩证标准:笔者建议制定“统一的辩证用四诊量表”作为目前阶段统一的辩证标准,即暂行“金”标准。制定方法可参阅本书第一章。 三、调查表 应包含一般项目和研究项目。一般项目:姓名;性别;年龄组(按世界卫生组织提供的“标准人

27、口构成”构成年龄分组方法,成年人5岁一个年龄组,75岁以上只一个年龄组,例如20 25 3075);职业。 2、了解某病及证候的患病率及其影响因子(相关因素):来自自然 研究项目:凡是可疑的病或证的一切相关因素,而且打算统计分析的,都不应遗漏; 不打算统计分析的,一项也不要列入。 各种项目都要写明计算机编码:三分类名义变量如男和女,编码为1和2;多类无序名义变量(如某病的证1、证2、证3)以及多类有序变量(等级变量),编码为1、2、3K;连续型变量(计算资料)填写实际观测值。 研究项目应尽量选择客观的测量指标,即硬数据(hard data),尽量减少主观的重复性差的不能准确度量的指标,即软数据

28、(softdata)。必不可少的软数据(如症状、心理学指标等)收集,为了统一,宜做成量表(scale),要做效度(真实性、准确度,即validity)和信度(可靠性、可重复性、精确度,即reliability)检验,可参阅本书有关章节。 研究项目:凡是可疑的病或证的一切相关因素,而且打算统计分析四、抽样方法及SAS 统计程序 无论采用何种抽样方法,必须遵守随机抽样的原则。因为只有随机样本才能代表总体(自然人群中所有的某病某证候者的总体)的各种特征。而且要计算抽样误差(sampling error),以便对总体参数作出估计,并对抽样调查结果的真实性(与总体真值的距离,即准确度或效度)和可靠性(可

29、重复性,即精确度或信度)进行评价。 1、单纯随机抽样(Simple random Sampling) 是简单又基本的抽样方法,从N个人的总体中随机抽出 n 个构成一个含量为 n 人的样本。这里,基本抽样单位是“人”。笔者建议使用SAS程序进行随机抽样四、抽样方法及SAS 统计程序1、单纯随机抽样(Simple单纯随机抽样SAS程序举例:设计例题1 现有有限总体2000人,欲从中随机抽出50人的样本 ,怎样改写SAS 程序? data ebm3.samp;do i=1 to 50;x=ranuni(20020808);y=int(x*2000);output;end;run;运行结果如下:OBS

30、 I X Y 1 1 0.09759 195 .单纯随机抽样SAS程序举例:设计例题1 现有有限总体2000答: 欲抽出50人,第3行do i1 to 50;如欲抽出80人,则把 50 改为80;从2000人的有限总体中抽样,所以第5行y = int(x*2000);即随机数先乘2,000 再取整。如有限总体为20000人,则把2000改为20000即可。第4行括号内是种子数,相当于抽样起始点,本例取日期,读者也可取其它任意正整数。当然首先给有限总体的每个抽样单位编号。 上面运行结果的第4列(Y列)就是在2 000人的有限总体内随机抽中的50人随机样本号,它是通过x*2000得到的,x也是随机

31、数。 50 50 0.53951 107949 49 0.16101 322答: 欲抽出50人,第3行do i1 to 50;如欲抽出2、抽样误差的计算公式:(1)无限总体抽样误差:当(n/N)5%时,N 可看作无限总体。例如本例,n/N=50/200=2.5%,看作无限总体。均数的标准误: 率的标准误: 式中S=样本标准差,样本均数的标准误,p=样本率,n=样本含量。 2、抽样误差的计算公式:率的标准误: 式中S=样本标 如果n/N5%,N 看作有限总体。上述2个公式分别乘上校正数(1n/N)的平方根。(2)有限总体的抽样误差:均数的标准误:率的标准误: 3、整群抽样(Cluster Sam

32、pling)基本抽样单位不是以“人”为单位,而是以“群组”为单位,例如城镇的居委会,农村的行政村、学校的班、部队的班、工人的车间等。 如果n/N5%,N 看作有限总体。上述2个公式分别乘上设计例题2 欲调查北京市2000年8月城区常驻户口居民II型糖尿病患病率及II型糖尿病气阴两虚证的现患率。问:怎样进行整群抽样?答:基本抽样单位是居委会。按照市公安局户口处的资料,先把各城区各街道办事处各居委会的名称、人口列表,并且按某种人为的顺序对居委会编号,假定1到2000号。再计算样本量,得出平均需要多少个居委会作为样本,(样本量计算方法见本章第五节), 假定需要抽出50个居委会。最后仍用SAS程序(数

33、据集名:ebm3.samp)随机抽出50个居委会。被抽中的居委会全体居民都是调查对象。整群抽样的抽样误差大于单纯随机抽样,需要增加样本量,一般增加50左右即可。 设计例题2 欲调查北京市2000年8月城区常驻户口居民I4、分层抽样(Stratified sampling)先按总体人口学特征(年龄组、性别、种族、职业、经济收水平等)或疾病的病情(轻、中、重、并发症等)分成若干层次,并在每层内作单纯随机抽样。一般说,当样本会计师足够大时,调查患病率和相关因素,只要单纯随机抽样即可,不一定需要事先分层。但是调查结束后处理资料时,分层统计分析是必要的,这是为了控制混杂偏倚(confounding bi

34、as)。 第四节 横断面调查需要的样本含量估计方法一、调查总体均数时样本含量计算公式(当总体标准差和均数未知时,都用样本统计量代替):4、分层抽样(Stratified sampling)第四式中,n= 样本含量;=0.05时,s=样本标准差;d=允许误差,即样本均数与总体均数的容许差值,既可用所求总体均数95可信区间间距之半(1.96倍标准误);又可根据专业知识提出一个容许差d,通常用后者。 设计例题3 某单位拟抽样调查了解该地区20岁男性身高。据预调查计算的样本均数为170cm,样本标准差为30cm,设计者要求容许差值d=总体均数(用样本均数代替)的1/100=170cm/100=1.7c

35、m. 问:需要多大样本含量? 式中,n= 样本含量;=0.05时,s=样本标准差;d=允答:设定=0.05,s=30cm,d=1.7cm,t0.05 =1.96 。将数据代入公式4-5得:n=(1.96*30/1.7)2=1196.3 。即决定至少需要抽样调查1197名20岁男性。如果想减少样本量必然要增大容许误差d,例如令d= 总体均数(用样本均数代替)的2/100=170cm*0.02=3.4cm. 将数据代入公式4-5,得 : n=(1.96*30/3.4)2=299.1即至少需要抽样调查300名20男性。 设计例题4 某中医科拟抽样调查了解空腹糖200mg/dL的II 型糖尿病气阴两虚

36、证的证候加权积分均值(指总体均值,这里的总体是研究结果推论的范围,即全国的该证型患者)。/15=0.2。 答:设定=0.05,s=30cm,d=1.7cm,t0.0据预调查样本计算,样本证候加权分均数为3分,标准差约为1分,要求容许误差d=总体均数(用样本均数代替)的1/15=3分/15=0.2。 问:所需要调查多少人数?答: 设定0.05,s=1分,d=0.2分,将数据代入公式45,得:n=(1.96*1/0.2)2=96.04 即至少需调查97位空腹血糖200mg/dL的II型糖尿病患者,才能了解气阴两虚证的加权均数,其误差在0.2分范围内。 二、调查总体阳性率时样本含量计算 当阳性率 p

37、 在0.20.8时: 式中n为所需样本含量;当时0.05时, p为总体阳性率的估计值;d为容许误差,一般可取总体率的1/10。 据预调查样本计算,样本证候加权分均数为3分,标准差约为1分,设计例题5 江南某地区欲用抽样调查了解该地区居民血吸虫感染率。总体感染率不知。要求样本感染率与总体感染率之差不超过总体感染率的1/10,问需调查多少人? 答:因为总体感染率一无所知,但估计在0.20.8之间,所以可以假定p0.5;容许误差要求不超过总体感染率的1/10,即d=0.1,p=0.10.5=0.05;设定0.05,代入公式4- 6 得: 即需要调查至少385人。 设计例题5 江南某地区欲用抽样调查了

38、解该地区居民血吸虫感染率设计例题6 某市欲抽样调查乙肝感染率。总体感染率用前些年文献中报告的样本率近似代替,约15;容许误差要求不超过总体感染率的1/10;问样本含量。答:p=0.15 ,d=0.1 ,p=0.10.15=0.015,设定=0.05 代入公式4-7: 即至少需要调查2177人。 设计例题7 现欲抽样调查了解命门火衰证在男性40岁以上阳痿病人中的比例(即总体率)。据笔者预调查经验,约为80;要求了解总体率的真值。要求样本得出的现患率与总体现患率真值之间的差距不超过总体率的1/10;问需调查多少例40岁以上的阳痿病人? 设计例题6 某市欲抽样调查乙肝感染率。总体感染率用前些年文献2

39、Kappa检验的统计量 为Kappa值,简记为K,计算公式为:1来自调查对象:有回忆偏倚和报告偏倚。横断面调查又称现况调查(cross-sectional survey)或患病率(现患病,prevalence rate)调查。量表不但要评价其真实性 (效度) 和可靠度, 还要评价反应度 .3Kappa值的标准误 根据实际资料计算的Kappa值是一个样本的统计量,同样存在着抽样误差,估计其抽样误差大小的统计量为Kappa值的标准误,用符号sK表示,计算公式为:如果想减少样本量必然要增大容许误差d,例如令d= 总体均数(用样本均数代替)的2/100=170cm*0.各种项目都要写明计算机编码:三分

40、类名义变量如男和女,编码为1和2;2 , 则反应度甚差 ;0.如果n/N5%,N 看作有限总体。K = 2(adbc) / (a+b) (a+c) +(b+d) (c+d) (10.4 , 可靠性较好, R0.4 , 可靠性较好, R0.samp)随机抽出50个居委会。1未遵守随机抽样的原则,使样本对总体代表性差。其科学价值可参考加拿大MCMaster大学的四级分类方法,属于第三级(较低一级)研究设计方案,论证强度较弱。质量外控制是对操作者盲法使用标准样品并规定警告线和最大容许线。K = 2(adbc) / (a+b) (a+c) +(b+d) (c+d) 2(3640-53)/(4145+3

41、943)=0.是 a b a+b例如:软水质使冠心病高发,硬水质使龋齿高发,黄曲霉素B在食品中的浓度与肝癌患病率呈正相关,吸烟与支气管肺癌,某些地区的民族某种病低发和高发,即使移民到某国几代人后仍与该国居民的患病率(或发病率)水平有显著差别。如果能像全球疾病监测那样,在监测点同样可以做到证候的监测,在同监测的相同人群样本中2次以上的调查,就可以提供时间动态变化。城镇的居民委员会或农村的行政村均为自然人群。答:p=0.80,d=0.1 ,p=0.10.80=0.08,设定=0.05 代入公式4-6:即至少需调查97例40岁以上阳痿病人。设计例题8 现欲抽样调查惊恐伤肾证在阳痿病人中的比例(总体率

42、)。根据笔者调查经验约为5%;要求样本现患率周围而不超过后者的20%(1/5)范围内;问需要调查多少人?答:p=0.05,d=0.2 ,p=0.20.05=0.01,设定=0.05 代入公式4-7: 2Kappa检验的统计量 为Kappa值,简记为K,计算即至少需要调查1824例阳痿患者。如果一次抽样调查试图同时了解若干个证候的现患率,则根据偏大估计的原则,选择那个需要最大样本含量参数。 用sin-1(反正弦)运算注意事项:如用计算器(例如SHARP scientific calculator 506A型),必须调到 DEG模式才能正确运算。其它计算器均需按说明书反正弦运算的要求。第五节 抽样

43、调查容易产生的主要偏倚及其控制措施 随机误差(这里是抽样误差)不可避免,只能控制在一定的水平()并且可以计算出来。 系统误差即偏倚,纯系调查时的错误,它使总体的真即至少需要调查1824例阳痿患者。第五节 抽样调查容易产生的值发生系统偏移,即使增大样本含量也济于事,必须千方百计预防各种偏倚的发生。常见的主要偏倚有:一、选择性偏倚(selection bias):1未遵守随机抽样的原则,使样本对总体代表性差。控制措施:随机抽样。2.样本含量计算不精确,导致样本含量不够,使样本缺乏代表性。控制措施:偏大估计。 3调查对象依从性(Compliance,低于80为低依从性)低或各种原因回避问题无应答。一

44、般认为应答率80时,调查结果不能代表总体真实情况。控制措施:调查对象的健康教育,5抽样重复调查估计符合率。 值发生系统偏移,即使增大样本含量也济于事,必须千方百计预防各二、信息偏倚(information bias)1来自调查对象:有回忆偏倚和报告偏倚。控制措施:设法帮助回忆,使理解问题的要求。2来自调查者:对调查对象的询问和检查(四诊收集资料过程)不能同等对待,持有人上人意愿而失去客观公正。控制措施:盲法收集资料。3来自仪器检测手段:缺乏质量内控制和外控制。控制措施:质量内控制是对操作者统一培训、统一型号的仪器和试剂;质量外控制是对操作者盲法使用标准样品并规定警告线和最大容许线。 第六节 横

45、断面调查资料的SAS程序统计分析(一):描述性统计 二、信息偏倚(information bias)第六节 横描述性统计分(descriptive analysis):病或证候按不同地区、时间、人群特征进行归类并描述其分布频率,计算计量的各种统计量,以及正态性检验等。 一、一般性统计描述设计例题9 男性阳痿病人的调查资料如表1,试作分析描述性统计分(descriptive analysis):病可见,K值实际为两个差值之比,分母为(1期望率),即非偶然机会造成的一致率;分子称为校正后的一致率,它是实际观察到的一致率和可能由于偶然机会造成的期望率之差值,差值越大,说明实际观察到的一致率远比由于机

46、会造成的期望一致率高。K值为经校正后一致率与非机会造成一致率的比值。配对四格表资料的期望率Pe 、实际观察一致率PA分别为: Pe =(a+b) (a+c)/n+ (b+d) (c+d)/ n / n = (a+b) (a+c)+ (b+d) (c+d) / n2 ( 10.15) PA = (a+d)/n ( 10.14)配对四格表资料的Kappa值可简化为式(10.16): K = 2(adbc) / (a+b) (a+c) +(b+d) (c+d) (10.16 可见,K值实际为两个差值之比,分母为(1期望率),即非偶然H0:两者吻合,一致性好;H1:两者不吻合,一致性不好。=0.05。这是是双向有序且属性相同的33方表资料. 可用McNemar检验与Kappa检验。使用SPSS11.5统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论