医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案_第1页
医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案_第2页
医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案_第3页
医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案_第4页
医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 定量资料的统计描述PAGE 4-PAGE 871参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数2非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用范围广,可适用于任何类型资料参数检验 优点:资料信息利用充分;检验效能较高 缺点:对资料的要求高;适用范围有限2非参数检验 优点:适用范围广,可适用于任何类型的资料 缺点:检验效能低,易犯型错误凡适合参数检验的资料,应首选参数检验 对于符合参数检验条件者,采用非参数检验,其检验

2、效能低,易犯型错误 第一章 绪论1.举例说明总体和样本的概念。研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其

3、红细胞数,组成样本,其样本含量为2000人。2.简述误差的概念。误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。3.举例说明参数和统计量的概念。某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据

4、样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。4.简述小概率事件原理。当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章 调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施不能用随机化分组来平衡混杂因素对调查结果的影响。2.简述调查设计的基本内容。明确调查目的和指标确定调查对象和观察单位确定调查方法确定调查方式确定调

5、查项目和调查表制定资料整理分析计划制定调查的组织计划。3.试比较常用的四种概率抽样方法的优缺点。(1)单纯随机抽样 优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。(2)系统抽样 优点是:易于理解,简便易行容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差实际工作中一般按

6、单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。(3)分层抽样 优点是:减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。(4)整群抽样 优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差,。4.常用的非概率抽样方法有哪些?有偶遇抽样、立意抽样、定额抽样

7、、雪球抽样等。5.简述调查问题的顺序安排。调查问题顺序安排总原则:符合逻辑一般问题在前,特殊问题在后易答题在前,难答题在后如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题敏感问题一般放在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。二、最佳选择题1. 实验性研究与观察性研究的根本区别在于A. 抽样方法不同B. 研究对象不同C. 是否设立对照组D. 假设检验方法不同E. 是否人为施加干预措施2. 以下抽样方法中不属于概率抽样的是A. 单纯随机抽样B. 系统抽样C. 整群抽样D. 分层抽样E. 雪球抽样3. 条件相同时,下列抽样方法中

8、抽样误差最大的是 A. 单纯随机抽样B. 系统抽样C. 分层抽样D. 整群抽样E. 无法直接比较4. 下列关于调查设计的叙述,正确的是A. 明确调查目的是调查研究最核心的问题B. 采用抽样调查还是普查是由该地区的经济水平决定的C. 调查设计出现缺陷时,可以通过相应的统计分析方法弥补D. 一旦制定了调查研究计划,在实际操作过程中,就不可改变E. 调查的质量控制主要在调查问卷设计阶段5. 为了解乌鲁木齐市儿童的肥胖状况,分别从汉族、维吾尔族、哈族、回族等民族中随机抽取部分儿童进行调查,这种抽样方法属于A. 单纯随机抽样B. 分层抽样C. 系统抽样D. 整群抽样E. 多阶段抽样6. 某县有30万人口

9、,其中农村人口占80%,现欲对农村妇女的计划生育措施情况进行调查,调查对象应为A. 该县所有的已婚夫妻B. 该县所有的农村妇女C. 该县所有的育龄期妇女D. 该县所有的已婚妇女E. 该县所有已婚育龄期农村妇女7. 欲了解某地区狂犬病死亡人数上升的原因,较适宜的抽样方式为A. 单纯随机抽样B. 整群抽样C. 分层抽样D. 典型调查E. 普查8. 普查是一种全面调查的方法,与抽样调查相比,叙述正确的是A确定普查观察单位非常简单B普查适于发病频率较低疾病的调查C普查不易获得反映平均水平的统计指标D因涉及面广普查可产生较大的抽样误差E普查更易统一调查技术,提高调查质量9. 以下五个问题中,最符合调查问

10、卷设计要求的是A你一个月工资多少?B你一个月吃多少克盐?C你是否有婚外恋:有 无D你和你的妈妈认为女孩几岁结婚比较好?E如果只生一个孩子,你希望孩子的性别是:女 男 男女均可1.E2.E3.D4.A5.B6.E7.D8.A9.E第三章 实验研究设计【思考与练习】一、思考题1. 实验设计根据对象的不同可分为哪几类?2. 实验研究中,随机化的目的是什么?3. 什么是配对设计?它有何优缺点?4. 什么是交叉设计?它有何优缺点?5. 临床试验中使用安慰剂的目的是什么?二、案例辨析题“三联药物治疗士兵消化性溃疡”一文中,对20002006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。内镜检

11、测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。该结论是否正确?如果不正确,请说明理由。 三、最佳选择题1. 实验设计的三个基本要素是A. 处理因素、实验效应、实验场所B. 处理因素、实验效应、受试对象C. 受试对象、研究人员、处理因素D. 受试对象、干扰因素、处理因素E. 处理因素、实验效应、研究人员2. 实验设计的三个基本原则是A. 随机化、对照、重复B. 随机化、对照、盲法C. 随机化、重复、盲法 D. 均衡、对照、重复E. 盲法、对照、重复3. 实验组与对照组主要不同之处在于A. 处理因素

12、B. 观察指标C. 抽样误差D. 观察时间E. 纳入、排除受试对象的标准4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。7天后观察两组幼猪的存活情况。该研究采用的是 A. 空白对照B. 安慰剂对照C. 实验对照D. 标准对照E. 自身对照5. 观察指标应具有A. 灵敏性、特异性、准确度、精密度、客观性B. 灵敏性、变异性、准确度、精密度、客观性C. 灵敏性、特异性、变异性、均衡性、稳定性D. 特异性、准确度、稳定性、均衡性、客观性E. 灵敏性、变异性、准确度、精密度、均衡性 6. 比较两

13、种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A. 选择性偏倚B. 测量性偏倚C. 混杂性偏倚D. 信息偏倚E. 失访性偏倚7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验, 该实验设计方案是A. 随机区组设计B. 完全随机设计C. 析因设计D. 配对设计E. 交叉设计8. 在某临床试验中,将180例患者随机分为两组,实验组给予试验药对照药的模拟剂,对照给予对照药试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。本试验中采用的控制偏倚的方法有A. 单盲、多中心B. 随机化、多中心C. 随机化、单盲D. 随机化、双盲双模拟E. 双盲双模拟、多中心

14、9. 临床试验的统计分析应主要包括A. 可比性分析、疗效评价、安全性评价B. 可比性分析、优效性分析、劣效性分析C. 可比性分析、安全性评价、可行性分析D. 优效性分析、等效性分析、安全性评价E. 疗效评价、安全性评价、可行性分析10. 药品上市后应用阶段进行的临床试验属于A. = 1 * ROMAN I期临床试验B. = 2 * ROMAN II期临床试验C. = 3 * ROMAN III期临床试验 D. = 4 * ROMAN IV临床试验E. 现场试验四、综合分析题1. 欲将16只豚鼠随机分为两组,某研究员闭上眼睛从笼中抓了8只豚鼠作为实验组,剩下8只作为对照组。该分组方法是否正确?若

15、不正确,请说明理由。2. 某研究人员欲将12只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分配到实验组和对照组,应如何分组?3. 某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠血管紧张素的影响,并欲分析两药联合应用是否更为有效。(1) 你认为该研究最好采用何种实验设计方案?并说明理由。(2) 请帮该研究者实现32只大鼠的随机分组。【习题解析】一、思考题1. 根据受试对象不同,实验可以分为动物实验、临床试验和现场试验三类。动物实验的受试对象为动物,也可以是器官、细胞或血清等生物材料;临床试验的受试对象通常为患者,持续时间可以较长,目的在于评价药物或治疗方法的疗

16、效;现场试验的受试对象通常是未患某种疾病的人群,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,了解其在人群中产生的预防效果。2. 实验研究中,随机化的目的在于使非处理因素在实验组和对照组中的影响相当,提高对比组间的可比性,使实验结论的外推具有科学性和可靠性。随机化是对资料进行统计推断的前提。3. 配对设计是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。用以配对的因素应为可能影响实验结果的主要混杂因素。在动物实验中,常将窝别、性别、体重等作为配对因素;在临床试验中,常将病情、性别、年龄等作为配对因素。配对设计和完全随机设计相比,其优点在于可增强处

17、理组间的均衡性、实验效率较高;其缺点在于配对条件不易严格控制,当配对失败或配对欠佳时,反而会降低效率。在临床试验中,配对的过程还可能延长实验时间。4. 交叉设计是一种特殊的自身对照设计。其中22交叉设计首先是将同质个体随机分为两组,每组先接受一种处理措施,待第一阶段结束后,两组交换处理措施进行第二阶段的实验,这样每个个体都接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。交叉设计一般不适于具有自愈倾向或病程较短的疾病研究。交叉设计的优点有:节约样本含量;能够控制个体差异和时间对处理因素的影响;在临床试验中同等地考虑了每个患者的利益。其缺点有:处理时间不能太长;当受试对象的

18、状态发生根本变化时,后一阶段的处理将无法进行;受试对象一旦在某一阶段退出试验,就会造成数据缺失。5. 临床试验中使用安慰剂,目的在于消除由于受试对象和试验观察者的心理因素引起的偏倚,还可控制疾病自然进程的影响,显示试验药物的效应。二、案例辨析题该结论不正确。研究某治疗方案对某病患者的治疗效果需进行临床试验,应遵循实验设计的三个基本原则,即对照、随机化和重复。只有设立了对照才能较好地控制非处理因素对实验结果的影响,不设立对照往往会误将非处理因素造成的偏倚当成处理效应,从而得出错误的结论。此研究仅纳入38例消化性溃疡患者,并未设立相应的对照组。而且这38例患者接受治疗的时间为2000年至2006年

19、,时间跨度太大,可能对研究结果造成影响的因素很多,在没有对照的情况下,不能控制非处理因素对试验结果的影响,其研究结论不具有说服力。三、最佳选择题1.B 2.A 3A. 4.A 5.A 6.C 7.C 8.D 9.A 10.D四、综合分析题1. 解:该分组方法不正确。随机不等于随便,随机的含义是指每只动物都有相同机会进入实验组或对照组,而该分组方法由于豚鼠活跃程度不相同,进入各组的机会就不同,较活跃的豚鼠进入实验组的机会增大,因此破坏了随机化原则。2. 解:先将6对小鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第18行最左端开始横向连续取12个两位数字。事先规定,每一对中,随机数较小者

20、序号为1,对应于A组,随机数较大者序号为2,对应于B组。分配结果见表3-1。表3-1 配对设计的12只小鼠随机分组的结果对子数123456动物编号随机数129688173165196902836075序号122112121212组别ABBAABABABABSPSS操作数据录入:打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量number和pair,再点击Data View标签,录入数据(见图3-1,图3-2)。图3-1 Variable View窗口内定义要输入的变量numbe

21、r和pair图3-2 Data View窗口内录入数据分析:TransformRandom Number Generators Active Generator InitializationSet Starting PointFixed ValueValue: 键入20071222设定随机种子为20071222OKTransformComputeTarget Valuable: 键入 randomNumeric Expression: RV.Uniform(0,1) 产生范围在01之间的伪随机数OKTransformRank CasesVariables(s): randomBy: pair对

22、每个对子中的两个伪随机数进行排序OK注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中用编程来完成本题。FileNewSyntax,打开Syntax窗口,键入如下程序:input program.开始数据录入程序段 numeric k b n number pair (F8.0)/random(F8.6). string treat(A1). compute k=2.处理组为2 compute b=6.对子数为6 compute n=b*k. loop number=1 to n. compute pair=rnd(number-1)/k+0.5). e

23、nd case. compute k=lag(k). end loop. end file.end input program.结束数据录入程序段set seed 20071222.设定随机种子为20071222compute random=uniform(1).产生范围在01之间的伪随机数rank variables=random by pair.对伪随机数排序formats rrandom(F3.0).compute treat=substr(ABCDEFGHIJKLMN ,rrandom,1).根据伪随机数的序号进行分组list number pair treat.结果中显示受试对象编号

24、及被分到的处理组在Syntax窗口中选择RunAll 提交运行。注:程序中的b(即对子数)可根据实际情况赋予不同的值。随机区组设计受试对象的分配也可以用此程序来实现,仅需将k值设为处理组数,b值设为相应的区组数。结果及解释Data View窗口图3-3 SPSS编程实现受试对象随机分配结果Output窗口Listnumberpairtreat11A21B32A42B53B63A74A84B95B105A116B126A编程实现随机分配的结果见data view窗口(图3-3)或output 窗口。可以看出12只小鼠被随机分配到A组和B组。在用此程序进行随机分组前,规定A组表示实验组,B组表示对

25、照组。则1,3,6,7,10,12号小鼠被分到实验组,2,4,5,8,9,11号小鼠被分到对照组。3. 解: (1) 该研究最好采用22析因设计的实验方案,如表3-2所示。因为析因设计不仅可以检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间的交互作用。因此既可分析MEL和TXL对糖尿病模型大鼠血管紧张素的影响,又可分析两药合用时的交互效应。表3-2 MEL和TXL对32只大鼠血管紧张素影响的析因设计MELTXL(用)b1(不用)b2(用)a1a1b1a1b2(不用)a2a2b1a2b2(2) 先将32只大鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第2列最上端开始纵向连

26、续取32个两位数字。对随机数字排序,事先规定,序号为18的豚鼠分为A组,序号为916的大鼠分为B组,序号为1724的大鼠分为C组,序号为2532的大鼠分为D组,分配结果见表3-3。表3-3 32只大鼠随机分组的结果编号12345678910111213141516随机数17367743282276683971355096938756序号18251154221992071430282715分组AADBAACCBCABDDDB编号17181920212223242526272829303132随机数72969464447617177629804056654396序号2131291713232324

27、6261016181232分组CDDCBCAACADBBCBDSPSS操作数据录入:打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量number,见图3-4。再点击Data View标签,录入变量number的值,即从132。图3-4 Variable View窗口内定义要输入的变量number分析:TransformRandom Number GeneratorsActive Generator InitializationSet Starting PointFixed ValueValue: 键入20071222设定随机种子为20071212O

28、KTransformComputeTarget Valuable: 键入 randomNumeric Expression: RV.Uniform(0,1) 产生范围在01之间的伪随机数OKTransformRank CasesVariables(s): random对伪随机数排序OKTransformRecodeInto Different VariablesInput VariableOutput Variable: Rrandom原变量名为伪随机数的序号RrandomOutput VariableName: 键入treat新变量名为treat点击Change点击Old And New V

29、aluesOld ValueRange: 键入1 through 8 Output variables are stringsNew ValueValue: 键入ARrandom值为18时,treat值为AOldNew: 点击AddOld ValueRange: 键入9 through 16 New ValueValue: 键入BRrandom值为916时,treat值为BOldNew: 点击AddOld ValueRange: 键入17 through 24 New ValueValue: 键入CRrandom值为1724时,treat值为COldNew: 点击AddOld ValueRan

30、ge: 键入25 through 32 New ValueValue: 键入DRrandom值为2532时,treat值为DOldNew: 点击AddContinueOK注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中用编程来完成本题。FileNewSyntax,打开Syntax窗口,键入如下程序:input program.开始数据录入程序段 numeric n k number group (F8.0)/random(F8.6). string treat(A1).compute n=32.受试对象总数为32compute k=4.4个处理组 lo

31、op number=1 to n. end pute n=lag(n).compute k=lag(k). end loop. end file.end input program.结束数据录入程序段compute random=uniform(1).产生范围在01之间的伪随机数set seed 20071222.设定随机种子为20071222rank variables=random .对伪随机数排序compute group = trunc(rrandom-1)*k/n ).formats group(F3.0).compute treat=substr(ABCDEFGHIJKLMN,gr

32、oup+1,1).根据伪随机数的序号进行分组list number treat.结果中显示受试对象编号及被分到的处理组注:程序中的n(受试对象总数)、k(即处理组数)可根据实际情况赋予不同的值。输出结果Data View窗口(由于篇幅限制,仅列出前16例受试对象的分组情况)图3-5 SPSS编程实现受试对象随机分配结果Output窗口ListnumbertreatnumberTreat1D17C2D18C3B19B4C20C5D21B6D22A7B23C8C24D9D25C10A26A11D27B12B28A13C29A14B30A15A31B16A32D编程实现随机分配的结果见data vi

33、ew 窗口(图3-5)或output 窗口。可以看出32只大鼠被随机分配到A、B、C、D组。在用此程序进行随机分组前,事先规定A、B、C、D分别对应于对照组、MEL组、TXL组和MEL+TXL组。从分配结果中可以看出:10,15,16,22,26,28,29,30号大鼠被分到对照组;3,7,12,14,19,21,27,31号大鼠被分到MEL组;4,8,13,17,18,20,23,25号大鼠被分到TXL组;1,2,5,6,9,11,24,32号大鼠被分到MEL+TXL组。第四章 定量资料的统计描述 【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,

34、。不同点:均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。2. 同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。3. 极差、四分位数

35、间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;标准差用于描述正态分布或近似正态分布资料的离散程度;变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。4. 正态分布的特征:正态曲线在横轴上方均数处最高;正态分布以均数为中心,左右对称;正态分布有两个参数,即位置参数和形态参数;正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间内的面积为95.00%;区间内的面积为99.00%

36、。5通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。二、案例辨析题统计描述时,常见错误是对定量资料的描述均采用均数、标准差,。正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资料的血清总胆固醇的频数分布图如下:频数图4-1 血清甘油三酯(TG)的频数分布可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数

37、和四分位数间距,计算结果为:集中趋势指标 (mmol/L)离散程度指标 四分位数间距= (mmol/L) 三、最佳选择题1. B 2. E 3. B 4. C 5. D 6. E 7. A 8. D 9. D四、综合分析题1. 解:输出结果频数图4-4 尿总砷的频数分布图 由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。频数输出结果 图4-5 尿总砷对数的频数分布图由图可见lgx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。(2) 燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。输出结果结果中的Mean表示尿总砷对数值的均数为1.

38、1831,求其反对数,得到几何均数。2. 解: (1) 已知健康人的血清TC服从正态分布,故采用正态分布法制定95%的参考值范围。下限:(mmol/L) 上限:(mmol/L)该市4555岁健康男性居民的血清总胆固醇的95%参考值范围为2.96 mmol/L6.72mmol/L。(2) 4555岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。查标准正态分布曲线下的面积表(附表2)得: 该市4555岁健康男性居民中,血清总胆固醇在3.25mmol/L5.25mmol/L范围内

39、的比例为61.79%。 (3) 作标准化变换查标准正态分布曲线下的面积表(附表2)得:该市4555岁健康男性居民中,血清总胆固醇低于3.80mmol/L所占的比例为14.01%。3. 解:输出结果50 60 70 80 90 100 110 120 130 140 150 频数 跟骨硬度指数图4-8 跟骨硬度指数的频数分布图由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百分位数法,制定双侧95%参考值范围。输出结果StatisticsSINValid120 Missing0Percentiles2.558.0167 97.5143.6618即该地区3035岁健康女

40、性的SI的95%参考值范围为(58.02, 143.66)。第五章 定性资料的统计描述【习题解析】一、思考题1 = 1 * GB3 计算相对数应时有足够的观察单位数; = 2 * GB3 分析时不能以构成比代替率; = 3 * GB3 计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率; = 4 * GB3 相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率; = 5 * GB3 样本率或样本构成比的比较应作假设检验。2. 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以

41、说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。3. 如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均

42、发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。5. = 1 * GB3 标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不相同。因此,标准化率仅用于相互间的比较,实际水平应采用未标化率来反映。 = 2 * GB3 样本的标准化率是样本指标,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。 = 3 * GB3 注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别

43、死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。 = 4 * GB3 各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。二、案例辨析题该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。三、最佳选择题1. B 2. A 3. D 4. E 5. D 6. D 7. C 8. C 9. B

44、四、综合分析题1. 解:表5-3 经常吸烟与慢性阻塞性肺病(COPD)的关系分 组调查人数经常吸烟经常吸烟率(%)是否COPD患者35623112564.89非COPD患者47918329638.20COPD患者的经常吸烟率:231/356100%=64.89%非COPD患者经常吸烟率:183/479100%=38.20%COPD患者的经常吸烟率比非COPD患者高26.69%还需进一步对作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。 输出结果2. 解: 表5-4 某地居民19982004年某病死亡率(1/10万)动态变化年份符号死亡率

45、绝对增长量发展速度增长速度 累计逐年定基比环比定基比环比1998a0160.51999a1144.2-16.3-16.30.900.90-0.10-0.102000a2130.0-30.5-14.20.810.90-0.19-0.102001a3120.2-40.3-9.80.750.92-0.25-0.082002a485.6-74.9-34.60.530.71-0.47-0.292003a569.5-91.0-16.10.430.81-0.57-0.192004a638.5-122.0-31.00.240.55-0.76-0.45该病死亡率的平均发展速度该病死亡率的平均增长速度3. 解:因

46、为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg阳性率的影响,应先进行标准化再进行比较。根据本题资料,以男、女合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。表5-5 直接法计算某地不同年龄、性别人群的HBsAg标准化阳性率(%)年龄组标准人口数男性女性原阳性率预期阳性数原阳性率预期阳性数 010812.3024.902.3225.092014732.7139.972.7240.024015466.0693.636.4699.866014087.52105.858.60121.04合 计5508(N)5.11264 ()4.86286()男性HBsA

47、g标准化阳性率: 女性HBsAg标准化阳性率: 可见,经标准化后女性HBsAg阳性率高于男性。输出结果注:将SPSS输出的sp1的和除以sp的和,得男性HBsAg标准化阳性率;sp2的和除以sp的和,得女性HBsAg标准化阳性率。第六章 总体均数的估计【习题解析】一、思考题1抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。2样本均数的抽样分布的特点有:各样本均数未必等于

48、总体均数;样本均数之间存在差异;样本均数服从正态分布;样本均数的变异范围较原变量的变异范围小;随着样本含量的增加,样本均数的变异范围逐渐缩小。3标准差与标准误的区别在于:计算公式:标准差为,标准误为;统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。标准差与标准误的联系:当样本量一定时,标准误随标准差的增加而增加,公式为:。4数理统计的中心极限定理:从均数为,标准差为的正态总体中进行独

49、立随机抽样,其样本均数服从均数为,标准差为的正态分布;即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增加时,其样本均数的分布逐渐逼近于均数为,标准差为的正态分布。越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。计算总体均数置信区间的通式为:;当样本含量较大时,例如,分布近似标准正态分布,可用值代替值,作为置信区间的近似计算,相应的置信度为时,总体均数的置信区间为:。5置信区间与医学参考值范围的区别见表6-1。表6-1 均数的置信区间与医学参考值范围的区别区别均数的置信区间医学参考值范围意义按一定的置信度()估计的总体均

50、数所在的区间范围大多数“正常人”的某项解剖、生理、生化指标的波动范围计算公式未知:()未知而n较大:()已知:()正态分布法: 双侧95%的参考值范围为()偏态分布法:单侧下限95%的参考值范围为单侧上限95%的参考值范围为用途用于总体均数的估计或假设检验判断观察对象的某项指标正常与否,为临床诊断提供参考二、案例辨析题该学生误用医学参考值范围的公式来计算总体均数的95%置信区间,正确计算公式为:,二者的主要区别在于,计算医学参考值范围时应该用“标准差”,计算置信区间时应该用标准误。根据置信区间的公式算得2005年该市7岁男孩身高的95%置信区间为(122.01,122.99)。 三、最佳选择题

51、1C 2E 3E 4A 5E 6A 7E 8B 四、综合分析题1解:由于该样本为小样本,故用公式估计总体均数95%置信区间为(8.27, 10.03)mm/h;用公式估计总体均数99%置信区间为(7.96, 10.34)mm/h。输出结果Descriptives StatisticStd. Error红细胞沉降率Mean9.1481.4256395% Confidence Interval for MeanLower Bound8.2697 Upper Bound10.0266 5% Trimmed Mean9.1795 Median9.4288 Variance4.529 Std. Devi

52、ation2.12816 Minimum5.01 Maximum12.68 Range7.67 Interquartile Range2.73 Skewness-.250.464Kurtosis-.429.902DescriptivesStatisticStd. Error红细胞沉降率Mean9.1481.4256399% Confidence Interval for MeanLower Bound7.9576 Upper Bound10.3386 5% Trimmed Mean9.1795 Median9.4288 Variance4.529 Std. Deviation2.12816 M

53、inimum5.01 Maximum12.68 Range7.67 Interquartile Range2.73 Skewness-.250.464Kurtosis-.429.9022解:抽样误差为1.82;由于该样本为大样本, 故用公式估计正常人ET含量的95%置信区间为(77.43, 84.57)ng/L。输出结果Descriptives StatisticStd. Error血浆内皮素Mean80.98911.8203395% Confidence Interval for MeanLower Bound77.3771 Upper Bound84.6010 5% Trimmed Mea

54、n80.8639 Median79.5837 Variance331.362 Std. Deviation18.20334 Minimum34.02 Maximum129.20 Range95.17 Interquartile Range21.75 Skewness.182.241Kurtosis.140.4783解:由于两样本均为小样本, 故用公式估计总体均数95%置信区间,肺心病组血液二氧化碳分压的95%置信区间为(7.86 , 13.10)kpa;慢性支气管炎合并肺气肿组血液二氧化碳分压的95%置信区间为(5.41 , 6.83)kpa。由于方差不齐,应当选择方差不齐时的结果。两组患者的

55、血液二氧化碳分压差值的95%置信区间为(1.66, 7.05)kpa,该区间不包含0,可以认为肺心病患者与慢性支气管合并肺气肿患者的均数不同,肺心病患者较高。输出结果Descriptives 组别 StatisticStd. Error二氧化碳压肺心病组Mean10.47821.2656495% Confidence Interval for MeanLower Bound7.8600 Upper Bound13.0964 5% Trimmed Mean10.2266 Median10.3473 Variance38.444 Std. Deviation6.20035 Minimum1.59

56、Maximum24.30 Range22.71 Interquartile Range7.13 Skewness.615.472Kurtosis-.030.918慢性支气管炎合并肺气肿组Mean6.1228.3380995% Confidence Interval for MeanLower Bound5.4151 Upper Bound6.8304 5% Trimmed Mean6.1266 Median6.0160 Variance2.286 Std. Deviation1.51198 Minimum2.93 Maximum9.25 Range6.32 Interquartile Rang

57、e1.78 Skewness-.081.512Kurtosis.192.992Group Statistics 组别NMeanStd. DeviationStd. Error Mean二氧化碳压肺心病组2410.47826.200351.26564 慢性支气管炎合并肺气肿组206.12281.51198.33809Independent Samples Test Levenes Test for Equality of Variancest-test for Equality of MeansFSig.tdfSig. Mean DifferenceStd. Error Difference95

58、% Confidence Interval of the Difference LowerUpper二氧化碳压Equal variances assumed17.431.0003.06142.0044.355471.422901.483947.22700Equal variances not assumed 3.32526.238.0034.355471.310021.663877.04706第七章 假设检验1、解释零假设与备择假设的含义。 零假设又称无效假设或无差异假设,记为H0,表示目前的差异是由抽样误差引起的;备择假设又称对立假设,记为H1,表示目前的差异是因为比较的对象之间存在本质不同

59、造成的。2、简述假设检验的基本步骤。 假设检验的基本步骤如下:(1)建立检验假设,确定检验水准。(2)计算检验统计量。(3)确定P值,作出统计推断。3、比较单侧检验与双侧检验的区别。 选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。例如,在临床试验中,比较甲、乙两种治疗方法的疗效有无差异,目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。若从专业角度无法确定的情况下,一般应采用双侧检验。4、解释I型错误、II型错误和检验效能,并说明它们之间的关系。拒绝实际成立的H0所犯的错误称为I型错误,记为。不拒绝实际不成立

60、的H0所犯的错误称为II型错误,记为。如果两个总体参数间确实存在差异,即H1:0成立,按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝H0)的能力被称为检验效能,记为(1-)。三者的关系为:当样本量确定时,与成反比,与(1-)成正比。如果把设置得很小,势必增加犯II型错误的概率,从而降低检验效能;反之,如果把重点放在减少上,势必增加犯I型错误的概率,从而降低了置信度。要同时减小和,只有通过增加样本含量来实现。5、简述假设检验与置信区间估计的联系。假设检验与置信区间估计的联系是:二者都属于统计推断的范畴,且统计推断结论是等价的。此外,置信区间在回答差别有无统计学意义的同时,还能提供一些

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论