版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、卫生统计学课程复习资料一、名词解释:1. 计量资料2.计数资料3. 等级资料4.总体5. 样本6.变异7. 频数表8.算术均数9. 中位数10.极差11. 方差12.标准差13. 变异系数14.正态分布15. 标准正态分布16.统计推断17. 抽样误差18.标准误19. 可信区间20.参数估计21. 假设检验中 P 的含义22.I型和 II 型错误23. 检验效能24.检验水准25. 方差分析26.随机区组设计27. 相对数28.标准化法29. 构成比30.Yates校正31. 非参数统计32.直线回归33. 相关系数34.统计图35. 回归系数、单项选择题:1. 观察单位为研究中的D A.
2、样本B.全部对象C.影响因素 D.个体2. 总体是由 CA. 个体组成B.研究对象组成 C.同质个体组成 D.研究指标组成3. 抽样的目的是 B A. 研究样本统计量B.由样本统计量推断总体参数C. 研究典型案例研究误差D.研究总体统计量4. 参数是指 B A. 参与个体数B.总体的统计指标C. 样本的统计指标D.样本的总和5. 关于随机抽样,下列哪一项说法是正确的? AA. 抽样时应使得总体中的每一个个体都有同等的机会被抽取B. 研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D. 为确保样本具有更好的代表性,样本量应越大越好6. 各观察值均加(或减)同一数后 B
3、 A. 均数不变,标准差改变 B. 均数改变,标准差不变C. 两者均不变D.两者均改变7. 比较身高和体重两组数据变异度大小宜采用 A A. 变异系数 B. 方差 C. 极差 D. 标准差8. 以下指标中 ( ) 可用来描述计量资料的离散程度。A. 算术均数 B. 几何均数 C. 中位数 D. 标准差9. 血清学滴度资料最常用来表示其平均水平的指标是A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数10. 两样本均数的比较,可用A. 方差分析 B. t 检验C.C 两者均可 D. 方差齐性检验第1页共 7 页11. 配伍组设计的方差分析中,配伍 等于A.总-误差B.总-处理 C.总-
4、 处理+误差D. 总-处理- 误差第4页共7页在均数为标准差为 的正态总体中随机抽样,A. 1.961.96 X完全随机设计方差分析的检验假设是 A.各处理组样本均数相等C.各处理组样本均数不相等 已知男性的钩虫感染率高于女性。 乡男多于女,适当的比较方法是 A.分别进行比较B.C.不具备可比性,不能比较 率的标准误的计算公式是B. 1.96C.10.052, S|XD.七0.05.,;2,各处理组总体均数相等 各处理组总体均数不全相等B.D.今欲比较甲乙两乡居民的钩虫感染率,D.)的概率为5%SXD A. . p(1 P) B.n非参数统计应用条件是A.总体是正态分布C.不依赖于总体分布 下
5、述哪些不是非参数统计的特点?A.不受总体分布的限定C.适用于等级资料 设配对设计资料的变量值为B.D.C.B.D.X 和 X2,A.把X与X2的差数绝对值从小到大编秩C.把X1和X2综合按绝对值从小到大编秩 秩和检验和t检验相比,其优点是A.计算简便,不受分布限制 对两样本均数作比较时,已知A. t检验B.u检验等级资料的比较宜用A. t检验B.秩和检验但甲乡人口女多于男,而乙 D 两个率比较的X 2检验对性别进行标准化后再比较D D.P(1 P)nC 若两组比较,要求两组的总体方差相等 要求样本例数很大D 多数非参数统计方法简单,易于掌握检验效能总是低于参数检验则配对资料的秩和检验A 把X和
6、X?综合从小到大编秩 把X与Xz的差数从小到大编秩A C.检验效能高D.抽样误差小C B.D.B.m、n2均小于30 ,总体方差不齐且分布呈偏态,宜用C.公式更为合理C.秩和检验D. F检验B F检验 D. 四格表两个小样本比较的假设检验,应首先考虑A. t检验B.C.任选一种检验方法D.对于配对比较的秩和检验,其检验假设为A. 样本的差数应来自均数为B. 样本的差数应来自均数为C. 样本的差数来自中位数为秩和检验资料符合哪种检验的条件0的正态总体0的非正态总体0的总体D. 样本的差数来自方差齐性和正态分布的总体用最小二乘法确定直线回归方程的原则是各观察点 A.距直线的纵向距离相等B.C.与直
7、线的垂直距离相等D.实验设计的三个基本要素是A.受试对象、实验效应、观察指标C.齐同对比、均衡性、随机化 实验设计的基本原则A.随机化、盲法、设置对照C.随机化、盲法、配对D.B.D.实验设计和调查设计的根本区别是A.实验设计以动物为对象B.X2检验D距直线的纵向距离的平方和最小与直线的垂直距离的平方和最小DB.随机化、重复、设置对照处理因素、受试对象、实验效应D 重复、随机化、配对随机化、重复、设置对照D 调查设计以人为对象12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.C. 实验设计可随机分组D.标准正态分布的均数与标准差分别为A.0 与 1
8、B.1正态分布有两个参数A. 越大若X服从以A. 1.64B.B.实验设计可人为设置处理因素A 与0C.0 与0D.1 与1与 ,()相应的正态曲线的形状越扁平。 越小95百分位数等于2.58 E C.越小 C. 越大为均数和标准差的正态分布,则1.961.64C.D.X的第D.C 计算某地某年麻疹发病率,其分母为A.该地体检人数B.D. 该地平均患者人数E.两个独立小样本计量资料比较的假设检验,A.用t检验 B. 用U检验 C.D.检验或Wilcoxon秩和检验均可E.若决定系数为0.04,则下列说法错误的是该地年平均就诊人数 该地易感人群人数 首先应考虑用Wilcox on秩和检验资料符合
9、t检验还是Wilcox on秩和检验条件A 该地年平均人口数E 28.29.30.31.32.33.34.35.36.37.38.39.40.第12页共7页B. 决定系数即是r2C.D.相关系数r = 0.2E.老年人口系数下降,可使A.粗死亡率上升 B.粗死亡率下降D. 婴儿死亡率下降E.标准化以后的总死亡率A.标化后的率比原来的率低B.C. 反映了实际水平D.E. 不随标准选择的变化而变化A.散点图中所有的实测点都排列在一条回归线上y的总变异中有4%可以由x的变化来解释 回归贡献相对较小B C. 婴儿死亡率上升以上都不对D 标化后的率比原来的率高反映了相对水平,仅作为比较的基础D 配对样本
10、差值的 Wilcox on符号秩检验,确定P值的方法为 A. T越大,P越大B.T越大,P越小C. T值在界值范围内,P小于相应的D. T值在界值范围内,P大于相应的E. T值即U值,查u界值表关于回归系数的描述,下列说法错误的是A. b 0,表示回归直线与y轴交点在原点上方B. b 0,回归直线与x轴平 C.b越大,则回归直线越陡C.调查设计以人为对象实验设计可人为设置处理因素E.两者无区别A 出生率上升 D.出生率下降E.生育率下降D. b 一般有单位E.实验设计和调查设计的根本区别是A.实验设计以动物为对象B.C.实验设计可随机分组D.少年儿童人口系数下降,可使A.粗死亡率上升 B.粗死
11、亡率下降 以下对于标准化法的描述错误的是b 0表示回归直线从左上方走向右下方D A. 标准化率是通过选择同一参照标准而计算的,目的是为了消除因年龄构成不同等混杂因素的影响, 从而达到可比性B. 样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,同样 需做假设检验C. 标准化率代表真实的死亡(或患病、发病)率水平D. 般在已知被标化组各年龄组死亡率时,宜采用直接法计算标准化率E. 当所比较的两组内部各分组率的变化呈现交叉或非平行变化趋势时,不宜采用标准化法多样本计量资料的比较,当分布类型不清时选择A.t检验 B.x 2检验回归系数的假设检验,其无效假设A. 3 =
12、1 B. 3* 0 估计样本含量时,所定第n类误差A.所要的样本含量愈大ED.所定的样本含量愈准确 欲计算某年新生儿死亡率,则应选用作为分母的是A.某年新生儿总数B.某年活产总数D.妊娠28周以上的妇女数 E.用以说明某现象发生的频率或强度的指标为A.率B.构成比当四个样本率比较,得到C.检验D.H检验E.F检验H)是E C.3> 0D.3< 0E.3 =0愈小,则A 3.所要的样本含量愈小C.不影响样本含量E.所定的样本含量愈粗糙DBC.20.05,3C.当年怀孕的妇女数妊娠28周以上出生并存活的新生儿相对比 D. 绝对数,则可以认为A.四个样本率都不相同C.四个样本率不同或不全
13、相同 成组设计两样本比较的秩和检验,其检验统计量A.以秩和较小者为TC.以例数较小者秩和为T四个总体率都不相同 四个总体率不同或不全相同T是B.以秩和较大者为TD. 以例数较大者秩和为TB.D.AE.均数E.以上都不对41.42.43.44.45.46.47.48.49.50.51.52.53.54.E. 当两样本例数不等时,可任取一样本的秩直线回归分析中,有直线回归方程Y?=0.004+0.0488X代入两点描出回归线。下面选项哪项正确? B A.所有实测点都应在回归线上B. 所绘回归直线必过点(X , Y)C.原点是回归直线与 Y轴的交点D.回归直线X的取值范围为(-1,1)E. 实测值与
14、估计值差的平方和必小于零研究A药抗癌效果,将患有某种肿瘤的大白鼠随机分为两组,一组未给药,一组饲服抗癌 A药;2周后检测体内存活的肿瘤细胞数。这种对照在实验设计中称为BA.实验对照B.空白对照C.安慰剂对照D.标准对照 E. 历史对照行X列表中,对于理论频数太小的情形,最好采用A A. 增大样本容量,以达到增大理论频数的目的B. 删去理论频数太小的格子所对应的行或列C. 理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并D. 性质不同的行或列中的实际频数合并E. 使用连续性校正公式直线相关分析中,对相关系数作假设检验,其目的是B A.检验相关系数r是否等于0 B.推断两变量间是否存在直
15、线相关关系C.检验两总体相关系数是否相等D.推断两变量间相关方向E.推断两变量间密切程度用最小二乘法确定直线回归方程的原则是B A.各观测点距直线的纵向距离相等B.各观测点距直线的纵向距离平方和最小C.各观测点距直线的垂直距离相等D.各观测点距直线的垂直距离平方和最小E.各观测点距直线的纵向距离最小为研究新药“胃灵丹”治疗胃病(胃炎、胃溃疡)疗效,在某医院选择40例胃炎和胃溃疡病人,随机分成实验组和对照组,实验组用胃灵丹治疗,对照组用公认有效的“胃苏冲剂”。这种对照在实验设计中称为D A.实验对照B.空白对照C.安慰剂对照D.标准对照 E. 历史对照某研究欲调查某市中学生对艾滋病的认识,从全市
16、40所中学随机抽取 4所,对该4所学校的全部学生实施问卷调查。该种抽样方法属于AA.整群抽样B.分层抽样C.系统抽样D.简单随机抽样E.多阶段抽样三、简答题:_1. 对于一组近似正态分布的资料,除样本含量n外,还可计算X,S和X 1.96S,问各说明什么?2. 说明频数分布表的用途。3. 试述正态分布的面积分布规律。4. 均数的可信区间与参考值范围有何不同?5. 假设检验中 和P的区别何在?6. 假设检验时,当 P 0.05,则拒绝Ho,理论依据是什么?7. 怎样正确选用单侧检验和双侧检验?8. 为什么假设检验的结论不能绝对化?9. 为什么不能以构成比代率?请联系实际加以说明。10. 方差分析
17、的基本思想和应用条件是什么?11. 为什么在方差分析的结果为拒绝H0、接受H之后,对多个样本均数的两两比较要用多重比较的方法12. 对于四格表资料,如何正确选用检验方法?13. 什么叫做非参数检验?它和参数检验有什么区别?14. 简述直线相关与秩相关的区别与联系。15. 统计表有哪些要素构成?制表的注意事项有哪些?16. 试述x 2检验的基本思想17. 非参数统计的特点和适用范围.18. 两组或多组等级资料的比较,为什么不能用x2检验,而用秩转换的非参数检验?19. 普通线图和半对数线图的主要区别是什么?20. 对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为
18、准?21. 某年级甲班、乙班各有男生50人。从两个班各抽取 10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么? 四、分析计算题:1. 某医生研究脑缺氧对脑组织中生化指标的影响,将出生状况相近的乳猪按出生体重配成7对共2组,随机接受两种处理,一组设为对照组,一组设为脑缺氧模型组,实验结果见下表第(1 )、( 2)、( 3)栏。试比较两组猪脑组织钙泵的含量有无差别。两组乳猪脑组织钙泵含量(g/g)乳猪号(1)对照组(2)试验组(3)差值d(4)=(2)-(3)10.35500.27550.079520.20000.2545-0.054530
19、.31300.18000.133040.36300.32300.040050.35440.31130.043160.34500.29550.049570.30500.28700.0180合计0.30862.某医院比较几种疗法对慢性胃炎病人的疗效:单纯西药组治疗79例,有效63例;单纯中药组治疗 54例,有效47例;中西医结合组治疗 68例,有效65例。问:该资料属何种资料?实验设计属何种设计?欲比较 3种疗法的疗效的差别,宜选用何种假设检验方法?写出该种检验方法的H0与;若求得的检验统计量为8.143,相应于0.05的检验统计量的临界值为5.99,你如何做出结论?根据你的结论,你可能犯哪一类统
20、计错误?3. 某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116 ( mg/L),血铅均数为1.81 ( mg/L)。服用果胶20天后再测,尿铅均数降为0.087 (mg/L),血铅均数降为0.73(mg/L),说明果胶驱铅的效果较好。请评述以上研究。4. 为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选20名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,面积减少百分率为 40%以上者为治疗有效。问:(1)如何将病人分组? (2)如何对结果进行统计分析 处理?5
21、. 试就下表资料分析比较甲、乙两医院乳腺癌手术后的5年生存率。甲、乙两医院乳腺癌手术后的5年生存率(%)腋下淋巴 结转移甲医院乙医院病例数生存数生存率病例数生存数生存率无453577.7730021571.67有71045068.38834250.60合计75548564.2438325767.10 126. 假定正常成年女性红细胞数 (10 /L)近似服从均值为4.18,标准差为0.29的正态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求:(1)变量X落在区间(4.00,4.50 )内的概率;(2)正常成年女性的红细胞数 95%参考值范围。7. 为了解某中药治疗原发性高血压的疗效,将
22、44名高血压患者随机分为两组。实验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如下表,问:该药治疗原发性高血压是否有效?两种疗法治疗原发性高血压的疗效分组例数有效有效率/%实验组232191.30对照组21523.818. 某研究者采用配对设计进行实验,比较2种抗癌药物对小白鼠肉瘤抑瘤效果,先将10只染有肉瘤小白鼠按体重大小配成 5个对子,每个对子内2只小白鼠随机接受两种抗癌药物,以肉瘤的重量为指标,实验结果见下表。问 2种不同的药物的抑瘤效果有无差别?表2不同药物作用后小白鼠肉瘤重量(g)编号A药B药(1)(2)(3)10.820.6520.730.5430.430.3440.41
23、0.2150.680.439. 某胸科医院,同时用甲、乙两法测定202份痰标本中的抗酸杆菌,结果如下表。问甲、乙两法的检出率有无差别?甲、乙两法检测痰标本中的抗酸杆菌结果甲法乙+法合计+492574一21107128合计7013220210.某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如下表,估计尿肌酐含量( Y )对其年龄(X )的回归方程。8名正常儿童的年龄 X (岁)与尿肌酐含量 Y (mmol/24h)探编号12345678年龄X131196810127尿肌酐含量Y3.543.013.092.482.563.363.182.65表1中:X 9.5Y2.98381 X
24、X42Iyy1.0462Ixy 5.845011.某地随机抽样调查了部分健康成人的血红蛋白量,结果见下表。问:该地健康成年男、女血红蛋白含 量有无差别?某年某地健康成年男、女血红蛋白含量(g L-1)性别例数均数标准差男360134.57.1女255117.610.2参考答案一、名词解释:1. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资 料亦称定量资料、测量资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。2. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性 资料或分类资料。其观察值是定性的,表现为
25、互不相容的类别或属性。3. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资 料。等级资料又称有序变量。4. 总体:总体指特定研究对象中所有观察单位的测量值。5. 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。6. 变异:同质个体间研究因素的差异。7. 频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。_8. 算术均数:描述一组数据在数量上的平均水平。总体均数用表示,样本均数用 X表示。9. 中位数:将一组观察值由小到大排列,位次居中的那个数。10. 极差:亦称全距,即最大值与最小值之差,用于资料的粗
26、略分析,其计算简便但稳定性较差。11. 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样 本均可,最为常用。13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。14. 正态分布:若资料 X的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号2 N(,)表示均数为,标准差为的正态分布。15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为N(0,12)。16统计推断:通过样本指标来说明总体特征,这种通过样本获取
27、有关总体信息的过程称为统计推断。17. 抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。18. 标准误:通常将样本统计量的标准差称为标准误。19. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。20. 参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。21. 假设检验中P的含义:指从 H)规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验 统计量值的概率。22. I型和n型错误:i型错误指拒绝了实际上成立的f,这类“弃真”的错误称为I型错误,其概率大小用 表示;n型错误,指接受了实际上不成立的H0,这类“存
28、伪”的错误称为n型错误,其概率大小用 表示。23. 检验效能:1- 称为检验效能,它是指当两总体确有差别,按规定的检验水准所能发现该差异的能力。24. 检验水准:是预先规定的,当假设检验结果拒绝f,接受H,下“有差别”的结论时犯错误的概率称为检验水准,记为。25. 方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分 解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。26. 随机区组设计:事先将全部受试对象按
29、自然属性分为若干区组,原则是各区组内的受试对象的特征相 同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各 处理组,这种设计叫做随机区组设计。27. 相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、 相对比。28. 标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。标准化法的基本思想就是选定一个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。29. 构成比(proportion )表示事物内部某一部分的个体数与该
30、事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。常以100%为比例基数。计算公式为100%(5.2)某一组成部分的观察单位数同一事物各组成部分的观察单位总数30. Yates校正:英国统计学家Yates F认为,由于x 2分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的x 2值不连续,尤其是自由度为 1的四格表,求出的概率 P值可能偏小,此时需对x 2 值作连续性校正 (correction of continuity ),这一校正即所谓的 Yates 校正(Yates' correction )。31. 非参数统计:针对某些资料的总体分布难以用某种
31、函数式来表达,或者资料的总体分布的函数式是未 知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametricstatistics ),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics) 的统计分析方法。32. 直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平 方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简
32、单回归。33. 相关系数:又称积差相关系数,以符号 r表示样本相关系数,p表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。34. 统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形 式直观的表示事物间的数量关系。35. 回归系数b :是直线的斜率(slope ),其统计意义是当 X变化一个单位时 Y的平均改变的估计值。b 0 时直线从左下方走向右上方,Y随X的增大而增大;b 0时直线从左上方走向右下方,Y随X的增大而减小;b 0时直线与X轴平行,Y与X无直线关系。b的计算公式为I XYI XX(X X)(Y Y)(X
33、 X)2、单项选择题:1.D2.C3.B4.B5.A6.B7.A8.D9.C10.C11.D12.B13.D14.D15.D16.C17.D18.A19.A20.C21.B22.D23.B24.B25.D26.D27.D28.A29.C30.B31.E32.E33.A34.B35.D36.D37.A38.D39.A40.C41.D42.E43.A44.B45.A46.D47.C48.B49.B50.A51.B52.B53.D54.A三、简答题:1. 答:三个指标分别说明:(1) X为算术均数,说明正态分布或近似正态分布资料的集中趋势;(2) s为标准差,说明正态分布或近似正态分布资料的离散趋势
34、;(3) X 1.96S可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含总体的95%的个体值。2. 答:频数分布表的用途是:描述频数分布的类型;描述频数分布的特征;便于发现一些特大或特小的可疑值;便于进一步做统计分析和处理。3. 答:正态分布的面积分布规律是:(1) X轴与正态曲线所夹面积恒等于1或100% ;(2) 区间的面积为68.27%,区间 1.96 的面积为95.00%,区间 2.58 的面积为 99.00%。4. 答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示。区别点均数的可信区间参考值范围意按预先给疋的概率所确疋的未知
35、参数的可能氾围。“正常人”的解剖、生实际上一次抽样算得的可信区间要么包含了总体均理、生化某项指标的波义数,要么不包含。但可以说:该可信区间有多大 当=0.05时为95%)的可能性包含了总体均数。(如 动范围。计算S *正态分布:X u /2S*公式未知:X t / 2偏态分布:PxP100 x已知:X u /2_*S未知但n>60 :X u /2用途估计总体均数判断观察对象的某项指 标正常与否* t /2,也可用t ,(对应于单尾概率时)* u /2也可用U (对应于单尾概率时)5. 答:和P均为概率,其中 是指拒绝了实际上成立的 H)所犯错误的最大概率,是进行统计推断时预先设定的一个小
36、概率事件标准。P直是由实际样本获得的,在 H)成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与对比来得到结论,若 P< ,则拒绝H),接受H ,有统计学意义,可以认为 不同或不等;否则,若P>,则不拒绝H),无统计学意义,还不能认为 不同或不等。6. 答:P值是指从f规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值 (如t或u)的概率。当P<0.05时,说明在H)成立的条件下,得到现有检验结果的概率小于通常确定的小概率事 件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了
37、,说明现有样本信息不支持H),所以怀疑原假设H)不成立,故拒绝H)。在下“有差别”的结论的同时,我们能够知道可能犯I型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。7. 答:单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中 一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可 能性,故更易得出有差别的结论,但应慎用。8. 答:因
38、为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H)时,可能犯I型错误;“接受” f时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。9. 答:率和构成比所说明的问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,5060岁年龄组的高血压病例占52.24%,所占比重最大,60岁组则只占到6.74%。这是因为60岁以上受检人数少, 造成患病数低于5060岁组,因而构成比相对较低。但不能认
39、为年龄在5060岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。10. 答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异 SSs间可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。方差分析的应用条件:各样本是相互独立的随机样本,均服从正态分布;相互比较的各样本的总体方差相等,即具有方差齐性。第3页共11页11. 答:方差分析的
40、备择假设 H是g个总体均数不全相等,拒绝H),接受H,只说明g个总体均数总的来说有差别,并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。12. 答:(1 )首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。(2) 对于两样本率比较的四格表资料,应根据各格的理论值T和总例数n的大小选择不同的x 2计算公式:当40且所有的T 5时,用x 2检验的基本公式(A T)2或四格表资料xT2检验的专用公式(a2(ad bc) nb)(c d)(a c)(bd)当n 40但有15时,用四格表资料x2检验的校正公式(A T °.5)2 或
41、(| ad - bc|-号)2n(a+b )(c+ d)(a+c )(b+ d),或改用四格表资料的Fisher确切概率法;当n 40,或T1时,用四格表资料的 Fisher确切概率法。若资料满足两样本率u检验的条件,也可用u检验。(3) 对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时当(b c) 40时,22 (|b c f2 (b c);当(b c) 40 时,c b c 。 b c13. 答:非参数检验对总体分布不作严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体 分布(或分布位置)作假设检验。如果总体分布为已知的数学形式,对其总体参数作假设检验则为参 数检验。
42、14. 答:二者的联系:(1) 两者所解决的应用问题相同,都可用来表示两个数值变量之间关系的方向和密切程度。(2) 两个相关系数都没有单位,取值范围都在 -11之间。(3) 计算上,用秩次作积差相关,得到的就是秩相关系数。二者的区别:(1) 资料要求不同。积差相关要求X、Y服从双变量正态分布,秩相关可以是任意分布。(2) 由于对资料要求不同,二者分属于参数统计与非参数统计方法,所以符合双变量正态分布条件时, 积差相关的效率高于秩相关。(3) 二者假设检验方法不同。15. 答:一般说来,统计表由标题、标目、线条、数字四部分构成(有时附有备注)。编制统计表的注意事项:(1)标题概括表的内容,写于表
43、的上方,通常需注明时间与地点。(2) 标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚。(3) 线条不宜过多,通常采用三条半线表示,即顶线、底线、纵标目下的横隔线及合计上的半条线。(4) 表内一律采用阿拉伯数字。同一指标小数点位数要一致,数次要对齐。表内不留空格。(5) 备注不要列于表内,如有必要,可在表内用“ * ”号标记,并在表外加以说明。16. 答:x 2检验的基本思想是以x 2值的大小来反映理论频数 T与实际频数 A的吻合程度。在零假设H。(比如H。: 12 )成立的条件下,实际频数与理论频数相差不应该很大,即x值不应该很大,若实际计算出的x 2值较大,超过了设定的检验水准所对应
44、的界值,则有理由怀疑H。的真实性,从而拒绝H。,接受H (比如比:12 )。17. 答:特点:第4页共11页(1)对样本所来自的总体的分布形式不作要求,分布未知都能适用。(2)收集资料方便,可用“等级”或“符号”来评定观察结果。(3)多数非参数方法比较简便,易于理解和掌握。(4)缺点是损失信息量,适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能。 适用范围:(1)等级资料。(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未 达到正态或近似正态分布时,宜用非参数检验。(3)各组离散程度相差悬殊,即方差明显不齐,且通过变换亦不能达到齐性。(4)个别数
45、据偏离过大,或资料为单侧或双侧没有上限或下限值。(5)分布类型不明。(6)资料初步分析。18. 答:若选行X列表资料的x 2检验,只能推断两个或多个总体的等级构成比差别,这一般不是推断目的;而选秩转换的非参数检验,可推断两个或多个总体的等级强度差别,这是推断目的。19. 答:从形式上看,二者的不同点在于纵坐标的尺度不同,普通线图的纵坐标为算术尺度,而半对数线 图的纵坐标为对数尺度。从用途上看,普通线图描述的是统计量的绝对变化趋势,半对数线图描述的 是相对变化趋势,特别适宜作不同指标或相同指标不同组别的变化速度的比较。20. 答:参数检验和非参数检验各有适用条件,究竟取哪种结论,要根据资料是否满
46、足该种检验方法的应 用条件进行选择。在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验为佳。以t检验为例,如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果。21. 答:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。既使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作 出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。四、分析计算题:
47、1.解:本例属异体配对设计,所得数据为配对计量资料,用配对t检验进行处理。(1)建立检验假设,确定检验水准H : d = 0H : dM0=0.05(2) 计算检验统计量Sd0.05716( g/g)dSd ” n0.04410.05716 .7n=7, d dn 0.3086 70.0441( g/g)2.0412(3)确定P值,作出推断结论按=n-仁7-1=6查t界值表,得10.025,6 =2.447 , t<t 0.025,6,则P>0.05,按 =0.05水准不拒绝H),差别无统 计学意义,即按现有样本不足以说明脑缺氧乳猪钙泵平均含量与对照组不同。2. 解:该资料属计数资
48、料?实验设计属完全随机设计; 宜选用RX C表的x 2检验方法; H。: 3种疗法的总体有效率相等H1 : 3种疗法的总体有效率不全相等 在0.05的水准上,拒绝H。,接受Hi,差别有统计学意义,可认为3种疗法的总体有效率不全相等,即3种疗法对慢性胃炎病人的疗效有差别。 可能犯I型错误。3. 解:人体有自行排铅的功能,应设对照组,并进行假设检验后才能下结论。4. 解:(1)根据题意,该设计为配对设计,首先将20例病人按年龄、性别、病型和病情等条件进行配对后,将10对患者从1到10编号,再任意指定随机排列表中的任一行,比如第8行,舍去1020,将随机数排列如下,规定逢单数者每对中的第1号试验对象
49、进入胃舒氨组 (A),第2号对象进入西米替丁组(B),逢双数者则相反。分组情况如下所示:病人号1.12.13.14.15.16.17.18.19.110.11.22.23.24.25.26.27.28.29.210.2随机数字3261809547入组情况ABBABBAABABAABAABBAB(2)首先以溃疡面积减少百分率40%为界限,将每位患者的治疗情况分为有效和无效两类,并整理成配对四格表的形式(见表21)。本试验的目的在于比较胃舒氨与西米替丁治疗消化性胃溃疡有效率的差别, 故选用配对四格表的 McNema检验(McNemar' s test for correlated prop
50、ortions)进行统计分析。表2 20位患者治疗情况TTT、F / -ft-H 西米替丁胃舒氨有效无效合计有效aba+b无效cdc+d合计a+cb+dN5.解:两医院乳腺癌患者的病情构成不同,比较两医院的标准化率,计算过程见表3。表3甲、乙两医院乳腺癌手术后的 5年生存率的标化(以甲乙两医院合计为标准)腋下淋巴 结转移标准 病例数N甲医院乙医院原生存率Pi预期生存人数Np二原生存率R预期生存人数Npi(6)=无34577.7726871.67247有79368.3850350.60401合计1138(刀 N)64.24771 (刀 Np67.10648 (刀 Npi甲医院乳腺癌手术后的 5年生存率的标化生存率:MR771p- - 100%100%67.75%N1138乙医院乳腺癌手术后的五年生存率标化生存率:Ni R648p- - 100%100%56.94%N1138因为甲、乙两医院有无腋下淋巴结转移的病情构成不同,故标化后,甲医院乳腺癌手术后的5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论