版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章 绪论(xln)习题一、选择题1统计工作和统计研究的全过程可分为(fn wi)以下步骤:(D)A. 调查、录入数据(shj)、分析资料、撰写论文B. 实验、录入数据、分析资料、撰写论文C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。 A. B. 或 C. D. E. 38 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A)。4.分别用
2、两种不同成分的培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A:48、84、90、123、171;B:90、116、124、225、84。该资料的类型是(C )。5.空腹血糖测量值,属于( C)资料。6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料的类型是(D )。8. 100名18岁男生的身高数据属于(C )。二、问答题1举例说明总体与样本的概念.答:统计
3、学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。2举例说明同质与变异的概念答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。3简要
4、阐述统计设计与统计分析的关系答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据(gnj)设计的不同特点,选择相应的统计分析方法对资料进行分析第二章统计(tngj)描述习题(xt)一、选择题1描述一组偏态分布资料的变异度,以(D )指标较好。 A. 全距 B. 标准差 C. 变异系数 D. 四分位数间距 E. 方差2各观察值均加(或减)同一数后(B )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 E. 以上都不
5、对3偏态分布宜用(C )描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 E. 方差4.为了直观地比较化疗后相同时点上一组乳腺癌患者血清肌酐和血液尿素氮两项指标观测值的变异程度的大小,可选用的最佳指标是(E )。A.标准差 B.标准误 C.全距 D.四分位数间距 E.变异系数5.测量了某地152人接种某疫苗后的抗体滴度,宜用(C )反映其平均滴度。A. 算术均数 B. 中位数 C.几何均数 D.众数 E.调和均数6.测量了某地237人晨尿中氟含量(mg/L),结果如下:尿氟值:0.2 0.6 1.0 1.4 1.8 2.2 2.6 3.0 3.4 3.8频
6、 数: 75 67 30 20 16 19 6 2 1 1宜用(B )描述该资料。A. 算术均数与标准差 B.中位数与四分位数间距 C.几何均数与标准差D. 算术均数与四分位数间距 E. 中位数与标准差7用均数和标准差可以全面描述(C )资料的特征。 A. 正偏态资料 B. 负偏态分布 C. 正态分布 D. 对称分布 E. 对数正态分布8比较身高和体重两组数据变异度大小宜采用(A )。 A. 变异系数 B. 方差 C. 极差 D. 标准差 E. 四分位数间距9血清学滴度资料最常用来表示其平均水平的指标是(C )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 变异系数 E. 标准差10
7、最小组段无下限或最大组段无上限的频数分布资料,可用(C )描述其集中趋势。A. 均数 B. 标准差 C. 中位数 D. 四分(s fn)位数间距 E. 几何均数11现有某种沙门(shmn)菌食物中毒患者164例的潜伏期资料,宜用(B )描述该资料。A. 算术(sunsh)均数与标准差 B.中位数与四分位数间距 C.几何均数与标准差D. 算术均数与四分位数间距 E. 中位数与标准差12测量了某地68人接种某疫苗后的抗体滴度,宜用(C )反映其平均滴度。A. 算术均数 B. 中位数 C.几何均数 D.众数 E.调和均数二、分析题1请按照国际上对统计表的统一要求,修改下面有缺陷的统计表(不必加表头)
8、年龄性别21-3031-4041-5051-6061-70男 女男 女男 女男 女男例数10 148 1482 37213 4922答案:性别年龄组21303140415051606170男1088221322女14143749.2某医生在一个有5万人口的社区进行肺癌调查,通过随机抽样共调查2000人,全部调查工作在10天内完成,调查内容包括流行病学资料和临床实验室检查资料。调查结果列于表1。该医生对表中的资料进行了统计分析,认为男性肺癌的发病率高于女性,而死亡情况则完全相反。表1 某社区不同性别人群肺癌情况性别检查人数有病人数死亡人数死亡率(%)发病率(%)男10506350.00.57女9
9、503266.70.32合计20009555.60.451)该医生所选择的统计指标正确吗?答:否2)该医生对指标的计算方法恰当吗?答:否3)应该如何做适当的统计分析?表1 某社区不同性别人群肺癌情况性别检查人数患病人数死亡人数死亡比()现患率()男1050632.8575.714女950322.1053.158合计2000952.54.531998年国家第二次卫生服务(fw)调查资料显示,城市妇女分娩地点分布(%)为医院63.84,妇幼保健机构20.76,卫生院7.63,其他7.77;农村妇女相应的医院20.38,妇幼保健机构4.66,卫生院16.38,其他58.58。试说明用何种统计图表达上
10、述资料最好。答:例如(lr),用柱状图表示:第三章 抽样(chu yn)分布与参数估计习题一、选择题1(E )分布的资料,均数等于中位数。A. 对数 B. 正偏态 C. 负偏态 D. 偏态 E. 正态2. 对数正态分布的原变量是一种( D )分布。A. 正态 B. 近似正态 C. 负偏态 D. 正偏态 E. 对称3. 估计正常成年女性红细胞计数的95%医学参考值范围时,应用( A. )。A. B.C.D.E.4. 估计正常成年男性尿汞含量的95%医学参考值范围时,应用(E )。A. B.C.D.E.5若某人群某疾病发生的阳性数服从二项分布,则从该人群随机抽出个人,阳性数不少于人的概率为(A )
11、。A. B. C. D. E. 6分布(fnb)的标准差和均数的关系(gun x)是( C )。A. B. C. = D. = E. 与无固定(gdng)关系7用计数器测得某放射性物质5分钟内发出的脉冲数为330个,据此可估计该放射性物质平均每分钟脉冲计数的95%可信区间为(E )。A. B. C. D. E. 8分布的方差和均数分别记为和,当满足条件(E )时, 分布近似正态分布。A. 接近0或1 B. 较小 C. 较小 D. 接近0.5 E. 9二项分布的图形取决于( C )的大小。 A. B. C.与 D. E. 10(C )小,表示用该样本均数估计总体均数的可靠性大。A. B. C.
12、D. E. 四分位数间距11在参数未知的正态总体中随机抽样,(E )的概率为5。A. 1.96 B. 1.96 C. 2.58 D. E. 12某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其总体均数的95%可信区间为(B )。 A. B. C. D. E. 13一药厂为了解其生产的某药物(同一批次)的有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数与标准差;估计该批药剂有效成分平均含量的95可信区间时,应用(A )。A. B. C. D.E. 14在某地按人口的1/20随机抽取1000人,对其检测汉坦病毒IgG抗体滴
13、度,得肾综合征出血热阴性感染率为5.25,估计该地人群肾综合征出血热阴性感染率的95可信区间时,应用(E )。A. B. C. D.E. 15在某地采用单纯随机抽样方法抽取10万人,进行(jnxng)一年伤害死亡回顾调查,得伤害死亡数为60人;估计该地每10万人平均伤害死亡数的95可信区间时,应用(D )。A. B. C. D.E. 16关于(guny)以0为中心的分布(fnb),错误的是(A )。A. 相同时,越大,越大 B. 分布是单峰分布 C. 当时, D. 分布以0为中心,左右对称 E. 分布是一簇曲线二、简单题1、标准差与标准误的区别与联系答:标准差:S=,表示观察值的变异程度。可用
14、于计算变异系数,确定医学参考值范围,计算标准误。标准差是个体差异或自然变异,不能通过统计方法来控制。标准误: ,是估计均数抽样误差的大小。可以用来估计总体均数的可信区间,进行假设检验。可以通过增大样本量来减少标准误2、二项分布的应用条件答:(1)各观察单位只能具有两种相互独立的一种结果(2)已知发生某结果的概率为,其对立结果的概率为(1-)(3)n次试验是在相同条件下独立进行的,每个观察单位的观察结果不会影响到其他观察单位的结果。3、正态分布、二项分布、poisson分布的区别和联系答:区别:二项分布、poisson分布是离散型随机变量的常见分布,用概率函数描述其分布情况,而正态分布是连续型随
15、机变量的最常见分布,用密度函数和分布函数描述其分布情况。联系:(1)二项分布与poisson分布的联系,当n很大,很小时,为一常数时,二项分布近似服从poisson分布(2)二项分布与正态分布的联系,当n较大,不接近0也不接近1,特别是当和都大于5时,二项分布近似正态分布(3)poisson分布与正态分布的联系,当时,poisson分布近似正态分布。三、计算分析题1、如何用样本均数估计总体均数的可信区间答:用样本均数估计总体均数有3种计算方法:(1)未知且小,按t分布的原理计算可信区间,可信区间为()(2)未知且足够(zgu)大时,t分布逼近分布(fnb),按正态分布原理,可信区间为(3)已知
16、,按正态分布原理(yunl),可信区间为2、某市2002年测得120名11岁男孩的身高均数为146.8cm,标准差为7.6cm,同时测得120名11岁女孩的身高均数为148.1cm,标准差为7.1cm,试估计该地11岁男、女童身高的总体均数,并进行评价。答:本题男、女童样本量均为120名(大样本),可用正态近似公式估计男、女童身高的总体均数的95%置信区间。男童的95%CI为=(145.44,148.16)女童的95%CI为=(146.83,149.37)3、按人口的1/20在某镇随机抽取312人,做血清登革热血凝抑制抗体反应检验,得阳性率为8.81%,求该镇人群中登革热血凝抑制抗体反应阳性率
17、的95%可信区间。答: 本例中,=0.0160=1.60%np=312*0.0881=28 5,n(1-p)=284 5,因此可用正态近似法进行估计。登革热血凝抑制抗体反应阳性率的95%可信区间为(0.08811.96*0.016)=(0.0568,0.119)第四章 数值变量资料的假设检验习题一、选择题1在样本均数与总体均数比较的检验中,无效假设是(B )。A. 样本均数与总体均数不等 B. 样本均数与总体均数相等 C. 两总体均数不等 D. 两总体均数相等 E. 样本均数等于总体均数2在进行成组设计的两小样本均数比较的检验之前时,要注意两个前提条件。一要考察各样本是否来自正态分布总体,二要
18、:(B)A.核对数据 B.作方差齐性检验 C.求均数、标准差 D.求两样本的合并方差 E.作变量变换3两样本均数比较时,分别取以下检验水准,以(E )所取第二类错误最小。A. B. C. D. E. 4正态性检验(jinyn),按检验水准,认为(rnwi)总体服从正态分布。若该推断有错,其错误的概率为( D )。 A. 大于0.10 B. 小于0.10 C. 等于(dngy)0.10 D. 等于,而未知 E. 等于,而未知5关于假设检验,下面哪一项说法是正确的(C )。A. 单侧检验优于双侧检验 B. 若,则接受犯错误的可能性很小C. 采用配对检验还是两样本检验是由实验设计方案决定的D. 检验
19、水准只能取0.05 E. 用两样本检验时,要求两总体方差齐性6假设一组正常人的胆固醇值和血磷值均近似服从正态分布。为从不同角度来分析该两项指标间的关系,可选用:(E)A.配对检验和标准差 B.变异系数和相关回归分析C.成组检验和检验 D.变异系数和检验E.配对检验和相关回归分析7在两样本均数比较的检验中,得到,按检验水准不拒绝无效假设。此时可能犯:(B)A.第类错误 B. 第类错误 C.一般错误 D.错误较严重E.严重错误二、简答题1.假设检验中检验水准以及P值的意义是什么?答:为判断拒绝或不拒绝无效假设的水准,也是允许犯型错误的概率。值是指从规定的总体中随机抽样时,获得等于及大于(负值时为等
20、于及小于)现有样本统计量的概率。2.t检验的应用条件是什么?答 t检验的应用条件:当样本含量较小(时),要求样本来自正态分布总体;用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体3.比较型错误和型错误的区别和联系。答 型错误拒绝了实际上成立的,型错误不拒绝实际上不成立的。通常,当样本含量不变时,越小,越大;反之,越大,越小4.如何恰当地应用单侧与双侧检验?答 在一般情况下均采用双侧检验,只有在具有充足理由可以认为如果无效假设不成立,实际情况只能有一种方向的可能时才考虑采用单侧检验。三、计算题1.调查显示,我国农村地区三岁男童头围均数为48.2cm,某医生记录了某乡村20名三岁男
21、童头围,资料如下:48.29 47.03 49.10 48.12 50.04 49.85 48.97 47.96 48.19 48.25 49.06 48.56 47.85 48.37 48.21 48.72 48.88 49.11 47.86 48.61。试问该地区三岁男童头围是否大于一般三岁男童 。解 检验(jinyn)假设 这里(zhl)的水准(shuzhn)上拒绝可以认为该地区三岁男童头围大于一般三岁男童2. 分别从10例乳癌患者化疗前和化疗后1天的尿样中测得尿白蛋白(ALb,mg/L)的数据如下,试分析化疗是否对ALb的含量有影响病人编号12345678910化疗前ALb含量3.31
22、1.79.46.82.03.15.33.721.817.6化疗后ALb含量33.030.88.811.442.65.81.619.022.430.2解 检验假设 这里,查表得双侧,按检验水准拒绝,可以认为化疗对乳腺癌患者ALb的含量有影响。3.某医生进行一项新药临床试验,已知试验组15人,心率均数为76.90,标准差为8.40;对照组16人,心率均数为73.10,标准差为6.84.试问在给予新药治疗之前,试验组和对照组病人心率的总体均数是否相同?解 方差齐性检验 可认为该资料(zlio)方差齐。两样(lingyng)本均数比较的假设检验 查所以(suy)可以认为试验组和对照组病人心率的总体均数
23、相同4.测得某市18岁男性20人的腰围均值为76.5cm,标准差为10.6cm;女性25人的均值为69.2cm,标准差为6.5cm。根据这份数据可否认为该市18岁居民腰围有性别差异?.解 方差齐性检验: 可认为该资料方差不齐。 两样本均数比较的假设检验 查所以根据这份数据可以认为该市18岁居民腰围有性别差异5欲比较甲、乙两地儿童血浆视黄醇平均水平,调查(dio ch)甲地312岁儿童150名,血浆视黄醇均数为1.21mol/L,标准差为0.28mol/L;乙地312岁儿童(r tng)160名,血浆视黄醇均数为0.98mol/L,标准差为0.34mol/L.试问甲乙两地(lin d)312岁儿
24、童血浆视黄醇平均水平有无差别?解 检验假设 这里,0.82在这里检验水准尚不能拒绝,可以认为甲乙两地312岁儿童血浆视黄醇平均水平没有差别第五章 方差分析习题一、选择题1完全随机设计资料的方差分析中,必然有(C )。A. B. C. D. E. 2当组数等于2时,对于同一资料,方差分析结果与检验结果( D )。A. 完全等价且 B. 方差分析结果更准确 C. 检验结果更准确 D. 完全等价且 E. 理论上不一致3在随机区组设计的方差分析中,若,则统计推论是( A )。A. 各处理组间的总体均数不全相等 B. 各处理组间的总体均数都不相等 C. 各处理组间的样本均数都不相等 D. 处理组的各样本
25、均数间的差别均有显著性E. 各处理组间的总体方差不全相等4随机区组设计方差分析的实例中有(E )。 A. 不会小于 B. 不会小于 C. 值不会小于1 D. 值不会小于1 E. 值不会是负数5完全随机设计方差分析中的组间均方是(C )的统计量。A. 表示抽样误差大小 B. 表示某处理因素的效应作用大小C. 表示某处理因素的效应和随机误差两者综合影响的结果。D. 表示个数据的离散程度 E. 表示随机因素的效应大小6完全随机设计资料,若满足正态性和方差齐性。要对两小样本均数的差别做比较,可选择(A )。A.完全(wnqun)随机设计(shj)的方差分析 B. 检验(jinyn) C. 配对检验 D
26、.检验 E. 秩和检验7配对设计资料,若满足正态性和方差齐性。要对两样本均数的差别做比较,可选择(A )。A. 随机区组设计的方差分析 B. 检验 C. 成组检验 D. 检验 E. 秩和检验8对个组进行多个样本的方差齐性检验(Bartlett法),得,按检验,可认为(B )。A. 全不相等 B. 不全相等C. 不全相等 D. 不全相等E. 不全相等 9变量变换中的对数变换(或),适用于(C ): A. 使服从Poisson分布的计数资料正态化B. 使方差不齐的资料达到方差齐的要求C. 使服从对数正态分布的资料正态化D. 使轻度偏态的资料正态化E. 使率较小(70%)的二分类资料达到正态的要求二
27、、简答题1、方差分析的基本思想及应用条件答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异可有处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。 方差分析的应用条件:(1)各样本是相互独立的随机样本,均服从正态分布;(2)相互比较的各样本的总体方差相等,即具有方差齐性。2、在完全随机设计资料的方差分析与随机区组设计资料的方差分析在试验设计和变异分解上有什么不同?答:完全随机设计:
28、采用完全随机化的分组方法,将全部实验对象分配到g个处理组(水平组),各组分别接受不同的处理。在分析时,随机区组设计:随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。在分析时,3、为何(wih)多个均数的比较不能直接做两两比较的t检验?答:多个均数的比较,如果(rgu)直接做两两比较的t检验,每次比较允许犯第类错误(cuw)的概率都是,这样做多次t检验,就增加了犯第类错误的概率。因此多个均数的比较应该先做方差分析,若多个总体均数不全相等,再进一步进行多个样本均数间的多重比较4、SNK-q检验和Dunnett-t检验都可用于均数的多重
29、比较,它们有何不同?答:SNK-q检验常用于探索性的研究,适用于每两个均数的比较Duunett-t检验多用于证实性的研究,适用于k-1个实验组与对照组均数的比较。三、计算题1、某课题研究四种衣料内棉花吸附十硼氢量。每种衣料各做五次测量,所得数据如表5-1。试检验各种衣料棉花吸附十硼氢量有没有差异。表5-1 各种衣料间棉花吸附十硼氢量衣料1衣料2衣料3衣料42.332.483.064.002.002.343.065.132.932.683.004.612.732.342.662.802.332.223.063.60采用完全随机设计的方差分析,计算步骤如下:Ho:各个总体均数相等H1:各个总体均数
30、不相等或不全相等=0.05表5-1 各种衣料间棉花吸附十硼氢量衣料1衣料2衣料3衣料4合计2.332.483.064.002.002.343.065.132.932.683.004.612.732.342.662.802.332.223.063.60555520(N)2.46402.41202.96804.02802.9680()0.36710.17580.17410.90070.80990()=*=0.809902 *(20-1)=12.4629,=20-1=19=5(2.4640-2.9680)2+5(2.4120-2.9680)2+5(2.9680-2.9680)2+5(4.0280-2
31、.9680)2=8.4338,=4-1=3=12.4629-8.4338=4.0292,=20-4=16=2.8113=0.2518F=11.16 方差分析表变异来源SSMSFP总12.462919组间8.433832.811311.160.01组内4.0292160.2518按=3,=16查F界值表,得,故P 0.05组内6.0713590.1029按=2,=59查F界值表,得,故P 0.05。按=0.05水准尚不能拒绝Ho,故可以认为(rnwi)各组总体均数相等3、将同性别、体重相近的同一配伍组的5只大鼠,分别(fnbi)用5种方法染尘,共有6个配伍组30只大鼠,测得的各鼠全肺湿重,见下表
32、。问5种处理间的全肺湿重有无差别?表5-2. 大鼠经5种方法(fngf)染尘后全肺湿重区组对照A组B组C组D组第1区1.43.31.91.82.0第2区1.53.61.92.32.3第3区1.54.32.12.32.4第4区1.84.12.42.52.6第5区1.54.21.81.82.6第6区1.53.31.72.42.1解:处理组间: Ho:各个处理组的总体均数相等 H1:各个处理组的总体均数不相等或不全相等 =0.05区组间: Ho:各个区组的总体均数相等 H1:各个区组的总体均数不相等或不全相等 =0.05表5-2. 大鼠经5种方法染尘后全肺湿重区组对照A组B组C组D组第1区1.43.
33、31.91.82.052.0800第2区1.53.61.92.32.352.3200 第3区1.54.32.12.32.452.5200第4区1.84.12.42.52.652.6800第5区1.54.21.81.82.652.3800第6区1.53.31.72.42.152.20006666630(N)1.53333.80001.96672.18332.33332.3633()0.13660.45610.25030.30610.25030.82816()=19.8897,=30-1=29=17.6613, =5-1=4=1.1697, =6-1=5=19.8897-17.6613-1.169
34、7=1.0587,=(5-1)(6-1)=20方差分析结果(ji gu)变异来源SSMSFP总19.889729处理组17.661344.415383.410.01区组1.169750.23394.420.01误差1.0587200.0529按=4,=20查F界值表,得,故P 0.01。按=0.05水准(shuzhn),拒绝,接受(jishu),可以认为5种处理间的全肺湿重不全相等。按=5,=20查F界值表,得,故P0.051与3 0.5560 3 2.47750.051与4 1.6160 47.20080.052与4 1.5640 3 6.9691 0.013与4 1.060024.7233
35、0.05,按的检验水准,不拒绝,尚不能认为该地新生儿染色体异常率低于一般2现用某种新药治疗患者400例,治愈369例,同时用传统药物治疗同类患者500例,477例治愈。试问两种药物的治愈率是否相同?答:(1)建立(jinl)检验假设,确定检验水准 : 单侧 (2)计算统计(tngj)量,做出推断结论 本例,根据(gnj)题意(3)确定P值,做出推断结论。,P0.05,按的检验水准,拒绝,接受,可以认为这两种药物的治愈率不同。3某医院分别用单纯化疗和符合化疗的方法治疗两组病情相似的淋巴肿瘤患者,两组的缓解率如下表,问两疗法的总体缓解率是否不同?两种疗法的缓解率的比较组别效果合计缓解率(%)缓解未
36、缓解单纯化疗15203542.86复合化疗1852378.26合计33255856.90答:(1)建立检验假设,确定检验水准 : 两法总体缓解率相同 两法总体缓解率不同 双侧 (2)计算统计量,做出推断结论 本例n=58 ,最小理论频数,用四格表资料的检验专用公式 (3)确定P值,做出推断结论。 ,P0.05, 在的检验水准下,差异有统计学意义,可以认为两种治疗方案的总体缓解率不同。4分别用对同一批口腔颌面部肿瘤患者定性检测唾液和血清中癌胚抗原的含量,得到结果如下表,问这两种方法的检测结果有无差别?两种方法(fngf)的检测结果 唾液 血清合计计172340答:(1)
37、建立(jinl)检验假设,确定检验水准 : 两种方法的检测(jin c)结果相同 两种方法的检测结果不同 双侧 (2)计算统计量,做出推断结论 本例b+c=1240,用配对四格表资料的检验校正公式 (3)确定P值,做出推断结论。,P0.05, 在的检验水准下,差异有统计学意义,可以认为两种方法的检测结果不同。 5测得250例颅内肿瘤患者的血清IL-8与MMP-9水平,结果如下表,问两种检测指标间是否存在关联?血清IL-8与MMP-9水平MMP-9IL-8合计22502718702010805560115合计4013080250答:(1)建立检验假设,确定检验水准 : 两种检测指标间无关联 两种
38、检测指标间有关联 双侧 (2)计算统计量,做出推断结论 本例为双向无序RC表,用式 求得 (3)确定P值,做出推断结论。,P0.05, 在的检验水准(shuzhn)下,差异有统计学意义,可以认为两种检测指标有关联,进一步计算Pearson列联系数,以分析其关联密切程度。 列联系(linx)数 ,可以(ky)认为两者关系密切。第七章 非参数检验习题选择题1配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说(A )。A正秩和与负秩和的绝对值不会相差很大 B正秩和与负秩和的绝对值相等C正秩和与负秩和的绝对值相差很大 D不能得出结论E以上都不对2设配对资料的变量值为和,则配对资料的秩和检验是(
39、 E )。A把和的差数从小到大排序 B分别按和从小到大排序C把和综合从小到大排序 D把和的和数从小到大排序E把和的差数的绝对值从小到大排序3下列哪项不是非参数统计的优点( D )。A不受总体分布的限制 B适用于等级资料C适用于未知分布型资料 D适用于正态分布资料E适用于分布呈明显偏态的资料4等级资料的比较宜采用(A )。A秩和检验 B检验 C检验 D检验 E检验5在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的( D )。A两样本均数相同 B两样本的中位数相同C两样本对应的总体均数相同 D两样本对应的总体分布相同E两样本对应的总体均数不同6以下检验方法中,不属于非参数检验方法的是( E
40、 )。AFriedman检验 B符号检验 CKruskal-Wallis检验DWilcoxon检验 E检验7成组设计两样本比较的秩和检验中,描述不正确的是(C )。A将两组数据统一由小到大编秩B遇有相同数据,若在同一组,按顺序编秩C遇有相同数据,若不在同一组,按顺序编秩D遇有相同数据,若不在同一组,取其平均值E遇有相同数据,若在同一组,取平均致词二、简答题1简要回答进行非参数统计检验的适用条件。答:(1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求(
41、yoqi)时,应首选参数法,以免降低检验效能你学过哪些(nxi)设计的秩和检验,各有什么用途?答:(1)配对设计的符号秩和检验(Wilcoxon配对法)是推断其差值是否来自中位数为零的总体的方法,可用于配对设计差值的比较和单一样本与总体中位数的比较;(2)成组设计两样本比较的秩和检验(Wilcoxon两样本比较法)用于完全(wnqun)随机设计的两个样本的比较,目的是推断两样本分别代表的总体分布是否吸纳共同。(3)成组设计多样本比较的秩和检验(Kruskal-Wallis检验),用于完全随机设计的多个样本的比较,目的是推断两样本分别代表的总体的分布有无差别。(4)随机区组设计资料的秩和检验(F
42、riedman检验),用于配伍组设计资料的比较。3试写出非参数统计方法的主要优缺点答:优点:(1)适用范围广,不受总体分布的限制;(2)对数据的要求不严;(3)方法简便,易于理解和掌握。缺点:如果对符合参数检验的资料用了非参数检验,因不能充分利用资料提供的信息,会使检验效能低于非参数检验;若要使检验效能相同,往往需要更大的样本含量。三、计算题1对8份血清分别用HITAH7600全自动生化分析仪(仪器一)和OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH),结果见表7-1。问两种仪器所得结果有无差别?表7-1 8份血清用原法和新法测血清乳酸脱氢酶(U/L)的比较编号仪器一
43、仪器二11001202121130322022541862005195190615014871651808170171解:(1)建立检验假设,确定检验水准:用方法一和方法二测得乳酸脱氢酶含量的差值的总体中位数为零,即:(2)计算检验统计量值求各对的差值 见表7-4第(4)栏。编秩 见表7-4第(5)栏。求秩和并确定统计量。 取。(3)确定值,做出推断结论本例中,查附表界值表,得双侧;按照(nzho)检验水准(shuzhn),拒绝,接受(jishu)。认为用方法一和方法二测得乳酸脱氢酶含量差别有统计学意义。表7-4 8份血清用原法和新法测血清乳酸脱氢酶(U/L)的比较编号原法新法差值秩次(1)(
44、2)(3)(4)=(2)(3)(5)1100120-20-82121130-9-53220225-5-3.54186200-14-6519519053.56150148227165180-15-78170171-1-1 40名被动吸烟者和38名非被动吸烟者的碳氧血红蛋白HbCO(%)含量见表7-2。问被动吸烟者的HbCO(%)含量是否高于非被动吸烟者的HbCO(%)含量?表7-2 吸烟工人和不吸烟工人的HbCO(%)含量比较含量被动吸烟者非被动吸烟者合计很低123低82331中161127偏高10414高404解:(1)建立检验假设,确定检验水准:被动吸烟者的HbCO(%)与非被动吸烟者的Hb
45、CO(%)含量总体分布相同:被动吸烟者的HbCO(%)与非被动吸烟者的HbCO(%)含量总体分布不同(2)计算检验统计量值编秩求秩和并检验统计量,,,故检验统计量,因,需要用检验;又因等级资料的相同秩次过多,故:(3)确定(qudng)值,做出推断(tudun)结论,按检验水准(shuzhn),拒绝,接受,认为被动吸烟者的HbCO(%)与非被动吸烟者的HbCO(%)含量总体分布不同表7-5 吸烟工人和不吸烟工人的HbCO(%)含量比较含量人数秩次范围平均秩次秩和被动吸烟者非被动吸烟者合计被动吸烟者非被动吸烟者(1)(2)(3)(4)(5)(6)(7)=(2)(6)(8)=(3)(6)很低123
46、13224低8233143419152437中161127346147.5760522.5偏高10414627568.5685274高404767977.53100合计39407919091237.5受试者4人,每人穿四种不同的防护服时的收缩压值如表,问四种防护服对收缩压的影响有无显著差别?四个受试者的收缩压值有无显著差别?表7-3 四种防护服与收缩压值受试者编号防护服A防护服B防护服C防护服D1115135140135212212513512031101301361304120115120130解:关于四种防护服对收缩压的影响:(1)建立检验假设,确定检验水准:穿四种防护服后收缩压总体分布相
47、同:4个总体分布不同或不全相同(2)计算(j sun)统计量值编秩求秩和并计算检验(jinyn)统计量,3)确定(qudng)值,做出推断结论处理组数,配伍组数查表,按检验水准不拒绝,尚不能认为不同防护服对收缩压影响有差别。表7-5 关于四种防护服对收缩压的影响受试者编号防护服A防护服B防护服C防护服D收缩压秩次收缩压秩次收缩压秩次收缩压秩次111511352.514041352.521222125313541201311011353136413024120211511263130469.5159.5关于四个受试者收缩压值的差别:(1)建立检验假设,确定检验水准:四个受试者的收缩压值没有差别:
48、四个受试者的收缩压值不同(2)计算统计量值编秩求秩和并计算检验统计量(3)确定值,做出推断结论处理组数,配伍组数查表,按检验水准不拒绝,尚不能认为四个受试者的收缩压值有差别。表7-6 关于四个受试者收缩压值的差别受试者编号防护服A防护服B防护服C防护服D收缩压秩次收缩压秩次收缩压秩次收缩压秩次111521353.51404135413.5212241252135212019311011353.513631302.51041203115112611302.57.5第八章 直线回归与相关(xinggun)习题一、选择题1直线回归(hugu)中,如果自变量乘以一个(y )不为0或1的常数,则有(B
49、)。 A. 截距改变 B. 回归系数改变 C. 两者都改变 D. 两者都不改变 E. 以上情况都有可能2如果直线相关系数,则一定有(C )。A. B. C. D. E. 以上都不正确3相关系数与决定系数在含义上是有区别的,下面的几种表述,哪一种最正确?(D )。A. 值的大小反映了两个变量之间是否有密切的关系B. 值接近于零,表明两变量之间没有任何关系C. 值接近于零,表明两变量之间有曲线关系D. 值接近于零,表明直线回归的贡献很小E. 值大小反映了两个变量之间呈直线关系的密切程度和方向4不同地区水中平均碘含量与地方性甲状腺肿患病率的资料如下:地 区 编 号1 23417碘含量(单位)10.0
50、 2.0 2.5 3.524.5患病率()40.537.739.020.0 0.0研究者欲通过碘含量来预测地方性甲状腺肿的患病率,应选用(B )。 A.相关分析 B.回归分析 C.等级相关分析D.检验 E.检验5直线回归中与的标准差相等时,以下叙述( B )正确。 A. B. C. D. E. 以上都不正确6利用直线回归估计值所对应值的均数可信区间时,(E )可减小区间长度。 A. 增加样本含量 B. 令值接近其均数 C. 减小剩余标准差 D. 减小可信度 E. 以上都可以7有两组适合于作直线相关(xinggun)分析的实验资料(按专业知识都应取双侧检验),第1组资料:,;第2组资料(zlio
51、):,。在没有详细资料和各种( zhn)统计用表的条件下,可作出的结论是(A )。A.缺少作出明确统计推断的依据 B.因,故有显著性意义C. 因,故有显著性意义 D. 、都有显著性意义E. 、都没有显著性意义8某监测站同时用极谱法和碘量法测定了水中溶解氧的含量,结果如下。若拟用极谱法替代碘量法测定水中溶解氧的含量,应选用(B )。水 样 号12345678910极谱法(微安值)5.35.22.13.03.32.83.46.86.36.5碘量法(mg/L)5.855.800.331.962.771.582.327.797.567.98 A.相关分析 B.回归分析 C.等级相关分析D.检验 E.检
52、验9对两个数值变量同时进行相关和回归分析,有统计学意义(),则(B)A无统计学意义 B有统计学意义C不能肯定有无统计学意义 D以上都不是10某医师拟制作标准曲线,用光密度值来推测食品中亚硝酸盐的含量,应选用的统计方法是(B)A检验 B回归分析 C相关分析 D检验11在直线回归分析中,回归系数的绝对值越大(D)A所绘制散点越靠近回归线 B所绘制散点越远离回归线C回归线对轴越平坦 D回归线对轴越陡12根据观测结果,已建立关于的回归方程,变化1个单位,变化几个单位?(C) A1 B2 C3 D513直线回归系数假设检验,其自由度为(A) B C D E二、简答题1详述直线回归分析的用途和分析步骤。答
53、:用途:定量描述两变量之间的依存关系:对回归系数进行假设检验时,若,可认为两变量间存在直线回归关系。利用回归方程进行预测:把预报因子(即自变量)代入回归方程对预报量(即因变量)进行估计,即可得到个体值的容许区间。利用回归方程进行统计控制:规定值的变化,通过控制的范围来实现统计控制的目标。分析步骤:首先控制散点图:若提示有直线趋势存在,可作直线回归分析;若提示无明显线性趋势,则根据散点图分布类型,选择合适的曲线模型,经数据变换后,化为线性回归来解决。若出现一些特大特小的异常点,应及时复核检查。求出直线回归方程,其中:,对回归系数进行假设检验:方差分析,基本思想是将因变量的总变异分解为和,然后利用
54、检验来判断回归方程是否成立。检验:基本(jbn)思想是利用样本回归系数与总体(zngt)均数回归系数进行比较来判断(pndun)回归方程是否成立,实际应用中用的检验来代替的检验。直线回归方程的图示回归方程拟合效果评价:决定系数,如说明回归能解释,此方程较好校正决定系数直线回归方程的区间估计:总体回归系数的区间估计;的区间估计;个体值的容许区间2直线相关与直线回归的联系和区别。答:区别:(1)资料要求不同 相关要求两个变量是双变量正态分布;回归要求应变量服从正态分布,而自变量是能精确测量和严格控制的变量。(2)统计意义不同 相关反映两变量间的伴随关系这种关系是相互的,对等的;不一定有因果关系;回
55、归则反映两变量间的依存关系,有自变量与应变量之分,一般将“因”或较易测定、变异较小者定为自变量。这种依存关系可能是因果关系或从属关系。(3)分析目的不同 相关分析的目的是把两变量间直线关系的密切程度及方向用一统计指标表示出来;回归分析的目的则是把自变量与应变量间的关系用函数公式定量表达出来联系:(1)变量间关系的方向一致 对同一资料,其与的正负号一致。 (2)假设检验等价 对同一样本,由于计算较复杂,实际中常以的假设检验代替对的检验。(3)与值可相互换算 。(4)相关和回归可以相互解释3简述直线回归分析的含义,写出直线回归分析的一般表达式,试述该方程中各个符号的名称及意义。答:直线回归是用直线
56、回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴。如果某一个变量随着另一个变量的变化而变化,并且它们的变化在直角坐标系中呈直线趋势,就可以用一个直线方程来定量地描述它们之间的数量依存关系,这就是直线回归分析。一般表达式:,和分别为第个体的自变量和应变量取值。称为截矩,为回归直线或其延长线与轴交点的纵坐标。称为回归直线的斜率。为误差。4写出直线回归分析的应用条件并进行简要的解释。答:线性回归模型的前提条件是线性、独立、正态与等方差。(1)线性是指任意给定的所对应的应变量的总体均数与自变量呈线性关系(2)独立是指任意两个观察单位之间相互独立。否则会使参数估计值不够准确和精确。(
57、3)正态性是指对任意给定的值,均服从正态分布,该正态分布的均数就是回归直线上与值相对应的那个点的纵坐标。(4)等方差是指在自变量的取值范围内,不论取什么值,都有相同的方差5什么是曲线拟合?它一般分为哪两类?答:曲线拟合是指选择适当的曲线类型来拟合观测数据,并用拟合的曲线方程分析两变量(binling)间的关系。曲线拟合一般(ybn)分为两类:曲线直线化法和直接拟合曲线方程三、计算题1某研究人员(rnyun)测定了12名健康妇女的年龄(岁)和收缩压(),测量数据见表1, 表8-1 12名健康妇女年龄和收缩压的测量数据(岁)594272366347554938426860()19.6016.672
58、1.2815.7319.8617.0719.9319.3315.3318.6720.1920.59,求与之间的直线回归方程解,故所求直线回归方程为.(2)用方差分析的方法检验与之间的直线关系是否存在?):,即认为健康妇女的年龄与收缩压之间不存在直线关系 :,即认为健康妇女的年龄与收缩压之间存在直线关系 ,。由,查表得,按的水准拒绝,接受。故可认为健康妇女的年龄与收缩压之间存在直线关系(3)估计总体回归系数的95%可信区间。,则总体(zngt)回归系数的95%可信区间(q jin)为2用A、B两种放射线分别局部(jb)照射家兔的某个部位,观察照射不同时间放射性急性皮肤损伤程度(见表8-2)。问由
59、此而得的两样本回归系数相差是否显著?表8-2 家兔皮肤损伤程度(评分)时间(分)皮肤损伤程度A B 31.02.362.55.093.67.61210.015.21515.318.01825.027.62132.340.2解:(1)分别求出与、之间的回归直线:,():,()(2) : :计算值:估计误差平方和:查值表,做结论(jiln)以查表得,故,不拒绝(jju),尚不能认为(rnwi)两样本回归系数相差显著3某学校为了调查学生学习各科目之间的能力迁移问题,特抽取了15名学生的历史与语文成绩见表,请计算其相关程度并进行假设检验。表8-3 15名学生历史与语文成绩学生编号12345678910
60、1112131415历史889583937678858490818073797295语文788583907580838585827580867590解:由以上数据计算得:,则相关系数。:本题,得,查界值表,得。按的水准,拒绝,接受,认为学生的历史和语文成绩存在直线相关关系。4在高血压脑出血微创外科治疗预后因素的研究中,调查了13例的术前GCS值与预后,见表,试作等级相关分析。表8-4 高血压脑出血微创外科治疗术前GIS值与预后评测编号12345678910111213术前GSC值7.011.04.06.011.014.05.05.013.012.014.06.013.0预后评测分值6.07.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年新疆喀什第二中学高三上学期9月月考语文试题及答案
- 2024年广东省深圳市龙岗区中考英语二模试卷
- 上海市市辖区(2024年-2025年小学五年级语文)统编版专题练习((上下)学期)试卷及答案
- 上海市县(2024年-2025年小学五年级语文)人教版随堂测试((上下)学期)试卷及答案
- 郴州文物百咏作者:湖南省郴州市五岭大道陈友训
- 浙江省台州市台州十校2024-2025学年高一上学期11月期中联考数学试题含答案
- 2024届安徽省马鞍山市重点中学青浦高中高三下开学考数学试题
- 机电设备安装与调试技术教案
- 公立医院公益目标评估指标调查表
- 广东省广州市四校2024-2025学年九年级上学期11月期中化学试题(含答案)
- 4.2 气温的变化与分布 课前导学案-2024-2025学年七年级地理上学期人教版
- 住宅区和住宅建筑通信配套工程技术标准 DG-TJ08-606-2022
- 2024年新苏教版一年级上册数学全册课件(新版教材)
- 2024年湖北省中考地理试题(含解析)
- 幼儿园中班语言课件:香喷喷的轮子
- 广州离婚协议书(2024版)
- GB/T 44218-2024微型扬声器测量方法
- 北师大版小学六年级数学上册期中测试试题及答案
- GB/T 44144-2024有声读物
- 2025届高考语文复习:2024年全国各地高考语文语言文字运用试题分析及备课建议+课件
- 安全技术管理专业毕业实习报告范文
评论
0/150
提交评论