生物医学研究的统计学方法-课后习题答案-2014-主编-方积乾_第1页
生物医学研究的统计学方法-课后习题答案-2014-主编-方积乾_第2页
生物医学研究的统计学方法-课后习题答案-2014-主编-方积乾_第3页
生物医学研究的统计学方法-课后习题答案-2014-主编-方积乾_第4页
生物医学研究的统计学方法-课后习题答案-2014-主编-方积乾_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

./思考与练习参考答案第1章绪论一、选择题1.研究中的基本单位是指<D>.A.样本B.全部对象C.影响因素D.个体E.总体2.从总体中抽取样本的目的是〔B.A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.计算统计指标3.参数是指〔B.A.参与个体数B.描述总体特征的统计指标C.描述样本特征的统计指标D.样本的总和E.参与变量数4.下列资料属名义变量的是〔E.A.白细胞计数B.住院天数C.门急诊就诊人数D.患者的病情分级E.ABO血型5.关于随机误差下列不正确的是〔C.A.受测量精密度限制B.无方向性C.也称为偏倚D.不可避免E.增加样本含量可降低其大小二、名称解释〔答案略1.变量与随机变量2.同质与变异3.总体与样本4.参数与统计量5.误差6.随机事件7.频率与概率三、思考题1.生物统计学与其他统计学有什么区别和联系?答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术.而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法.2.某年级甲班、乙班各有男生50人.从两个班各抽取10人测量身高,并求其平均身高.如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能.因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本.样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值.即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等.因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断.3.某地区有10万个7岁发育正常的男孩,为了研究这些7岁发育正常男孩的身高和体重,在该人群中随机抽取200个7岁发育正常的男孩,测量他们的身高和体重,请回答下列问题.<1> 该研究中的总体是什么?答:某地区10万个7岁发育正常的男孩.<2> 该研究中的身高总体均数的意义是什么?答:身高总体均数的意义是:10万个7岁发育正常的男孩的平均身高.<3> 该研究中的体重总体均数的意义是什么?答:体重总体均数的意义是:10万个7岁发育正常的男孩的平均体重<4>该研究中的总体均数与总体是什么关系?答:总体均数是反映总体的统计学特征的指标.〔5该研究中的样本是什么?答:该研究中的样本是:随机抽取的200个7岁发育正常的男孩.〔宇传华方积乾第2章统计描述思考与练习参考答案一、最佳选择题1.编制频数表时错误的作法是〔E.A.用最大值减去最小值求全距B.组距常取等组距,一般分为10~15组C.第一个组段须包括最小值D.最后一个组段须包括最大值E.写组段,如"1.5~3,3~5,5~6.5,…"2.描述一组负偏峰分布资料的平均水平时,适宜的统计量是〔A.A.中位数B.几何均数C.调和均数D.算术均数E.众数3.比较5年级小学生瞳距和他们坐高的变异程度,宜采用〔A.A.变异系数B.全距C.标准差D.四分位数间距E.百分位数P2.5与P97.5的间距4.均数和标准差S的关系是〔A.A.S越小,对样本中其他个体的代表性越好B.S越大,对样本中其他个体的代表性越好C.越小,S越大D.越大,S越小E.必小于5.计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为〔B.A.阳转人数B.疫苗接种人数C.乙肝患者数D.乙肝病毒携带者数E.易感人数6.某医院的院内感染率为5.2人/千人日,则这个相对数指标属于〔C.A.频率B.频率分布C.强度D.相对比E.算术均数7.纵坐标可以不从0开始的图形为〔D.A.直方图B.单式条图C.复式条图D.箱式图E.以上均不可二、简答题1.对定量资料进行统计描述时,如何选择适宜的指标?答:详见教材表2-18.教材表2-18定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值①非对称分布;②半定量资料;③末端开口资料;④分布不明众数频数最多的观察值不拘分布形式,概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式,概略分析标准差〔方差观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距居中半数观察值的全距①非对称分布;②半定量资料;③末端开口资料;④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较2.举例说明频率和频率分布的区别和联系.答:2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况,被调查者150人,分别有30人病情稳定,66人处于进展状态,54人死亡.当研究兴趣只是了解死亡发生的情况,则只需计算死亡率54/150=36%,属于频率指标.当研究者关心患者所有可能的结局时,则可以算出反映3种结局的频率分别为20%、44%、36%,它们共同构成所有可能结局的频率分布,是若干阳性率的组合.两者均为"阳性率",都是基于样本信息对总体特征进行估计的指标.不同的是:频率只是一种结局发生的频率,计算公式的分子是某一具体结局的发生数;频率分布则由诸结局发生的频率组合而成,计算公式的分子分别是各种可能结局的发生数,而分母则与频率的计算公式中分母相同,是样本中被观察的单位数之和.3.应用相对数时应注意哪些问题?答:〔1防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标.〔2计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜.〔3观察单位数不等的几个相对数,不能直接相加求其平均水平.〔4相对数间的比较须注意可比性,有时需分组讨论或计算标准化率.4.常用统计图有哪些?分别适用于什么分析目的?答:详见教材表2-20.教材表2-20常用统计图的适用资料及实施方法图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数三、计算题1.某内科医生调查得到100名40~50岁健康男子总胆固醇〔mg/dl,结果如下227190224259225238180193214195213193209172244199155208203199253181196224210220255257216249235220190203197149175236202209174184174185167235167210171248201266189222199197214199198230246209202186217206200203197161247138186156195163273178190207259186194246172234232189172235207208231234226174199278277181〔1编制频数表,绘制直方图,讨论其分布特征.答:频数表见练习表2-1.根据直方图〔练习图2-1,可认为资料为基本对称分布,其包络线见练习图2-2.练习表2-1某地100名40~50岁健康男子总胆因醇/〔mg·dl-1FrequencyPercentValidPercentCumulativePercentValid130~145~160~175~190~205~220~235~250~265~280Total13111225151311541001.03.011.012.025.015.013.011.05.04.0100.01.03.011.012.025.015.013.011.05.04.0100.01.04.015.027.052.067.080.091.096.0100.0练习图2-1直方图练习图2-2包络线图〔2根据〔1的讨论结果,计算恰当的统计指标描述资料的平均水平和变异度.答:利用原始数据,求出算术均数mg/dl和标准差mg/dl.〔3计算P25,P75和P95.答:利用原始数据,求出P25=186.8mg/dl,P75=229.3mg/dl,P95=259.0mg/dl.2.某地对120名微丝蚴血症患者治疗3个疗程后,用IFA间接荧光抗体试验测得抗体滴度如下,求抗体滴度的平均水平.抗体滴度1:51:101:201:401:801:1601:320例数516273422133利用上述频数表,得平均滴度为1:36.3.3.某地1975-1980年出血热发病和死亡资料如教材表2-21,设该地人口数在此6年间基本保持不变.教材表2-21某地6年间出血热的发病与死亡情况年份发病数病死数1975324197656519771621219782411319793301019802745试分析:〔1粗略判断发病率的变化情况怎样.答:该地人口数在此6年间基本保持不变,发病人数在1979年前逐年上升,1980年略有下降.可以认为发病率大致呈上升趋势,1980年略有下降.〔2病死率的变化情况怎样?答:病死率由各年度病死数除以发病数获得,病死率依次为12.5%、8.9%、7.4%、5.4%、3.0%和1.8%,呈逐年下降趋势.〔3上述分析内容可用什么统计图绘制出来?答:由于没有给出该地人口数,故不能计算发病率,可用普通线图表示发病数变化情况.病死率的下降情况可以用普通线图表示,下降速度则可以用半对数线图表示.〔4评述该地区出血热防治工作的效果.答:随着时间的推移,预防工作做得不好,治疗水平则逐年提高〔体现在病死率下降.〔张晋昕第3章概率分布思考与练习参考答案一、最佳选择题1.某资料的观察值呈正态分布,理论上有〔C的观察值落在范围内.A.68.27%B.90%C.95%D.99%E.45%2.正态曲线下,从均数到的面积为〔A.A.45%B.90%C.95%D.47.5%E.99%3.若正常人的血铅含量X近似服从对数正态分布,则制定X的95%参考值范围,最好采用〔其中,为Y的标准差〔C.A.B.C.D.E.4.在样本例数不变的情况下,若〔D,则二项分布越接近对称分布.A.总体率越大B.样本率p越大C.总体率越小D.总体率越接近0.5E.总体率接近0.1或0.55.铅作业工人周围血象点彩红细胞在血片上的出现数近似服从〔D.A.二项分布B.正态分布C.偏态分布D.Poisson分布E.对称分布6.Poisson分布的均数与标准差的关系是〔E.A.B.C.D.E.二、思考题1.服从二项分布及Poisson分布的条件分别是什么?简答:二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立.Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数很大,而所关心的事件发生的概率很小.2.二项分布、Poisson分布分别在何种条件下近似正态分布?简答:二项分布的正态近似:当n较大,π不接近0也不接近1时,二项分布B〔,π近似正态分布N〔,.Poisson分布的正态近似:Poisson分布,当相当大时〔≥20,其分布近似于正态分布.三、计算题1.已知某种非传染性疾病常规疗法的有效率为80%,现对10名该疾病患者用常规疗法治疗,问至少有9人治愈的概率是多少?解:对10名该疾病患者用常规疗法治疗,各人间对药物的反应具有独立性,且每人服药后治愈的概率均可视为0.80,这相当于作10次独立重复试验,即=0.80,n=10的贝努利试验,因而治愈的人数X服从二项分布.至少有9人治愈的概率为:至少有9人治愈的概率是37.58%.或者2.据以往的统计资料,某地新生儿染色体异常率为1%,问100名新生儿中染色体异常不少于2名的概率是多少?解:=3.调查某市2000年110名20岁男性青年的身高〔cm资料如下:173.1166.8172.9175.9172.8170.5174.1174.2175.7173.5168.2173.7184.4174.8172.5174.9174.9174.2173.8176.2170.9165.0176.3174.2179.8174.5180.5171.5178.9171.5166.7170.8168.8177.5174.5183.5182.0170.9173.5177.5181.2177.1172.3176.5174.0174.3174.6172.6171.3173.1176.9170.5174.2177.5176.6182.3172.1169.9179.5175.8178.6180.6175.6173.3168.7174.5178.5171.3172.0173.2168.8176.0182.6169.5177.5180.6181.5175.1165.2168.0175.4169.2170.0171.9176.6178.8177.2173.4168.5177.6175.8164.8175.6180.0176.6176.5177.7174.1180.8170.6173.8180.7176.3177.5178.3176.0174.8180.8176.5179.2〔1试估计当年该市20岁男性青年中,身高在175.0~178.0〔cm内的占多大比例?〔2估计当年该市95%以及99%的20岁男青年身高范围.〔3若当年由该市随机抽查1名20岁男青年,试估计其身高超过180cm的概率.解:用SPSS计算本题.数据文件:data3-n.sav.数据格式:数据库2列110行,变量n为男性青年序号,x表示身高.操作步骤:操作说明AnalyzeDescriptiveStatisticsDescriptivesOptions√Mean√Std.DeviationContinueVariable[s]:xOK调用Descriptives过程计算得均数=174.766,标准差=4.1509TransformCompute调用"变量计算<ComputeVariable>"对话框TargetVariableP定义目标变量"P"NumericExpression:CDF.NORMAL<178.0,174.766,4.1509>-CDF.NORMAL<175.0,174.766,4.1509>OK当年该市20岁男性青年中,身高在175.0~178.0cm内的比例TargetVariablex1该市95%以及99%的20岁男青年身高范围间的比例NumericExpression:174.766-1.96*4.1509OKTargetVariablex2NumericExpression:174.766+1.96*4.1509OKTargetVariablex3NumericExpression:174.766-2.58*4.1509OKTargetVariablex4NumericExpression:174.766+2.58*4.1509OKTargetVariablep1NumericExpression:1-CDF.NORMAL<180.0,174.766,4.1509>OK由该市随机抽查1名20岁男青年,其身高超过180cm的概率计算结果〔练习图3-1:DescriptiveStatisticsNMeanStd.Deviationx110174.7664.1509ValidN<listwise>110练习图3-1SPSS输出结果以上是SPSS输出结果,得到均数〔Mean为174.766cm,标准差〔Std.Deviation为4.1509cm.估计当年该市20岁男性青年中,身高在175.0~178.0cm内的比例为25.956%,身高在175.0~178.0cm内的约有29人.估计当年该市95%的20岁男青年身高范围为166.63~182.90cm,99%的20岁男青年身高范围为164.06~185.48cm.由该市随机抽查1名20岁男青年,估计其身高超过180cm的概率约为10%.〔祁爱琴高永石德文第4章参数估计思考与练习参考答案一、最佳选择题1.关于以0为中心的t分布,错误的是〔EA.t分布的概率密度图是一簇曲线 B.t分布的概率密度图是单峰分布C.当∞时,t分布Z分布D.t分布的概率密度图以0为中心,左右对称E.相同时,值越大,P值越大2.某指标的均数为,标准差为S,由公式计算出来的区间常称为〔B.A.99%参考值范围B.95%参考值范围C.99%置信区间D.95%置信区间E.90%置信区间3.样本频率与总体概率均已知时,计算样本频率p的抽样误差的公式为〔C.A.B.C.D.E.4.在已知均数为,标准差为的正态总体中随机抽样,〔B的概率为5%.A.B.C.D.E.5.〔C小,表示用样本均数估计总体均数的精确度高.A.CVB.SC.D.RE.四分位数间距6.95%置信区间的含义为〔C:A.此区间包含总体参数的概率是95%B.此区间包含总体参数的可能性是95%C."此区间包含总体参数"这句话可信的程度是95%D.此区间包含样本统计量的概率是95%E.此区间包含样本统计量的可能性是95%二、思考题1.简述标准误与标准差的区别.答:区别在于:〔1标准差反映个体值散布的程度,即反映个体值彼此之间的差异;标准误反映精确知道总体参数〔如总体均数的程度.〔2标准误小于标准差.〔3样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,但标准差不随样本含量的改变而有明显方向性改变,随着样本含量的增大,标准差有可能增大,也有可能减小.2.什么叫抽样分布的中心极限定理?答:样本含量n越大,样本均数所对应的标准差越小,其分布也逐渐逼近正态分布,这种现象统计学上称为中心极限定理〔centrallimittheorem.当有足够的样本含量〔如时,从任何总体中抽取随机样本的样本均数近似地服从正态分布.样本含量越大,抽样分布越接近于正态分布.正态分布的近似程度与总体自身的概率分布和样本含量有关.如果总体原本就是正态分布,那么对于所有值,抽样分布均为正态分布.如果总体为非正态分布,仅在n值较大情况下近似服从正态分布.一般说,时的抽样分布近似为正态分布;但是,如果总体分布极度非正态〔如双峰分布、极度偏峰分布,即使有足够大的值,抽样分布也将为非正态.3.简述置信区间与医学参考值范围的区别.答:置信区问与医学参考值范围的区别见练习表4-1.练习表4-1置信区间与医学参考值范围的区别区别置信区间参考值范围含义用途计算公式总体参数的波动范围,即按事先给定的概率100<1>%所确定的包含未知总体参数的一个波动范围估计未知总体均数所在范围未知:已知或未知但n≥30,有或个体值的波动范围,即按事先给定的范围100<1>%所确定的"正常人"的解剖、生理、生化指标的波动范围供判断观察个体某项指标是否"正常"时参考〔辅助诊断正态分布:偏峰分布:PX~P100X4.何谓置信区间准确度与精确度?如何协调两者间的关系.答:置信区间有准确度〔accuracy与精密度〔precision两个要素.准确度由置信度<1->的大小确定,即由置信区间包含总体参数的可能性大小来反映.从准确度的角度看,置信度愈接近于1愈好,如置信度99%比95%好.精密度是置信区间宽度的一半〔即、,意指置信区间的两端点值离样本统计量〔如、p的距离.从精密度的角度看,置信区间宽度愈窄愈好.在抽样误差确定的情况下,两者是相互矛盾的.为了同时兼顾置信区间的准确度与精密度,可适当增加样本含量.三、计算题1.随机抽取了100名一年级大学生,测得空腹血糖均数为4.5mmol/L,标准差为0.61mmol/L.试估计一年级大学生空腹血糖总体均数及方差的95%置信区间.答:总体均数95%置信区间为〔4.379,4.621,方差的95%置信区间为2.调查某地蛲虫感染情况,随机抽样调查了260人,感染人数为100.试估计该地蛲虫感染率的95%置信区间.答:该地蛲虫感染率的95%置信区间为〔32.55%,44.38%.〔宇传华第5章假设检验思考与练习参考答案一、最佳选择题1.样本均数比较作t检验时,分别取以下检验水准,以〔E所取Ⅱ类错误最小.A.B.C.D.E.2.在单组样本均数与一个已知的总体均数比较的假设检验中,结果t=3.24,t0.05,v=2.086,t0.01,v=2.845.正确的结论是〔E.A.此样本均数与该已知总体均数不同B.此样本均数与该已知总体均数差异很大C.此样本均数所对应的总体均数与该已知总体均数差异很大D.此样本均数所对应的总体均数与该已知总体均数相同E.此样本均数所对应的总体均数与该已知总体均数不同3.假设检验的步骤是〔A.A.建立假设,选择和计算统计量,确定P值和判断结果B.建立无效假设,建立备择假设,确定检验水准C.确定单侧检验或双侧检验,选择t检验或Z检验,估计Ⅰ类错误和Ⅱ类错误D.计算统计量,确定P值,作出推断结论E.以上都不对4.作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是〔C.A.统计量t越大,说明两总体均数差别越大B.统计量t越大,说明两总体均数差别越小C.统计量t越大,越有理由认为两总体均数不相等D.P值就是E.P值不是,且总是比小5.下列〔E不是检验功效的影响因素的是:A.总体标准差B.容许误差C.样本含量nD.Ⅰ类错误E.Ⅱ类错误二、思考题1.试述假设检验中α与P的联系与区别.答:值是决策者事先确定的一个小的概率值.P值是在成立的条件下,出现当前检验统计量以及更极端状况的概率.P≤时,拒绝假设.2.试述假设检验与置信区间的联系与区别.答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法.置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等.3.怎样正确运用单侧检验和双侧检验?答:选用双侧检验还是单侧检验需要根据数据的特征及专业知识进行确定.若比较甲、乙两种方法有无差异,研究者只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验.若甲法是从乙法基础上改进而得,已知如此改进可能有效,也可能无效,但不可能改进后反不如以前,则应选用单侧检验.在没有特殊专业知识说明的情况下,一般采用双侧检验即可.4.试述两类错误的意义及其关系.答:Ⅰ类错误〔typeⅠerror:如果检验假设实际是正确的,由样本数据计算获得的检验统计量得出拒绝的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设〔弃真的错误称为Ⅰ类错误.Ⅱ类错误<typeⅡerror>:假设检验的另一类错误称为Ⅱ类错误<typeⅡerror>,即检验假设原本不正确〔正确,由样本数据计算获得的检验统计量得出不拒绝〔纳伪的结论,此时就犯了Ⅱ类错误.Ⅱ类错误的概率用表示.在假设检验时,应兼顾犯Ⅰ类错误的概率〔和犯Ⅱ类错误的概率〔.犯Ⅰ类错误的概率〔和犯Ⅱ类错误的概率〔成反比.如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度.为了同时减小和,只有通过增加样本含量,减少抽样误差大小来实现.5.试述检验功效的概念和主要影响因素.答:拒绝不正确的的概率,在统计学中称为检验功效<poweroftest>,记为.检验功效的意义是:当两个总体参数间存在差异时<如备择假设:成立时>,所使用的统计检验能够发现这种差异<拒绝零假设:>的概率,一般情况下要求检验功效应在0.8以上.影响检验功效的四要素为总体参数的差异、总体标准差、检验水准及犯Ⅱ类错误的概率.6.简述假设检验的基本思想.答:假设检验是在H0成立的前提下,从样本数据中寻找证据来拒绝、接受的一种"反证"方法.如果从样本数据中得到的证据不足,则只能不拒绝,暂且认为成立〔因为拒绝的证据不足,即样本与总体间的差异仅仅是由于抽样误差所引起.拒绝是根据某个界值,即根据小概率事件确定的.所谓小概率事件是指如果比检验统计量更极端〔即绝对值更大的概率较小,比如小于等于0.05〔各种科研杂志习惯上采用这一概率值,则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝,即有足够证据推断差异具有统计学意义.三、计算题1.一般正常成年男子血红蛋白的平均值为140g/L,某研究者随机抽取25名高原地区成年男子进行检查,得到血红蛋白均数为155g/L,标准差25g/L.问:高原地区成年男子的血红蛋白是否比一般正常成年男子的高?解:::〔单侧=3.00t=3,,可认为高原地区居民的血红蛋白比一般正常成年男子的高.2.一般而言,对某疾病采用常规治疗,其治愈率约为45%.现改用新的治疗方法,并随机抽取180名该疾病患者进行了新疗法的治疗,治愈117人.问新治疗方法与常规疗法的效果是否有差别?解::,:,=5.41Z=5.41,,可认为新治疗方法与常规疗法的效果不同,新疗法优于常规疗法.〔林爱华宇传华第6章两样本定量资料的比较思考与练习参考答案一、最佳选择题1.正态性检验,按α=0.10检验水准,认为其总体服从正态分布,此时若推断有错,其错误的概率为〔D.A.大于0.10B.等于0.10C.小于0.10D.等于β,而β未知E.等于1-β,而β未知2.甲、乙两人分别从同一随机数字表抽取30个〔各取两位数字随机数字作为两个样本,求得、,则理论上〔C.A.B.C.由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0D.作两样本均数比较的t检验,必然得出无统计学意义的结论E.作两样本方差比较的F检验,必然方差齐3.两样本均数比较时,能用来说明两组总体均数间差别大小的是〔D.A.t值B.P值C.F值.两总体均数之差的95%置信区间E.上述答案均不正确4.两小样本均数比较,方差不齐时,下列说法不正确的是〔C.A.采用秩和检验B.采用t′检验C.仍用t检验.变量变换后再作决定E.要结合正态性检验结果方能作出决定5.两样本秩和检验的是〔B.A.两样本秩和相等B.两总体分布相同C.两样本分布相同D.两总体秩和相等E.两总体均数相等6.在统计检验中是否选用非参数统计方法〔A.A.要根据研究目的和数据特征作决定B.可在算出几个统计量和得出初步结论后进行选择C.要看哪个统计结论符合专业理论D.要看哪个值更小E.既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用7.配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是〔D.A.T越大,P值越小B.T越大,P值越大C.T值在界值范围内,P值小于相应的αD.T值>界值,P值大于相应的α值E.T值在界值范围上,P值大于相应的α8.成组设计两样本比较的秩和检验,其检验统计量T是〔C.A.为了查T界值表方便,一般以秩和较小者为TB.为了查T界值表方便,一般以秩和较大者为TC.为了查T界值表方便,一般以例数较小者秩和为TD.为了查T界值表方便,一般以例数较大者秩和为TE.当两样本例数不等时,任取一样本的秩和为T都可以查T界值表二、思考题1.假设检验中,P值和α的含义是什么?两者有什么关系?答:P是指H0成立时出现目前样本情形的概率最多是多大,α是事先确定的检验水准.但P值的大小和α没有必然关系.2.既然假设检验的结论有可能有错,为什么还要进行假设检验?答:假设检验中,无论拒绝不拒绝H0,都可能会犯错误,表现为拒绝H0时,会犯Ⅰ类错误,不拒绝H0时,会犯Ⅱ类错误,但这并不能否认假设检验的作用.只要涉及到抽样,就会有抽样误差的存在,因此就需要进行假设检验.只是要注意,假设检验的结论只是个概率性的结论,它的理论基础是"小概率事件不可能原理".3.配对设计资料能否用完全随机设计资料的统计检验方法?为什么?答:不能.采用完全随机设计资料的t检验会使检验效能降低,从而可能会使应有的差别检验不出来.4.对于完全随机设计两样本定量资料的比较,如何选择统计方法?答:完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性〔样本量较大时不必进行正态性检验和方差齐性.如果资料来自正态总体且总体方差齐,采用t检验;如果满足正态性但总体方差不齐,采用t′检验;当两者都不满足时,才考虑选用秩和检验.当然,我们也可采用变量变换的方法使其满足t或t′检验的条件.5.为什么在秩和检验编秩次时不同组间出现相同数据要给予"平均秩次",而同一组的相同数据不必计算"平均秩次"?答:秩和检验编秩次时不同组间出现相同数据要给予"平均秩次",而同一组的相同数据不必计算"平均秩次",是因为取不取"平均秩次"对该组的总的秩和没有影响.三、计算题1.某单位研究饲料中维生素E缺乏对肝中维生素A含量的影响,将同种属、同年龄、同性别、同体重的大白鼠配成8对,并将每对动物随机分配到正常饲料组和缺乏维生素E的饲料组,定期将大白鼠杀死,测定其肝中维生素A的含量〔教材表6-12,问饲料中维生素E缺乏对肝中维生素A的平均含量有无影响?教材表6-12正常饲料组与维生素E缺乏组大白鼠肝中维生素A含量/〔U·mg-1>大白鼠对别12345678正常饲料组3.552.603.003.953.803.753.453.05维生素E缺乏组2.452.401.8002.401.75解:此题是个配对设计的资料,差值的正态性检验结果表明:差值来自正态总体〔检验:P=0.268,所以采用配对t检验.结果为:t=6.837,=7,P<0.001,拒绝H0,可以认为维生素E缺乏对肝中维生素A含量有影响.2.某实验室观察局部温热治疗小鼠移植性肿瘤的疗效,以生存日数作为观察指标.实验结果如下,请比较两组的平均生存日数有无差别.实验组10121415151718202680对照组2367891012121330解:此题是个完全随机设计的资料.两组资料的正态性检验结果表明,差值来自正态总体<检验:P1<0.001,P2=0.011>,所以采用两样本比较的秩和检验.结果为:T1=150.5,T2=80.5,本例中n1=10,n2-n1=1,对应双侧0.05的界值为81~139,故在α=0.05的水平上拒绝H0,认为两组小鼠生存日数不同.〔施学忠杨永利赵耐青第7章多组定量资料的比较思考与练习参考答案一、最佳选择题1.完全随机设计资料的方差分析中,必然有〔C.A.>B.C.=+D.E.2.定量资料两样本均数的比较,可采用〔D.A.检验B.检验C.Bonferroni检验D.检验与检验均可E.LSD检验3.当组数等于2时,对于同一资料,方差分析结果与检验结果相比,〔C.A.检验结果更为准确B.方差分析结果更为准确C.完全等价且D.完全等价且E.两者结果可能出现矛盾4.若单因素方差分析结果为,则统计推断是〔D.A.各样本均数都不相等B.各样本均数不全相等C.各总体均数都不相等D.各总体均数不全相等E.各总体均数全相等5.完全随机设计资料的方差分析中,组间均方表示〔C.A.抽样误差的大小B.处理效应的大小C.处理效应和抽样误差综合结果D.个数据的离散程度E.随机因素的效应大小6.多样本定量资料比较,当分布类型不清时应选择〔D.A.方差分析B.检验C.Z检验D.Kruskal-Wallis检验E.Wilcoxon检验7.多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用值而不用校正后的值,则会〔C.提高检验的灵敏度B.把一些无差别的总体推断成有差别C.把一些有差别的总体推断成无差别D.Ⅰ、Ⅱ类错误概率不变E.以上说法均不对二、思考题1.方差分析的基本思想和应用条件是什么?答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较.不同之处在于变异分解的项目因设计不同而异.具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响.其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性.2.多组定量资料比较时,统计处理的基本流程是什么?答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验.若方差齐性,且各样本均服从正态分布,选单因素方差分析.若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件.若方差分析或秩和检验结果有统计学意义,则需选择合适的方法〔如Bonferonni、LSD法等进行两两比较.三、计算题:1.根据教材表7-11资料,大白鼠感染脊髓灰质炎病毒后,再作伤寒或百日咳接种是否影响生存日数?若结论为"有影响",请作多重比较〔与对照组比.教材表7-11各组大鼠接种后生存日数/天伤寒百日咳对照5687698710981098101091110912111012111014121116解:本题资料可考虑用完全随机设计的单因素方差分析进行统计处理.〔1建立检验假设,确定检验水准.:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等.:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等,=0.05.〔2方差分析应用前提条件的检验首先进行正态性及方差齐性检验,三组均服从正态分布〔P1=0.684,P2=0.591,P3=0.507,三个总体的方差齐〔P=0.715,符合单因素方差分析的条件,可行方差分析.〔3各组可分别采用均数和标准差描述其集中趋势和离散趋势,各组的统计描述及总体均数的置信区间如下:表1三组大鼠接种后生存日数的描述性统计量/天N均数标准差95%置信区间下限上限伤寒010.70百日咳108.401.717.179.63对照1011.22.399.4912.91合计309.602.348.7310.47〔4资料的方差分析见方差分析表方差分析结果,,即大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等.表2三组大鼠接种后生存日数差别有无统计学意义的方差分析表变异来源SSdfMSFP组间41.6220.8004.7760.017组内117.6274.356合计159.229进一步行多重比较<LSD检验>,结果两实验组均与对照组有统计学差异.认为大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗对生存日数有影响,生存日数减少.表3三组大鼠接种后生存日数两两比较的结果对比组P均数差值的95%置信区间下限上限伤寒组与对照组2.00.93330.041-3.92-0.09百日咳组与对照组2.80.93330.006-4.72-0.892.将18名乙脑患者随机分为三组,分别用单克隆抗体、胸腺肽和利巴韦林三种药物治疗,观察指标为治疗后的退热时间,结果见教材表7-12.问三组治疗结果的差异是否具有统计学意义?教材表7-12三组乙脑患者的退热时间/天治疗分组退热时间单克隆抗体组020059胸腺肽组321367102利巴韦林组011151131解:从专业上考虑,退热时间一般不服从正态分布,可采用Kraskal-Wallis检验分析三组乙脑患者的退热时间差异有无统计学意义.各组可分别采用四份位数描述其集中趋势和离散趋势,各组的统计描述如下:表1三组乙脑患者退热时间的描述性统计量/天组别NP25P50P75单克隆抗体组60.001.006.00胸腺肽组65.008.5017.75利巴韦林组60.757.0012.00〔2建立检验假设,确定检验水准.:三组乙脑患者的退热时间相等,:三组乙脑患者的退热时间不等或不全相等,=0.05.〔3Kraskal-Wallis检验结果,=4.799,=2,P=0.091>0.05.结论为,在=0.05的水平上尚不能认为三组治疗结果的差异具有统计学意义.〔王玖徐天和高永石德文第8章定性资料的比较思考与练习参考答案一、最佳选择题1.定性资料的统计推断常用〔D.A.检验B.正态检验C.检验D.检验E.t′检验2.两组二分类资料发生率比较,样本总例数100,则检验自由度为〔A.A.1B.4C.95D.99E.1003.四格表检验中,<,可以认为〔B.A.两总体率不同B.不能认为两总体率不同C.两样本率不同D.不能认为两样本率不同E.以上都不对4.等级资料比较宜采用〔E.A.检验B.检验C.检验D.正态检验E.秩和检验5.为比较治疗某病的新疗法与常规方法,试验者将100名患者按性别、年龄等情况配成对子,分别接受两疗法治疗.观察得到有28对患者同时有效,5对患者同时无效,11对患者新药有效常规治疗无效.欲比较两种疗法的有效率是否相同,应选择的统计分析方法为〔D.A.独立的两组二分类资料比较检验B.独立的两组二分类资料比较校正检验C.配对的两组二分类资料比较检验D.配对的两组二分类资料比较校正检验E.Fisher确切概率法二、思考题1.简述检验适用的数据类型.答:提示:卡方检验是应用较广的一种定性资料的假设检验方法,常用于检验两个或多个样本率〔或构成比之间有无差别.2.两组二分类资料的设计类型有几类?其相应的检验方法是什么?答:提示:两组二分类资料的设计类型主要有2类,即完全随机设计和配对设计.完全随机设计和配对设计资料在假设检验方法上均采用卡方检验.完全随机设计资料应用公式〔8-1或〔8-4,配对设计资料应用公式〔8-7或〔8-8.3.什么资料适合用秩和检验进行检验?简述秩和检验步骤.答:提示:进行有序资料的比较时宜采用秩和检验.秩和检验步骤为:①建立假设,并确定检验水准;②根据不同的设计类型对资料进行编秩并计算秩和;③根据计算的秩和直接查表或计算相应的统计量再查表,确定值下结论.进行有序资料的比较时宜采用秩和检验.4.试证明对于R×C式〔8-11与式〔8-1等价.提示:三、计算题1.某医院观测了28例肝硬化患者和14例再生障碍性贫血患者血清中抗血小板抗体,结果是:肝硬化患者中有2例阳性,再生障碍性贫血患者中有5例阳性.问:两类患者血清抗血小板抗体阳性率有无差别?解:将资料进行整理列表〔练习表8-1.练习表8-1两类患者血清抗血小板抗体检测结果患者类型阳性阴性合计肝硬化患者再生障碍性贫血患者226285914资料属于独立的两组二分类资料比较.理论频数分别为4.67、23.33、2.33、11.67,应选用校正公式计算.假设:两种疾病患者血清抗血小板抗体检测阳性率相同,=0.05.计算统计量校正卡方=3.6214,自由度=1,=0.0570,无统计学意义,尚不能认为两种疾病患者血清抗血小板抗体检测阳性率不同.2.对100名钩端螺旋体病患者同时用间接免疫抗体试验和显微镜凝集试验进行血清学诊断,结果见教材表8-18.试比较用两种方法检验的阳性率有无差别?教材表8-18两种方法的检验结果比较〔例数间接免疫荧光显微镜凝集合计+-+661177-61723合计7228100解:答案提示,本资料属于配对的两组二分类资料比较,+=11+6=17<40,应选用校正配对卡方公式计算.假设:两种方法检测的阳性率相同,=0.05.计算统计量0.9412,=1,=0.332,无统计学意义,尚不能认为两种方法检测的阳性率不同.3.研究两种不同的治疗训练方案对肥胖症患者的减肥效果情况,结果见教材表8-19.问这两种治疗训练方案对肥胖症患者的减肥效果是否相同?教材表8-19两种治疗训练方案对肥胖症患者的减肥效果〔例数治疗方案效果较好效果一般效果较差合计甲1622846乙2817550合计44391396解:该资料属于结果变量为有序变量的定性资料,应选用秩和检验.假设:两种治疗方案对肥胖症患者的减肥效果相同,=0.05.按照治疗效果由差到好编秩,计算秩和,统计量=-2.064,=0.039,有统计学意义,可以认为两种治疗方案的减肥效果不同,由两组平均秩和看,甲组为1974÷46=42.91,乙组为2682÷50=53.64,因为编秩是由差到好,因此可认为乙治疗方案的效果好于甲治疗方案.4.比较三种中药方剂对骨质疏松症的治疗效果,结果见教材表8-20.三种方剂的治疗效果是否有差异?教材表8-20三种中药方剂对骨质疏松症的治疗效果〔例数分组有效无效合计A方剂18624B方剂121426C方剂111526合计413576解:本题属于独立的多组二分类资料比较.假设:三种方剂对骨质疏松症的治疗效果相同,=0.05.计算统计量6.3350,=2,=0.042,差别有统计学意义,拒绝H0,接受H1,尚不能认为这三种方剂的治疗效果不相同.〔郭秀花罗艳侠第9章关联性分析思考与练习参考答案最佳选择题1.对简单相关系数作假设检验,,统计结论为〔B.A.两变量不相关B.两变量有线性关系C.两变量无线性关系D.两变量不会是曲线关系,一定是线性关系E.上述说法都不准确2.计算积矩相关系数要求〔C.A.是正态变量,可以不满足正态的要求B.是正态变量,可以不满足正态的要求C.两变量都要求满足正态分布规律D.两变量只要是测量指标就行E.是定量指标,可以是任何类型的数据3.对两个分类变量的频数表资料作关联性分析,可用〔C.A.积矩相关B.秩相关C.关联系数D.线性相关E.以上均可4.由样本算得相关系数,检验结果为<0.01,说明〔D.A.两变量之间有高度相关性B.来自高度相关的总体C.来自总体相关系数为0的总体 D.来自总体相关系数不为0的总体E.来自总体相关系数大于0的总体二、思考题1.1988年某地抽查0~7岁儿童营养不良患病情况如教材表9-10,某医师要想了解年龄与营养不良患病率是否有关,你认为应选用什么统计方法?为什么?教材表9-101988年某地抽查0~7岁儿童营养不良患病情况年龄/岁0~1~2~3~4~5~6~7患病人数982788629598234患病率/%15.711.77.35.1解:提示,用秩相关分析年龄与患病率的关系,因患病率资料一般不服从正态分布.2.请查找最近三年主题为相关分析或关联分析的已发表国内医学文献,至少认真阅读其中3篇〔建议分别选取Pearson、Spearman相关分析和关联分析各1篇,找出其中不妥之处.3.在讲散点图时,我们曾提到分层应慎重,有可能出现分层分析与总体情况大相径庭的结果.请举一两个实例说明这种现象.三、计算分析题1.某学校随机抽取18名学生,测定其智商〔IQ值,连同当年数学和语文两科总成绩如表教材9-11.试计算数学成绩与智商、语文成绩与智商以及数学与语文成绩的相关系数,并检验总体相关系数是否为零.能否认为数学好的原因是语文好,或者语文好的原因是数学好?教材表9-1118名学生的智商、数学成绩和语文成绩编号123456789数学成绩X语文成绩Y智商得分Z78846152938998986583767058827889956195100100751059711012076编号101112131415161718数学成绩X语文成绩Y智商得分Z7348456775958899817553437078979292889261608896125113126102解:提示,数学与智商的相关系数〔Pearson为0.918,语文与智商的相关系数为0.958,数学与语文的相关系数为0.932.各总体相关系数均不为0.数学好或者语文好与智商有关系.不能认为数学好的原因是语文好,或者语文好的原因是数学好,两者之间不存在因果关系.2.将10份研究生院的入学申请书让两位老师排序,结果见教材表9-12.请问两人的排序是否相关?教材表9-12两位老师对10份入学申请书的排序申请书编号12345678910A老师的排序61051728934B老师的排序78546391012解:提示,Spearman相关系数为0.842,总体相关系数不为0〔P=0.002,可以认为两人的排序相关.3.关于丈夫和妻子关节炎的患病率分析中,100对中年夫妇的患病情况见教材表9-13,试分析丈夫和妻子关节炎的患病有无关系.教材表9-13100对中年夫妇的患病情况妻子患病情况丈夫患病情况合计有病无病有病162440无病243660合计4060100解:提示,运用交叉分类2×2列联表的关联分析,=0.00,=3.84>0.00,在α=0.05的水平下,不拒绝H0,尚不能认为中年夫妇中丈夫患关节炎和妻子患关节炎有关联.〔凌莉刘清海简单线性回归分析思考与练习参考答案最佳选择题1.如果两样本的相关系数,样本量,那么〔D.A.回归系数B.回归系数C.回归系数D.统计量E.以上均错2.如果相关系数=1,则一定有〔C.A.=B.=C.=D.>E.=3.记为总体相关系数,为样本相关系数,为样本回归系数,下列〔D正确.A.=0时,=0B.||>0时,>0C.>0时,<0D.<0时,<0E.||=1时,=14.如果相关系数=0,则一定有〔D.A.简单线性回归的截距等于0B.简单线性回归的截距等于或C.简单线性回归的等于0D.简单线性回归的等于E.简单线性回归的等于05.用最小二乘法确定直线回归方程的含义是〔B.A.各观测点距直线的纵向距离相等B.各观测点距直线的纵向距离平方和最小C.各观测点距直线的垂直距离相等D.各观测点距直线的垂直距离平方和最小E.各观测点距直线的纵向距离等于零二、思考题1.简述简单线性回归分析的基本步骤.答:①绘制散点图,考察是否有线性趋势及可疑的异常点;②估计回归系数;③对总体回归系数或回归方程进行假设检验;④列出回归方程,绘制回归直线;⑤统计应用.2.简述线性回归分析与线性相关的区别与联系.答:区别:〔1资料要求上,进行直线回归分析的两变量,若为可精确测量和严格控制的变量,则对应于每个的值要求服从正态分布;若、都是随机变量,则要求、服从双变量正态分布.直线相关分析只适用于双变量正态分布资料.〔2应用上,说明两变量线性依存的数量关系用回归〔定量分析,说明两变量的相关关系用相关〔定性分析.〔3两个系数的意义不同.说明具有直线关系的两变量间相互关系的方向与密切程度,表示每变化一个单位所导致的平均变化量.〔4两个系数的取值范围不同:-1≤≤1,.〔5两个系数的单位不同:没有单位,有单位.联系:〔1对同一双变量资料,回归系数与相关系数的正负号一致.>0时,>0,均表示两变量、同向变化;<0时,<0,均表示两变量、反向变化.〔2回归系数与相关系数的假设检验等价,即对同一双变量资料,.由于相关系数的假设检验较回归系数的假设检验简单,故在实际应用中常以的假设检验代替的假设检验.〔3用回归解释相关:由于决定系数=S/S,当总平方和固定时,回归平方和的大小决定了相关的密切程度.回归平方和越接近总平方和,则越接近1,说明引入相关的效果越好.例如当r=0.20,n=100时,可按检验水准0.05拒绝H0,接受H1,认为两变量有相关关系.但=<0.20>2=0.04,表示回归平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大.3.决定系数与相关系数的意义相同吗?如果不一样,两者关系如何?答:现将相关系数、决定系数与Y的总变异的关系阐释如下:假如在一回归分析中,回归系数的变异数=9,而Y的总变异数=13,则决定系数=/=9/14=0.6429/1,相关系数R=0.8018即将决定系数表示为一比值关系,当=l时,则=0.6429,我们可以采用直角三角形的"勾股定理"图示决定系数与相关系数的关系,如练习图10-1所示.SSSS残差面积=4边长=2SS回归面积=9边长=3SS回归SS残差=9=4SS总=13SS残差SS回归面积=0.6429边长=0.8018SS回归SS残差=0.6429=0.3571SS总=1练习图10-1相关系数、决定系数与总变异的关系三、计算题1.以例10-1中空气一氧化氮〔NO为因变量,风速〔X4为自变量,采用统计软件完成如下分析:〔1试用简单线性回归方程来描述空气中NO浓度与风速之间的关系.〔2对回归方程和回归系数分别进行假设检验.〔3绘制回归直线图.〔4根据以上的计算结果,进一步求其总体回归系数的95%置信区间.〔5风速为1.50m/s时,分别计算个体值的95%容许区间和Y的总体均数的95%置信区间,并说明两者的意义.解:运用SPSS进行处理,主要分析结果如下:〔1简单线性回归方程、假设检验结果及总体回归系数的95%置信区间如下:Coefficients<a>UnstandardizedCoefficientsStandardizedCoefficientstSig.95%ConfidenceIntervalforBBStd.ErrorBetaLowerBoundUpperBoundConstant0.1590.0198.4220.0000.1200.198风速-0.0530.012-0.680-4.3450.000-0.078-0.028〔2方差分析结果:ANOVA<b>SumofSquaresdfMeanSquareFSig.Regression0.03810.03818.8780.000<a>Residual0.044220.002Total0.08123〔3回归直线如练习图10-2.练习图10-2回归直线图2.教材表10-8为本章例10-1回归分析的部分结果,依次为、、的估计值〔与残差〔,请以相关分析考察四者之间的关系,以回归分析考察与、与、与、与之间的关系,并予以解释.教材表10-8案例分析中回归分析的部分结果1.300.070.0707-0.0045480.04521.120.040.0415-0.00251.440.080.0935-0.01751.480.130.09860.03041.660.060.1271-0.06810.790.00-0.01080.01181.820.140.1531-0.01811.540.090.1081-0.02111.650.170.12650.04351.440.100.09220.00680.960.040.01680.02221.760.160.14290.01310.950.010.0149-0.00991.780.220.14740.07461.750.120.1426-0.02261.440.010.0929-0.08191.500.150.10170.04331.200.040.0548-0.01481.080.000.0365-0.03351.060.030.0327-0.00371.500.120.10240.01761.840.140.1569-0.01691.440.100.09220.0068解:主要分析结果:<1>四者之间的相关系数Correlationshathat10.8091.0000.0000.80910.8090.586hat1.0000.80910.000hat0.0000.5860.0001**Correlationissignificantatthe0.01level<2-tailed>.〔2四个变量间的回归系数因变量自变量截距回归系数tP-0.1360.159456.0160.0001.0050.0016.4570.0000.0880.9993.3940.0030.00001470.00001050.0001.000与呈完全正相关关系,回归系数t检验结果P=0.000,表明的变异可由完全解释.与的相关系数与与的相关系数相同,表明正是由于的影响引起的变异,与关系即体现了与的变化关系.与体现了扣除的影响后,与残差仍呈正相关关系.与呈零相关关系,表明扣除了的影响,回归方程的残差与不再有相关或回归关系.〔张岩波郝元涛第11章多重线性回归分析思考与练习参考答案一、最佳选择题1.逐步回归分析中,若增加自变量的个数,则〔D.A.回归平方和与残差平方和均增大B.回归平方和与残差平方和均减小C.总平方和与回归平方和均增大D.回归平方和增大,残差平方和减小E.总平方和与回归平方和均减小2.下面关于自变量筛选的统计学标准中错误的是〔E.A.残差平方和〔缩小B.确定系数〔增大C.残差的均方〔缩小D.调整确定系数〔增大E.统计量增大3.多重线性回归分析中,能直接反映自变量解释因变量变异百分比的指标为〔C.A.复相关系数B.简单相关系数C.确定系数D.偏回归系数E.偏相关系数4.多重线性回归分析中的共线性是指〔E.A.关于各个自变量的回归系数相同B.关于各个自变量的回归系数与截距都相同C.变量与各个自变量的相关系数相同D.与自变量间有较高的复相关E.自变量间有较高的相关性5.多重线性回归分析中,若对某一自变量的值加上一个不为零的常数,则有〔D.A.截距和该偏回归系数值均不变B.该偏回归系数值为原有偏回归系数值的倍C.该偏回归系数值会改变,但无规律D.截距改变,但所有偏回归系数值均不改变E.所有偏回归系数值均不会改变二、思考题1.多重线性回归分析的用途有哪些?答:多重线性回归在生物医学研究中有广泛的应用,归纳起来,可以包括以下几个方面:定量地建立一个反应变量与多个解释变量之间的线性关系,筛选危险因素,通过较易测量的变量估计不易测量的变量,通过解释变量预测反应变量,通过反应变量控制解释变量.2.多重线性回归模型中偏回归系数的含义是什么?答:偏回归系数的含义是:在控制其他自变量的水平不变的情况下,该自变量每改变一个单位,反应变量平均改变的单位数.3.请解释用于多重线性回归参数估计的最小二乘法的含义.答:最小二乘法的含义是:残差的平方和达到最小.4.如何判断和处理多重共线性?答:如果自变量之间存在较强的相关,则存在多重共线性.可以通过分析自变量之间的相关系数、计算方差膨胀因子和容忍度等指标判断是否存在多重共线性.如果自变量间存在多重共线性,最简单的处理办法是删除变量,即在相关性较强的变量中删除测量误差大的、缺失数据多的、从专业上看意义不是很重要的或者在其他方面不太满意的变量.其次,也可采用主成分回归方法.5.如何判断、分析自变量间的交互作用?答:基于专业背景知识,构造可能的交互作用项,并检验交互作用项是否有统计学意义.6.多重线性回归模型的基本假定有哪些?如何判断资料是否满足这些假定?如果资料不满足假定条件,常用的处理方法有哪些?答:多重线性回归的前提条件是线性、独立性、正态性和等方差性,可以借助残差分析等方法判断资料是否满足条件.如果资料不满足前提条件,可以采用变量变换和非线性回归等方法处理.三、计算题为确定老年妇女进行体育锻炼还是增加营养会减缓骨骼损伤,一名研究者用光子吸收法测量了骨骼中无机物含量,对三根骨头主侧和非主侧记录了测量值,结果见教材表11-20.分别用两种桡骨测量结果作为反应变量对其他骨骼测量结果作多重线性回归分析,提出并拟合适当的回归模型,分析残差.解:答案提示,需要对自变量进行筛选,而且要考虑是否存在多重共线性,如果存在,应进行适当的处理.教材表11-20骨骼中无机物的含量受试者编号主侧桡骨桡骨主侧肱骨肱骨主侧尺骨尺骨11.1031.0522.1392.2380.8730.87220.8420.8591.8731.7410.5900.74430.9250.8731.8871.8090.7670.71340.8570.7441.7391.5470.7060.67450.7950.8091.7341.7150.5490.65460.7870.7791.5091.4740.7820.57170.9330.8801.6951.6560.7370.80380.7990.8511.7401.7770.6180.68290.9450.8761.8111.7590.8530.777100.9210.9061.9542.0090.8230.765110.7920.8251.6241.6570.6860.668120.8150.7512.2041.8460.6780.546130.7550.7241.5081.4580.6620.595140.8800.8661.7861.8110.8100.819150.9000.8381.9021.6060.7230.677160.7640.7571.7431.7940.5860.541170.7330.7481.8631.8690.6720.752180.9320.8982.0282.0320.8360.805190.8560.7861.3901.3240.5780.610200.8900.9502.1872.0870.7580.718210.6880.5321.6501.3780.5330.482220.9400.8502.3342.2250.7570.731230.4930.6161.0371.2680.5460.615240.8350.7521.5091.4220.6180.664250.9150.9361.9711.8690.8690.868资料来源:《实用多元统计分析》〔第4版,RichardA.Johnson&DeanW.Wichern,陆璇译,清华大学出版社.〔郝元涛张岩波第12章实验设计思考与练习参考答案一、最佳选择题1.处理因素作用于受试对象的反映须通过观察指标来表达,则选择指标的依据具有〔E.A.客观性B.特异性C.敏感性D.特异性和敏感性E.A与D2.以前的许多研究表明,血清三酰甘油的含量与冠心病危险性有关,即三酰甘油的含量越高,患冠心病的危险性就越大,有的医生以此筛选危险人群.后来的研究表明,冠心病还与其他因素有关,特别是血清中高含量胆固醇和低含量的高密度脂蛋白,它们常与冠心病同时发生联系,采用严格的实验设计平衡了其他因素的作用后,发现三酰甘油的含量与冠心病发病的危险性之间的联系就不复存在了.这是以下选项中的〔B选项把握得较好所致.A.重复实验次数较多B.均衡性原则考虑得周到C.用多因素设计取代单因素设计D.提高实验人员的技术水平E.严格按随机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论