




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本文格式为Word版,下载可任意编辑——第14章思考与练习习题答案网http://.
第十四章直线回归分析
一、思考题
1.试述建立直线回归方程的步骤以及散点图的作用。2.如何将方差分析运用于回归系数的假设检验?简述其思想。3.简述直线相关和直线回归的区别与联系。4.对回归系数进行假设检验可以采用哪些方法?
二、案例辨析题
某研究采用火箭电泳法对已知浓度的标准血清进行测量,其免疫球蛋白IgA浓度(μg/ml)和火箭电泳高度(mm)如表14-1所示。研究者据此数据建立直线回归方程,用于测定未知样品血清中的IgA浓度,以上分析正确吗?
表14-1标准品的IgA浓度(μg/ml)和火箭电泳高度(mm)
标准品的IgA浓度x
1.02.02.04.04.0
火箭电泳高度y
6.610.210.313.113.316.216.419.420.1
6.06.010.010.0
??5.335?1.599x,经假设检验得采用最小二乘法建立直线回归方程,得到yP?0.001,故此回归方程可用于测定未知样品血清中的IgA含量。
三、最正确选择题
14-1
习题答案网http://.
1.对于一组听从双变量正态分布的资料,经直线相关分析得相关系数r?0,若对该资料拟合回归直线,其回归系数A.b?0B.b?0C.b?0D.?1?b?1E.b?1
2.一组听从双变量正态分布的资料,经直线相关分析得相关系数r??1,则有A.SS总?SS残B.SS残?SS回C.SS总?SS回D.MS残?MS回E.MS总?MS回
3.直线回归中x与y的标准差相等时,则有A.b?aB.b?r
C.b?1D.r?1E.a?1
4.若直线回归系数b?0,则一定有A.截距等于0B.截距等于yC.SS残等于0D.SS总等于0E.SS残等于SS回
5.两组听从双变量正态分布的资料,若两样本b1?b2,n1?n2,则有A.r1?r2B.tb1?tb2
14-2
习题答案网http://.
C.r1?r2D.tb1?tr1E.tr1?tr2
6.最小二乘法的原理是各观测点
A.距回归直线的纵向距离相等B.距回归直线的纵向距离平方和最小C.距回归直线的垂直距离相等D.距回归直线的垂直距离平方和最小E.距回归直线的纵向距离最小
??0.004?0.0588x,代入两点绘制回归直线,7.直线回归分析中,按直线方程y以下选项中正确的是
A.所有实测点都应在回归直线上B.所绘回归直线必过点(x,y)C.回归直线必过原点D.x的取值范围为[?1,1]
E.实测值与估计值之差的平方和必小于零
8.同一资料进行直线回归与直线相关分析时,以下说法正确的是A.??0时,则r?0B.|r|?0时,则b?0
C.r?0时,则b?0D.r?0时,则b?0E.|b|?1
四、综合分析题
1.为了研究女大学生胸围(cm)与肺活量(L)的关系,随机抽取某高校一年级女生15名,测量其胸围与肺活量数据如表14-2所示。
表14-215名一年级女大学生的胸围(cm)与肺活量(L)
学生编号
1
胸围x76.50
肺活量y2.51
14-3
习题答案网http://.
23456789101112131415
83.9078.3088.4077.1081.7078.3074.8076.7079.4083.0090.3085.9082.6080.90
2.822.603.352.532.802.761.911.982.583.343.573.112.982.88
(1)建立肺活量y与胸围x的回归方程;(2)用两种方法对回归系数进行假设检验;(3)计算总体回归系数的95%置信区间;
2.为研究肺癌患者肺组织中的DNA加合物含量(个/108核苷酸)与吸烟的关系,某研究者用“同位素标记法〞测定了12名肺癌患者肺组织中DNA加合物含量(y),并调查其每日吸烟量(x),结果如表14-3所示。
表14-3肺组织中DNA加合物含量(个/108核苷酸)与每日吸烟量(支/天)
x
553.17
106.34
1514.92
157.78
1512.00
209.70
2015.66
2012.40
2511.40
2517.20
3019.34
y9.26
(1)问该资料有无可疑的离群点?
(2)试建立直线回归方程来分析肺组织中DNA加合物含量y与每日吸烟量x之间的关系。
一、思考题
1.建立直线回归方程的步骤:①绘制自变量与应变量的散点图,观测是否有可
14-4
习题答案网http://.
疑的离群值及两变量是否有直线趋势;②利用最小二乘法计算回归系数b及截距a,得到样本回归方程;③对回归系数进行假设检验。在此过程中应当注意考察资料是否满足模型假设条件,即应变量与自变量关系是否为线性、误差是否听从正态分布且方差相等、各观测值是否独立等。通过散点图可以初步考察两变量间是否有直线关系及识别可能的离群值。
2.方差分析的基本思想是将总的变异依照设计和需要分解成2个或2个以上的部分,在对回归系数的假设检验中,将应变量y的变异SS总分解为可以用y与x的直线关系解释的部分SS回和不能用y与x的线性关系解释的部分SS残,假使两变量间直线关系确实存在,回归的均方应大于误差的均方,大到何种程度时可以认为具有统计学意义,可根据SS回与SS残的关系构造检验统计量F,
F?MS回MS残?SS回/?回SS残/?残。在??0成立的假设下,F听从自由度为?回、?残的F分布,
可根据F分布曲线下面积确定P值,作出统计推断结论。
3.区别:①资料要求上:直线相关要求x、y听从双变量正态分布;而直线回归要求y在给定某个x值时听从正态分布,x须为可确切测量和严格控制的值。②应用上:说明两变量间相互关系用相关,此时两变量的关系是平等的;而说明应变量y和自变量x在数量上的依存关系则用直线回归分析。③意义上:相关系数
r说明两变量直线相关的方向与密切程度;回归系数b表示x每改变一个单位时,
y的平均改变量。④计算:r?lxy/lxxlyy,b?lxy/lxx。⑤取值范围:?1?r?1,
???b??。⑥r没有单位,b有单位。
联系:①对于听从双变量正态分布的同一组数据,既可作直线相关分析又可作直线回归分析,计算出的r与b符号一致。②对于同一样本,相关系数与回归系数的假设检验等价。③对于听从双变量正态分布的同一组资料,其相关系数r和回
SS回bSx2归系数b可以相互换算:r=。④用回归可以解释相关,决定系数R?。
SS总Sy4.有以下方法:方差分析、总体回归系数的t检验、计算总体回归系数的置信区间。若资料听从双变量正态分布,除上述方法外,由于相关系数与回归系数的假设检验等价,还可采用总体相关系数的t检验、计算总体相关系数的置信区间等方法来推断总体回归关系是否成立。
14-5
习题答案网http://.
二、案例辨析题
要进行直线回归分析,首先应绘制自变量与应变量的散点图,观测两变量是否有直线趋势。如图14-1所示,两变量散点呈曲线趋势,不宜进行直线回归分析。
2118火箭电泳高度(mm)15129630246810
IgA浓度(μg/ml)图14-1火箭电泳高度与IgA浓度的关系??5.335?1.599x不正确。因此直接用原始数据建立直线回归方程得到y对自
变量进行对数变换,令x??lg(x),再观测y与x?的散点图,如图14-2所示,可见对数转换后其直线趋势较为明显。
21181512963-0.4-0.20.00.81.0火箭电泳高度(mm)
IgA浓度的对数值图14-2火箭电泳高度与IgA浓度对数值的关系
??6.737?12.259x?,对回归系数进行假设建立y与x?的直线回归方程得到y14-6
习题答案网http://.
检验,得P?0.001,回归方程有统计学意义。进一步检查两次回归的决定系数,直接以IgA浓度为自变量时R2=0.911,而以IgA浓度的对数值为自变量时
R2=0.989,拟合效果更好。此案例强调了直线回归分析之前绘制散点图的重要性。
三、最正确选择题
1.A2.C3.B4.B5.D6.B7.B8.D
四、综合分析题1.解:
(1)建立肺活量y与胸围x的回归方程
1)作两变量的散点图,以胸围为横坐标,肺活量为纵坐标绘制散点图(见SPSS结果),散点呈直线趋势,故可进行直线回归分析。2)由样本数据计算如下统计量
x?81.18667,y?2.78133
lxx??x2?(?x)2/n?289.73737
lyy??y2?(?y)2/n?3.02857
lxy??xy?(?x?y)/n?26.62227
3)计算回归系数b及截距a
b?lxylxx?0.09188,a=y-bx=-04.6781???4.67810?0.09188x4)得直线回归方程为:y(2)对回归系数进行假设检验
方法一:采用方差分析对回归系数进行假设检验1)建立检验假设,确定检验水准
H0:??0,即胸围与肺活量之间无直线回归关系H1:??0,即胸围与肺活量之间有直线回归关系
?=0.05
2)计算检验统计量
14-7
习题答案网http://.
SS总??(y?y)2?lyy?3.02857
?)2?0.58241SS残??(y?ySS回?SS总?SS残?3.02857?0.58241?2.44616
F?MS回MS残?SS回/?回SS残/?残?2.44616/1?54.601
0.58241/133)确定P值,作出统计推断
?1??回?1,?2??残?n?2?13,查
F界值表(附表4),
F?(?1,?2)?F0.01(1,13)?9.07,得P?0.01,按?=0.05水准拒绝H0,回归方程有统计
学意义,可以认为女大学生的胸围与肺活量之间有直线回归关系。方法二:采用t检验对回归系数进行假设检验1)建立检验假设,确定检验水准
H0:??0,即胸围与肺活量之间无直线回归关系H1:??0,即胸围与肺活量之间有直线回归关系
?=0.05
2)计算检验统计量
Sy?x?Sb?tb?SS残n?2lxx??0.58241?0.21166
15?2Sy?x0.21166?0.012435
289.73737b0.09188??7.389Sb0.0124353)确定P值,作出统计推断
??13,查t界值表(附表3),得P?0.001,按?=0.05水准拒绝H0,回归方
程有统计学意义,可认为女大学生的胸围与肺活量之间有直线回归关系。
(3)计算总体回归系数的95%置信区间
由以上计算结果可知b?0.09188,Sb?0.012435,??13,查t界值表得
t0.05/2,13?2.160。回归系数?的95%置信区间为:
0.09188?2.160?0.012435,0.09188?2.160?0.012435)?(0.06502,0.11875)。
14-8
习题答案网http://.
SPSS操作数据录入:
开启SPSSDataEditor窗口,点击VariableView标签,定义要输入的胸围x、肺活量y,再点击DataView标签,录入数据(见图14-3,图14-4)。
图14-3VariableView窗口内定义要输入的变量
图14-4DataView窗口内录入数据
分析:
绘制散点图:
Graphs→Scatter/Dot…→SimpleScatterDefineyAxis框:yxAxis框:xOK回归分析:
Analyze→Regression→Linear…Dependent框:yIndependent(s)框:x
Statistics→RegressionCoefficients
14-9
习题答案网http://.
Estimates
ConfidenceintervalsModelfitContinueOK
输出结果
肺活量1.874767880828486889092SumofSquares2.446.5823.029胸围ANOVAbModel1df11314MeanSquare2.446.045F54.601Sig..000aRegressionResidualTotala.Predictors:(Constant),胸围b.DependentVariable:肺活量CoefficientsaModel1(Constant)胸围UnstandardizedCoefficientsStd.BError-4.6781.011.092.012StandardizedCoefficientsBeta.899t-4.6277.389Sig..000.00095%ConfidenceIntervalforBLowerUpperBoundBound-6.863-2.494.065.119a.DependentVariable:肺活量2.解:
(1)以每日吸烟量为横坐标,DNA加合物含量为纵坐标绘制散点图(见SPSS结果),散点呈直线趋势,不存在离群点,故可进行直线回归分析。
14-10
习题答案网http://.
(2)建立DNA加合物含量y与每日吸烟量x的回归方程由样本数据计算如下统计量
x?17.083,y?11.5975
lxx??x2?(?x)2/n?672.9167
lyy??y2?(?y)2/n?242.0240
lxy??xy?(?x?y)/n?318.9625
计算回归系数b及截距a
b?lxylxx?0.474,a?y?bx?3.500??3.500?0.474x得直线回归方程为:y采用方差分析对回归系数进行假设检验1)建立检验假设,确定检验水准
H0:??0,即DNA加合物含量与每日吸烟量之间无直线回归关系H1:??0,即DNA加合物含量与每日吸烟量之间有直线回归关系
?=0.05
2)计算检验统计量
SS总??(y?y)2?lyy?242.0240?)2?90.8358SS残??(y?ySS回?SS总?SS残?242.0240?90.8358?151.1882
F?MS回MS残?SS回/?回SS残/?残?151.1882/1?16.644
90.8358/103)确定P值,作出统计推断
?1??回?1,?2??残?n?2?10,查F界值表(附表4),得P?0.01,按?05=0.水准拒绝H0,回归方程有统计学意义,可以认为肺癌患者肺组织中DNA加合物含量与每日吸烟量之间有直线回归关系。
SPSS操作数据录入:
开启SPSSDataEditor窗口,点击VariableView标签,定义要输入的每日吸烟
14-11
习题答案网http://.
量x、DNA加合物含量y,再点击DataView标签,录入数据(见图14-5,图14-6)。
图14-5VariableView窗口内定义要输入的变量
图14-6DataView窗口内录入数据
分析:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国矿物棉保温制品生产线装备行业发展研究报告
- 2025至2030年中国真丝方巾数据监测研究报告
- 2025至2030年中国直线滑动圆柱导轨装置行业投资前景及策略咨询报告
- 2025至2030年中国直埋式球阀市场调查研究报告
- 2024年山东出版集团有限公司山东出版传媒股份有限公司招聘62人笔试参考题库附带答案详解
- 信息安全与风险防范措施计划
- 促进学生心理健康计划
- 优化社区论坛和交流活动计划
- 发展生物学习策略计划
- 2024年永州市东安县卫健系统招聘工作人员考试真题
- 妇科肿瘤的预防与治疗方法
- 水泥脱硝安全专篇
- 社会工作者综合能力(中级)讲义
- 2023年山东省淄博市中考历史试卷真题(含答案)
- 教学能力大赛-教学实施报告范本(汽车电子-附格式模板)
- 医院劳务派遣投标方案(技术方案)
- 《急性肺栓塞》课件
- 艾滋病患者的沟通难点与技巧课件
- 广东广州天河区明珠中英文学校2022-2023学年小学六年级第二学期小升初数学试卷含答案
- 北师大版小学数学三年级下册 口算1000题(含答案)
- 人教版二年级下册快乐读书吧课外阅读测试卷
评论
0/150
提交评论