版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十二章简单回归分析(twovariableregressionanalysis)要求:1.掌握回归分析的应用条件和算法2.了解回归分析方法在卫生管理中的应用3.掌握回归分析在SPSS上实现的操作过程第一节简单线性回归一、线性回归的概念及其统计描述图12-114例中老年健康妇女基础代谢与体重的散点图图12-2免疫球蛋白浓度与沉淀环直径数据散点图二、回归模型的前提假设(LINE)
一般自变量x可以是随机变量,也可以是精确可测的;因变量y
必须是服从正态分布的随机变量。1.线性性(Linear)x与y呈线性关系2.独立性(Independent)n个观测值是独立的3.正态性(误差项εi是正态的,εi
~N(0,σ2))4.等方差性(EqualVariance)无论x在什么范围取值,y都具有相同的方差等方差性
x1x2x3
xyμ1μ2μ3三、回归参数的估计:最小二乘估计原理:利用最小二乘法(
leastsquaremethod)—回归残差平方和最小离差参数而可在计算器上实现例12-1开机mode→2→Shift/INV→AC→50.7→xD,yD→4175.6→DATA53.7→xD,yD→4435.0→DATA→…→…→…例12-1
估计例11-1中基础代谢(y)与体重(x
)的的回归方程体重x50.753.737.151.7………61.5代谢
y4175.64435.03460.24020.8………5029.2结果四、总体回归系数β的统计推断(一)回归系数b的标准误Sb(二)回归系数β的假设检验(1)t检验法拒绝H0,可认为体重与基础代谢之间有线性回归关系。(2)方差分析法YXP(X,Y)回归贡献残差(随机的)总变异因变量总变异的分解因变量总变异的分解例12-3用方差分析法对例12-1资料回归系数作假设检验
变异来源SSυMSFP回归4318227.7214318227.72158.36<0.05残差327219.301227268.27总4645447.0113---拒绝H0,可认为体重与基础代谢之间有线性回归关系。(三)直线回归系数β的可信区间在例12-1中,估计总体回归系数β
的95%可信区间(四)决定系数r2即总变异中可由x解释的回归贡献约占93%。说明40~60岁健康妇女的体重信息大约可以解释自身基础代谢信息量的93%。回归分析的SPSS操作例12-1在某地一项膳食调查中,随机抽取了14名40~60岁的健康妇女,测得每人的基础代谢(kj/d,每日千克焦耳)与体重(kg)数据如下。据此描述y与x的回归关系?编号基础代谢(y)体重(x)编号基础代谢(y)体重(x)14175.650.783970.648.624435.053.793983.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.659.764970.662.8134874.462.175359.767.3145029.261.5例12-1资料变量的确定例12-1资料分析结果直线回归与直线相关的区别区别1.r
没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有关,且不能根据
b
的大小判断回归关系的密切程度。2.相关表示相互关系,没有依存关系;而回归有依存关系3.对资料的要求不同:当x和y都是随机的,可以进行相关和回归分析;当y是随机的(x是控制的),理论上只能作回归而不能作相关分析。直线回归与直线相关的联系
联系1.均表示线性关系;2.符号相同:共变方向一致;3.假设检验结果相同:是否存在共变关系;也称为Ⅱ型回归。第二节线性回归的应用统计预测统计控制一、统计预测在例12-1中第一观测点x1=50.7,求y的均数的95%可信区间(一)当x=xp固定时,对估计值y
的均数的区间估计(二)当x=xp固定时,对个体y的预测区间估计在例12-1中第一观测点x1=50.7,求y的个体值的95%可信区间y
的个体值和均值的可信区间均值可信区间个体值可信区间x预测实例例某地卫生防疫站研究10年来乙脑发病率(1/10万,预报量Y)与相应前一年7月份日照时间(小时,预报因子X)之间的数量关系,先将乙脑发病率作平方根反正弦变换:1990年7月份日照时间X0=260小时,试估计1991年该地乙脑发病率(设α=0.05)解:利用个体值的预测范围估计乙脑发病率二、统计控制在一定y值的前提下,确定自变量x值的取值,方法同上。例12-5
在硝酸钠的溶解试验中,测得在不同温度x下溶解于100份水中的硝酸钠份数y的数据见表。若要求溶解于100份水中的硝酸钠份数在80份以上,温度应不低于多少?设置信度为95%。温度(C0)x0410152129365168溶解份数y66.77176.380.685.792.999.4113.6125.1分析:求单侧区间下限直线回归应用应注意的问题1.作回归分析要有实际意义;2.在回归分析之前,应先绘制散点图,观察点趋势;3.当样本含量较大时,统计学检验的作用减弱;4.应用时,应以内插为主,适当外延;5.自变量的选择:原因型容易测量的变异小的
如:年龄、身高、体重、体表面积第三节残差分析基础代谢依体重数据回归的标准化残差图结果:散点在以0参考线的2随机波动且均匀分布。结论:模型拟合度高。不同类型标准化残差图以因变量取值为横坐标,以标准化残差为纵坐标结果:误差的方差随着y的增大而增大(减小)结论:误差不满足方差齐性。不同类型标准化残差图以因变量取值为横坐标,以标准化残差为纵坐标结果:散点呈弯曲的点带状结论:两变量是非线性的。不同类型标准化残差图以因变量取值为横坐标,以标准化残差为纵坐标结果:散点呈线性趋势的点带状结论:可能漏掉了另外的自变量。不同类型标准化残差图以因变量取值为横坐标,以标准化残差为纵坐标结果:散点在0附近2或3均匀分布结论:有奇异点(离群点)。2之外的离群点不同类型标准化残差图以因变量取值为横坐标,以标准化残差为纵坐标结果:散点在0附近2或3均匀分布结论:拟合恰当。第四节非线性回归一、对自变量实施变换实现线性化二、变换自变量实现线性回归的步骤1.将观察数据(xi,yi)作散点图,观察点分布变化特点2.选定恰当的变换公式(只能对x进行变换,y不变)3.对变换后的数据用常规最小二乘法估计线性参数4.一般拟合多个相近的模型,然后通过对各个模型的拟合优度评价挑选合适的模型。例12-6某研究者随访测得某女童1~9个月的身高(cm)数据,试用合适的回归模型拟合月龄与身高的关系。月(x)123456789身高(y)545761636466676869形似对数曲线时间变量取对数变换月(x)123456789X´=ln(x)00.693151.098611.386291.609441.791761.945912.079442.19722身高(y)5457616364
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年版:特许连锁经营合同
- 2025年度虚拟现实娱乐项目合作协议范本3篇
- 2024年环保项目委托合同:废气处理设施建设与运营
- 2024版智能语音识别系统研发合同
- 2024年私借私还转账借款协议
- 2024年度债务转移及债务清偿监督合同范本3篇
- 2025年度智能建筑项目监理合同补充协议书3篇
- 2024年绿色制造生产车间承包与环保责任承诺书3篇
- 2024年环保设备采购与安装承包合同
- 2025年度橱柜安装与售后服务标准合同范本3篇
- 锥坡工程量计算
- 融资服务(居间)协议带分流表参考
- 《仪器分析》课后习题答案
- 浅层气浮的工艺原理及操作
- 医疗器械风险管理计划
- 北京保险中介行业营销员增员及流动自律公约
- 柴油发电机施工方案33709
- 外来施工单位人员报备登记表完整
- 100以内加减法混合[列竖式运算练习]
- 深圳市建设工程施工围挡图集(试行版_下半部分).pdf
- 全国城市雕塑行业设计收费标准
评论
0/150
提交评论