生物统计学:直线相关和回归_第1页
生物统计学:直线相关和回归_第2页
生物统计学:直线相关和回归_第3页
生物统计学:直线相关和回归_第4页
生物统计学:直线相关和回归_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第十章 直线相关与直线回归问题的引入变量间关系问题:身高体重、凝血时间凝血酶浓度、肺活量体重、药物剂量与动物死亡率等。相关分析用于研究事物或现象之间有无相关关系(或互依关系)、关系的方向和密切程度。回归分析用于研究事物或现象之间的数量依存关系。相关分析和回归分析都属于双变量分析范畴。第一节 直线相关分析一、直线相关的概念二、相关系数的意义及计算三、相关系数的假设检验一、直线相关的概念直线相关(linear correlation): 又称简单相关(simple correlation),用于研究两个来自正态分布总体的连续性随机变量X和Y之间的线性关系。最直观的方法是绘制散点图。实 例 编号身

2、高(m)X体重(l )YX2Y2XY(1)(2)(3)(4)(5)(6)11.7424.6503.03521.6238.10021.7184.2782.95218.3017.35031.7144.4202.93819.5367.57641.7124.3792.93119.1767.497161.6923.9112.86315.2966.617合计27.26666.29346.471275.73113.04表12-1 16名1822岁男大学生肺活量及身高测量资料二、相关系数的意义及计算相关系数(correlation coefficient):又称积差相关系数,是反映两个变量线性关系的方向和密切

3、程度的指标,用符号r 表示。相关系数的特点: r 是没有单位的数值,取值范围为 图74 相关系数示意图 图12-2 相关系数示意图 应当注意的几点:Rr是样本相关系数,是总体相关系数 的估计值。相关关系并不一定是因果关系,只反映两变量的互依或伴随关系。相关分析的任务是对相关关系给予定量的描述。相关系数的计算: 三、相关系数的假设检验 r0原因: 由于抽样误差引起,=0 存在相关关系, 0公式:,n-2Sr- 样本相关系数的标准误 (一)t 检验法:(二)查表法:根据自由度查相关系数r界值表(附表12)。K=1,自由度v ,查r0.05 ,r0.01。R r0.05 , p0,Y随X的增大而增大

4、(减少而减少) 斜上; b0,Y随X的增大而减小(减少而增加) 斜下; b=0,Y与X无直线关系 水平。 b越大,表示Y随X变化越快,直线越陡峭。散点图截距a和斜率b的估计: 最小二乘法原则(least square method):使各散点到直线的纵向距离的平方和最小。即使 最小。实 例 编号汽车流量XNO2YX2Y2XY(1)(2)(3)(4)(5)(6)113000.06616900000.00435685.8214440.07620851360.005776109.7443165200289280.84417560024336273.

5、936910600.02911236000.00084130.74合计132080.921198923520.1150751445.164 表12-2 汽车流量与大气中二氧化氮浓度资料三、回归系数的假设检验b0原因: 由于抽样误差引起,总体回归系数=0 存在回归关系,总体回归系数 0公式: ,n2Sb为回归系数的标准误 SY.X为Y 的剩余标准差 扣除X的影响后Y 的变异程度。 XYSS总=SS回+SS残四、直线回归的图示法回归线五、回归方程的应用1.描述两变量间的数量上的依存关系2.利用回归方程进行统计预测3.利用回归方程进行统计控制年龄(岁)X尿肌酐含量Y(mmol/24h)yx二、直线回

6、归方程的求法年龄(岁)X尿肌酐含量Y(mmol/24h)三、直线回归方程中的统计推断(一)回归方程的假设检验1.方差分析(1)建立检验假设并确定检验水准 H0:=0 H1: 0 =0.05 SS总=SS回+SS残 (3)计算检验统计量F值SS总=lYY =1.0462 SS回=blXY=l2XY/lXX=5.8452/42=0.8134SS残= SS总- SS回=1.0462-0.8134=0.2328v总=v回+v剩v总=n-1,v回=1, v残=n-22.t 检验(2)计算检验统计量t值(1)建立检验假设并确定检验水准(3)确定P值下结论 (二)总体回归系数的可信区间此区间不包括0 (三)

7、利用回归方程进行估计与预测1.总体均数 的可信区间平均有100(1-)个可信区间包括总体均数2.个体Y值的预测区间平均将有100(1-)个个体值在求出的范围内表2 温度与蛙的心率对象 温度(cm) (X) 心率(kg) (Y)1 2 52 4 113 6 114 8 145 10 226 12 237 14 328 16 299 18 32Y=2.14+1.775x第三节 回归和相关分析的区别与联系及应用注意事项一、应用注意事项:作相关和回归分析要有实际意义。有相关关系不一定有因果关系;但若有因果关系,必然有相关关系。相关或回归关系不能任意“外延”。绘制散点图。相关系数和回归系数都必须作假设检验。区别: 1. 资料: X、Y 均为随机变量,服从 双变量正态分布 Y正态随机变量,X为选定变量 回归2. 应用 :回归 由一个变量值推算另一个变量值 相关 只反映两变量间互依关系 相关3. 回归系数有单位,相关系数无单位二、相关和回归的区别与联系联系: 10名男生身高和他们父亲

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论