回归系数的假设检验(7)_第1页
回归系数的假设检验(7)_第2页
回归系数的假设检验(7)_第3页
回归系数的假设检验(7)_第4页
回归系数的假设检验(7)_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归系数的假设检验 前面所求得的回归方程是否成立,即 X、Y 是否有直 线关系,是回归分析 要考虑的首要问题。我们知道即使 X、Y 的总体回归 系数为零,由于抽样误 差,其样 本回归系数 b 也不一定 为零。因此需作是否为零的假设检验,可用 方差分析或 t 检验。 .P(x, y) Y Y Y - -Y X 应变量 Y 的平方和划分示意图 任一点 P 的纵坐标被回归直线与均数 截成三段: 第一段 ,表示实测点 P 与回归直线的纵向距离,即 实际值 Y 与估计)(Y 值 之差,称为剩余或残差。 第二段 ,即 Y 估计值 与均数 之差,它与回 归系数的大小有关。 |b|)(Y 值越大, 也越大,反之亦然。当 b=0 时, 亦为零,则 =Y )()(Y ,也就是回归直线不能使残差 减小。)( )( 第三段 ,是应变量 Y 的均数。 依变量 y 的总变 异 由 y 与 x间存在直线关系所引起的变异 与)( )(y 偏差 两部分构成,即)( )()()(yy 上式两端平方,然后对所有的 n 点求和,则有 2)(y2)()(y )(yy 由于 ,所以)(xbyxay )(xb 于是 )( yxb )()( xbyx )(b =0 所以有 2)(y22)()(yy 反映了 y 的总变异程度,称 为 y 的总平方和,记为 ;2)(y yS 反映了由于 y 与 x间存在直线关系所引起的 y 的变异程度,称为回归 平方和,记为 ; 反映了除 y 与 x 存在直 线关系以外的原因,包括随RS2)( 机误差所引起的 y 的变异程度,称为离回归平方和或剩余平方和,记为 SSr。总 变异 SS 总 是由回 归关系引起的 SS 回 和与回归无关的其它各种因素产生的 SS 剩 所构成。若回归直线与各实测 点十分吻合, 则 SS 回 将明显大于 SS 剩 ,当全部实 测值都在回归直线上时,SS 总 =SS 回 ,SS 剩 =0,反之,若回归直线拟合不好,SS 回 相对较小,SS 剩 则相对增大。可见 SS 回 /SS 剩 反映了回 归的效果。 上式又可表示为: rRySS 这表明 y 的总 平方和划分 为回归平方和与离回归平方和两部分。与此相对应, y 的总自由度 也划分为 回归自由度 与离回归 自由度 两部分,即ydf Rdf rdf rRf 在直线回归分析中,回归自由度等于自变量的个数,即 ;y 的总自由度1Rdf ;离回 归自由度 。于是:1ndfy 2ndfr 离回归均方 ,回归均方rrfSM/ RRdfSM/ (1)、方差分析法: 具体计算如下: 1、建立无效假设: H0 := 0, 即胆固醇与年龄之间无直线关系 H1 :0, 即胆固醇与年龄之间有直线关系 = 0.05 2、计 算 SS 总 =88.8081 df 总 =19 SS 回 =b l xy =0.141 (453.7385)=63.9771 df 回 =1 SS 剩 = SS 总 SS 回 =88.8081-63.9771=24.8310 df 剩 =18 方差分析结果表 变异来源 SS df MS F 总变异 88.8081 19 回归 63.9771 1 63.9771 46.377 剩余 24.8310 18 1.3795 3、查 表确定 p 值 F0.05(1,18) = 4.41 , F0.01(1,18) = 8.29 P0.01 故按 = 0.05 水准拒 绝无效假设,接受备择假设。 4、结论 :可以 认为高血脂病人治疗前胆固醇与年龄由直线关系。 (2)、t 检验 基本思想与样本均数与总体均数比较的 t 检验类似,而检验统计量 t 值的计 算按下式完成: df = n-2 xyblS t/0 本例 n =20,SS 剩 =1.3795 , lxx=3216.95, b=0.141 1745.2083.yxS.9.36b812.07.4t 按 df = 18 ,查 t 界值表,t 0.05(18) =2.101, t0.01(18) =2.878 ,按=0.05 水准,拒 绝 H0, 接受 H1 , 结论同上。 直线回归方程的应用 统计预测: 1、总 体回归 系数 的区间估计 根据参数估计原理,回归系数 b 是总体回归系数 的点估计,正像样本均数 不一定恰好等于总体均数 一样,需要 对总体回归系数 进行区间估计。X ),(2()2( bnbnStt 式中 Sb为回归系数的标准 误;n-2 为自由度。 回归方程为 xy14.06. 根据资料的样本回归系数 b=0.141 估计总体回归系数 的 95%可信区间。 已知 b=0.141, sb=0.0207, t0.05(18)=2.101,1820 则总体回归系数 的 95%可信区间为 (0.141-2.101 0.0207, 0.141+2.101 0.0207)=(0.0975,0.1977) 2、 的区 间 估计Y 是指总体中自变量 X为某一定值 X0时, 的总体均数。对 的估计可 YY 计算可信区间: ),(2()2( YnYnStt 式中 即 的标准误,可按下式计算:YS 20. )(1XnSXY 式中 SY.X为剩余标准差。当 时, ,此时,可信区间的范0 nSXY/. 围最窄, 预测精度相对较高。 试计算当 X0=50 岁时, 的 95%可信区间。Y 已知 , , sy.x=1.17545.3995.3216)( =2.661+0.141 50 = 9.71Y)/(3418.095.3216)0(175. 2 LmolS t0.05(18)=2.101,820 当 X0=50 时, 的 95%可信区间为Y (9.71-2.101 0.3418,9.71+2.101 0.3418)= ( 8.99, 10.43) Lmol/ 即当年龄为 50 岁时,估计其胆固醇的的总体均数 在(8.99, 10.43) Y 范围内的可能性为 95%。Lmol/ 2030405060年 龄4.6.08.0 10.12.0胆固醇 R Sq线 性 = 0.721 3、个体 Y 值的容许区间 总体中,X 为一定值时,个体 Y 值的波动范围,可按下式求出: ),(2()2(nnStt 式中 SY为 X 取一定值时,个体 Y 值的标准差,其 计算公式为 20. )(1XnY 试计算当 X0=50 时,个体 Y 值的 95%容许区间。 已知 =9.71,t0.05(18)=2.101 ,SY.X=1.175 230.195.326)40(175. YS 故当 X0=50 岁时,个体 Y 值的 95%容许区间为: (9.71-2.101 1.2230, 9.71+2.101 1.2230)=(7.14, 12.28) Lmol/ 即当年龄为 50 岁时,总体中有 95%的个体 Y 值波动在(7.14 ,12.28) 的范围内。Lmol/ 2030405060年 龄4.6.08.0 10.12.0胆固醇 R Sq线 性 = 0.721 用回归方程进行统计控制 控制是指党要求 Y 值在一定的范围内波动时,如何通过控制 X 的范围 来实现统计控制的目标, 所以统计控制是利用回归方程进行的逆估计。如: 为使一名糖尿病人的血糖维持在正常范围(4.44 6.66mol/L),如何控制血 中胰岛素水平?这可以对回归的逆运算来实现。 例如:资料已建立了有胰岛素估计血糖平均水平的直线回归方程,问: 欲将血糖水平控制在正常范围的上限 6.66mol/L 以内时,血中胰岛素应维 持在什么水平上? 已知 ,取 0.05 ,本例当6324.1,0 458.079.18ysnXY, 个体 y 值取 6.66mol/L 时的 x 值,故取 单侧 t0.05(18)=1.734,所得方程为: xStY 458.062.1.77.6.)18(05. ) ( 由此式解得 x = 32.64(mu/L) , 即如要将一名糖尿病人的血糖控制在 6.66mol/L 以内,胰岛素水平可维持在 32.64(mu/L)以上。 又例:某市环境监测站在某交通点连续测定 30 天,每天定 时采样 3 次,发现 大气中 NO2浓 度 Y(mg/m3)与当时的汽车流量 X(辆 /小时)呈直线关系,根据 90 对观测数据求得回归方程 ,剩余标准差XY01.648.0 。若 NO2 最大容许浓度为 0.15mg/m3,则汽车流量应如何控制?035.xys 设 =0.05。 本例 ,=0.05,=90-2=88,查表得单侧 t0.05(88)=1.6624。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论