回归分析及独立性检验规律小结.doc_第1页
回归分析及独立性检验规律小结.doc_第2页
回归分析及独立性检验规律小结.doc_第3页
回归分析及独立性检验规律小结.doc_第4页
回归分析及独立性检验规律小结.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、本章知识结构二、知识要点与联系1已知回归直线的斜率估计值为k,样本点的中心为(m, n),则回归直线方程为 。2相关指数R2 ,R2越 表示回归效果越好。3建立回归模型基本步骤: 第一步:第二步:第三步:第四步:第五步:4三维柱形图中,估计“X与Y有关系”成立的可能性越大的依据是 。5二维条形图中,估计“X与Y有关系”成立的可能性越大的依据是 。6精确判断两个分类变量是否有关系的具体做法是 。7考查某种针剂的预防效果进行试验数据如下:注射针剂的串病12例,未患病48例,未注射针剂的患病22例,未患病35例,则认为针剂无效的可能性约为 。三、综合型问题剖析例1: 假设关于某设备的使用年限x和所支出的维修费用 y(万元),有如下的统计资料。使用年限x23456维修费用y2.23.85.56.57.0若由资料知,y对x呈线性相关关系。试求:线性回归方程的回归系数;解:由已知数据制成表格。i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3xi24916253690所以有评注:例2为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;(2)描述解释变量与预报变量之间的关系;(3)计算残差、相关指数R2.解:(1)散点图如右所示天数繁殖个数(2)由散点图看出样本点分布在一条指数函数的周围,于是令Z=lny,则 x123456Z1.792.483.223.894.555.25由计数器算得,则有(3)6.0612.0924.0948.0495.77190.9612254995190即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.评注:例3在某医院,因为患心脏病而住院的 665 名男性病人中,有 214 人秃顶,而另外 772 名不是因为患心脏病而住院的男性病人中有 175 人秃顶 (1)利用图形判断秃顶与患心脏病是否有关系 (2)能够以 99 的把握认为秃顶与患心脏病有关系吗?为什么?解:根据题目所给数据得到如下列联表:(1)相应的三维柱形图如图3.2一4所示比较来说,底面副对角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃顶与患心脏病有关”.(2)根据题中的数据,得到16.3736 . 因此有 99 的把握认为“秃顶与患心脏病有关” .评注:例4为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:性别与喜欢数学课程列联表喜欢数学课程不喜欢数学课程总计男 37 85122女 35 143178总计 72 228300由表中数据计算得的观测值能够以95的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐明得出结论的依据解:可以有约95以上的把握认为“性别与喜欢数学课之间有关系”作出这种判断的依据是独立性检验的基本思想,具体过程如下:分别用a , b , c , d 表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例与女生中喜欢数学课的人数比例应该相差很多,即应很大将上式等号右边的式子乘以常数因子,然后平方得,其中因此越大,“性别与喜欢数学课之间有关系”成立的可能性越大另一方面,在假设“性别与喜欢数学课之间没有关系”的前提下,事件A =3. 841的概率为P (3. 841) 0.05, 因此事件 A 是一个小概率事件而由样本数据计算得的观测值k=4.514,即小概率事件 A发生因此应该断定“性别与喜欢数学课之间有关系”成立,并且这种判断结果出错的可能性约为5 %所以,约有95 的把握认为“性别与喜欢数学课之间有关系”.评注:四、规律总结1作为非确定性关系的相关关系包括两种情况:其一,两个变量中,一个变量为可失控变量,另一个变量为随机变量;其二,两个变量均为随机变量,主要研究第二种情况。2一元线性回归分析是回归分析中最简单,也是最基本的一种类型,它类似于代数方程理论中的一元一次方程。3求回归直线方程和相关系数通常是用计算器完成的,列出相应的表格可便于求出回归直线方程中的系数和相关系数。4对两个变量的线性相关性进行检验,有几种彼此等价的方法,相关系数检验法只是其中一种。5用随机变量K2的值作22列联表的独立性检验时,要求表中的4个数据都要大于5,为此,在选取样本容量时,一定要注意这一点。6独立性检验的基本思想类似于反证法。要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论