版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、考点五回归分析与独立性检验考点要揽会做两个相关变量的数据的散点图,会利用散点图认识变量间的相关关 系。了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回 归方程。 了解独立性检验(只要求2 2列联表)的基本思想、方法及其简单应用。 了解回归分析的基本思想、方法及其简单应用。命题趋向以选择题和填空题的形式考查线性回归系数或利用线性回归方程进行预 测,在给出临界值的情况下判断两个变量是否有关。在解答题中与频率分布结合考查线性回归方程的建立及应用和独立性检 验的应用。备考策略系统掌握有关概念能熟练的运用公式求线性回归系数一、回归分析Xi -x yy 、 XiYi - nXy(一)回归直
2、线方程:y = bx a,其中 b=i吕n、Xi -X 2n、Xi2 -nX2i=1i =1w = y -依,X, y称为样本中心点,因而回归直线过样本中心点 (二)样本相关系数r用来衡量两个变量之间线性相关关系的方法Xi X yi yr越接近1,表im nnXi -X2yi -y2 i =1当r 0时,表明两变量正相关;当r :0,表明两变量负相关明两变量的线性相关性越强;r越接近0,表明两变量的线性相关关系几乎不存 在,通常当r 0.75时,认为两个变量有很强的线性相关关系.理解总结(一)线性回归分析一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认
3、具有线性相关关系后,再求回归直线方程回归分析的一般步骤为:1. 从一组数据出发,画出散点图,只有在散点图大致呈线性时,求出的回归直线方 程才有实际意义,否则,求出的回归直线方程毫无意义;2. 如果具有线性相关关系,求出回归方程y = 8x a?,其中?是常数项,b?是回归 系数;3. 根据回归方程,由一个变量的值,预测或控制另一个变量的值(二)估计线性回归模型中的未知参数 召和?时,般利用最小二乘法.其计算公式为:?=v Xi -X Yi-y v XiYi - nxyi 4i 4n二Xi - Xi =4P 22x Xi - nXi 二o? = ?-bX其中X丄Xi,Y 丄 Yi.n i吕n i
4、吕对此公式不要求记忆,但要会用. 咼考导航例1假设关于某设备使用年限X和所支出的维修费用y(万元)有如下的统计资料:使用年限X23456维修费用Y2.23.85.56.57.0若由资料知Y对X呈线性相关关系试求:(i)线性回归方程? = bX ?的回归系数a,?;(2)估计使用年限为10时,维修费用是多少? 解题思路求回归直线方程的计算量较大,需要细心、谨慎地计算.可以通过列表,计算nn出XiYiXi2 , X , y,后将这些量代入公式计算.i =4i 丑解析:(1)制表如下:i12345合计X2345620yi2.23.85.56.57.025XYi4.411.422.032.542.01
5、12.3?Xi24916253690nn2? x=4; ? y =5; ?送 Xj =90;送 xy =112.3i i 于是JH1.23,依心皿. 回归直线方程为y=1.23x 0.08=12.38.当x =10时,0=12.38,即估计使用10年时,维修费用是12.38万元.二、独立性检验(一)独立性检验的概念y1y2总计X1aba +bX2cdc +d总计a +cb +da +b +c + d其样本频数列联表(称为2 2列联表)为:n (ad -bcf般地,假设有两个分类变量 X和Y ,它们的值域分别为 g, X2 和治,耐,我们利用随机变量K2来确定在多大程度上可以(a+b(c + d
6、(a + c(b + d )认为“两个分类变量有关系”,这种方法称为两个分类变量的独立性检验.(二)独立性检验的基本思想独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一 结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量 K2应该很小,如果由观测数据计算得到的K 2的观测值k很大,则在一定程度上说明假设不合理.具体比较如下表:反证法原理与独立性检验原理的比较反证法原理在假设Ho下,如果推出一个矛盾,就证明了 Ho不成立.独立性检验原理在假设Ho下,如果出现一个与Ho矛盾的小概率事件,就推 断Ho不成立,且该推断犯错误
7、的概率不超过这个小概率.(三)独立性检验的方法假设Hi: “ X与Y有关系”,可按如下步骤判断结论Hi成立的可能性:1. 通过等高条形图,可以粗略地判断两个分类变量是否有关系 ,但是这种判断无 法精确地给出所得结论的可靠程度2. 利用独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判 断的可靠程度,具体做法是:2n(ad - be)(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a,然后通过下表确定临界值k0.P(K2 * )0.500.400.250.150.100.050.0250.010 ().0050.001ko0.4550.7081.3232.
8、0722.7063.8415.0246.635 879 10.828由公式宀& Fe d; eb d,计算的观测值k *(3)如果k 一 k。,就推断“ X与Y有关系”.这种推断犯错误的概率不超过a;否 则,就认为在犯错误的概率不超过 a的前提下不能推断“ X与Y有关系”,或者 在样本数据中没有足够证据支持结论“ X与Y有关系”.理解总结根据独立性检验的基本思想,可知对于K2的观测值k ,存在一个正数ko为判断规则的临界值,当k k。,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量没有关系” 在实际应用中,我们把k 一 ko解释为有1 - P K2 - ko 100%的把握认为“两
9、个分类变量之间有关系”;把k : ko解释为不能以1 - P K2 一 ko 100%的把握认为“两个分类变量之间有关系”,或者样本观测数据没有提供“两个分类变量之间有关系”的充分证据咼考导航例1 (1)下列关系中不是相关关系的是?()(A) 产品投入的广告费与产品的销售量.(B) 数轴上的点与实数X.(C) 人的身高与体重的大小.(D) 一天中的湿度与气温的高低 对分类变量X与Y的随机变量K 2的值,下列说法正确的是()(A) K2越大,“X与Y有关系”可信度越小.(B) K2越小,“X与Y有关系”可信度越小.(C) K2越接近于0, “ X与Y无关”程度越小.(D) K2越大,“X与Y无关
10、”程度越大.解题思路(1)观察给出的两个量之间是否是函数关系、是否具备一定的联系,是否没有 关系,从而可以判断出各种关系(2) K2是反映变量X与Y是否有相关关系的一个重要参数.解析:(1)A项产品投入的广告费与产品的销售量、C项的人的身高与体重的大小、 D项的一天中的湿度与气温的高低之间都是有一定的联系但是是不确定性的关 系,故为相关关系.B项数轴上的点与实数x之间为确定的函数关系.例2为了比较注射A、B两种药物后产生的皮肤疱疹的面积,选200只家兔做 试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组 注射药物B .(1) 甲、乙是200只家兔中的2只,求甲、乙
11、分在不同组的概率;(2) 下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积60,65)65,70)70,75)75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积60,65)65,70)70,75)75,80) 80,85)频数1025203015完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小频率/组距JI111T | Irli厂i1匚T 1VT 11 IT 11尸iV1V1 II1V1VH11: :IWtL1V11 1111hV11h111Il; 11一11 人VI_ -1
12、1I|111V1111V1A1LI 1|111II1AT*-_&5 了U 73 U 85疱疹面积 图1注射药物4后皮肤疱疹面积的频率分布直方图0.0f频率/组距r!讣.-.1iTI1r II厂11fIIIiIVIi11t1iiI1I fl11riLJ_i1J_11Jui1 lUi1卜r11i111fl 11111 1-11111VLIIII-.L .-.11VV1A亠11JV1i|11I111VI i| A11r-r_疱疹面积2注射药物后皮肤疱疹 面积的频率分布直方图完成下面2 2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹 面积与注射药物B后疱疹面积有差异”.疱疹面积小于70
13、mm2疱疹面积不小于70mm合计注射药物Aa =b =注射药物Bc =d =合计n =附:KSnadbc(a +b c +d (a +c j(b +d )P(K2)0.100.050.0250.0100.001ko2.7063.8415.0246.63510.828解题思路(1) 将甲、乙两只家兔分在不同组,可在剩余的198只中选99只,也就是将剩 余的分为两组,然后再将甲乙两只分在两个组中即可;(2) 第问画频率分布直方图时,应该首先计算出相应的频率,要注意其纵轴为频率与组距的比值;在频率分布直方图中,中位数将小矩形的面积分为相等的 两部分,据此可以估计中位数所在的范围;第问可以根据给出的频
14、数分布表得 到2 2列联表,然后利用给定的公式和对应表来确定其可信程度.199【解析】甲、乙两只家兔分在不同组的概率为:PUCC9100.C2001 99(2)0.0&0.070.06).050.040.030.020.01-O_65_70758085疱疹面积图1注射药物虫后皮肤疱疹面积的频率分布直方图+频率/组距 在频率分布直方图中,中位数两边对应的小长方形的面积相等,都等于0.5,可以 看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹 面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药 物B后疱疹面积的中位数.OOOOOOOOz60657075
15、8085 舟疹面积图2注射药物B后皮肤疱疹面积的频率分布直方图表3:疱疹面积小于70mm2疱疹面积不小于70mm合计注射药物Aa = 70b =30100注射药物Bc = 35d =65100合计10595n = 200K 200 (A)变量x与y正相关,u与v正相关(B)变量x与y正相关,u与v负相关30 65: 24.56100 100 105 95由于K210.828 ,所以有99.9%的把握认为“注射药物 A后的疱疹面积与注射药物B后的疱疹面积有差异”.迁移应用1、( 2009宁夏海南卷理科)对变量x, y有观测数据x,yi i =1,2,,10,得散点图1;对变量u,v有观测数据Ui
16、,Vi i =1,2/ ,10 ,得散点图2.由这两个散点图可以判断。(C)变量x与y负相关,u与v正相关(D)变量x与y负相关,u与v负相关2、(2010 湖南卷文科)则其回归方程可能是(A) ? -10x 200某商品销售量y (件)与销售价格x (元/件)负相关,(B)?=10x200Vi W 25 20 15 W(C) y - -10x -200(D)yy=iox _2oo3、(2011 江西卷文科)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身咼x(cm)174176176176178儿子身高y (cm)175175176177177则y对x的线性回归方程为
17、()(A)yy = x _i(B)y = x i1(C) y x 88( D) y = 17624、 (2011 江西卷理科)变量X与Y相对应的一组数据为(10, 1), (11.3,2 ),(11.8,3 ), (12.5,4 ), (13,5);变量 U 与 V 相对应的一组数据为(10,5 ),(11.3,4 ), (11.8,3 ), (12.5,2 ), (13,1 ),几表示变量Y与X之间的线性相关系数,Q表示变量V与U之间的线性相关系数,则()(A)r2: a: 0(B)0 r2: r1(C)r2: 0: r1(D)r2二 r15、 (2012 湖南卷理科)设某大学的女生体重y
18、(单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据,yi i =1,2,,n,用最小二乘法建立的回归方程为y = 0.8585.71,则下列结论中不正确的是()(A) y与x具有正的线性相关关系(B) 回归直线过样本点的中心 x, y(C) 若该大学某女生身高增加1cm则其体重约增加0.85kg(D) 若该大学某女生身高为170cm则可断定其体重必为58.79kg& (2012 新课标全国卷文科)在一组样本数据x1,y1 , x2, y2 ,焉,yn(n 2 , X1,X2, ,xn不全相等)的散点图中,若所有样本点 Xi,% i = 1,2, ,n1都在直线y = 1 x 1上,则这组样本数据的样本相关系数为()21(A) -1(B) 0(C) -(D) 127、(2010 广东卷文科)某市居民20052009年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)的统计资料如下表所示:年份20052006200720082009收入11.512.11313.315支出6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是 ,家庭年平均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 保育员学期工作计划小班简短2022
- 中职学生开学典礼精彩发言稿(14篇)
- 体育部部长竞选演讲稿三篇
- 五心好家长先进事迹(8篇)
- 主管护师述职报告
- 节水节电课件教学课件
- 影响农村教师专业发展问题的研究结题报告
- 影响地产金融的因素
- 轮胎噪声测试方法 转鼓法 征求意见稿
- 2025年山东辖内农村商业银行高校毕业生招聘(2180人)笔试备考题库及答案解析
- 门诊发热病人登记表
- 新课标-人教版数学六年级上册第五单元《圆》单元教材解读
- 2022湖北汉江王甫洲水力发电有限责任公司招聘试题及答案解析
- 2019新人教必修1unit2Travelling-Around整单元完整教案
- 大学生辩论赛评分标准表
- 诊所污水污物粪便处理方案及周边环境
- 江苏开放大学2023年秋《马克思主义基本原理 060111》形成性考核作业2-实践性环节(占过程性考核成绩的30%)参考答案
- 《我是班级的主人翁》的主题班会
- 酒店安全设施及安全制度
- 近代化的早期探索与民族危机的加剧 单元作业设计
- 租赁机械设备施工方案
评论
0/150
提交评论