版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
章末复习一、两个基本思想1.回归分析的基本思想回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分析的思想.注意理解以下几点:(1)确定线性相关关系线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系.判断是否线性相关的依据是观察样本点的散点图.(2)引起预报误差的因素对于线性回归模型y=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))+e,引起预报变量y的误差的因素有两个:一个是解释变量x,另一个是随机误差e.(3)回归方程的预报精度判断回归方程的预报精度是通过计算残差平方和来进行的,残差平方和越小,方程的预报精度越高.简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值.(4)回归模型的拟合效果判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通过残差图直观判断,二是通过计算相关指数R2的大小判断.2.独立性检验的基本思想独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算随机变量K2的观测值,最后由K2的观测值很大在一定程度上说明两个分类变量有关系.进行独立性检验要注意理解以下三个问题:(1)独立性检验适用于两个分类变量.(2)两个分类变量是否有关系的直观判断:一是根据2×2列联表计算|ad-bc|,值越大关系越强;二是观察等高条形图,两个深色条的高度相差越大关系越强;(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.二、两个重要参数1.相关指数R2相关指数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好.2.随机变量K2随机变量K2是用来判断两个分类变量在多大程度上相关的变量.独立性检验即计算K2的观测值,并与教材中所给表格中的数值进行比较,从而得到两个分类变量在多大程度上相关.三、两种重要图形1.散点图散点图是进行线性回归分析的主要手段,其作用如下:一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;二是判断样本中是否存在异常.2.残差图残差图可以用来判断模型的拟合效果,其作用如下:一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.二是确认样本点在采集中是否有人为的错误.题型一回归分析思想的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.例1一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下表:零件数x/个102030405060708090100加工时间y/min627275818595103108112127(1)画出散点图,并初步判断是否线性相关;(2)若线性相关,求线性回归方程;(3)求出相关指数;(4)作出残差图;(5)进行残差分析;(6)试制订加工200个零件的用时规定.解(1)散点图,如图所示.由图可知,x与y线性相关.(2)x与y的关系可以用线性回归模型来拟合,不妨设回归模型为eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x.将数据代入相应公式可得数据表:序号零件个数xi/个加工时间yi/minxiyixeq\o\al(2,i)110626201002207214404003307522509004408132401600550854250250066095570036007701037210490088010886406400990112100808100101001271270010000∑5509205613038500∵eq\o(x,\s\up6(-))=55,eq\o(y,\s\up6(-))=92,∴eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(10),\s\do4(i=1))xiyi-10\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(10),\s\do4(i=1))xeq\o\al(2,i)-10\o(x,\s\up6(-))2)=eq\f(56130-10×55×92,38500-10×552)=eq\f(553,825)≈,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=92-eq\f(553,825)×55=eq\f(827,15)≈,故线性回归方程为eq\o(y,\s\up6(^))=+.(3)利用所求回归方程求出下列数据:eq\o(y,\s\up6(^))iyi-eq\o(y,\s\up6(^))i---yi-eq\o(y,\s\up6(-))-30-20-17-11-7eq\o(y,\s\up6(^))iyi-eq\o(y,\s\up6(^))i---yi-eq\o(y,\s\up6(-))311162035∴R2=1-eq\f(\o(∑,\s\up6(10),\s\do4(i=1))(yi-\o(y,\s\up6(^))i)2,\o(∑,\s\up6(10),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)≈.(4)∵eq\o(e,\s\up6(^))i=yi-eq\o(y,\s\up6(^))i,利用上表中数据作出残差图,如图所示.(5)由散点图可以看出x与y有很强的线性相关性,由R2的值可以看出回归效果很好.由残差图也可观察到,第2,5,9,10个样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.(6)将x=200代入回归方程,得eq\o(y,\s\up6(^))≈189,所以可以制订189min加工200个零件的规定.跟踪演练1在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为x(元)1416182022y(件)1210753且知x与y具有线性相关关系,求出y对x的线性回归方程,并说明拟合效果的好坏.解eq\o(x,\s\up6(-))=eq\f(1,5)×(14+16+18+20+22)=18,eq\o(y,\s\up6(-))=eq\f(1,5)×(12+10+7+5+3)=,eq\o(∑,\s\up6(5),\s\do4(i=1))xeq\o\al(2,i)=142+162+182+202+222=1660,eq\o(∑,\s\up6(5),\s\do4(i=1))yeq\o\al(2,i)=122+102+72+52+32=327,eq\o(∑,\s\up6(5),\s\do4(i=1))xiyi=14×12+16×10+18×7+20×5+22×3=620,∴eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(5),\s\do4(i=1))xiyi-5\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(5),\s\do4(i=1))xeq\o\al(2,i)-5\o(x,\s\up6(-))2)=eq\f(620-5×18×,1660-5×182)=eq\f(-46,40)=-.∴eq\o(a,\s\up6(^))=+×18=,∴线性回归方程为eq\o(y,\s\up6(^))=-+.列出残差表为yi-eq\o(y,\s\up6(^))i0--yi-eq\o(y,\s\up6(-))---∴eq\o(∑,\s\up6(5),\s\do4(i=1))(yi-eq\o(y,\s\up6(^))i)2=,eq\o(∑,\s\up6(5),\s\do4(i=1))(yi-eq\o(y,\s\up6(-)))2=,R2=1-eq\f(\o(∑,\s\up6(5),\s\do4(i=1))(yi-\o(y,\s\up6(^))i)2,\o(∑,\s\up6(5),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)≈.故R2≈说明拟合效果较好.题型二独立性检验思想的应用独立性检验的基本思想是统计中的假设检验思想,类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理.例2为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)频数1025203015完成下面2×2列联表,能否在犯错误概率不超过的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:疱疹面积小于70mm2疱疹面积不小于70mm2总计注射药物Aa=b=注射药物Bc=d=总计n=解列出2×2列联表疱疹面积小于70mm2疱疹面积不小于70mm2总计注射药物Aa=70b=30100注射药物Bc=35d=65100总计10595n=200K2=eq\f(200×(70×65-35×30)2,100×100×105×95)≈,由于K2>,所以在犯错误概率不超过的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.跟踪演练2某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:赞同反对总计男198217415女476109585总计6743261000根据表中数据,能否在犯错误的概率不超过的前提下认为对这一问题的看法与性别有关系?[P(K2≥≈]解假设“对这一问题的看法与性别无关”,由列联表中的数据,可以得到:K2的观测值k=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))=eq\f(1000×(198×109-217×476)2,415×585×674×326)≈>,又P(K2≥≈,故在犯错误的概率不超过的前提下认为对“男女同龄退
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业园区供水保障项目可行性报告
- 高中学生宿舍楼建设项目建设管理方案
- 变电站升级改造项目的可行性分析
- ZigBee技术及智能家居
- 购牛合同范本
- 2023届新高考化学一轮复习原子结构与性质(二)学案
- 中国人造板制造行业市场现状、前景分析研究报告(智研咨询发布)
- 砂石建材厂员工合同范本
- 预防艾滋病课程
- 合测绘合同范本
- 2024-2025学年七年级英语上学期期中试卷(沪教五四制2024)(含答案)
- 2024-2025学年高中政治上学期《新时代的劳动者》教学设计
- 幼儿园故事绘本《卖火柴的小女孩儿》课件
- 10以内口算题每页50道
- 《短视频拍摄与制作》课件-3短视频中期拍摄
- 护理领导力培养护士的领导潜能培训课件
- Linux操作系统应用(麒麟系统)PPT完整全套教学课件
- 印刷业管理条例-2020
- 中国联通某分公司网格化管理工作指导意见
- 充电桩施工方案
- 110KV变电站设计毕业论文.doc
评论
0/150
提交评论