




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 三 章 统计案例章 末 高 效 整 合知能整合提升1两个基本思想(1)回归分析的基本思想回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分析的思想注意理解以下几点:确定线性相关关系线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系判断是否线性相关的依据是观察样本点的散点图;引起预报误差的因素对于线性回归模型ybxae,引起预报变量y的误差的因素有两个:一个是解释变量x,另一个是随机误差e
2、;回归方程的预报精度判断回归方程的预报精度是通过计算残差平方和来进行的,残差平方和越小,方程的预报精度越高简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值;回归模型的拟合效果判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通过残差图直观判断,二是通过计算相关指数R2的大小判断(2)独立性检验的基本思想独立性检验的基本思想类似于反证法要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算随机变量K2的观测值,最后由K2的观测值很大在一
3、定程度上说明两个分类变量有关系进行独立性检验要注意理解以下三个问题:独立性检验适用于两个分类变量;两个分类变量是否有关系的直观判断:一是根据22列联表计算|adbc|,值越大关系越强;二是观察等高条形图,两个深色条的高度相差越大关系越强独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系2两个重要参数(1)相关指数R2相关指数R2是用来刻画回归模型的回归效果的,其值越接近1,残差平方和越小,模型的拟合效果越好(2)随机变量K2随机变量K2是用来判断两个分类变量在多大程度上相
4、关的变量独立性检验即计算K2的观测值,并与教材中所给表格中的数值进行比较,从而得到两个分类变量在多大程度上相关3两种重要图形(1)散点图散点图是进行线性回归分析的主要手段,其作用如下:一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;二是判断样本中是否存在异常(2)残差图残差图可以用来判断模型的拟合效果,其作用如下:一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高;二是确认样本点在采集中是否有人为的错误热点考点例析线性回归分析的应用点拨:回归分析的基本步骤为:(1)确定研究对象,明确哪个变量是解释变
5、量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系;(3)由经验确定回归方程的类型;(4)按一定规则估计回归方程中的参数;(5)得检查回归模型的拟合程度,如分析残差图、求相关指数R2等一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下表:零件数x(个)102030405060708090100加工时间y(min)627275818595103108112127(1)画出散点图,并初步判断是否线性相关;(2)若线性相关,求回归直线方程;(3)求出相关指数;(4)作出残差图;(5)进行残差分析;(6)试制订加工200个零
6、件的用时规定 思维点击明确各相关概念求出回归直线方程是解题关键注意正确使用公式和准确计算(1)散点图如图所示由图可知,x,y线性相关将数据代入相应公式可得数据表: (3)利用所求回归方程求出下列数据:1为了研究3月下旬的平均气温(x)与4月20日前棉花害虫化蛹高峰日(y)的关系,某地区观察了2007年至2011年的情况得到下面数据:年份200620072008200920102011x(C)24.429.632.728.730.328.9y(天)19611018点拨:非线性回归问题的处理技巧一般地,有些非线性回归模型通过变换可以转化为线性回归模型,即借助于线性回归模型研究呈非线性回归关系的两个
7、变量之间的关系(1)如果散点图中的点分布在一个直线状带形区域,可以选用线性回归模型来建模;(2)如果散点图中的点的分布在一个曲线状带形区域,要先对变量作适当的变换,再利用线性回归模型来建模非线性回归问题xi0.050.060.250.310.070.10yi0.100.141.001.120.230.37xi0.380.430.140.200.47yi1.191.250.590.791.29ui20.00016.6674.0003.22614.28610.000vi2.3031.96600.1131.4700.994ui2.6322.3267.1435.0002.128vi0.1740.223
8、0.5280.2360.2552电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律公式UAebt(b0)表示,观测得时间t(s)时的电压U(V)如下表所示:试求电压U对时间t的回归方程t012345678910U100755540302015101055解析:对UAebt两边取自然对数得ln Uln Abt,令yln U,aln A,即ybta,由所给数据可得t012345678910ln U(y)4.64.34.03.73.43.02.72.32.31.61.6其散点图为:点拨:1.独立性检验的一般步骤:(1)提出假设H0:和没有关系;(2)根据22列联
9、表计算K2的观测值;(3)根据K2的观测值与临界值的大小关系作统计推断独立性检验2可以用反证法的原理来解释独立性检验原理.反证法原理独立性检验原理在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立在一个已知假设下,如果出现一个与该假设矛盾的小概率事件发生,就推断这个假设不成立,且该推断犯错误的概率不超过这个小概率从上述对比中可以看出,假设检验的原理和反证法原理类似不同之处:一是独立性检验中用有利于H0的小概率事件的发生代替了反证法中的矛盾;二是独立性检验中接受原假设的结论相当于反证法中没有找到矛盾把独立性检验的基本思想具体化到独立性检验中,就可以通过随机变量K2的值的大小来研究两个分类
10、变量是否有相关关系调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表,试问婴儿的性别与出生的时间是否有关系?出生时间性别晚上白天总计男婴153146女婴82634总计235780思维点击根据列联表,将相应数据代入公式求K2.3为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查如下表所示:试问:50岁以上的人患慢性气管炎与吸烟习惯是否有关系?患慢性气管炎未患慢性气管炎合计吸烟43162205不吸烟13121134合计56283339解析:5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位答案:B4若由一个22列联表中的数据计算得K26.630,则判断“这
11、两个分类变量有关系”时,犯错误的最大概率是()A0.025B0.01C0.005D0.001解析:P(K25.024)0.025,又K26.6305.024,犯错误的最大概率为0.025.答案:A5若由一个22列联表中的数据计算得K24.073,那么在犯错误的概率不超过_的前提下认为两变量有关系,已知P(K23.841)0.05,P(K25.024)0.025.解析:查表可知K2的观测值k4.0733.841,因此在犯错误的概率不超过5%的前提下认为两变量有关系答案:5%7某产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:请画出散点图并用散点图粗略地判断x,y是否线性相关x24
12、568y3040605070解析:散点图如图从散点图可以看出散点呈条状分布,所以x,y具有较强的线性相关关系8某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人试根据这些数据判断这一高考试题的得分情况与性别是否有关系解析:根据题中数据得如下列联表:及格不及格总计男生290160450女生100350450总计390510900其中一定不正确的结论的序号是()ABCD解析:中y与x负相关而斜率为正,不正确;中y与x正相关而斜率为负,不正确答案:D3(2014全国卷)某地区2007年至2013年农
13、村居民家庭人均纯收入y(单位:千元)的数据如下表:(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.94(2014安徽卷)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12,估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.P(K2k0)0.100.050.0100.005k02.7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江西新建二中2025届高三下学期期末复习检测试题(一模)生物试题含解析
- 四川文化传媒职业学院《室内设计及原理》2023-2024学年第二学期期末试卷
- 广西质量工程职业技术学院《民乐合奏》2023-2024学年第一学期期末试卷
- 江苏安全技术职业学院《数字合成技术》2023-2024学年第二学期期末试卷
- 2025年福建省泉州聚龙外国语校中考化学试题仿真卷:化学试题试卷(4)含解析
- 山东服装职业学院《系统解剖学》2023-2024学年第二学期期末试卷
- 上海对外经贸大学《海洋生物学B》2023-2024学年第二学期期末试卷
- 2025年江苏省南京师大附中中考英语试题命题比赛模拟试题含答案
- 浙江汽车职业技术学院《兽医免疫学》2023-2024学年第二学期期末试卷
- 2025届浙江省温州十五校联合体高三下学期大联考卷Ⅱ历史试题试卷含解析
- 简约复古风夏洛蒂勃朗特《简爱》作品简介名著读后感PPT课件
- 新人教版七年级初一数学下册第一二单元测试卷
- 白内障手术操作规范及质量控制标准(2017版)
- 中国银行履约保函(中英文)
- 不锈钢储罐施工方案(2024043554)
- 自考00911互联网数据库 精华小抄笔记
- 《电子商务法律法规》课程标准
- 中国联通科技创新奖励办法
- 中药饮片储存与养护
- 【《项链》莫泊桑】《项链》课本剧剧本
- 唐长安城高官住宅分布变迁之初步研究
评论
0/150
提交评论