成对数据的统计分析一元线性回归独立性检验章末复习课_第1页
成对数据的统计分析一元线性回归独立性检验章末复习课_第2页
成对数据的统计分析一元线性回归独立性检验章末复习课_第3页
成对数据的统计分析一元线性回归独立性检验章末复习课_第4页
成对数据的统计分析一元线性回归独立性检验章末复习课_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

章末复习课第八章成对数据的统计分析知识网络一、线性回归分析(1)求该地域这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);从而该地域这种野生动物数量的估计值为60×200=12000.(2)求样本(xi,yi)(i=1,2,…,20)的有关系数(精确到0.01);解样本(xi,yi)(i=1,2,…,20)的有关系数为(3)根据既有统计资料,各地块间植物覆盖面积差别很大,为提升样本的代表性以取得该地域这种野生动物数量更精确的估计,请给出一种你觉得更合理的抽样措施,并阐明理由.解分层随机抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正有关关系.因为各地块间植物覆盖面积差别很大,从而各地块间这种野生动物数量差别也很大,采用分层随机抽样的措施很好地保持了样本构造与总体构造的一致性,提升了样本的代表性,从而能够取得该地域这种野生动物数量更精确的估计.跟踪训练1如图给出了根据我国2023年~2023年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和经验回归方程的残差图(2023年~2023年的年份代码x为1~7).(1)根据散点图分析y与x之间的有关关系;解根据散点图可知y与x呈正线性有关.(3)根据经验回归方程的残差图,分析经验回归方程的拟合效果.解由题中给出的残差图知历年数据的残差均在-2到2之间,阐明经验回归方程的拟合效果很好.反思感悟处理回归分析问题的一般环节(1)画散点图.根据已知数据画出散点图.(2)判断变量的有关性并求经验回归方程.经过观察散点图,直观感知两个变量是否具有有关关系.在此基础上,利用最小二乘法求然后写出经验回归方程.(3)回归分析.画残差图或计算R2,进行残差分析.(4)实际应用.根据求得的经验回归方程处理实际问题.二、独立性检验例2

为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:

SO2PM2.5

[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超出75,且SO2浓度不超出150”的概率;解由表格可知,该市100天中,空气中的PM2.5浓度不超出75,且SO2浓度不超出150的天数为32+6+18+8=64,

SO2PM2.5

[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(2)根据所给数据,完毕下面的2×2列联表:

SO2PM2.5

[0,150](150,475][0,75]

(75,115]

由所给数据,可得2×2列联表:

SO2PM2.5

[0,150](150,475][0,75]6416(75,115]1010(3)根据(2)中的列联表,根据小概率值α=0.010的独立性检验,分析该市一天空气中PM2.5浓度与SO2浓度是否有关.解

零假设为H0:该市一天空气中PM2.5浓度与SO2浓度无关.根据列联表中数据,经计算得到根据小概率值α=0.010的独立性检验,我们推断H0不成立,即觉得该市一天空气中PM2.5浓度与SO2浓度有关.跟踪训练2考察小麦种子灭菌是否跟发生黑穗病的关系,经试验观察,得到数据如下表:

种子灭菌种子未灭菌合计黑穗病26184210无黑穗病50200250合计76384460试分析根据小概率值α=0.05的独立性检验,能否据此推断种子灭菌与小麦发生黑穗病有关?解

零假设H0:种子灭菌与小麦发生黑穗病无关.由列联表的数据可得根据小概率值α=0.05的独立性检验,我们推断H0不成立,能够觉得种子灭菌与小麦发生黑穗病有关系.反思感悟独立性检验的一般环节①根据样本数据制成2×2列联表;③查表比较χ2与临界值的大小关系,作出统计判断.三、数形结合思想在独立性检验中的应用例3某机构为了了解患色盲是否与性别有关,随机抽取了1000名成年人进行调查,在调查的480名男性中有38名患色盲,520名女性中有6名患色盲,分别利用图形和独立性检验(α=0.001)的措施来判断患色盲与性别是否有关.解根据题目所给的数据作出如下的列联表:性别色盲合计患色盲未患色盲男38442480女6514520合计449561000根据列联表作出相应的等高堆积条形图,如图所示.图中两个深色条的高分别表达男性和女性中患色盲的频率,从图中能够看出,男性中患色盲的频率明显高于女性中患色盲的频率,所以我们可觉得患色盲与性别有关.零假设为H0:患色盲与性别无关.根据列联表中所给的数据,得根据小概率值α=0.001的独立性检验,推断H0不成立,即觉得患色盲与性别有关,此推断犯错误的概率不超出0.001.跟踪训练3电视传媒企业为了解某地域电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查成果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完毕下面的2×2列联表,据此资料你是否觉得“体育迷”与性别有关?

非体育迷体育迷合计男

1055合计

解由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:

非体育迷体育迷合计男301545女451055合计7525100零假设为H0:“体育迷”与性别无关.将2×2列联表中的数据代入公式计算,得根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,即觉得“体育迷”与性别无关.(2)将上述调查所得到的频率视为概率.目前从该地域大量电视观众中,采用随机抽样措施每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的成果是相互独立的,求X的分布列,均值E(X)和方差D(X).α0.050.01xα3.8416.635解由频率分布直方图,知抽到“体育迷”的频率为0.25,将频率视为概率,反思感悟解独立性检验的应用问题的关注点(1)两个明确:①明确两类主体;②明确研究的两个问题;(2)两个精确:①精确画出2×2列联表;②精确了解χ2.四、化归与转化思想在非线性回归分析中的应用1.转化与化归思想主要体目前非线性回归分析中.在实际问题中,并非全部的变量关系均满足线性关系,故要选择合适的函数模型去拟合样本数据,再经过代数变换,把非线性问题线性化.2.主要培养数学建模和数学运算的素养.例4某机构为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,搜集了某些数据并进行了初步处理,得到了下面的散点图及某些统计量的值.(1)根据散点图判断y=a+bx与y=c+

哪一个模型更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的经验回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断成果及表中数据,建立y有关x的经验回归方程(回归系数的成果精确到0.01).(3)若该图书每册的定价为10元,则至少应该印刷多少册才干使销售利润不低于78840元?(假设能够全部售出.成果精确到1)所以x≥10,所以至少印刷10000册才干使销售利润不低于78840元.跟踪训练4光伏发电是利用太阳能电池及有关设备将太阳光能直接转化为电能.近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如表:年份20112012201320142015201620172018年份代码x12345678新增光伏装机量y兆瓦0.40.81.63.15.17.19.712.2(1)根据残差图,比较模型①、模型②的拟合效果,应该选择哪个模型?并简要阐明理由;解选择模型①.理由如下:根据残差图能够看出,模型①的估计值和真实值比较相近,模型②的残差值相对较大某些,所以模型①的拟合效果相对很好.(2)根据(1)的判断成果及表中数据建立y有关x的经验回归方程,并预测该地域2023年新增光伏装机量是多少?(在计算回归系数时精确到0.01)由所给数据可得预测该地域2023年新增光伏装机量为反思感悟可线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最佳的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.随堂演练1.如图所示的是一组观察值的四个线性回归模型相应的残差图,则相应的线性回归模型的拟合效果最佳的残差图是1234√解析因为残差点比较均匀地落在水平的带状区域中,阐明选用的模型比较合适,故选A.1234A.3B.4C.5D.62.两个分类变量X和Y,值域都为{0,1},其样本频数分别是a=10,b=21,c+d=35.根据小概率值α=0.025的独立性检验,觉得X与Y有关系,则c等于√1234α0.050.025xα3.8415.024解析2×2列联表为1234

Y=0Y=1合计X=0102131X=1cd35合计10+c21+d66把选项A,B,C,D代入验证可知选A.1234③若两个随机变量的线性有关性越强,则有关系数r的值越接近于1;④在残差图中,残差点比较均匀落在水平的带状区域中即可阐明选用的模型比较合适,与带状区域的宽度无关;⑤在线性回归模型中,决定系数R2表达解释

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论