下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、章末复习课整合·网络构建警示·易错提醒1回归分析:(1)回归分析是建立在两个具有相关性变量之间的一种模拟分析,因此必须先判断两变量是否具有相关性(2)线性回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上(3)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值)2独立性检验:(1)通过独立性检验得到的结论未必正确,它只是对一种可靠性的预测(2)在2×2列联表中,当数据a,b,c,d都不小于5时,才可以用k2检测(3)独立性检验易错误理解假设检验原理,导致得到相反的结论专题一线性回归分析回归
2、分析是对具有相关关系的两个变量进行统计分析的一种方法根据两个变量的一组观测值,可以画出散点图,以判断两个变量是否具有线性相关关系,若具有线性相关关系,可求出线性回归直线方程求出线性回归模型后,可以借助残差、残差平方和以及相关指数r2等对模型进行评判相关指数r2刻画回归的效果,其计算公式:r21 , r2的值越大,模型的拟合效果越好.例1 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90
3、吨标准煤.试根据(2)求出的线性回归方程,预测技改后生产100吨甲产品比技改前少消耗多少吨标准煤.解:(1)散点图如图所示:(2) x iyi3×2.54×35×46×4.566.5,4.5,3.5,3242526286.0.7,3.50.7×4.50.35.因此,所求的线性回归方程为0.7x0.35.(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.7×1000.3570.35(吨),故耗能减少了9070.3519.65(吨标准煤)归纳升华1求线性回归方程的基本步骤2需特别注意的是,只有在散点图大致呈直线时,求出的
4、线性回归方程才有实际意义,否则求出的回归方程毫无意义变式训练如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20082014(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量附注:解:因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系所以y关于t的回归方程为0.920.10t.将2018年对应的t11代入回归方程得0.920.10×112。03.所以预测2018
5、年我国生活垃圾无害化处理量将约为2。03亿吨专题二独立性检验独立性检验是判断两个分类变量之间是否有关系的一种方法在判断两个分类变量之间是否有关系时,作出等高条形图只能近似地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论例22017年10月18日至24日,中国共产党第十九次全国人民代表大会在北京顺利召开大会期间,北京某高中举办了一次“喜迎十九大”的读书读报知识竞赛,参赛选手为从高一年级和高二年级随机抽取的各100名学生图1和图2分别是高一年级和高二年级参赛选手成绩的频率分布直方图图1图2(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(2)若称成绩在68分以上的学生知识
6、渊博,试以上述数据估计该高一、高二两个年级学生的知识渊博率;(3)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.010的前提下,认为高一、高二两个年级学生这次读书读报知识竞赛的成绩有差异分类成绩低于60分人数成绩不低于60分人数总计高一年级高二年级总计附:p(k2k)0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828k2.思路点拨:(1)利用均值公式求平均成绩;(2)先利用频率分布直方图求出高一、高二两个年级学生成绩在68分以上的学生所占的频率;(3)完善2×2列联表,代入k2公式求解解:(1)高一年级参赛学生
7、的平均成绩为(45×0.0455×0.0465×0.0175×0.01)×1054(分)高二年级参赛学生的平均成绩为(45×0.01555×0.02565×0.03575×0.025)×1062(分)(2)高一年级参赛学生的知识渊博率为p110×0.01×10×0.010.12,高二年级参赛学生的知识渊博率为p210×0.035×10×0.0250.32.故可估计该校高一年级学生的知识渊博率为0.12,高二年级学生的知识渊博率为0.32
8、.(3)补全2×2列联表,如下:分类成绩低于60分人数成绩不低于60分人数总计高一年级8020100高二年级4060100总计12080200根据表中数据得k2的观测值k33.33>6.635,故在犯错误的概率不超过0.010的前提下,认为高一、高二两个年级学生这次读书读报知识竞赛的成绩有差异归纳升华1正确利用概率分布直方图与平均数等,求出高一、高二年级各个分数的学生数是利用k公式求得k并进行估计的前提条件2独立性检验的一般步骤如下:(1)根据样本数据制成2×2列联表(2)根据公式计算k2的观测值k.(3)比较k与临界值的大小关系,做统计推断注:根据学生用书选用 变式
9、训练某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本,并称出它们的重量(单位:克),重量值落在495,510)内的产品为合格品,否则为不合格品统计结果如下:甲流水线样本的频数分布表产品重量(克)频数490,495)6495,500)8500,505)14505,510)8510,5154乙流水线样本的频率分布直方图(1)求甲流水线样本合格的频率;(2)由以上统计数据完成下面2×2列联表,并回答有多大的把握认为产品的包装质量与两条自动包装流水线的选择有关分类甲流水线乙流水线总计合格品不合格品总计附:k2.p(k2k0)0.150.100.
10、050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解:(1)由表知甲流水线样本中合格品数为814830,故甲流水线样本中合格品的频率为0.75.(2)由(1)知甲流水线样本中合格品格数30,乙流水线样本中合格品数为0.9×4036.2×2列联表如下:分类甲流水线乙流水线总计合格品303666不合格品10414总计404080由2×2列联表中的数据得k2的观测值为k3.12>2.706.故有90%的把握认为产品的包装质量与两条自动包装流水线的选择有关变式训练调查某医院某段时间内婴儿出生的时间
11、与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人(1)将2×2列联表补充完整性别出生时间总计晚上白天男婴女婴总计(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?解:(1)列出2×2列联表:性别出生时间总计晚上白天男婴243155女婴82634总计325789(2)由所给数据计算k2的观测值k3.6892.706.根据临界值表知p(k22.706)0.10,因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系.专题三化归转化思想在回归分析中的应用如果两个变量非线性相关
12、,要进行回归分析,可以通过对变量进行代换,转化成线性相关问题,进而进行回归分析 例3电容器充电后,电压达到100 v,然后开始放电,由经验知道,此后电压u随时间t变化的规律用公式uaebt(b<0)表示,现测得时间t(s)时的电压u(v)如下表:t(s)012345678910u(v)100755540302015101055试求:电压u对时间t的回归方程(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解:对uaebt两边取对数得ln uln abt,令yln u,aln a,xt,则yabx,得y与x的数据如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.6根据表中数据作出散点图,如图所示,从图中可以看出,y与x具有较强的线性相关关系,由表中数据求得5,3.045,进而可以求得0.313,4.61.所以y对x的线性回归方程为y4.610.313x.由yln u,得uey,ue4.610.313xe4.16·e0.313x.因此电压u对时间t的回归方程为ue4.61·e0.313x.归纳升华非线性回归分析的一般步骤:1确定变量,作出散点图2根据散点
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 贵州省黔南州都匀市2023-2024学年八年级上学期期末考试数学试卷(答案不全)
- 养老院老人生活照顾人员激励制度
- 养老院老人健康监测人员社会保险制度
- 《开场白的艺术》课件
- 挽回婚姻协议书(2篇)
- 拆架子免责协议书(2篇)
- 《生化课件生物氧化》课件
- 2025年甘肃货运资格证考题
- 2025年黑龙江货运从业资格考试题目及答案大全解析
- 2025年拉萨货运从业资格证结业考试答案
- 金陵十三钗(部编)课件
- 人教版高二化学《选择性必修一》期末复习模拟测试题(含答案)
- 中央2024年国家医疗保障局大数据中心招聘应届生笔试历年典型考题及考点剖析附带答案详解
- 透水沥青混凝土路面技术规程DBJ-T 15-157-2019
- 2023-2024学年湖北省黄石市黄石港区八年级(上)期末数学试卷(含解析)
- 职业素养提升第2版(大学生职业素养指导课程)全套教学课件
- 声音的产生省公开课一等奖新名师课比赛一等奖课件
- indesign典型实例第一章
- 新时代大学生劳动教育智慧树知到期末考试答案章节答案2024年延边大学
- 离心式压缩机设计-离心压缩机气动及结构设计含6张CAD图
- TB 10003-2016 铁路隧道设计规范 含2024年4月局部修订
评论
0/150
提交评论