版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
章末分层突破[自我校对]①回归分析②相互独立事件的概率③χ2公式④判断两变量的线性相关回归分析问题建立回归模型的步骤:(1)确定研究对象,明确变量x,y.(2)画出变量的散点图,观察它们之间的关系(如是否存在线性相关关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性相关关系,则选用回归直线方程eq\o(y,\s\up7(^))=eq\o(b,\s\up7(^))x+eq\o(a,\s\up7(^))).(4)按一定规则估计回归方程中的参数(如最小二乘法).(5)得出回归方程.另外,回归直线方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归直线方程的适用范围,否则没有实用价值.假设一个人从出生到死亡,在每个生日那天都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:年龄/周岁3456789身高/cm年龄/周岁10111213141516身高/cm(1)作出这些数据的散点图;(2)求出这些数据的线性回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)解释一下回归系数与每年平均增长的身高之间的联系.【精彩点拨】(1)作出散点图,确定两个变量是否线性相关;(2)求出eq\o(a,\s\up7(^)),eq\o(b,\s\up7(^)),写出线性回归方程;(3)回归系数即eq\o(b,\s\up7(^))的值,是一个单位变化量;(4)根据线性回归方程可找出其规律.【规范解答】(1)数据的散点图如下:(2)用y表示身高,x表示年龄,因为eq\o(x,\s\up7(-))=eq\f(1,14)×(3+4+5+…+16)=,eq\o(y,\s\up7(-))=eq\f(1,14)×++…+=132,eq\o(b,\s\up7(^))=≈eq\f(18993-14××132,1491-14×≈,eq\o(a,\s\up7(^))=eq\o(y,\s\up7(-))-beq\o(x,\s\up7(-))=,所以数据的线性回归方程为y=+.(3)在该例中,回归系数表示该人在一年中增加的高度.(4)回归系数与每年平均增长的身高之间近似相等.[再练一题]1.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:xy(1)以x为解释变量,y为预报变量,作出散点图;(2)求y与x之间的回归方程,对于基本苗数预报有效穗.【导学号:37820006】【解】(1)散点图如下.(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系.设回归方程为eq\o(y,\s\up7(^))=eq\o(b,\s\up7(^))x+eq\o(a,\s\up7(^)),eq\o(x,\s\up6(-))=,eq\o(y,\s\up6(-))=,故所求的线性回归方程为eq\o(y,\s\up7(^))=+.当x=时,eq\o(y,\s\up7(^))=+×=.估计成熟期有效穗约为.独立性检验独立性检验的基本思想类似于反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下,我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说明假设不合理,根据随机变量χ2的含义,可以通过P(χ2>≈来评价假设不合理的程度,由实际计算出χ2>说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表.(2)根据公式χ2=eq\f(n(n11n22-n12n21)2,n1+n2+n+1n+2)计算χ2的值.(3)比较χ2与临界值的大小关系并作统计推断.在某校高三年级一次全年级的大型考试中数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?物理化学总分数学优秀228225267数学非优秀14315699注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.【精彩点拨】分别列出数学与物理,数学与化学,数学与总分优秀的2×2列联表,求k的值.由观测值分析,得出结论.【规范解答】(1)列出数学与物理优秀的2×2列联表如下:物理优秀物理非优秀合计数学优秀228132360数学非优秀143737880合计3718691240n11=228,n12=132,n21=143,n22=737,n1+=360,n2+=880,n+1=371,n+2=869,n=1240.代入公式χ2=eq\f(n(n11n22-n12n21)2,(n1+n2+n+1n+2))得χeq\o\al(2,1)=eq\f(1240×(228×737-132×143)2,360×880×371×869)≈3.(2)列出数学与化学优秀的2×2列联表如下:化学优秀化学非优秀合计数学优秀225135360数学非优秀156724880合计3818591240n11=225,n12=135,n21=156,n22=724,n1+=360,n2+=880,n+1=381,n+2=859,n=1240.代入公式,得χeq\o\al(2,2)=eq\f(1240×(225×724-135×156)2,360×880×381×859)≈2.(3)列出数学与总分优秀的2×2列联表如下:总分优秀总分非优秀合计数学优秀26793360数学非优秀99781880合计3668741240n11=267,n12=93,n21=99,n22=781,n1+=360,n2+=880,n+1=366,n+2=874,n=1240.代入公式,得χeq\o\al(2,3)=eq\f(1240×(267×781-93×99)2,360×880×366×874)≈5.由上面计算可知数学成绩优秀与物理、化学、总分优秀都有关系,由计算分别得到χ2的统计量都大于临界值,由此说明有99%的把握认为数学优秀与物理、化学、总分优秀都有关系,但与总分优秀关系最大,与物理次之.[再练一题]2.某推销商为某保健药品做广告,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不服用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对预防A疾病是否有效.【解】将问题中的数据写成如下2×2列联表:患A疾病不患A疾病合计服用该药品5100105不服用该药品18400418合计23500523将上述数据代入公式χ2=eq\f(n(n11n22-n12n21)2,n1+n2+n+1n+2)中,计算可得χ2≈4,因为4<,故没有充分理由认为该保健药品对预防A疾病有效.转化与化归思想在回归分析中的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.某商店各个时期的商品流通率y(%)的商品零售额x(万元)资料如下:xy64xy散点图显示出x与y的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y决定于商品的零售额x,体现着经营规模效益,假定它们之间存在关系式:y=a+eq\f(b,x).试根据上表数据,求出a与b的估计值,并估计商品零售额为30万元的商品流通率.【规范解答】设u=eq\f(1,x),则y=a+bu,得下表数据:u30151y64u35624y由表中数据可得y与u之间的回归直线方程为eq\o(y,\s\up7(^))=-5+u.所以所求的回归方程为eq\o(y,\s\up7(^))=-5+eq\f,x).当x=30时,y=5,即商品零售额为30万元时,商品流通率为5%.[再练一题]3.在某化学实验中,测得如下表所示的6对数据,其中x(单位:min)表示化学反应进行的时间,y(单位:mg)表示未转化物质的质量.x/min123456y/mg(1)设y与x之间具有关系y=cdx,试根据测量数据估计c和d的值(精确到;(2)估计化学反应进行到10min时未转化物质的质量(精确到.【解】(1)在y=cdx两边取自然对数,令lny=z,lnc=a,lnd=b,则z=a+bx.由已知数据,得x123456yz由公式得eq\o(a,\s\up7(^))≈5,eq\o(b,\s\up7(^))≈-9,则线性回归方程为eq\o(z,\s\up7(^))=5-9x.而lnc=5,lnd=-9,故c≈,d≈,所以c,d的估计值分别为,.(2)当x=10时,由(1)所得公式可得y≈(mg).所以化学反应进行到10min时未转化物质的质量约为mg.1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)支出y(万元)根据上表可得回归直线方程eq\o(y,\s\up7(^))=eq\o(b,\s\up7(^))x+eq\o(a,\s\up7(^)),其中eq\o(b,\s\up7(^))=,eq\o(a,\s\up7(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up7(^))eq\o(x,\s\up6(-)).据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元 万元万元 万元【解析】由题意知,eq\o(x,\s\up6(-))=eq\f++++,5)=10,eq\o(y,\s\up6(-))=eq\f++++,5)=8,∴eq\o(a,\s\up7(^))=8-×10=,∴当x=15时,eq\o(y,\s\up7(^))=×15+=(万元).【答案】B2.根据如下样本数据x345678y---得到的回归方程为eq\o(y,\s\up7(^))=bx+a,则()>0,b>0 >0,b<0<0,b>0 <0,b<0【解析】作出散点图如下:观察图象可知,回归直线eq\o(y,\s\up7(^))=bx+a的斜率b<0,当x=0时,eq\o(y,\s\up7(^))=a>0.故a>0,b<0.【答案】B3.根据下面给出的2023年至2023年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()图11A.逐年比较,2023年减少二氧化硫排放量的效果最显著年我国治理二氧化硫排放显现成效年以来我国二氧化硫年排放量呈减少趋势年以来我国二氧化硫年排放量与年份正相关【解析】对于A选项,由图知从2023年到2023年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2023年到2023年矩形高度明显下降,因此B正确.对于C选项,由图知从2023年以后除2023年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2023年以来我国二氧化硫年排放量与年份负相关,故选D.【答案】D4.如图12是我国2023年至2023年生活垃圾无害化处理量(单位:亿吨)的折线图.图12(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到,预测2023年我国生活垃圾无害化处理量.附注:参考数据:eq^\o(,\s\do4(i=1))yi=,eq^\o(,\s\do4(i=1))tiyi=,=,eq\r(7)≈.参考公式:相关系数r=,回归方程eq\o(y,\s\up7(^))=eq\o(a,\s\up7(^))+eq\o(b,\s\up7(^))t中斜率和截距的最小二乘估计公式分别为eq\o(b,\s\up7(^))=,eq\o(a,\s\up7(^))=eq\o(y,\s\up7(-))-eq\o(b,\s\up7(^))eq\o(t,\s\up6(-)).【解】(1)由折线图中的数据和附注中的参考数据得t=4,eq^\o(,\s\do4(i=1))(ti-t)2=28,=,=-4×=,∴r≈eq\f,×2×≈.因为y与t的相关系数近似为,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系.(2)由eq\o(y,\s\up6(-))=eq\f,7)≈及(1)得eq\o(b,\s\up7(^))==eq\f,28)≈.eq\o(a,\s\up7(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up7(^))eq\o(t,\s\up6(-))≈-×4≈.所以y关于t的回归方程为eq\o(y,\s\up7(^))=+.将2023年对应的t=9代入回归方程得eq\o(y,\s\up7(^))=+×9=.所以预测2023年我国生活垃圾无害化处理量约为亿吨.5.某地区2023年至2023年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2023202320232023202320232023年份代号t1234567人均纯收入y(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2023年至2023年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2023年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:eq\o(b,\s\up7(^))=eq\f(\o(∑,\s\up7(n),\s\do14(i=1))(ti-t)(yi-\o(y,\s\up7(-))),\o(∑,\s\up7(n),\s\do14(i=1))(ti-\o(t,\s\up7(-)))2),eq\o(a,\s\up7(^))=eq\o(y,\s\up7(-))-eq\o(b,\s\up7(^))eq\o(t,\s\up6(-)).【解】(1)由所给数据计算得eq\o(t,\s\up6(-))=eq\f(1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《状态检修基础知识》课件
- 内蒙古呼和浩特市2024届九年级上学期期末考试数学试卷(含答案)
- 养老院老人满意度调查评估制度
- 《电动机与电气传动》课件
- 《市场调查讲座》课件
- 《石墨烯的研究》课件
- 2024年版:国际文化旅游项目开发合同
- 技术研发合作合同(2篇)
- 2024年版金融服务合同(企业上市辅导)
- 2024天津房屋买卖合同中房屋租赁保证金及退还3篇
- 模板支撑脚手架集中线荷载、施工总荷载计算表(修正)
- GB/T 43700-2024滑雪场所的运行和管理规范
- 新媒体部门岗位配置人员架构图
- 水电站厂房设计-毕业设计
- 综合金融服务方案课件
- 《镇原民俗》课件
- 球磨机岗位作业指导书
- 眼科护理滴眼药水论文
- 市级社保基金运行分析报告
- 2024年辽宁省水资源管理集团招聘笔试参考题库附带答案详解
- 小学信息技术画图课件巧妙的直线和曲线
评论
0/150
提交评论