版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章统计案例1.1回归分析的基本思想及其初步应用
1.回归分析(1)概念:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)步骤:画散点图→求回归直线方程→用回归直线方程进行预报.必备知识·自主学习【思考】回归直线方程得到的预报值是精确值吗?提示:回归直线方程得到的预报值不是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.2.线性回归模型(1)在线性回归方程中,其中称为变量样本点的中心,回归直线过样本点的中心.(2)线性回归模型y=bx+a+e,其中e称为随机误差,自变量x称为解释变量,因变量y称为预报变量.【思考】(1)预报值y与真实值y之间误差大了好还是小了好?提示:越小越好.(2)随机误差产生的原因是什么?提示:主要有:所用的拟合函数不恰当;忽略了某些因素的影响;存在观测误差等.3.刻画回归效果的方式残差把随机误差的估计值称为相应于点(xi,yi)的残差残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和残差平方和为
,残差平方和越小,模型拟合效果越好相关指数R2R2=1-,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归的效果越好【思考】(1)残差是怎样形成的?提示:残差是回归分析得到的估计值与实际值的偏差.(2)如果自变量与因变量之间没有回归关系,R2等于多少?提示:如果自变量与因变量之间没有回归关系,R2等于0.【思考】(1)残差是怎样形成的?提示:残差是回归分析得到的估计值与实际值的偏差.(2)如果自变量与因变量之间没有回归关系,R2等于多少?提示:如果自变量与因变量之间没有回归关系,R2等于0.【基础小测】1.辨析记忆(对的打“√”,错的打“×”)(1)圆的面积和圆的直径之间是相关关系. (
)(2)回归方程必经过点. (
)(3)设回归方程为=-5x+3,若变量x增加1个单位,则y平均增加5个单位.(
)提示:(1)×.圆的面积和圆的直径之间是确定关系,而不是相关关系.(2)√.回归方程必经过点,故正确.(3)×.若变量x增加1个单位,则y平均减少5个单位,故错误.2.(教材二次开发:例题改编)在如图所示的四个散点图中,适合用线性回归模型拟合其中两个变量的是 (
)
A.①② B.①③ C.②③ D.③④【解析】选B.结合散点图可知①③中的散点大体分布在一条直线的左右两侧.3.已知回归方程=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是 (
)A.0.01 B.0.02 C.0.03 D.0.04【解析】选C.因为残差=yi-,所以残差的平方和为(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.关键能力·合作学习类型一求线性回归方程(数据分析、数学运算)
【典例】某研究机构对高三学生的记忆力x和判断力y进行统计分析,得如表数据:x681012y2356关键能力·合作学习类型一求线性回归方程(数据分析、数学运算)
【典例】某研究机构对高三学生的记忆力x和判断力y进行统计分析,得如表数据:x681012y2356(1)请画出表中数据的散点图(要求:点要描粗);(2)请根据表中提供的数据,用最小二乘法求出y关于x的线性回归方程(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.【思路导引】(1)依据表中数据描点,注意不要连线.(2)利用公式求解.(3)将x=9代入线性回归方程.【解析】(1)如图:(2)=6×2+8×3+10×5+12×6=158,=62+82+102+122=344,==4-0.7×9=-2.3,故线性回归方程为=0.7x-2.3.(3)由(2)中线性回归方程知,当x=9时,=0.7×9-2.3=4,预测记忆力为9的同学的判断力为4.【解题策略】建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.【跟踪训练】某调查者从调查中获知某公司近年来科研费用支出x(万元)与公司所获得的利润y(万元)的统计资料如表:序号科研费用支出xi利润yixiyi
15311552521140440121343012016453417025求利润y对科研费用支出x的线性回归方程.序号科研费用支出xi利润yixiyi
53257596220404总计301801000200【解析】设线性回归方程为.由题表中数据,得==2,所以=30-2×5=20,所以线性回归方程为=2x+20.类型二线性回归分析(数据分析、数学运算)
【典例】为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图,并求线性回归方程.(2)求出R2.(3)进行残差分析.【思路导引】(1)依据数据画出散点图,再判断是否存在线性相关性.(2)可代入公式直接求解.(3)可依据残差的意义进行分析.【解析】(1)散点图如图所示.因为=×(5+10+15+20+25+30)=17.5,=×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,=2275,xiyi=1076.2.计算得≈0.183,≈6.285,所以所求线性回归方程为=6.285+0.183x.(2)列表如下:所以(yi-
)2≈0.01318,(yi-)2=14.6784.所以R2≈1-≈0.9991,所以回归模型的拟合效果较好.yi-0.050.005-0.08-0.0450.040.025yi--2.24-1.37-0.540.411.412.31(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量成线性关系.【解题策略】残差分析的思路(1)要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.(2)通过残差
,,…,来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这种分析工作称为残差分析,可以借助残差图来进行观察.【跟踪训练】假设关于某设备的使用年限x(单位:年)和支出的维修费用y(单位:万元),有如表的统计资料:使用年限x/年23456维修费用y/万元2.23.85.56.57.0若由资料知y对x呈线性相关关系,(1)求线性回归方程.(2)估计使用年限为10年时,维修费用是多少?(3)计算残差平方和.(4)求R2并说明模型的拟合效果.【解析】
(1)由已知条件整理如表:于是有
=5-1.23×4=0.08,线性回归直线方程是=1.23x+0.08.(2)当x=10时,=1.23×10+0.08=12.38,即估计使用年限为10年时,维修费用是12.38万元.(3)=2.46+0.08=2.54,=3.77,=5,=6.23,=7.46,残差平方和:(yi-)2=0.651.(4)R2=1-=1-≈0.9587,模型的拟合效果较好,使用年限解释了95.87%的维修费用支出.类型三非线性回归分析(数据分析、数学运算)
【典例】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中wi=(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:【思路导引】根据散点图,选择恰当的回归模型,转化为线性回归,求线性回归方程,最后得到所求回归方程.【解析】(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=,先建立y关于w的线性回归方程.由于=68,=563-68×6.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(3)①由(2)知,当x=49时,年销售量y的预报值=100.6+68=576.6,年利润z的预报值=0.2-x=0.2×576.6-49=66.32.②根据(2)的结果知,年利润z的预报值
=0.2(100.6+68)-x=-x+13.6+20.12.所以当==6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.【解题策略】解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,预报变量为y.(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型.(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题.(4)分析拟合效果:通过计算相关指数等来判断拟合效果.(5)写出非线性回归方程.【跟踪训练】1.在某种新型材料的研制中,试验人员获得了下列一组试验数据,现准备用下列四个函数中的一个近似地表示这些数据的规律,其中最接近的一个是(
)A.y=2x B.y=log2xC.y=(x2-1) D.y=2.61cosxx1.953.003.945.106.12y0.971.591.982.352.61【解析】选B.作散点图,从图中观察可知,应为对数函数模型.2.电容器充电后,电压达到100V,然后开始放电.由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示.现测得时间t(s)时的电压U(V)如下所示:试求电压U对时间t的回归方程.t012345678910U100755540302015101055【解析】对U=Aebt两边取自然对数得lnU=lnA+bt,令y=lnU,a=lnA,即y=a+bt,即lnU=-0.3t+4.6,所以=e-0.3t+4.6.t012345y4.64.34.03.73.43.0t678910y2.72.32.31.61.6课堂检测·素养达标1.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是 (
)
A.=1.23x+4 B.=1.23x+5C.=1.23x+0.08 D.=0.08x+1.23【解析】选C.设回归直线的方程为,依题意可知,=1.23,又样本点的中心(4,5)在直线上,即5=1.23×4+,得=0.08,所以回归直线的方程为=1.23x+0.08.2.在两个变量y与x的回归模型中,分别选择了4个不同的模型.通过计算得R2的值如下,其中拟合效果最好的模型是(
)A.模型1的R2为0.98 B.模型2的R2为0.80C.模型3的R2为0.50 D.模型4的R2为0.25【解析】选A.相关指数R2能够刻画用回归模型拟合数据的效果,相关指数R2的值越接近于1,说明回归模型拟合数据的效果越好.3.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x(单位:千箱)与单位成本y(单位:元)的资料进行线性回归分析,结果如下:=,=71,=79,xiyi=1481.=≈-1.8182,≈71-(-1.8182)×≈77.36,则销量每增加1000箱,单位成本下降________元.
【解析】由已知得,=-1.8182x+77.36,则销量每增加1千箱,单位成本下降1.8182元.答案:1.81824.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性进行试验,并用回归分析方法分别求得相关指数R2与残差平方和m如表:则__________同学的试验结果体现A,B两变量有更强的线性相关性.
甲乙丙丁R20.820.780.690.85m106115124103【解析】由题表知,丁同学的相关指数R2最大且残差平方和m最小,故丁同学的试验结果体现A,B两变量有更强的线性相关性.答案:丁5.某种商品价格与该商品日需求量之间的几组对照数据如下表:(1)求y关于x的线性回归直线方程.(2)当价格x=40元/kg时,日需求量y的预测值为多少?x1015202530y1110865【解析】(1)因为=(10+15+20+25+30)=20,=(11+10+8+6+5)=8,(xi-)2=(-10)2+(-5)2+02+52+102=250,(xi-)(yi-)=(-10)×3+(-5)×2+0×0+5×(-2)+10×(-3)=-80,所以
=-0.32,=8+0.32×20=14.4,所以所求线性回归直线方程为=-0.32x+14.4.(2)由(1)知当x=40时=-0.32×40+14.4=1.6.所以当价格x=40元/kg时,日需求量y的预测值为1.6kg.Thebestclassroomintheworldisatthefeetofanelderlyperson.世界上最好的课堂在老人的脚下.Havingachildfallasleepinyourarmsisoneofthemostpeacefulfeelingintheworld.让一个孩子在你的臂弯入睡,你会体会到世间最安宁的感觉.Beingkindismoreimportantthanbeingright.善良比真理更重要.Youshouldneversaynotoagiftfromachild.永远不要拒绝孩子送给你的礼物.Sometimesallapersonneedsisahandtoholdandahearttounderstand.有时候,一个人想要的只是一只可握的手和一颗感知的心.Love,nottime,healsallwounds.治愈一切创伤的并非时间,而是爱.Lifeistough,butI'mtougher.生活是艰苦的,但我应更坚强.励志名言请您欣赏【解析】(1)因为=(10+15+20+25+30)=20,=(11+10+8+6+5)=8,(xi-)2=(-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 深圳股权转让合同(2025年版)4篇
- 商场LED显示屏租赁合同(二零二五年)
- 二零二五年度国际法学与留学项目合同3篇
- 2025年度个人一手房买卖合同环保标准范本4篇
- 2025版户外休闲场所草皮采购与租赁合同3篇
- 2025年智能家居系统产品销售激励协议书2篇
- 2025版团购楼房指标转让与房地产咨询代理合同3篇
- 2025版智能防蚊纱窗研发与销售合作协议3篇
- 2025年度个人投资分红收据模板制作服务协议4篇
- 2025年度互联网金融服务提供商合作协议范本4篇
- 骨髓穿刺课件
- 乡村治理中正式制度与非正式制度的关系解析
- 2024版义务教育小学数学课程标准
- 智能护理:人工智能助力的医疗创新
- 国家中小学智慧教育平台培训专题讲座
- 5G+教育5G技术在智慧校园教育专网系统的应用
- VI设计辅助图形设计
- 浅谈小学劳动教育的开展与探究 论文
- 2023年全国4月高等教育自学考试管理学原理00054试题及答案新编
- 河北省大学生调研河北社会调查活动项目申请书
- JJG 921-2021环境振动分析仪
评论
0/150
提交评论