统计案例-回归分析的基本思想及其初步应用_第1页
统计案例-回归分析的基本思想及其初步应用_第2页
统计案例-回归分析的基本思想及其初步应用_第3页
统计案例-回归分析的基本思想及其初步应用_第4页
统计案例-回归分析的基本思想及其初步应用_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#/10第三章统计案例3・1回归分析的基本思想及其初步应用知识点1•回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性.2•线性回归方程:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,其方程称为线性回归方程.记回归直线方程为:y=bx+a,称为变量y对变量x的回归直线方程,其中a,b叫做回归系数.未知参数b和a的最小二乘法估计分别为b和a,给定一组数据(x,y)(x,y)(x,y),则ab和a的最小二乘法估计分别为b和a,给定一组数据1122nnii为:b=工xy-ii为:b=工xy-nxy,a=y-bx,其中x=丄工x,y=丄工y,从而bx+a的nii=1ii=1x2-nx2ii=1nii=1估计表示为y=bx+a.3•相关关系的强弱:相关系数:给定一组数据6,y则变量间线性相关系数r的计算公式为:ii=1—x工xy-nxyiii=1r两个变量的变化趋势线性相关关系Z、0<r<1同增或者同减正相关(>00Z、一1<r<0一个变量增,另一个变量减负相关(<00r=0无规律不相关i=1x2、送,-y)、:正x2-nx2)(Xy2-ny2).iiii=1i=1i=1(2)相关系数和相关程度:当r>0.75时,通常认为两个变量有较强的线性关系.随机误差y=bx+a+e,线性回归模型{,其中a,b为模型的未知参数,通常e为随机变量,称为随机误Ee=0,De=o2

差」称为解释变量,尹称为预报变量.3.残差分析⑴残差:对于样本点(X],儿),(x2,尹2),…,(xn,yj,它们的随机误差为e^y—bx厂a,i=1,2,…,人人人人人l(入\n,其估计值为e=y—y=y—bx—a,i=1,2,-^,n,e.称为相应于点(x,,y.)的残差.残差平方和工Vi-y力i=1越小,模型拟合效果越好(2)残差图:作图时纵坐标为残差,横坐标为样本编号,或x的数据,或y的数据,这样做出的图形ii称为残差图nA工e,—y,)24•相关指数:R2=1—一1,,•,相关指数的值越大,模型的拟合效果越好.n——工(y-y)2,=1注建立回归模型的基本步骤确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程).按一定规则(如最小二乘法)估计回归方程中的参数.得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.题型一求线性回归方程【例1】某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=bx+a;相关公式:S—nx•yA,=1相关公式:S—nx•yA,=1乙x?—nx2=1AAa=y一bx丿

【过关练习】假设关于某设备的使用年限x(年)和所支出的维修费用尹(万元)有如下的统计数据:X23456y2.23.85.56.57.0由此资料可知y对x呈线性相关关系.(1)求线性回归方程;(2)求使用年限为10年时,该设备的维修费用为多少?题型二线性回归分析【例1】在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:X1416182022y1210753求出y对x的线性回归方程,并说明拟合效果的程度.【过关练习】1.关于x与y有如下数据:X24568y3040605070有如下的两个线性模型:(1/=6.5x+17.5;(2/=7x+17•试比较哪一个拟合效果更好.题型二非线性回归分析【例1】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费X’和年销售量yi(i=1,2,-,8)数据作了初步处理,得到下面的散点图及一些统计量的值.600530500■Wf)-°44464^5()52S456

xyw£(x?—x)2i=1£(w?—w)2i=1£(x厂x)i=1•(y厂y)£(wi—w)i=1•e厂y)46.65636.8289.81.61469108.81,8表中W.=YX.,w=Q工wii8ii=1根据散点图判断,y=a+bx与y=c+d丘哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)根据(1)的判断结果及表中数据,建立y关于x的回归方程;已知这种产品的年利润z与x,y的关系为z=0.2y-x•根据(2)的结果回答下列问题:年宣传费x=49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(勺,q),(u2,V2),…,(un,vn),其回归直线v=a+〃u的斜率和截距的最小二乘估计分别为£(u厂u)(v厂v)AAa=v—puAAa=v—pu.p=£(气—u)2i=1【过关练习】在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521试建立y与x之间的回归方程.课后练习【补救练习】A1•设有一个回归方程为y=2-2.5x,则变量x增加一个单位时,()y平均增加2.5个单位B.y平均增加2个单位C.y平均减少2.5个单位D.y平均减少2个单位对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最咼的是()矗.2形高.30.3.6为卫矗.2形高.30.3.6为卫越H-0-OTT•141为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如表所示:父亲身咼x(cm)174176176176178儿子身高y(cm)175175176177177则y对x的线性回归方程为()TOC\o"1-5"\h\zAAy=x~1B.y=x+1A1AC.y=88+2xD.y=176变量X与K相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).q表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,贝%)A.r2<r1<0B.0<r2<r1C.r2<0<r1D.r2=r15•关于残差图的描述错误的是()残差图的横坐标可以是样本编号残差图的横坐标也可以是解释变量或预报变量残差点分布的带状区域的宽度越窄相关指数越小残差点分布的带状区域的宽度越窄残差平方和越小如图311四个散点图中,适合用线性回归模型拟合的两个变量的(填序号).y.++-”y■・/JAI「肿+0rororo①②③④图311【巩固练习】某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的A数据(如下表),由最小二乘法求得回归方程y=0.67x+54.9.零件数x(个)1020304050加工时间Y(min)62PIMM758189现发现表中有一个数据模糊看不清,请你推断出该数据的值.若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R2为9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568Z2ZAA——A——求回归直线方方程y=bx+a,其中b=—20,a=y——bx;预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入一成本)10.在一段时间内,某淘宝网店一种商品的销售价格x元和日销售量y件之间的一组数据为:价格x元2220181614日销售量y件3741435056求出y关于x的回归方程,并说明该方程拟合效果的好坏.参考数据:ixy=3992,£x?=1660.i=ii=i【拔高练习】1.A.相关系数r【拔高练习】1.A.相关系数r变大B.残差平方和变大C.相关指数R2变大如图312,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()样*1OJ2)*D(3,10)图3-1-2D.2.解释变量x与预报变量尹的相关性变强已知x与D.2.x123456y021334人人人假设根据上表数据所得线性回归直线方程为y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为yz=bzx+az,则以下结论正确的是()AAAAA.b>b,a>aAAb>b‘,aVaAAAAb<bz,a>aAAD.b<b‘,a<a3•甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性进行分析,并用回归分析的方法分别求AA得相关指数R2与残差平方和Qa,b)如下表:甲乙丙丁R20.670.610.480.72AAQ(a,b)106115124103则能体现A,B两个变量有更强的线性相关性的为

4.某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(C)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:时间二月上旬二月中旬二月下旬三月上旬旬平均气温x(C)381217旬销售量y(件)55m3324AAAA由表中数据算出线性回归方^^y=bx^a中的b=—2,样本中心点为(10,38).表中数据m=.气象部门预测三月中旬的平均气温约为22°C,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为件.5•某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x〔和年销售量yi(i=1,2,-,8)数据作了初步处理,得到下面的散点图及一些统计量的值.620年弟普鈕A图313600»图313xyw8_E(x.一x)2i=1i8E(w,一W)2i=1i8_E(x—x)(yti=1一y)8E(w—w)(y.i=1一y)46.65636.8289.81.61469108.83436闊404244464K50525456年住传樂元18表中w=;任,w]=1Ew,.8根据散点图判断,y=a+bx与y=c+dpx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论