线性回归方程_第1页
线性回归方程_第2页
线性回归方程_第3页
线性回归方程_第4页
线性回归方程_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、线性回归方程、解答题1.为了适应高考改革,某中学推行“创新课堂”教学.高一平行甲班采用“传统教学”的教学方式授课,高一平行乙班采用“创新课堂”白教学方式授课,为了比较教学效果,期中考试后,分别从两个班中各随机抽取20名学生的成绩进行统计分析,结果如下表:(记成绩不低于120分者为“成绩优秀”)分数80,90)90,100)100,110)110,120)120,130130,140)1140,150甲班频数1145432乙班频数01126641.由以上统计数据填写下面的2父2列联表,并判断是否有95%以上的把握认为“成绩优秀与教学方式有关”?甲班乙班总计成绩优秀成绩/、优秀总计2.现从上述样本

2、“成绩不优秀”的学生中,抽取3人进行考核,记“成绩不优秀”的乙班人数为X,求X的分布列和期望.参考公式:K22n(ad-bc)其中n=abcd.(ab)(cd)(ac)(bd)_2P(K>k0)0.100?0.050?0.010?0.001k02.706?3.841?6.63510.828临界值表:2.某学校为了了解学生使用手机的情况,分别在高一和高二两个年级各随机抽取了100件学生进行调查.下面是根据调查结果绘制的学生日均使用手机时间的频数分布表和频率分布直方图,将使用手机时间不低于80分钟的学生称为“手机迷”。高一学生日均使用手机时间的频数分布表:时间分组频数10,20)12120,

3、40)2040,60)243,80)1880,100)22100,1204P(K2之)0.1500.1000.0500.025k02.0722.7063.8415.024(ab)(cd)(ac)(bd)(其中n=a+b+c+d为样本总量).1.将频率视为概率,估计哪个年级的学生是“手机迷”的概率大?请说明理由.2.在高二的抽查中,已知随机抽到的女生共有55名,其中10名为“手机迷”.根据已知条件完成下面的2x2列联表,并据此资料你有多大的把握认为“手机迷”与性别有关?非手机迷手机迷合计男女合计3.某中学为了解中学生的课外阅读时间,决定在该中学的1200名男生和800名女生中按分层抽样的方法抽取

4、20笄学生,对他们的课外阅读时间进行问卷调查。现在按课外阅读时间的情况将学生分成三类:八类(不参加课外阅读),B类(参加课外阅读,但平均每周参加课外阅读的时间不超过3?J、时),C类(参加课外阅读,且平均每周参加课外阅读的2时间超过3?、时)。调查结果如下表:A类B类C类男生x53女生y331.求出表中x,y的值;,2n(ad-bc)k二(ab)(cd)(ac)(bd)P(k2法)0.100.050.01k02.7063.8416.6354.2020年开始,国家逐步推行全新的高考制度.新高考不再分文理科,采用3+3模式,其中语文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取

5、的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1500名学生(其中男生900人,女生600人)中,采用分层抽样的方法从中抽取n名学生进行调查.1 .已知抽取的n名学生中含女生20人,求n的值及抽取到的男生人数;2 .学校计划在高一上学期开设选修中的“物理”和“地理”两个科目,为了了解学生对这两个科目的选课情况,对在1的条件下抽取到的n名学生进行问卷调查(假定每名学生在这两个科目中必须选择一个科目且只能选择一个科目),下表是根据调查Z果得到的2m2列联表.请将列联表补

6、充完整,并判断是否有99%的把握认为选择科目与性别有关?说明你的理由;选择“物理”选择“地理”总计男生10女生5总计3 .在2抽取的选择“地理”的学生中按分层抽样再抽取5名,再从这5名学生中抽取2人了解学生对“地理”的选课意向,f#况,求2人中至少有1名男生的概率.附:参考公式及数据k22nad-bcabcdacbd2.根据此数据,能否有99%勺把握认为性别与休闲方式有关系2P(K2=k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828P(K2>k0)0.050.0100.001k03.8416.6

7、3510.828k2nad-bcabcdacbd=abcd.26.某市春节期间7家超市的广告费支出x(万元)和销售额y1(万元)数据如下:超巾ABCDEFG广告费支出x11246111319销售额y1193240445253541.若用线性回归模型拟合y与x的关系,求y关于x的线性回归方程2.用对数回归模型拟合y与x的关系,可得回归方程别约为0.75和0.97,请用说明选择哪个回归模型更合适?=12lnx+22,经计算得出线性回归模型和对数模型的R2分,并用此模型预测A超市广告费支出为8万元时的销售额.参数n77xxyi-n-Xy数据及公式:X=8,y=42,"xy=2794Jxi2

8、=708,<?=y-t?X,ln2:0.7i1i4-22性回归模型的残差平方和=3930线_xxi-nx6'、(yi-yi)2=236.64,e8.06053167,i4其中xi.yi分别为观测数据中的温度和产卵数,i=1,2,3,4,5,61 .若用线性回归模型,求y关于x的回归方程?=&+台(精确到0.1);2 .若用非线性回归模型求得y关于x的回归方程为夕=0.06e°.23°3x,且相关指数R2=0.9522.试与1中的回归模型相比,用R2说明哪种模型的合效果更好.用拟合效果好的*II型预测温度为35:C时该种药用昆虫的产卵数(结果取整数).附

9、:一组数据(为,%),?天,y2),?.,(4,yn),?其回归直线?=&的斜率和截距的最小二乘估计为nn-,一、,一、一,、2(xi-x)(y-y)'(yi-y),?='_改;相关指数R2=1Y.%(xi-x)2'、'(Yi-y)21 1i18.中华人民共和国道路交通安全法第47条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,中华人民共和国道路交通安全法第90臻规定:对不礼让行人的驾驶员处以扣3盼,罚款50元的处罚.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为统计数据

10、:月份12345违章驾驶员人数12010510090851 .请利用所给数据求违章人数y与月份之间的回归直线方程?=&+j?2 .预测该路口7?g份的不“礼让斑马线”违章驾驶员人数3 .交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如下2?2列J联表:不礼让斑马线礼让斑马线合计驾龄不超过1年22830驾龄1年以上81220合计302050能否据此判断有97.5%的把握认为“礼让斑马线”行为与驾龄有关nn、xy-nxy'(x-x)(yi-y)_参考公式:|?二i1=门,S?=Y-I&,n2nj、x2-nx工(xi-x

11、)2i1i12(其中n=a+b+c+d)2_n(ad-bc)K二(ab)(cd)(ac)(bd)2P(K2之k)0.1500.1000.0500.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.8289.某公司为确定下一年度投入某种产品的宣传费z(单位:千元)的影响.对近8年的年宣传费xi一些统计量的值.600金正确云,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润和年销售量y.i=1,2,|”,8)数据作了初步处理,得到下面的散点图及f年”他量片580560'M0-5205004»0.i18年“双十一”

12、期xyw8工(X-x)2iX8一,一、2Z(wi-w)y8工(xi-x)<Yi-y)8一,一、2/_L工(wi-w)(Yi-y)y46.65636.8289.81.61469108.8t3436384C4244464«5025456早交转香,于北_18表中wi=x,w=wi.8y1 .根据散点图判断,y=a+bx与y=c+d4哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)2 .根据1的判断结果及表中数据,建立y关于x的回归方程.3 .已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据2的结果回答下列问题:年宣传费x=49时,年销售

13、量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(U1,V1),(U2,V2),,(Un,vn)其回归直线V=«+PU的斜率和截距的最小二乘估计分别为n.二'.Ui-uVi-V?二i,?-V-?u.2Ui-u1 .请用相关系数r说明y与x之间是否存在线性相关关系(当ra0.81时,说明y与x之间具有线性相关关系);2 .根据1的判断结果,建立y与x之间的回归方程,并预测当x=24时,对应的利润y?为多少(b,a,夕精确到0.1).n'、'xyi-nxy附参考公式:回归方程中?=bx+?中8和?最小二乘估计分别为?=岩,?=y-

14、依,22二.xi-nxi1n'xy-nxy相关系数r二一二nn产xi-xI-iyi-y88"8"8参考数据:Zxyi=241,£Xi2=356历6-X).8.25'(y-y)=6.i±i1,i-1-vri111.为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.911

15、0.1310.029.2210.0410.059.95116116211622经计算得X=vX-9.97,s:一二(为-X)2=CX-16x2)0.212,16y16y164.16216一忤(i8.5)之18.439方(xxJ(i8.5)=2.78,i1i4其中Xi为抽取的第i个零件的尺寸,i=1,2,川16。1 .求(X,iXi=1,2,|,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)2 .一天内抽检零件中,如果出现了尺寸在(X-3s,X+3s)之外的零件,就

16、认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(X-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)n“x-xy-y附:样本(,yi)(i=1,2,n)的相关系数r=,J0.008球0.09.12.某网络营销部门为了统计某市网友2016年12月12日的网购情况,从该市当天参与网购的顾客中随机抽查了男女各30人,统计其网购金额,得到如下频率分布直方图:频率网购达人非网购达人合计男性30女性1230合计60若网购金额超过2千元

17、的顾客称为“网购达人”,网购金额不超过2千元的顾客称为“非网购达人”1 .抽取的“网购达人”中女性占12人,请根据条件完成上面的2父2列联表,并判断是否有99%的把握认为“网购达人”与性别有关?2 .该营销部门为了进一步了解这60名网友的购物体验,从“非网购达人”、“网购达人”中用分层抽样的方法确定12人,若需从这12人中随机选取3人进行问卷调查.设巴为选取的3人中“网购达人”的人数,求U的分布列和数学期cn/arl_h。、2(参考公式:K2=n(ad一bc),其中n=a+b+c+d)abcdacbd_2P(k之k)0.150.100.050.0250.0100.0050.001k2.0722

18、.7063.8415.0246.6357.87910.82813.经观测,某昆虫的产卵数y与温度x有关,现将收集到的温度Xi和产卵数y(i=1,2,.,10)的10组观测数据作了初步处理,得到如图的散点图及一些统计量表10工xiig102小i10工z10工(xi-x)2i410工(x-x)(yi-y)10工(xi-x)(zi-z)y275731.121.71502368.3630-110表中zi=lny1,z=-'、,zi,10y*J.i正确教音库:“哪一个适宜作为y与x之间的回归方程模型?(给出判断即1 .根据散点图判断,y=a+bx,y=a十或与y=3、可,不必说明理由)2 .根据

19、1的判断结果及表中数据.试求y关于x回归方程;已知用人工培养该昆虫的成本h(x)与温度x和产卵数y的关系为h(x)=x(lny-2.4)+170,当温度x(x取整数)为何值时,培养成本的预报值最小?附:对于一组数据(Ui,Vi)(U2,V2)(Un,Vn),其回归直线V="十PU的斜率和截距的最小二乘估计分别为n_、Ui-uVi-V:二,:"v-un-27'、Ui-Ui1>.闻徽女.¥麻米轻s携用卧1 .求y与t的相关系数2 .求y关于t的回归方程(系数精确到0.01),并预测2018年我国生活垃圾无害化处理量。77-72-.参考数据:1yi=9.3

20、2:ty=40.17,“yi-y=0.55,7:2.646i1i1i4n一it-1yi-y参考公式:相关系数r=T回归方程?=今十说中斜率和截距的最小二乘估计公式分别为n2n2>.:壮Ji-ti.-1yi_yi1i1n二i.ti-tyi-y_b)2-,a=y_btxti-ti4参考答案一、解答题1.答案:1.补充的2m2列联表如下表甲班乙班总计成绩优秀91625成绩/、优秀11415总计202040.C/C/Qv/根据2x2列联表中的数据,得K的观测值为k=40(941611)&5.227>3.841,25152020所以有95%以上的把握认为“成绩优秀与教学方式有关”2.

21、X的可能取值为0,1,2,3?16533455一91C;1P(X=0)=巡C15P(X=1)辛C1522044455一9166455c1C2P(X=2)=箕C15P(X=3)=4455X0123P33914491664554455C3C;5所以X的分布列为EX=033144291916645543455解析:2.答案:1.由频数分布表可知,高一学生是“手机迷”的概率为224100=0.26由频率分布直方图可知,高二学生是“手机迷”的概率为H=(0.0025+0.010)乂20=0.25因为R>P2,所以高一年级的学生是“手机迷”的概率大2 .由频率分布直方图可知,在抽取的100人中,“手

22、机迷”有(0.010+0.0025产20M100=25(人),222nad-bc10030*10-45*15K二二a+bcdacbd75*25*45*5510033:3.030非手机迷有100-25=75(人)从而2X2列联表如下:非手机迷手机迷合计男301545女451055合计7525100将2M2列联表中的数据代入公式计算,得因为3.030>2.706,所以有90%勺把握认为“手机迷”与性别有关解析:3.答案:1.设抽取的20队中,男、女生人数分别为n1,n2,201200n1二=12则200020800°1二二82000所以x=12-5-3=4,y=8-3-3=2.2

23、.列联表如下:男生女生总计不参加课外阅读426参加课外阅读8614总计128202220(46-28)2K的观测值k=()-12814610&630.159:二2,706,所以没有90%的把握认为“参加阅读与否”与性别有关3 .X的可能取值为0,1,2,3,则P(X=0)=Cs+c2c;c319C;,56P(X=1)=c兔3+c兔2+c;c:+C22C33P(X=2)=C;C;C3+C;C33c314P(X193131,EX=01-2351567145656°、C;1=3)=-=,C;5620.,解得n=50,男生人数为:50-20=30人解析:选择“物理”选择“地理”总计男

24、生201030女生51520总计2525502.列联表为:15006004.答案:1.由题意得:22502015-510k2;8.3336.63525253020所以有99%的把握认为选择科目与性别有关.3 .从25个选择地理的学生中分层抽样抽5名,所以这5名学生中有2名男生,3名女生,男生编号为1,2,女生编号为a,b,c,5名学生中再选抽2个,则所有可能的结果为'1=:ab,ac,a1,a2,bc,b1,b2,c1,c2,12:至少一名男生的结果为1a1,a2,b1,b2,c1,c2,12),所以2人中至少一名男生的概率为P=10解析:5.答案:1.97923.689:6.635,

25、892426-3182 .由列联表中的数据,得K2的观测值为k=I55343257因此,没有99%的把握认为性别与休闲方式有关系.解析:Xiyi-nxy6.答案:1.解:g-22、,xi-nxi42794-7842_2708-78=1.7,?=y-&=28.4所以,y关于x的线性回归方程是夕=1.7x+28.42.0.75<0.97,对数回归模型更合适.当x=8万元时,预测A超市销售额为47.2万元.解析:7.答案:1.y关于x的线性回归方程为?=6.6x138.62.由所给数据求得的线性回归方程为贸=6.6x-138.6,相关指数为6%(yiR2=161=12(y-y)i1因为

26、0.9398<0.9522,236.643930:1-0.0602=0.9398所以回D3方程夕=0.06e°.2303x比线性回归方程p=6.6x138.6拟合效果更好由得当温度x=35C时,?=0.06和303通5=0.06xe8.°605又e8.0605:3167夕期0.06父3167定190(个).即当温度x=35C时,该种药用昆虫的产卵数估计为190个.6lx-x)(yi-y)解析:由题意得b)=1J-%(x-又)2i1.?=33-6.626=-138.6,557中846.6,.y关于x的线性回归方程为?=6.6x138.68.答案:1.由表中数据知,x=3

27、,y=100'、xYi-nxyb二n22xi-nxi1所求回归直线方程为1415-150055-45=一8.5?=y-bx=125.5?=-8.5x125.53 .由1知,令x=7,则?=8.5父7+125.5=66人250(2212-88)2504 .由表中数据得K=定5.556>5.024,302030209根据统计有97.5%的把握认为“礼让斑马线”行为与驾龄关解析:9.答案:1.由散点图可以判断,y=c+djx适宜作为年销售量y关于年宣传费x的回归方程类型2.令w=jx,先建立y关于w的线性回归方程.“Wi-wyi-y由于(?=J8_2Wi-Wi1108.81.6=68,

28、?=ydW=563-686.8=100.6,所以y关于w的线性回归方程为?=100.6+68w因此y关于x的回归方程为d?=100.6+68JX.3.由2知,当x=49时,年销售量y的预报值?=100.6+68炳=576.6,年利润z的预报值2=576.6x0.249=66.32.根据2的结果知,年利润z的预报值2=0.2(100.6+68jX)x=x+13.6JX+20.12.一一,一13.6所以当/=6.8,即x=46.24时,22取得最大值.故年宣彳专费为46.24千元时,年利润的预报值最大解析:10.答案:1.由题意得x=6,y=4.882-82飞2又“Xy,=241;x2=356,.

29、“x-x:8.25,*7=6,i鼻i4.Yi1二i28;x,yi=8xyi18_28_2xi-xiI:yi-yi1i4241-8640.990.81,8.256所以y与x之间具有线性相关关系8%xyi=8xyi4241-864“因为b=-8=20.7工22356-56X-8xi12.因为a=y-bx定4-0.7乂6=0.2,所以回归直线方程为a=0.7x-0.2,当x=24时,y=0.7x0.2=0.7X240.2=16.6,即禾1J润约为166万元.解析:11.答案:1.由样本数据得(x,iXi=1,2,|16的相关系数为“xi-xi-8.5i1162.162£(x-x)X(i-8.5)i1ii1-2.780.212.1618.439-0.18.由于r<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小2.(i)由于x=9.97,s定0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x3s,x+3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为(169.97-9.22)=10.02,这条生产线当天生产的零件尺寸1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论