版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
章末综合测评(三)成对数据的统计分析(时间:120分钟满分:150分)一、选择题:本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1为变量X与Y之间的样本相关系数,r2为变量U与V之间的样本相关系数,则()A.r2<r1<0 B.r2<0<r1C.0<r2<r1 D.r2=r12.根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn)的散点图分析x与y之间是否存在线性相关关系,若求得其经验回归方程为y=0.85x-85.7,则在样本点(165,57)处的随机误差为()A.54.55 B.2.45C.3.45 D.111.553.已知变量x与y,其一组观测数据如表所示(其中6.5>a>4>b>1,a+b=6),则由该观测数据算得的经验回归方程可能是()x12345y6.5a4b1A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+0.444.有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计得到了一个热饮销售杯数与当天气温之间的线性关系,其经验回归方程为y=-2.35x+155.47.如果某天气温为4℃时,那么该小卖部大约能卖出热饮的杯数是()A.140B.146C.151D.1645.随着国家三孩政策的全面放开,为了调查一线城市和非一线城市的三孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.是否愿生城市非一线一线合计愿生452065不愿生132235合计5842100由χ2=nad-bc2a+bc参照下表:α0.050.010.001xα3.8416.63510.828下列结论正确的是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.依据小概率值α=0.01的独立性检验,认为“生育意愿与城市级别有关”D.依据小概率值α=0.01的独立性检验,认为“生育意愿与城市级别无关”6.已知对某散点图作拟合曲线及其对应的决定系数R2,如下表所示:拟合曲线直线指数曲线抛物线二次曲线y与x回归方程y=19.8x-463.7y=e0.27x-3.84y=0.367x2-202y=x决定系数R20.7460.9960.9020.002则这组数据模型的经验回归方程的最好选择应是()A.y=19.8x-463.7 B.y=e0.27x-3.84C.y=0.367x2-202 D.y=x7.某运动制衣品牌为了使成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:cm),图1为选取的15名志愿者身高与臂展的折线图,图2为身高(x)与臂展(y)所对应的散点图,并求得其经验回归方程为y=1.16x-30.75,则下列结论中不正确的为()A.15名志愿者身高的极差小于臂展的极差B.15名志愿者身高和臂展成正相关关系C.可估计身高为190cm的人臂展大约为189.65cmD.身高相差10cm的两人臂展都相差11.6cm8.某初级中学在课后延时一小时开设相关课程,为了解学生选课情况,在该校全体学生中随机抽取50名学生进行问卷调查,得到数据如表所示.(附:计算得到χ2≈8.333)项目喜欢音乐不喜欢音乐喜欢体育2010不喜欢体育515参考数据:α0.050.0250.010.0050.001xα3.8415.0246.6357.87910.828根据以上数据,对该校学生情况判断不正确的是()A.估计该校既喜欢体育又喜欢音乐的学生约占2B.从这30名喜欢体育的学生中采用随机数表法抽取6人做访谈,则他们每个个体被抽到的概率为1C.从不喜欢体育的20名学生中任选4人做访谈,则事件“至少有2人喜欢音乐”与“至多有1人不喜欢音乐”为对立事件D.在犯错误的概率不超过0.005的前提下,认为“喜欢体育”与“喜欢音乐”有关系二、选择题:本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.9.对于样本相关系数r,下列说法不正确的是()A.r越大,成对样本数据的线性相关程度越强B.r=0,成对样本数据没有任何相关关系C.r刻画了样本点集中于某条直线的程度D.成对样本数据相关的正负性与r的符号(正负)相同10.某班级学生开展课外数学探究活动,将一杯冷水从冰箱中取出后静置,在25℃的室温下测量水温y(单位:℃)随时间x(单位:min)的变化关系,在测量了15个数据后,根据这些数据(xi,yi)(i=1,2,…,15)得到如下散点图:现需要选择合适的回归模型进行回归分析,则根据散点图,合适的回归模型有(注:c1,c2均为常数)()A.y=25-c1e-c2x B.yC.y=25-1c1x+c2 D.y=c1(11.工作人员在某地区随机抽取了8对母女的身高数据,如表:母亲身高x/cm154157158159160161162163女儿身高y/cm155156159162161164165166下列说法正确的是()A.8个成对样本数据呈正相关关系B.成对样本数据中变量x和变量y的样本相关系数r约为0.963C.用关于均值x和y为零点(x,y)平移后的成对样本数据(x1-x,y1-y),(x2-x,y2-y),…,(x8-x,yD.用样本相关系数r可以估计总体两个变量的相关系数12.已知由成对样本数据(xi,yi),i=1,2,…,n求得的经验回归方程为y=1.5x+0.5,且x=3,现发现两个样本点(1.2,2.2)和(4.8,7.8)的残差较大,去除后重新求得的经验回归直线l的斜率为1.2,则去除后()A.变量x与y具有正相关关系B.经验回归方程为y=1.2x+1.4C.y的估计值的增加速度比原来变快D.样本点(2,3.75)的残差为0.05三、填空题:本大题共4小题,每小题5分,共20分.将答案填在题中的横线上.13为y=0.3x+a,则x≈________,a≈________.(精确到0.01)14.若两个分类变量X与Y的2×2列联表如下:xy合计y1y2x1101525x2401656合计503181则“X与Y之间有关系”这个结论出错的概率为________.15.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500名,女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人.则抽取的男生人数为________.16.某化工厂产生的废气经过过滤后排放,以模型y=ce-kt(其中e为自然对数的底数)去拟合过滤过程中废气的污染物浓度ymg/L与时间th之间的一组数据,为求出线性回归方程,设z=lny,经变换后得到线性回归方程为z=-t+3+ln15,则当经过4h后,预报废气的污染物浓度为____________mg/L.四、解答题:本大题共6小题,共70分.解答时应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)期中考试后,对某班60名学生的成绩优秀和不优秀与学生近视和不近视的情况做了调查,其中成绩优秀的36名学生中,有20人近视,另外24名成绩不优秀的学生中,有6人近视.(1)请列出列联表并画出等高堆积条形图,并判断成绩优秀与患近视是否有关系.(2)能否在犯错误的概率不超过0.05的前提下认为成绩优秀与患近视之间有关系?附:χ2=nα0.10.050.010.005xα2.7063.8416.6357.87918.(本小题满分12分)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9并计算得(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).附:相关系数r=,1.896≈1.377.19.(本小题满分12分)网购已成为当今消费者最喜欢的购物方式之一,某机构对A,B,C,D四家同类运动服装网店的关注人数x(单位:千人)与其商品销售件数y(单位:百件)进行统计对比,得到表格:网店ABCD关注人数x/千人3467销售件数y/百件11122017由散点图得知,可以用经验回归方程y=bx+a来近似刻画它们之间的关系.(1)试建立y关于x的经验回归方程;(2)在(1)的回归模型中,请用R2说明销售件数的差异有多大程度是由关注人数引起的.(精确到0.01)20.(本小题满分12分)某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下对应数据:单价x/元35404550日销售y/台56412811(1)画出散点图并说明y与x是否具有线性相关关系?如果有,求出经验回归方程(方程的斜率保留一个有效数字);(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.21.(本小题满分12分)已知某校5名学生的数学成绩和物理成绩如下表:学生的编号i12345数学成绩xi8075706560物理成绩yi7066686462(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x表示数学成绩,用y表示物理成绩,求y关于x的经验回归方程;(3)利用残差分析经验回归方程的拟合效果,若残差和在(-0.1,0.1)范围内,则称经验回归方程为“优拟方程”,问:该经验回归方程是否为“优拟方程”?参考数据和公式:y=bx+a,其中b=i=122.(本小题满分12分)为研究某种图书每册的成本费y(元)与印刷册数x(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.其中(1)根据散点图判断:y=a+bx与y=c+dx哪一个更适宜作为每册成本费y(元)与印刷册数x(千册)的回归方程类型?(只要求给出判断,不必说明理由(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(回归系数的结果精确到0.01).(3)若该图书每册书定价为10元,则至少应该印刷多少千册才使销售利润不低于78840元?(假设能够全部售出,结果精确到1)(附:对于一组数据(ω1,v1)(ω2,v2),…,(ωn,vn),其经验回归方程v=α+βω的斜率和截距的最小二乘估计分别为章末综合测评(三)1.B[由变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可得变量X与Y正相关,因此r1>0;由变量U与V相对应的一组数据为(10,5),(11.3,4)(11.8,3),(12.5,2),(13,1),可得变量U与V负相关,因此r2<0.故r2<0<r1.]2.B[把x=165代入y=0.85x-85.7,得y=0.85×165-85.7=54.55,所以在样本点(165,57)处的随机误差为57-54.55=2.45.故选B.]3.C4.B[热饮杯数与当天气温之间的线性关系,其经验回归方程为y=-2.35x+155.47,如果某天气温为4℃时,即x=4,则该小卖部大约能卖出热饮的杯数y=-2.35×4+155.47=146.07≈146.]5.C[因为χ2≈9.616>6.635=x0.01,所以依据小概率值α=0.01的独立性检验,认为“生育意愿与城市级别有关”,故选C.]6.B[∵R2越大,拟合效果越好,∴应选择y=e0.27x-3.84.]7.D[对于A,身高极差大约为20,臂展极差大约为25,故A正确;对于B,很明显根据散点图以及经验回归直线得到,身高矮一些,臂展就可能短一些,身高高一些,臂展就可能长一些,故B正确;对于C,身高为190cm,代入经验回归方程可得到臂展的预测值为189.65cm,但是不是准确值,故C正确;对于D,身高相差10cm的两人臂展的预测值相差11.6cm,但并不是准确值,经验回归方程上的点并不都是准确的样本点,故D不正确.]8.C[对A选项,估计该校既喜欢体育又喜欢音乐的学生约占2050=2对B选项,每个个体被抽到的概率为630=1对C选项,“至少有2人喜欢音乐”与“至多有1人喜欢音乐”为对立事件,C错误;对D选项,由χ2≈8.333>7.879,则在犯错误的概率不超过0.005的前提下,认为“喜欢体育”与“喜欢音乐”有关系,D正确.故选C.]9.AB[样本相关系数r是用来衡量两个变量之间的线性相关程度的,r是一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大,所以A不正确;样本相关系数为0说明两个变量不存在线性相关关系,但这并不意味着两个变量之间不存在其他类型的关系,所以B不正确;C,D的阐述均正确.故选AB.]10.AC[题中散点图的特点是y随x的增长而增长,增长的速度越来越慢,且y<25.对于A,当c1>0,c2>0时符合题意;对于B,y=25+c1x+对于C,当c1>0,c2>0时符合题意;对于D,y=c1(x-25)+c2的增长速度保持不变,不符合题意.故选AC.]11.ABD[由成对样本数据可得,x=18×(154+157+158+159+160+161+162+163)y=18×(155+156+159+162+161+164+165+166)i∴r==8059.5×116≈0.963由r≈0.963>0,8个成对样本数据呈正相关关系,A正确;对于选项C,平移后的成对样本数据所对应平面直角坐标系中的散点图与原始的成对样本数据所对应的散点图形状完全一致,故相关性完全相同,C错误;根据统计学思想,D正确.]12.AB[∵x=3,去除前的经验回归方程为y=1.5x+0.5,∴y=5.设重新求得的经验回归直线l的方程为y=a+bx,则b=1.2,∴变量x与y设新的成对样本数据为(xi',yi'),i=1,2,…,n-2,xi'的平均值为x',yi'的平均值为y',则(n-2)x'=nx-(1.2+4.8)=3n-6=3(n-2),(n-2)y'=ny-(2.2+7.8)=5n-10=5(n-2),故x'=3,y'=5,∴a=y'-bx'=5-1.2×3故新的经验回归方程为y=1.2x+1.4,故B正确.因为1.2<1.5,所以去除后y的估计值的增长速度比原来变慢,故C错误.把x=2代入新的经验回归方程中,得y=3.8,3.75-3.8=-0.05,故D错误.故选AB.]13.46.365.55[由题意得xy所以21411=0.3×51011+a14.0.01[由列联表数据,可求得χ2=81×(10×16-40×15)225×5615.15[根据等高堆积条形图可知,喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为300+160=460,按分层抽样的方法抽取23人,则抽取的男生人数为300460×23=15.16.15e[当t=4时,z=-1+ln15=ln15∴y=ez=15e.17.解:(1)列联表如下:是否近视合计近视不近视成绩优秀201636成绩不优秀61824合计263460等高堆积条形图如图所示,由图知成绩优秀与患近视有关.(2)由列联表中的数据得到χ2=60×(20×18-6×18.解:(1)样本中10棵这种树木的根部横截面积的平均值x=0.610样本中10棵这种树木的材积量的平均值y=3.910据此可估计该林区这种树木平均一棵的根部横截面积为0.06m2,平均一棵的材积量为0.39m3.=0.2474=0.01340.0001896≈0.01340.01377≈19.解:(1)由表中数据可得x=3+4+6+7=320-300110-所以a=y-bx=15-2×
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 茶花女读后感
- 经典伤感语录摘录63条
- 企业现场施工安全管理培训
- 《元线性回归分析》课件
- 《建议书制作及促成》课件
- 斯利安美容仪社会化营销策略规划案
- 母乳喂养课件教学
- 《汽车销售技术》课件
- 2024年新高一数学初升高衔接《函数的奇偶性》含答案解析
- 企业年金方案草案的决议模板-公司管理
- 阅读素养:培养学生良好的阅读习惯和能力
- 数字媒体艺术大学生职业生涯规划
- 门式起重机方案
- 人工智能在医疗健康中的应用案例
- 危化品运输安全监测与报警系统
- 跑团活动方案
- 2024年实验中学减负工作实施方案
- 大学生发展生涯展示
- 上海复旦附中2024年高三最后一模英语试题含解析
- 社会主义现代化建设教育科技人才战略
- 抗凝药物的使用和注意事项课件
评论
0/150
提交评论