




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 1 讲统计与统计案例高考定位1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点,2016 年,2017 年和 2018 年在解答题中均有考查.真题感悟考点整合真题感悟jfV1.(2018 全国I卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻O统计了该地区新农村建设前后农村的经答案 A2._(2018 全国川卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异 .为 了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、 分层抽
2、样和系统抽样,则最合适的抽样方法是.解析因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样, 才能了解到不同年龄段的客户对公司服务的客观评价 答案分层抽样番.为更好地了解该地区农村的经济收入变化情况,济收入构成比例,得到如图所示的饼图:第三产业收入口其他收入*第二产业收入刮耳他收入则下面结论中不正确的是(A.新农村建设后, 种植收入减少芥殖收入建设后疑济收人枸成比例B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后, 养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析设新农村建设前经济收入为a,D.新农村建设后,养殖则新农村建
3、设后经济收入为2a,则由饼图可得新农村建设前种植收入为 0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为 0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.故选 A.择殖收入裟设前蛭济收人枸成比例种植收入种植收入23.(2018 全国n卷)下图是某地区 2000 年至 2016 年环境基础设施投资额y(单位:亿元)的 折线图.f 1为了预测该地区 2018 年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据 2000 年至 2016 年的数据(时间变量t的值依次为 1
4、, 2, , 17) 建立模型:y= 30.4 + 13.5t;根据 2010 年至 2016 年的数据(时间变量t的值依次为 1, 2,7)建立A模型:y= 99+ 17.5t.(1)分别利用这两个模型,求该地区2018 年的环境基础设施投资额的预测值;你认为用哪个模型得到的预测值更可靠?并说明理由A解(1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为y= 30.4 +13.5X19= 226.1(亿元).利用模型,该地区 2018 年的环境基础设施投资额的预测值为Ay= 99 + 17.5X9= 256.5(亿元).(2)利用模型得到的预测值更可靠.理由如下:sX/w从折线
5、图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线y=30.4 + 13.5t上下,这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描X述环境基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010 年至 2016 年的数据建立的线性模型y= 99+ 17.5t可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型 得到的预测值更可靠.考点整合31.抽样方法
6、4抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围2. 统计中的四个数据特征(1) 众数:在样本数据中,出现次数最多的那个数据(2) 中位数:样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数-1(3) 平均数:样本数据的算术平均数,即x=n(xi+X2+xn).(4) 方差与标准差.21-222s=n【(XiX) + (X2X) + (XnX),2n(adbc)1 2 3则K= (a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d为样本容量).烈点聚焦Ifi类
7、突破丨研热点析考遴:热点一抽样方法【例 1】(1)(2018 合肥模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1000 人、高二 1 200 人、高三n人中抽取 81 人进行问卷调查,已知高二被抽取的人数为30,1-2-2-2S= n(X1X) +(X2X) +(XnX).3. 直方图的两个结论频率2小长方形的面积=组距X组距=频率3各小长方形的面积之和等于1.4. 回归分析与独立性检验(1)回归直线y=bx+a经过样本点的中心点(x, y),若X取某一个值代入回归直线方程y=bx+a中,可求出y的估计值(2)独立性检验对于取值分别是X1,X2和y1,y2的分类变量X和Y,其样本频
8、数列联表是:X1X2总计y2总计ba+bdc+db+dn513 003 15668889区间139 , 151上的运动员人数是 _ ./、301解析(1)依题意,分层抽样比为 1200=40.1” e 81 =(1 000 + 1 200 +n),解得n= 1 040.40(2)依题意,可将编号为 135 号的 35 个数据分成 7 组,每组有 5 个数据在区间139 , 151上共有 20 个数据,分在 4 个小组内,每组抽取 1 人,共抽取 4 人.答案(1)D(2)4探究提高1.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,
9、都等于样本容量与总体容量的比值2.在系统抽样的过程中,要注意分段间隔,需要抽取n个个体,样本就需要分成n个组,则N分段间隔即为 n(n为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每n组中按规则抽取每个个体【训练 1】(1)(2018 郑州模拟)为规范学校办学,某省教育厅督察组对某所高中进行了抽 样调查.抽到的班级一共有 52 名学生,现将该班学生随机编号, 用系统抽样的方法抽取一个 容量为 4 的样本,已知 7 号、33 号、46 号同学在样本中,那么样本中还有一位同学的编号应是()A.13B.19C.20 D.51某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200
10、, 400, 300, 100 件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60 件进行检验,则应从丙种型号的产品中抽取_ 件.那么n=()A.860B.720C.1 020D.1 040(2018 长沙雅礼中学质检) 在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所若将运动员按成绩由好到差编为135 号,再用系统抽样方法从中抽取7 人,则其中成绩在6解析(1)由系统抽样的原理知,抽样的间隔为52 十 4= 13,故抽取的样本的编号分别为7,7+ 13,7+ 13X2, 7+ 13X3,即卩 7 号,20 号,33 号,46 号.样本中还有一位同学的编号为
11、20 号.n60因为样本容量 n=60,总体容量 N= 200 + 400 + 300+ 100= 1 000,所以抽取比例为 -=而3=50.3 因此应从丙种型号的产品中抽取300X= 18(件).50答案(1)C(2)18热点二用样本估计总体考法 1 数字特征与茎叶图的应用【例 2 1】(2018 北京东城区质检)某班男女生各 10 名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:男生女生45655668866522262 85 07035假设每名同学最近一周平均每天的锻炼时间是互相独立的1男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;2从平均值分析,男生每天锻炼的时
12、间比女生多;3男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;4从 10 个男生中任选一人,平均每天的锻炼时间超过 65 分钟的概率比同样条件下女生锻炼 时间超过65 分钟的概率大.其中符合茎叶图所给数据的结论是()A.B.C.D.解析由茎叶图知,男生每天锻炼时间差别小,女生差别大,正确51男生平均每天锻炼时间超过65 分钟的概率P= 10 =-,女生平均每天锻炼时间超过65 分钟42的概率 R= =-,RF2,因此正确.105设男生、女生两组数据的平均数分别为x甲,x乙,标准差分别为s甲,s乙.7易求乂甲=65.2 ,x乙=61.8,知x甲x乙,正确.又根据茎叶图,男生锻炼时间
13、较集中,女生锻炼时间较分散, s甲s乙,错误,因此符合茎叶图所给数据的结论是.答案 C考法 2 用样本的频率分布估计总体分布【例 2 2】(2017 北京卷)某大学艺术专业 400 名学生参加某次测评,根据男女学生人数100 名学生,记录他们的分数,将数据分成7. V(1)从总体的 400 名学生中随机抽取一人,估计其分数小于70 的概率;已知样本中分数小于 40 的学生有 5 人,试估计总体中分数在区间40, 50)内的人数;(3)已知样本中有一半男生的分数不小于 70,且样本中分数不小于 70 的男女生人数相等.试估计总体中男生和女生人数的比例*解(1)根据频率分布直方图可知,样本中分数不
14、小于 70 的频率为(0.02 + 0.04)X10= 0.6 , 所以样本中分数小于 70 的频率为 1 0.6 = 0.4.所以从总体的 400 名学生中随机抽取一人,其分数小于70 的概率估计为 0.4.vU V(2)根据题意,样本中分数不小于50 的频率为 (0.01+0.02+0.04+0.02)X10=0.9,分数在区间40 , 50)内的人数为 100- 100X0.9 5 = 5.所以总体中分数在区间40 , 50)内的人数估计为 400X沽=20.(3)由题意可知,样本中分数不小于70 的学生人数为 (0.02+0.04)X10X100=60,1所以样本中分数不小于70 的男
15、生人数为 60X -= 30.比例,使用分层抽样的方法从中随机抽取了组:20 , 30) , 30 , 40),8所以样本中的男生人数为30X2= 60,女生人数为 100 60= 40,男生和女生人数的比例为 60 : 40= 3 :2.9所以根据分层抽样原理,总体中男生和女生人数的比例估计为3 : 2.探究提高1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义平均数、中位数、众数描述数据的集中趋势,方差和标准差描述 数据的波动大小.2.在本例 2 - 2 中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频
16、率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错【训练 2】(1)如图所示的茎叶图记录了甲乙两组各5 名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3 , 5B.5 , 5C.3 , 7D.5 , 7解析由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.由乙组数据 59, 61, 67, 65 , 78,可得乙组数据的平均值为66,故甲组数据的平均值也56 + 62 + 65 + 74+ 70+x5答案 A (2)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水
17、情况进行了调查.通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照0 , 0.5),0.5 , 1),4 , 4.5分成 9 组,制成了如图所示的频率分布直方图.1求直方图中a的值;2设该市有 30 万居民,估计全市居民中月均用水量不低于3 吨的人数,说明理由;3估计居民月均用水量的中位数 解由频率分布直方图可知:月均用水量在 0 , 0.5)内的频率为 0.08X0.5 = 0.04.同理,在0.5 , 1) , 1.5 , 2) , 2 , 2.5) , 3 , 3.5) , 3.5 , 4) , 4 , 4.5等组的频率分别屮组乙组652 S61 7 yJT 4
18、7K为 66,从而有=66,解得x= 3.月的用水址10为 0.08 , 0.21 , 0.25 , 0.06 , 0.04 , 0.02.由 1 (0.04 + 0.08 + 0.21 + 0.25 + 0.06 + 0.04 + 0.02) = 0.5 Xa+ 0.5 Xa,解得a= 0.30.2由知,该市 100 位居民中月均用水量不低于 3 吨的频率为 0.06 + 0.04 + 0.02 = 0.12.由 以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数为 300 000X0.12 =36 000.3设中位数为x吨.因为前 5 组的频率之和为 0.04 +
19、0.08 + 0.15 + 0.21 + 0.25 = 0.730.5.又前 4 组的频率之和为 0.04 + 0.08 + 0.15 + 0.21 = 0.480.5.所以 2x200 , 400)400 , 600)600 , 800)800 , 1 000频数(天)3e61263M(1) 设x=1M0,若x与y之间是线性关系,试根据表 1 的数据求出y关于x的线性回归方程;(2) 小李在该市开了一家洗车店,洗车店每天的平均收入与AQI 指数存在相关关系如表 3:/ M外外0 , 200)200 , 400)400 , 600)600 , 800)800 , 1 000日均收入 (元)2
20、0001 0002 0006 0008 000根据表 3 估计小李的洗车店 2017 年 11 月份每天的平均收入nEXiyinx yAAAAi=1A人人附参考公式:y=bx+a, 其中b=n-,a=ybx2 2EXinxi=111-1解X=-(9 + 7 + 3+ 1) = 5,4-1y= 一(0.5 + 3.5 + 6.5 + 9.5) = 5,44刀Xiyi= 9X0.5 + 7X3.5 + 3X6.5 + 1X9.5 =58,i=i42亠22 Q “ 2刀Xi= 9 + 7 + 3 + 1 = 140.i=121“214120,a=5-20X 5=刁,12 天每天收入 2 000 元,
21、有 6 天每天收入 6 000 元,有 3 天每天收入 8 000 元.1新(2 000 X 31 000 X6+2 000X12+ 6 000X6+ 8 000X3) =2 400(元).探究提高1.求回归直线方程的关键及实际应用 (1)关键:正确理解计算b,a的公式和准确地计算(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变 量的值.2.相关系数(1)当r0 时,表明两个变量正相关;当r0.75 时,认为两个变量具有较强的线性相关.【训练 3】(2016 全国川卷)如图是我国
22、2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码 17 分别对应年份 20082014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;58-4X5X5140-4X52 y关于x的线性回归方程为2141y=-刃x+7.(2)根据表 3 可知,该月 30 天中有 3 天每天亏损2 000 元,有 6 天每天亏损 1 000 元,有估计小李洗车店 2017 年 11 月份每天的平均收入为害化处理虽、12(2)建立y关于t的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾无害化处理量 附注:因为y与t的相关系数近似为0.
23、99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.刀(tit)(yiy)9.32厂e i -2.89由y=- 1.331 及(1)得b=- 7-= 0.103 ,7228刀(tit)i=1a=yb t1.3310.103X40.92.所以y关于t的回归方程为y= 0.92 + 0.10t.A将 2016 年对应的t= 9 代入回归方程得y= 0.92 + 0.10X9= 1.82.所以预测 2016 年我国生活垃圾无害化处理量将约为1.82 亿吨.参考数据:77刀yi= 9.32,刀tiyi= 40.17 ,i=1i=1刀(yiy)2= 0.55 ,72.646.参
24、考公式:回归方程y=a+bt中斜率和截距的最小二乘估计公式分别为n刀Ai=1b=-n-刀(tit)2i=1(tit) (yiy)AA,a=yb t.解(1)由折线图中数据和附注中参考数据得t= 4,刀(tit)2= 28, 刀 (yiy)2= 0.55.i=1- i=177 7刀(ti1)(yiy) =1tiyt刀y= 40.17 4X9.32 = 2.89 ,i=1i=1 2.89r2X2.646X0.55 (yy)相关系数13热点四独立性检验14【例 4】(2018 全国川卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式 为比较两种生产方式的效率,选取
25、40 名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图:第一神生产亩式第二种生产方式H 6 5 5 rt B Q9 72 rA( 1 223456680 8 7 7 6 5 4 3 3 214 4 52 1 1 o a 90(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求 40 名工人完成生产任务所需时间的中位数m并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式根据 中的列联表,能否有 99%勺把握认
26、为两种生产方式的效率有差异?附:n(adbe)(a+b)(e+d)(a+e)(b+d)P(Kko)0.0500.0100.001ko3.8416.63510.828解(1)第一种生产方式时间集中在区间80 , 90,且平均工作时间xi= 84.第二种生产方式的时间集中在区间70, 80),且平均工作时间X2= 74.7. 1X2,所以第一种生产方式完成任务的平均时间大于第二种,第二种生产方式的效率更高由茎叶图数据得到m= 80.由此填写列联表如下:超过m不超过m总计第种生产方式15520第二种生产方式51520总计202040(3)根据(2)中的列联表计算1516K11(adbe)=(a+b)
27、(e+d)(a+e)(b+d)=20X20X20X20把握认为两种生产方式的效率有差异探究提高1.独立性检验的一般步骤 (1)根据样本数据制成 2X2列联表;2n(adbe)2(2)根据公式K= (a+b)(e+d)(a+e)(b+d)计算K的值;查表比较K2与临界值的大小关系,作统计判断.2.K2的观测值k越大,对应假设事件 H)成立(两类变量相互独立)的概率越小,H)不成立的概率越大【训练 4】 微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商)为了调查每天微信用户使用微信的时间,某经销化
28、妆品的微商在一广场随机采访男性、女性用户各 50 名,将男性、女性使用微信的时间分成崗 5 组:(0 , 2 , (2 , 4 , (4 , 6 , (6 ,8 , (8 ,10分别加以统计,得到如图所示的频率分布直方图0.16X1 + 0.24X3+ 0.28X5+ 0.2X7+ 0.12X9=4.76(小时).(2)由已知得:2(0.04 +a+ 0.14 + 2X0.12) = 1,解得a= 0.08.由题设条件得列联表微信控非微信控总计男性381250女性3020502n(ad be)106.635 ,所以有 99%的解(1)女性平均使用微信的时间为:17的频率.4.回归分析是对具有相
29、关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值专题圳练对接高考求落灾迎高淆一、选择题1.(2017 全国I卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为X1,X2,,xn,下面给出的指标中可以用来评估这种农作物亩产量稳 定程度的是()A.X1,X2,,Xn的平均数B.X1,X2,Xn的标准差(a+b)总计6832100n(adbc)(c +d)(a+c)(b+d)100(38X2030X12)50X50X68X322
30、2.9412.706.所以有 90%勺把握认为“微信控”与“性别”有关曲纳总结思雄升华探规律防失误1.用样本估计总体是统计的基本思想用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大3. 茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律.在频率分布直方图中,可分析样本数
31、据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小.注意:频率分布直方图的纵轴刻度是组距,而不是频率,每个小直方图的面积才是相应区间18C.X1,X2,,Xn的最大值D.X1,X2,Xn的中位数解析刻画评估这种农作物亩产量稳定程度的指标是标准差19答案 B2.采用系统抽样方法从960 人中抽取 32 人做问卷调查,为此将他们随机编号为1, 2,,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的 32 人中,编号落入区间1 , 450的人做问卷A,编号落入区间451 , 750的人做问卷B,其余的人做问卷C则 抽到的人中,做问卷B的人数为()一
32、960750450解析 抽取号码的间隔为 亦=30,从而区间451 , 750包含的段数为3030= 10,则编、号落入区间451 , 750的人数为 10 人,即做问卷B的人数为 10.答案 C3.(2017 全国川卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014 年 1 月至 2016 年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图B. 年接待游客量逐年增加-4X X. 1 JiC. 各年的月接待游客量高峰期大致在 7, 8 月D. 各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性更小,变化比较平稳解析 由题图可知,20
33、14 年 8 月到 9 月的月接待游客量在减少,则A 选项错误.答案 A4.(2018 北京燕博园质检)某超市从 2017 年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取 100 个,并按(0 , 10 , (10 , 20 , (20 , 30 , (30 , 40 , (40 , 50分组,A.7B.9C.10D.15根据该折线图,A.月接待游客量逐月增加20得到频率分布直方图如下:21记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s2,s2,则频率分布直方图(甲)中的a的值及S2与s2的大小关系分别是()2 22 2A.a= 0.015 ,SiS22 22 2C.a=
34、 0.015 ,SiS2D.a= 0.15 ,Si3.841.( 12+ 20)( 30 + 20)由统计表3.841) = 0.05 ,有 95%勺把握认为“能否缓解交通拥堵的认识与性别有(48+ 30 + 12+ 20) (48+ 30)( 48+ 12)23关”.答案 A、填空题6.(2018 泉州模拟)某厂在生产甲产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据如表:x30405060y25354045解析 由题意,x= 45,y= 36.25,代入y= 0.65x+a,计需要生产能耗为0.65X80+ 7 = 59.答案 597.(2018 邯郸模拟)空气质量指数(Air Qu
35、ality Index,简称 AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,050 为优;51100 为良;101150 为轻度污染;151200 为中度污染;201300 为重度污染;大于 300 为严重污染.从某地一环保人士某年的 AQI 记录数据中,/ % Tk随机抽取 10 个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于 100 的天数约为 _ (该年为 365 天).2解析 该样本中 AQI 大于 100 的频数是 4,频率为4 5 6,2由此估计该地全年 AQI 大于 100 的频率为-,该地全年74估计此地该年 AQI 大于 100 的天数
36、约为 365X- = 146.5答案 1468.某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5 , 30,样本数据分组为17.5 , 20), 20 , 22.5) ,22.5 ,根据最小二乘法求得回归方程为_吨.y= 0.65x+a,当产量为 80 吨时,预计需要生产能耗为可得a= 7,二当产量为A80 吨时,预2425) , 25 , 27.5) , 27.5 , 30.根据直方图,这 200 名学生中每周的自习时间不少于22.5小时的人数是_.25解析设所求的人数为n由频率分布直方图,自习时间不少于0.08+0.16
37、)X2.5=0.7 , n=0.7X200=140.答案 140三、解答题9.(2018 全国I卷)某家庭记录了未使用节水龙头50 天的日用水量数据(单位:m3)和使用了节水龙头 50 天的日用水量数据,得到频数分布表如下:未使用节水龙头 50 天的日用水量频数分布表日用水量0 , 0.1)0.1 ,0.2)0.2 ,0.3)0.3 ,0.4)0.4 ,0.5)0.5 ,0.6)0.6 ,0.7)频数13249265使用了节水龙头 50 天的日用水量频数分布表估计该家庭使用节水龙头后,日用水量小于0.35(m3)的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按 365 天计算
38、,同一组中的数据 以这组数据所在区间中点的值作代表).解(1)所求的频率分布直方图如下:o 04 0.2 0.3 0.43U.6日用水童血22.5 小时的频率为(0.04 +26由题可知用水量在0.3 , 0.4的频数为 10,所以可估计在0.3 , 0.35)的频数为 5,故用水量小于 0.35(m3)的频数为 1 + 5 + 13+ 5= 24,其概率为P= |0= 0.48.50(3)该家庭未使用节水龙头50 天的日用水量的平均数为Xi=丄(0.05X1+0.15X3+0.25X2+0.35X4+0.45X9+0.55X26+0.65X5)=50该家庭使用了节水龙头后50 天的日用水量的
39、平均数为X2=(0.05X1+0.15X5+0.25X13+0.35X10+0.45X16+0.55X5)=0.35.503估计使用节水龙头后,一年可节省水(0.48 0.35)X365= 47.45(m ).10.某市春节期间 7 家超市的广告费支出x(万元)和销售额y(万元)数据如下:超市A ABCDEFG广告费支出Xi1246111319销售额yi19324044525354(1)若用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;A用对数回归模型拟合y与x的关系,可得回归方程y= 12lnx+ 22,经计算得出线性回归模型和对数模型的R2分别约为 0.75 和 0.97,请用氏说明选择哪个回归模型更合适,并用此模型预测A超市广告费支出为8 万元时的销售额.n77EXiyinx y参数数据及公式:x=8,y=42,2Ai=1AAEXiyi2 794, EXi708,b=n,a=ybi=1i=122i 1i 1EXinxi=1x,In 20.7.77解(1)Tx=8,y=42,EXiyi=22 794, EXi=70
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 邵阳职业技术学院《地方政府管理》2023-2024学年第二学期期末试卷
- 济南职业学院《传播效果研究与测量》2023-2024学年第二学期期末试卷
- 湖南文理学院芙蓉学院《数据结构与算法设计》2023-2024学年第一学期期末试卷
- 江西信息应用职业技术学院《中小学乐队合奏》2023-2024学年第二学期期末试卷
- 贵州财经大学《数据结构及应用》2023-2024学年第一学期期末试卷
- 儿童美术培训机构讲课大纲
- 1 古诗词三首宿新市徐公店 教学设计-2024-2025学年语文四年级下册统编版
- 1 观潮教学设计-2024-2025学年四年级上册语文统编版
- 第16课 大家排好队 教学设计-2024-2025学年道德与法治一年级上册统编版
- 2025年江苏城市职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 新教科版小学1-6年级科学需做实验目录
- 2024年高等教育自学考试自考《英语二》试卷及解答参考
- 高低压配电安全规程
- 量子神经网络算法
- 2024智联招聘行测题库
- 三级人工智能训练师(高级)职业技能等级认定考试题库-上(单选题部分)
- 症状护理-疼痛课件
- 店铺(初级)营销师认证考试题库附有答案
- 《建筑深基坑工程施工安全技术规范》(JGJ311-2013)
- 消防责任划分协议书
- 八年级数学下册专题05垂美四边形模型与378、578模型(原卷版+解析)
评论
0/150
提交评论