版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1页(共1页)2025年高考数学复习热搜题速递之统计(2024年7月)一.选择题(共10小题)1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程ŷ=b̂xA.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.1403.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数 B.平均数 C.方差 D.极差4.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+blnx5.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别是x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数6.某学校为了解1000名新生的身体素质,将这些学生编号1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生 B.200号学生 C.616号学生 D.815号学生7.若样本数据x1,x2,…,x10的标准差为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的标准差为()A.8 B.15 C.16 D.328.根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关9.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5 B.5,5 C.3,7 D.5,710.为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样二.填空题(共5小题)11.我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为.12.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.13.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.14.已知样本数据x1,x2,…,xn的均值x=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为15.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.三.解答题(共5小题)16.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xywi=18(xii=18(wii=18(xi-x)(i=18(wi-w)(46.65636.8289.81.61469108.8表中wi=xi,(Ⅰ)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:β̂=i17.某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(Ⅰ)求y关于t的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b̂=i18.如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:ŷ=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:ŷ(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.19.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=nP(K2≥k)0.0500.0100.001k3.8416.63510.82820.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:P(K2≥k)0.0500.0100.001k3.8416.63510.828K2=n
2025年高考数学复习热搜题速递之统计(2024年7月)参考答案与试题解析一.选择题(共10小题)1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程ŷ=b̂xA.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元【考点】经验回归方程与经验回归直线.【专题】概率与统计;数据分析.【答案】B【分析】由题意可得x和y,可得回归方程,把x=15代入方程求得y值即可.【解答】解:由题意可得x=15(8.2+8.6+10.0+11.3+11.9y=15(6.2+7.5+8.0+8.5+9.8代入回归方程可得â=8﹣0.76×10=∴回归方程为ŷ=0.76x把x=15代入方程可得ŷ=0.76×15+0.4=故选:B.【点评】本题考查线性回归方程,涉及平均值的计算,属基础题.2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140【考点】频率分布直方图的应用.【专题】计算题;图表型;概率与统计.【答案】D【分析】根据已知中的频率分布直方图,先计算出自习时间不少于22.5小时的频率,进而可得自习时间不少于22.5小时的频数.【解答】解:自习时间不少于22.5小时的频率为:(0.16+0.08+0.04)×2.5=0.7,故自习时间不少于22.5小时的频数为:0.7×200=140,故选:D.【点评】本题考查的知识点是频率分布直方图,难度不大,属于基础题目.3.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数 B.平均数 C.方差 D.极差【考点】用样本估计总体的集中趋势参数;用样本估计总体的离散程度参数.【专题】计算题;方程思想;转化思想;概率与统计.【答案】A【分析】根据题意,由数据的数字特征的定义,分析可得答案.【解答】解:根据题意,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变,故选:A.【点评】本题考查数据的数字特征,关键是掌握数据的平均数、中位数、方差、极差的定义以及计算方法,属于基础题.4.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+blnx【考点】经验回归方程与经验回归直线.【专题】图表型;对应思想;数学模型法;概率与统计;直观想象.【答案】D【分析】直接由散点图结合给出的选项得答案.【解答】解:由散点图可知,在10℃至40℃之间,发芽率y和温度x所对应的点(x,y)在一段对数函数的曲线附近,结合选项可知,y=a+blnx可作为发芽率y和温度x的回归方程类型.故选:D.【点评】本题考查回归方程,考查学生的读图视图能力,是基础题.5.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别是x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数【考点】用样本估计总体的离散程度参数;用样本估计总体的集中趋势参数.【专题】计算题;对应思想;定义法;概率与统计.【答案】B【分析】利用平均数、标准差、最大值、中位数的定义和意义直接求解.【解答】解:在A中,平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标,故A不可以用来评估这种农作物亩产量稳定程度;在B中,标准差能反映一个数据集的离散程度,故B可以用来评估这种农作物亩产量稳定程度;在C中,最大值是一组数据最大的量,故C不可以用来评估这种农作物亩产量稳定程度;在D中,中位数将数据分成前半部分和后半部分,用来代表一组数据的“中等水平”,故D不可以用来评估这种农作物亩产量稳定程度.故选:B.【点评】本题考查可以用来评估这种农作物亩产量稳定程度的量的判断,是基础题,解题时要认真审题,注意平均数、标准差、最大值、中位数的定义和意义的合理运用.6.某学校为了解1000名新生的身体素质,将这些学生编号1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生 B.200号学生 C.616号学生 D.815号学生【考点】系统抽样方法.【专题】计算题;概率与统计.【答案】C【分析】根据系统抽样的特征,从1000名学生从中抽取一个容量为100的样本,抽样的分段间隔为10,结合从第4组抽取的号码为46,可得第一组用简单随机抽样抽取的号码.【解答】解:∵从1000名学生从中抽取一个容量为100的样本,∴系统抽样的分段间隔为1000100=∵46号学生被抽到,则根据系统抽样的性质可知,第一组随机抽取一个号码为6,以后每个号码都比前一个号码增加10,所有号码数是以6为首项,以10为公差的等差数列,设其数列为{an},则an=6+10(n﹣1)=10n﹣4,当n=62时,a62=616,即在第62组抽到616.故选:C.【点评】本题考查了系统抽样方法,关键是求得系统抽样的分段间隔.7.若样本数据x1,x2,…,x10的标准差为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的标准差为()A.8 B.15 C.16 D.32【考点】用样本估计总体的离散程度参数.【专题】概率与统计.【答案】C【分析】根据标准差和方差之间的关系先求出对应的方差,然后结合变量之间的方差关系进行求解即可.【解答】解:∵样本数据x1,x2,…,x10的标准差为8,∴DX=8,即DX=64数据2x1﹣1,2x2﹣1,…,2x10﹣1的方差为D(2X﹣1)=4DX=4×64,则对应的标准差为D(2X故选:C.【点评】本题主要考查方差和标准差的计算,根据条件先求出对应的方差是解决本题的关键.8.根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关【考点】频率分布直方图.【专题】概率与统计.【答案】D【分析】根据已知条件,结合频率分布直方图的数据,依次求解.【解答】解:对于A,从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量明显减少,且减少的最多,故A正确;对于B,2004﹣2006年二氧化硫排放量越来越多,从2007年开始二氧化硫排放量变少,故B正确;对于C,从图中看出,2006年以来我国二氧化硫年排放量越来越少,故C正确;对于D,2006年以来我国二氧化硫年排放量越来越少,而不是与年份正相关,故D错误.故选:D.【点评】本题考查了学生识图的能力,能够从图中提取出所需要的信息,属于基础题.9.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5 B.5,5 C.3,7 D.5,7【考点】茎叶图.【专题】计算题;图表型;概率与统计.【答案】A【分析】由已知有中这两组数据的中位数相等,且平均值也相等,可得x,y的值.【解答】解:由已知中甲组数据的中位数为65,故乙组数据的中位数也为65,即y=5,则乙组数据的平均数为:66,故x=3,故选:A.【点评】本题考查的知识点是茎叶图,平均数和中位数,难度不大,属于基础题.10.为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样【考点】分层随机抽样.【专题】阅读型.【答案】C【分析】若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样.【解答】解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选:C.【点评】本小题考查抽样方法,主要考查抽样方法,属基本题.二.填空题(共5小题)11.我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为0.98.【考点】用样本估计总体的集中趋势参数.【专题】计算题;方程思想;定义法;概率与统计;数据分析.【答案】见试题解答内容【分析】利用加权平均数公式直接求解.【解答】解:∵经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,∴经停该站高铁列车所有车次的平均正点率的估计值为:x=110+20+10(10×0.97+20×0.98+10×0.99故答案为:0.98.【点评】本题考查经停该站高铁列车所有车次的平均正点率的估计值的求法,考查加权平均数公式等基础知识,考查推理能力与计算能力,属于基础题.12.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取18件.【考点】分层随机抽样.【专题】计算题;转化思想;定义法;概率与统计.【答案】见试题解答内容【分析】由题意先求出抽样比例即为6100,再由此比例【解答】解:产品总数为200+400+300+100=1000件,而抽取60件进行检验,抽样比例为601000则应从丙种型号的产品中抽取300×6100故答案为:18【点评】本题的考点是分层抽样.分层抽样即要抽样时保证样本的结构和总体的结构保持一致,按照一定的比例,即样本容量和总体容量的比值,在各层中进行抽取.13.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=3.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为6000.【考点】补全频率分布直方图.【专题】概率与统计.【答案】见试题解答内容【分析】(1)频率分布直方图中每一个矩形的面积表示频率,先算出频率,在根据频率和为1,算出a的值;(2)先求出消费金额在区间[0.5,0.9]内的购物者的频率,再求频数.【解答】解:(1)由题意,根据直方图的性质得(1.5+2.5+a+2.0+0.8+0.2)×0.1=1,解得a=3(2)由直方图得(3+2.0+0.8+0.2)×0.1×10000=6000故答案为:(1)3(2)6000【点评】本题考查了频率分布直方图中每一个矩形的面积表示频率,频数=频率×样本容量,属于基础题.14.已知样本数据x1,x2,…,xn的均值x=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为11【考点】用样本估计总体的集中趋势参数.【专题】概率与统计.【答案】见试题解答内容【分析】利用平均数计算公式求解【解答】解:∵数据x1,x2,…,xn的平均数为均值x=5则样本数据2x1+1,2x2+1,…,2xn+1的均值为:x'=2x'+1=5故答案为:11.【点评】本题考查数据的平均数的求法,是基础题.15.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为25.【考点】分层随机抽样.【专题】计算题;概率与统计.【答案】见试题解答内容【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出应抽取的男生人数.【解答】解:根据题意得,用分层抽样在各层中的抽样比为45900则应抽取的男生人数是500×120故答案为:25.【点评】本题的考点是分层抽样方法,根据样本结构和总体结构保持一致,求出抽样比,再求出在各层中抽取的个体数目.三.解答题(共5小题)16.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xywi=18(xii=18(wii=18(xi-x)(i=18(wi-w)(46.65636.8289.81.61469108.8表中wi=xi,(Ⅰ)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:β̂=i【考点】经验回归方程与经验回归直线.【专题】概率与统计.【答案】见试题解答内容【分析】(Ⅰ)根据散点图,即可判断出,(Ⅱ)先建立中间量w=x,建立y关于w的线性回归方程,根据公式求出w(Ⅲ)(i)年宣传费x=49时,代入到回归方程,计算即可,(ii)求出预报值得方程,根据函数的性质,即可求出.【解答】解:(Ⅰ)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型;(Ⅱ)令w=x,先建立y关于w的线性回归方程,由于d̂ĉ=y-d̂w=所以y关于w的线性回归方程为ŷ=100.6+68因此y关于x的回归方程为ŷ=100.6+68(Ⅲ)(i)由(Ⅱ)知,当x=49时,年销售量y的预报值ŷ=100.6+6849年利润z的预报值ẑ=576.6×0.2﹣49=(ii)根据(Ⅱ)的结果可知,年利润z的预报值ẑ=0.2(100.6+68x)﹣x=﹣x+13.6x当x=13.62=6.8时,即当【点评】本题主要考查了线性回归方程和散点图的问题,准确的计算是本题的关键,属于中档题.17.某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(Ⅰ)求y关于t的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b̂=i【考点】经验回归方程与经验回归直线.【专题】计算题;概率与统计.【答案】见试题解答内容【分析】(Ⅰ)根据所给的数据,利用最小二乘法可得横标和纵标的平均数,横标和纵标的积的和,与横标的平方和,代入公式求出b的值,再求出a的值,写出线性回归方程.(Ⅱ)根据上一问做出的线性回归方程,代入所给的t的值,预测该地区2015年农村居民家庭人均纯收入,这是一个估计值.【解答】解:(Ⅰ)由题意,t=17×(y=17×(∴b̂=â=y-b̂t=∴y关于t的线性回归方程为ŷ=0.5t(Ⅱ)由(Ⅰ)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入ŷ=0.5tŷ=0.5×9+2.3=故预测该地区2015年农村居民家庭人均纯收入为6.8千元.【点评】本题考查线性回归分析的应用,本题解题的关键是利用最小二乘法认真做出线性回归方程的系数,这是整个题目做对的必备条件,本题是一个基础题.18.如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:ŷ=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:ŷ(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【考点】经验回归方程与经验回归直线.【专题】数形结合;定义法;概率与统计.【答案】见试题解答内容【分析】(1)根据模型①计算t=19时ŷ的值,根据模型②计算t=9时y(2)判断模型优劣(预测值是否可靠)人教社教材提供了两种思路,1)事前:如果数据比较集中(|r|→1)则依据这些数据得出的回归模型就比较好(预测值就比较可靠);2)事后:根据回归模型计算R2,如果R2→1,则回归模型较好(或者计算相应数据的残差绝对值之和,越小越好).【解答】解:(1)根据模型①:ŷ=-30.4+13.5计算t=19时,ŷ=-30.4+13.5×19=利用这个模型,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;根据模型②:ŷ=99+17.5计算t=9时,ŷ=99+17.5×9=利用这个模型,求该地区2018年的环境基础设施投资额的预测值是256.5亿元;(2)解法1:模型②得到的预测值更可靠,因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,从2000年到2009年间递增的幅度较小些,从2010年到2016年间递增的幅度较大些,所以利用模型②的预测值更可靠些.解法2,模型②对应的7个点分布宽度小于模型①对应的17个点的分布宽度,则|r2|>|r1|,所以模型②较好;解法3,选择与2018邻近的三个年份(2014,2015,2016)计算模型②对应的残差绝对值之和=2.5+5+1.5=9,模型①对应的残差绝对值之和=12+23.5+21=56.5;且9<56.5,所以模型②较好;所以利用模型②的预测值更可靠些.【点评】本题考查了线性回归方程的应用问题,也考查了数据统计于分析问题,是中档题.19.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=nP(K2≥k)0.0500.0100.001k3.8416.63510.828【考点】独立性检验.【专题】对应思想;数学模型法;概率与统计.【答案】见试题解答内容【分析】(1)根据茎叶图中的数据判断第二种生产方式的工作时间较少些,效率更高;(2)根据茎叶图中的数据计算它们的中位数,再填写列联表;(3)列联表中的数据计算观测值,对照临界值得出结论.【解答】解:(1)根据茎叶图中的数据知,第一种生产方式的工作时间主要集中在72~92之间,第二种生产方式的工作时间主要集中在65~85之间,所以第二种生产方式的工作时间较少些,效率更高;(2)这40名工人完成生产任务所需时间按从小到大的顺序排列后,排在中间的两个数据是79和81,计算它们的中位数为m=79+812由此填写列联表如下;超过m不超过m总计第一种生产方式15520第二种生产方式51520总计202040(3)根据(2)中的列联表,计算K2=n(ad-∴能有99%的把握认为两种生产方式的效率有差异.【点评】本题考查了列联表与独立性检验的应用问题,是基础题.20.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:P(K2≥k)0.0500.0100.001k3.8416.63510.828K2=n【考点】频率分布直方图的应用.【专题】数形结合;数形结合法;概率与统计.【答案】见试题解答内容【分析】(1)由题意可知:P(A)=P(BC)=P(B)P(C),分别求得发生的频率,即可求得其概率;(2)完成2×2列联表:求得观测值,与参考值比较,即可求得有99%的把握认为箱产量与养殖方法有关:(3)根据频率分布直方图即可求得其中位数.【解答】解:(1)记B表示事件“旧养殖法的箱产量低于50kg”,C表示事件“新养殖法的箱产量不低于50kg”,由P(A)=P(BC)=P(B)P(C),则旧养殖法的箱产量低于50kg:(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值0.62,新养殖法的箱产量不低于50kg:(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为,则事件A的概率估计值为P(A)=P(B)P(C)=0.62×0.66=0.4092;∴A发生的概率为0.4092;(2)2×2列联表:箱产量<50kg箱产量≥50kg总计旧养殖法6238100新养殖法3466100总计96104200则K2=200(62×66-38×34)由15.705>6.635,∴有99%的把握认为箱产量与养殖方法有关;(3)由新养殖法的箱产量频率分布直方图中,箱产量低于50kg的直方图的面积:(0.004+0.020+0.044)×5=0.34,箱产量低于55kg的直方图面积为:(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法产量的中位数的估计值为:50+0.5-0.340.068≈52.35新养殖法箱产量的中位数的估计值52.35(kg).【点评】本题考查频率分布直方图的应用,考查独立性检验,考查计算能力,属于中档题.
考点卡片1.分层随机抽样【知识点的认识】1.定义:当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比例进行抽样,这种抽样叫做分层抽样,其中所分的各部分叫“层”.2.三种抽样方法比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率是相同的从总体中逐个抽取总体中的个体数较少系统抽样将总体均匀分成几个部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成【解题方法点拨】分层抽样方法操作步骤:(1)分层:将总体按某种特征分成若干部分;(2)确定比例:计算各层的个体数与总体的个体数的比;(3)确定各层应抽取的样本容量;(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.【命题方向】(1)区分分层抽样方法例:某交高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()A.简单随机抽样法B.抽签法C.随机数表法D.分层抽样法分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:总体由男生和女生组成,比例为500:400=5:4,所抽取的比例也是5:4.故选D点评:本小题主要考查抽样方法,属基本题.(2)求抽取样本数例1:某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是()A.8,8B.10,6C.9,7D.12,4分析:先计算每个个体被抽到的概率,再用每层的个体数乘以每个个体被抽到的概率,即得到该层应抽取的个体数.解答:每个个体被抽到的概率等于1654+42=16,54×16故从一班抽出9人,从二班抽出7人,故选C.点评:本题考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数.例2:某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为()A.35B.25C.15D.7分析:先计算青年职工所占的比例,再根据青年职工抽取的人数计算样本容量即可.解答:青年职工、中年职工、老年职工三层之比为7:5:3,所以样本容量为7715故选C.点评:本题考查分层抽样的定义和方法,求出每个个体被抽到的概率,用个体的总数乘以每个个体被抽到的概率,就得到样本容量n的值.2.系统抽样方法【知识点的认识】1.定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.2.系统抽样的特征:(1)当总体容量N较大时,适宜采用系统抽样;(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此系统抽样又称等距抽样,这里的间隔一般为k=[(3)在第一部分的抽样采用简单随机抽样;(4)每个个体被抽到的可能性相等3.系统抽样与简单随机抽样的关系:(1)系统抽样是建立在简单随机抽样的基础之上的,当将总体均分后对每一部分进行抽样时,采用的是简单随机抽样;(2)系统抽样和简单随机抽样都是等概率抽样,它是公平的.4.系统抽样与简单随机抽样的优缺点:(1)当总体的个体数较大时,用系统抽样比用简单随机抽样更易实施,更节约成本;(2)系统抽样比简单随机抽样应用范围更广;(3)系统抽样所得到的样本的代表性和个体的编号有关,而简单随机抽样所得到的样本的代表性与编号无关,如果编号的特征随编号的变化呈一定的周期性,可能造成系统抽样的代表性很差.【解题方法点拨】系统抽样的一般步骤:(1)编号:采用随机的方式将总体中的个体编号;(2)分段:确定分段间隔k,对编号进行分段(N为总体个数,n为样本容量):①当Nn∈Z时,②当Nn∉Z时,通过从总体中剔除一些个体,使剩下的总体中的个体数N′能被n(注意这时要重新编号1﹣N′后,才能再分段)(3)确定起始编号:在第一段用简单随机抽样确定起始的个体编号l(l∈N,l≤k);(4)抽样:按事先确定的规则抽取样本,即l,l+k,l+2k,…,l+(n﹣1)k.【命题方向】1.考查系统抽样的定义例:某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了了解有关情况,留下了座位号是15的25名学生进行测试,这里运用的抽样方法是()A.抽签法B.随机数表法C.系统抽样法D.分层抽样法分析:由题意可得,从第一排起,每隔20人抽取一个,所抽取的样本的间隔距相等,符合系统抽样的定义.解答:由题意可得,从第一排起,每隔20人抽取一个,所抽取的样本的间隔距相等,故属于系统抽样,故选C.点评:本题考查系统抽样的定义和方法,属于容易题.2.考查系统抽样的应用例:将参加夏令营的100名学生编号为001,002,…,100.先采用系统抽样方法抽取一个容量为20的样本,若随机抽得的号码为003,那么从048号到081号被抽中的人数是分析:根据系统抽样的定义,即可得到结论.解答:∵样本容量为20,首个号码为003,∴样本组距为100÷20=5∴对应的号码数为3+5(x﹣1)=5x﹣2,由48≤5x﹣2≤81,得10≤x≤16.6,即x=10,11,12,13,14,15,16,共7个,故答案为:7.点评:本题主要考查系统抽样的应用,利用系统抽样的定义建立号码关系是解决本题的关键,比较基础.3.频率分布直方图【知识点的认识】1.频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.2.频率分布直方图的特征①图中各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1.②从频率分布直方图可以清楚地看出数据分布的总体趋势.③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.3.频率分布直方图求数据①众数:频率分布直方图中最高矩形的底边中点的横坐标.②平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和.③中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.【解题方法点拨】绘制频率分布直方图的步骤:4.补全频率分布直方图补全频率分布直方图5.频率分布直方图的应用频率分布直方图的应用6.茎叶图【知识点的认识】1.茎叶图:将样本数据有条理地列出来,从中观察样本分布情况的图称为茎叶图.例:某篮球运动员在某赛季各场比赛的得分情况:12,15,24,25,31,31,36,36,37,39,44,49,50得分表示成茎叶图如下:2.茎叶图的优缺点:优点:(1)所有信息都可以从茎叶图上得到(2)茎叶图便于记录和表示缺点:分析粗略,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.【解题方法点拨】茎叶图的制作步骤:(1)将每个数据分为“茎”(高位)和“叶
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年股东股权溢价转让协议2篇
- 2024年大型打印机购销合同专业定制3篇
- 城镇老旧小区改造项目管理与组织结构
- 2024年度个人承包养鱼协议范本版B版
- 2024年石球购置与石材原料供应合同3篇
- 2024年航空公司飞机采购合同标的与性能要求
- 电桥法课程设计
- 2024年国际贸易信用保险合同签订与理赔3篇
- 2024年绿色建筑采光施工物业合同3篇
- 2024年企业培训课程评估与改进合同范本3篇
- 喜庆中国节春节习俗文化PPT模板
- 各种骨折英文名称
- 加热炉温度控制系统
- 二次供水工程技术规程(CJJ140—2010 )
- 小说HOTEL介绍
- 设备故障处理流程图
- 晨晖智能一卡通管理系统
- 应急预案评审要素表
- 安全生产组织架构图
- 如何在CAD中快速绘制纵断面图
- 搞笑小品剧本《家长驾到》台词完整版 金牌喜剧班李海银高海宝盛伟
评论
0/150
提交评论