新高考数学二轮复习专题五 统计与概率第1讲 统计和统计案例解析版_第1页
新高考数学二轮复习专题五 统计与概率第1讲 统计和统计案例解析版_第2页
新高考数学二轮复习专题五 统计与概率第1讲 统计和统计案例解析版_第3页
新高考数学二轮复习专题五 统计与概率第1讲 统计和统计案例解析版_第4页
新高考数学二轮复习专题五 统计与概率第1讲 统计和统计案例解析版_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1讲统计和统计案例目录第一部分:知识强化第二部分:重难点题型突破突破一:随机数表法突破二:分层抽样突破三:频率分布直方图突破四:平均数,众数,中位数,方差,标准差突破五:总体百分位数突破六:回归直线方程突破七:相关系数SKIPIF1<0突破八:残差突破九:非线性回归突破十:独立性检验第三部分:冲刺重难点特训第一部分:知识强化1、总体平均数与样本平均数(1)总体平均数一般地,总体中有SKIPIF1<0个个体,它们的变量值分别为SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0则称SKIPIF1<0为总体均值,又称总体平均数.(2)加权平均数如果总体的SKIPIF1<0个变量值中,不同的值共有SKIPIF1<0(SKIPIF1<0)个,不妨记为SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,其中SKIPIF1<0出现的频数SKIPIF1<0(SKIPIF1<0),则总体均值还可以写成加权平均数的形式:SKIPIF1<0.(3)样本平均数如果从总体中抽取一个容量为SKIPIF1<0的样本,它们的变量值分别为SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0则称SKIPIF1<0为样本均值,又称样本平均数.2、分层随机抽样的步骤①根据己经掌握的信息,将总体分成互不相交的层;②根据总体中的个体数SKIPIF1<0和样本量SKIPIF1<0计算抽样比SKIPIF1<0;③确定第SKIPIF1<0层应该抽取的个体数目SKIPIF1<0(SKIPIF1<0为第SKIPIF1<0层所包含的个体数),使得各SKIPIF1<0之和为SKIPIF1<0;④在各个层中,按步骤③中确定的数目在各层中随机抽取个体,合在一起得到容量为SKIPIF1<0的样本.3、绘制频率分布直方图的步骤及频率分布直方图的性质①求极差,即一组数据中的最大值与最小值的差.②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.③将数据分组.④列频率分布表.计算各小组的频率,第SKIPIF1<0组的频率是eq\f(第i组频数,样本容量).⑤画频率分布直方图.其中横轴表示分组,纵轴表示eq\f(频率,组距).eq\f(频率,组距)实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.4、第SKIPIF1<0百分位数(1)第SKIPIF1<0百分位数的概念一般地,一组数据的第SKIPIF1<0百分位数是这样一个值,它使得这组数据中至少有SKIPIF1<0的数据小于或等于这个值,且至少有SKIPIF1<0的数据大于或等于这个值.(2)计算第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算SKIPIF1<0.第3步,若SKIPIF1<0不是整数,而大于SKIPIF1<0的比邻整数为SKIPIF1<0,则第SKIPIF1<0百分位数为第SKIPIF1<0项数据;若SKIPIF1<0是整数,则第SKIPIF1<0百分位数为第项与第SKIPIF1<0项数据的平均数.5、总体集中趋势的估计(1)平均数①定义:一组数据的和与这组数据的个数的商.数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0的平均数为SKIPIF1<0.②特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.(2)众数①定义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数。②特征:一组数据的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.(3)中位数①定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.②特征:一组数据的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.6、在频率分布直方图中平均数,中位数,众数的估计值(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.7、总体离散程度的估计(1)极差一组数据中的最大值与最小值的差称为极差.(2)方差与标准差一组数据SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0用SKIPIF1<0表示这组数据的平均数,则这组数据的方差:SKIPIF1<0;标准差:SKIPIF1<0(3)总体方差和标准差如果总体中所有个体的变量值分别为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0总体平均数为SKIPIF1<0,则称SKIPIF1<0为总体方差,SKIPIF1<0为总体标准差.(4)样本方差和标准差如果一个样本中个体的变量值分别为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0,样本平均数为SKIPIF1<0,则称SKIPIF1<0为样本方差,SKIPIF1<0为样本标准差.(5)加权方差如果总体的SKIPIF1<0个变量值中,不同的值共有SKIPIF1<0(SKIPIF1<0)个,记为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0,其中SKIPIF1<0出现的频数为SKIPIF1<0(SKIPIF1<0),则总体方差为SKIPIF1<0.8、相关关系的强弱(1)样本相关系数现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里一般用SKIPIF1<0来衡量SKIPIF1<0与SKIPIF1<0的线性相关性强弱,我们称SKIPIF1<0为变量SKIPIF1<0和变量SKIPIF1<0的样本相关系数.(2)相关系数SKIPIF1<0的性质①当SKIPIF1<0时,称成对样本数据正相关;当SKIPIF1<0时,成对样本数据负相关;当SKIPIF1<0时,成对样本数据间没有线性相关关系.②样本相关系数SKIPIF1<0的取值范围为SKIPIF1<0当SKIPIF1<0越接近1时,成对样本数据的线性相关程度越强;当SKIPIF1<0越接近0时,成对样本数据的线性相关程度越弱.9、一元线性回归模型参数的最小二乘法回归直线方程过样本点的中心SKIPIF1<0,是回归直线方程最常用的一个特征;我们将SKIPIF1<0称为SKIPIF1<0关于SKIPIF1<0的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的SKIPIF1<0,叫做SKIPIF1<0,SKIPIF1<0的最小二乘估计,其中SKIPIF1<0称为回归系数,它实际上也就是经验回归直线的斜率,SKIPIF1<0为截距.其中SKIPIF1<010、残差对于响应变量SKIPIF1<0,通过观测得到的数据称为观测值,通过经验回归方程得到的SKIPIF1<0称为预测值,观测值减去预测值称为残差.11、决定系数SKIPIF1<0(1)残差平方和残差平方和SKIPIF1<0,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.(2)决定系数SKIPIF1<0决定系数SKIPIF1<0是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.SKIPIF1<0,SKIPIF1<0越大,即拟合效果越好,SKIPIF1<0越小,模型拟合效果越差.12、分类变量与列联表(1)分类变量为了方便,会使用一种特殊的随机变量,区别不同的现象或性质,这随机变量称为分类变量.(2)SKIPIF1<0列联表①2×2列联表给出了两个分类变量数据的交叉分类频数.②定义一对分类变量SKIPIF1<0和SKIPIF1<0,我们整理数据如下表所示:SKIPIF1<0SKIPIF1<0合计SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0合计SKIPIF1<0SKIPIF1<0SKIPIF1<0知识点2:独立性检验(1)独立性检验定义:利用SKIPIF1<0的取值推断分类变量SKIPIF1<0和SKIPIF1<0是否独立的方法称为SKIPIF1<0独立性检验,读作“卡方独立性检验”.简称独立性检验.(2)独立性检验公式:SKIPIF1<0其中SKIPIF1<0(注意使用公式时分子的平方不要忽略了)第二部分:重难点题型突破突破一:随机数表法1.(2022·广东·博罗县榕城中学高一阶段练习)从800件产品中抽取6件进行质检,利用随机数表法抽取样本时,先将800件产品按001,002,…,800进行编号.如果从随机数表第8行第8列的数开始往右读数(随机数表第7行至第9行的数如下),则抽取的6件产品的编号的75%分位数是(

)……8442175331

5724550688

77047447672176335025

83921206766301637859

1695566711

69105671751286735807

44395238793321123429

7864560782

52420744381551001342

9966027954A.105 B.556 C.671 D.169【答案】C【详解】由题设,依次读取的编号为SKIPIF1<0,根据编号规则易知:抽取的6件产品编号为SKIPIF1<0,所以将它们从小到大排序为SKIPIF1<0,故SKIPIF1<0,所以75%分位数为SKIPIF1<0.故选:C2.(2022·全国·高一课时练习)“双色球”彩票中有33个红色球,每个球的编号分别为01,02,…,33.一位彩民用随机数表法选取6个号码作为6个红色球的编号,选取方法是从下面的随机数表中第1行第5列和第6列的数字开始,从左向右读数,则依次选出来的第5个红色球的编号为7816657208026314021443199714019832049234493682003623486969387181A.01 B.02 C.14 D.19【答案】A【详解】分析:根据随机数表,依次进行选择即可得到结论.详解:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于33的编号去除重复,可知对应的数值为08,02,14,19,01,04;则第5个个体的编号为01.故选A.3.(2022·江西景德镇·模拟预测(理))某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,…,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第6个数的编号是(

)1676622766

5650267107

3290797853

1355385859

88975414101256859926

9682731099

1696729315

5712101421

88264981765559563564

3854824622

3162430990

0618443253

2383013030A.827 B.315 C.696 D.729【答案】B【详解】从685开始向右数,即685,992,696,827,310,991,696,729,315,跳过992,991,696重复,跳过,所以第6个数字为315故选:B4.(2022·全国·高一课时练习)福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.49

54

43

54

82

17

37

93

23

28

87

35

20

56

43

84

26

34

91

6457

24

55

06

88

77

04

74

47

67

21

76

33

50

25

83

92

12

06

76【答案】05【详解】根据随机数表,排除超过33及重复的编号,第一个编号为21,第二个编号为32,第三个编号05,故选出来的第3个红色球的编号为05.5.(2022·山西太原·三模(文))设某总体是由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列数字开始从左到右依次选取两个数字,则选出来的第6个个体编号为___________.SKIPIF1<0【答案】19【详解】解:由随机数的抽样规则得:依次选取的样本编号为:SKIPIF1<0,故选出来的第6个个体编号为SKIPIF1<0.故答案为:SKIPIF1<0突破二:分层抽样1.(2022·河南·开封市东信学校模拟预测(文))为了贯彻落实中央新疆工作座谈会和全国对口支援新疆工作会议精神,促进边疆少数民族地区教育事业发展,从A市20名教师、B市15名教师和C市10名教师中,采取分层抽样的方法,抽取一个容量为n的样本,若A市抽取4人,则SKIPIF1<0(

)A.9 B.10 C.12 D.15【答案】A【详解】根据分层抽样的定义可得SKIPIF1<0,解得SKIPIF1<0.故选:A.2.(2022·新疆乌鲁木齐·二模(理))从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在SKIPIF1<0,SKIPIF1<0,SKIPIF1<0三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在SKIPIF1<0内的学生中选取的人数应为(

)A.3 B.4 C.5 D.7【答案】B【详解】依题意SKIPIF1<0,解得SKIPIF1<0,身高在SKIPIF1<0,SKIPIF1<0,SKIPIF1<0三组内的学生比例为SKIPIF1<0,用分层抽样的方法选取16人参加一次活动,则从身高在SKIPIF1<0内的学生中选取的人数应为SKIPIF1<0人故选:B3.(2022·广西河池·模拟预测(文))雅言传承文明,经典浸润人生,南宁市某校每年举办“品经诵典浴书香,提雅增韵享阅读”中华经典诵读大赛,比赛内容有三类:“诵读中国”、“诗教中国”、“笔墨中国”.已知高一、高二、高三报名人数分别为:100人、150人和250人.现采用分层抽样的方法,从三个年级中抽取25人组成校代表队参加市级比赛,则应该从高一年级学生中抽取的人数为______.【答案】5【详解】根据题意可得:高一、高二、高三报名人数之比为SKIPIF1<0,故从高一年级学生中抽取的人数为SKIPIF1<0.故答案为:5.4.(2022·全国·模拟预测)“中国式过马路”是网友对部分中国人集体闯红灯现象的一种调侃,即“凑够一撮人就可以走了,和红绿灯无关.”出现这种现象是大家受法不责众的“从众”心理影响,从而不顾及交通安全,某校对全校学生过马路方式进行调查,在所有参与调查的人中,“跟从别人闯红灯”“从不闯红灯”“带头闯红灯”人数如表所示.跟从别人闯红灯从不闯红灯带头闯红灯男生6001000200女生400650300用分层抽样的方法从“带头闯红灯”的人中抽取10人参加“文明交通”宣传活动,从这10人中任选取3人,则这三人性别不完全相同的概率为______.【答案】SKIPIF1<0##0.8【详解】由题可知“带头闯红灯”的人中男生与女生的比例为SKIPIF1<0,所以抽取的10人中,男生有SKIPIF1<0(人),女生有SKIPIF1<0(人),则这三人中性别不完全相同的概率为SKIPIF1<0.故答案为:SKIPIF1<05.(2022·山东聊城·二模)如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为______.【答案】15【详解】根据等高条形图可知:喜欢徒步的男生人数为SKIPIF1<0,喜欢徒步的女生人数为SKIPIF1<0,所以喜欢徒步的总人数为SKIPIF1<0,按分层抽样的方法抽取23人,则抽取的男生人数为SKIPIF1<0人.故答案为:156.(2022·陕西·交大附中模拟预测(理))某校为了解学生学习的情况,采用分层抽样的方法从高一SKIPIF1<0人、高二SKIPIF1<0人、高三SKIPIF1<0人中,抽取SKIPIF1<0人进行问卷调查.已知高一被抽取的人数为SKIPIF1<0,那么高三被抽取的人数为_______.【答案】SKIPIF1<0【详解】由分层抽样的知识可得SKIPIF1<0,即SKIPIF1<0,所以高三被抽取的人数为SKIPIF1<0,应填答案SKIPIF1<0.突破三:频率分布直方图1.(2022·四川省遂宁市第二中学校模拟预测(文))在某次高中学科竞赛中,SKIPIF1<0名考生的参赛成绩统计如图所示,SKIPIF1<0分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是(

)A.成绩在SKIPIF1<0分的考生人数最多 B.考生竞赛成绩的中位数为SKIPIF1<0分C.不及格的考生人数为SKIPIF1<0人 D.考生竞赛成绩的平均分约SKIPIF1<0分【答案】B【详解】根据频率分布直方图得,成绩出现在SKIPIF1<0的频率最大,所以成绩在SKIPIF1<0分的考生人数最多,故A正确;由于SKIPIF1<0,SKIPIF1<0,故考生竞赛成绩的中位数为SKIPIF1<0,故B错误;不及格考生数为SKIPIF1<0,故C正确;根据频率分布直方图估计考生竞赛成绩平均分为SKIPIF1<0,故D正确。故选:B.2.(2022·江苏·华罗庚中学三模)光明学校为了解男生身体发育情况,从2000名男生中抽查了100名男生的体重情况,根据数据绘制样本的频率分布直方图,如图所示,下列说法中错误的是(

)A.样本的众数约为SKIPIF1<0 B.样本的中位数约为SKIPIF1<0C.样本的平均值约为66 D.体重超过75kg的学生频数约为200人【答案】C【详解】对于SKIPIF1<0,样本的众数为SKIPIF1<0,故SKIPIF1<0正确,对于SKIPIF1<0,设样本的中位数为SKIPIF1<0,则SKIPIF1<0,解得SKIPIF1<0,故SKIPIF1<0正确,对于SKIPIF1<0,由直方图估计样本平均值可得:SKIPIF1<0,故SKIPIF1<0错误,对于SKIPIF1<0,2000名男生中体重超过SKIPIF1<0的人数大约为SKIPIF1<0,故SKIPIF1<0正确.故选:SKIPIF1<0.3.(2022·天津·静海一中模拟预测)某校随机抽取了400名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组画出频率分布直方图如图所示,下列说法正确的是(

)A.直方图中x的值为0.040B.在被抽取的学生中,成绩在区间SKIPIF1<0的学生数为30人C.估计全校学生的平均成绩为84分D.估计全校学生成绩的样本数据的80%分位数约为93分【答案】C【详解】定义A:根据学生的成绩都在50分至100分之间的频率和为1,可得SKIPIF1<0,解得x=0.03,所以A错;对于B:在被抽取的学生中,成绩在区间[70,80)的学生数为10×0.015×400=60(人),所以B错;对于C:估计全校学生的平均成绩为55×0.05+65×0.1+75×0.15+85×0.3+95×0.4=84(分),所以C对;对于D:全校学生成绩的样本数据的80%分位数约为SKIPIF1<0(分).所以D错.故选:C4.(2022·安徽·模拟预测(文))某校开展“正心立德,劳动树人”主题教育活动,对参赛的100名学生的劳动作品的得分情况进行统计,并绘制了如图所示的频率分布直方图,根据图中信息,下列说法错误的是(

)A.图中的x值为0.020 B.得分在80分及以上的人数为40C.这组数据平均数的估计值为77 D.这组数据中位数的估计值为75【答案】D【详解】对于A选项,由频率分布直方图可得,SKIPIF1<0,解得SKIPIF1<0,所以A选项正确;对于B选项,由频率分布直方图可知,得分在SKIPIF1<0分以上的人数为SKIPIF1<0,所以B选项正确;对于C选项,由频率分布直方图可知,这组数据平均数的估计值为SKIPIF1<0,所以C选项正确;对于D选项,由频率分布直方图可知,SKIPIF1<0的频率为SKIPIF1<0,SKIPIF1<0的频率为SKIPIF1<0,则中位数在SKIPIF1<0内,所以这组数据中位数的估计值为SKIPIF1<0,所以D选项错误;故选:D.5.(2022·云南昆明·一模(文))“双减”政策实施后,某初中全面推进学校素质教育,推动学校体育运动发展,引导学生积极参与体育锻炼,为了解该校学生每周平均体育运动的时间,学校随机调查了500名学生每周平均体育运动时间的样本数据(单位:小时),所得数据分成6组:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,据此得到的频率分布直方图如图所示,则该校学生每周平均体育运动的时间约为______小时(同一组中的数据用该组区间的中点值为代表).【答案】SKIPIF1<0【详解】由频率分布直方图可知,每周平均体育运动的时间约为:SKIPIF1<0,故答案为:SKIPIF1<06.(2022·广东汕头·一模)在党史学习教育动员大会上,习近平总书记强调全党同志要做到学史明理、学史增信、学史崇德,学史力行.某单位对200名党员进行党史知识测试,将成绩分成6组:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,得到如图所示的频率分布直方图,则SKIPIF1<0______.【答案】0.050【详解】由SKIPIF1<0,解得SKIPIF1<0,故答案为:0.0507.(2022·云南·玉溪市民族中学模拟预测(文))全民健身,强国有我,某企业为增强广大职工的身体素质和健康水平,组织全体职工开启了“学习强国”平台的强国运动项目,为了解他们的具体运动情况,企业工会从该企业全体职工中随机抽取了100名,统计他们的日均运动步数,并得到如下频率分布直方图:(1)求直方图中a的值;(2)估计该企业职工日均运动步数的平均数;(同一组中的数据用该组区间的中点值为代表)(3)若该企业恰好有SKIPIF1<0的职工的日均运动步数达到了企业制定的优秀强国运动者达标线,试估计该企业制定的优秀强国运动者达标线是多少?【答案】(1)SKIPIF1<0(2)9.08千步(3)11千步【详解】(1)由频率分布直方图得SKIPIF1<0,解得SKIPIF1<0.(2)设平均数为SKIPIF1<0,则SKIPIF1<0.所以该企业职工日均运动步数的平均数约为9.08千步.(3)日均运动步数在SKIPIF1<0的频率为SKIPIF1<0,日均运动步数在SKIPIF1<0的频率为SKIPIF1<0,则SKIPIF1<0位数在SKIPIF1<0内,为SKIPIF1<0,该企业制定的优秀强国运动者达标线是11千步8.(2022·河南省杞县高中模拟预测(理))在全民抗击新冠肺炎疫情期间,某市教育部门开展了“停课不停学”活动,为学生提供了多种网络课程资源.活动开展一个月后,某学校随机抽取了高二年级的学生若干进行网络问卷调查,统计学生每天的学习时间(单位:小时),将样本数据分成SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0五组(全部数据都在SKIPIF1<0内),并整理得到如图所示的频率分布直方图.(1)已知该校高二年级共有800名学生,根据统计数据,估计该校高二年级每天学习时间不低于5小时的学生人数;(2)利用统计数据,估计该校高二年级学生每天平均学习时间;【答案】(1)640人(2)5.6小时(1)根据统计数据估计该校高二年级每天学习时间不低于5小时的学生人数为SKIPIF1<0.所以估计该校高二年级每天学习不低于5小时的人数为640人.(2)样本中学生每天学习时间的各组频率分别为0.05,0.15,0.50,0.25,0.05.样本中学生每天平均学习时间为SKIPIF1<0(小时).所以估计该校高二年级学生每天平均学习时间为5.6小时.9.(2022·新疆克拉玛依·三模(文))第SKIPIF1<0届北京冬季奥林匹克运动会于SKIPIF1<0年SKIPIF1<0月SKIPIF1<0日至SKIPIF1<0月SKIPIF1<0日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取SKIPIF1<0名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.

(1)求频率分布直方图中SKIPIF1<0的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.【答案】(1)SKIPIF1<0,平均数为SKIPIF1<0(2)SKIPIF1<0(1)解:由频率分布直方图可知,测试分数位于SKIPIF1<0的频率为SKIPIF1<0,则测试分数位于SKIPIF1<0个数为SKIPIF1<0,所以,测试分数位于SKIPIF1<0的个数为SKIPIF1<0,所以SKIPIF1<0.估计平均数为SKIPIF1<0.(2)解:因为测试分数位于SKIPIF1<0的频率为SKIPIF1<0,测试分数位于SKIPIF1<0的频率为SKIPIF1<0,能够获得“滑雪达人”证书的中学生测试分数要在前SKIPIF1<0,故设能够获得证书的测试分数线为SKIPIF1<0,则SKIPIF1<0,由SKIPIF1<0,可得SKIPIF1<0,所以分数线的估计值为SKIPIF1<0.10.(2022·广西·南宁三中一模(文))某种植园在芒果临近成熟时,随机从一些芒果树上摘下100个芒果,其质量分布在SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0(单位:克)中,经统计频率分布直方图如图所示.(1)估计这组数据的平均数;(2)某经销商来收购芒果,同一组中的数据以这组数据所在区间中点的值作代表,用样本估计总体,该种植园中共有芒果大约10000个,经销商提出以下两种收购方案:方案①:所有芒果以10元/千克收购;方案②:对质量低于350克的芒果以3元/个收购,对质量高于或等于350克的芒果以5元/个收购.请通过计算确定种植园选择哪种方案获利更多?【答案】(1)387(克)(2)方案②获利更多【详解】(1)由频率分布直方图可得这组数据的平均数为:SKIPIF1<0(克);(2)方案①收入:SKIPIF1<0(元);方案②收入:由题意得低于350克的收入:SKIPIF1<0(元);高于或等于350克的收入:SKIPIF1<0(元).故总计SKIPIF1<0(元),由于SKIPIF1<0,故种植园选择方案②获利更多.突破四:平均数,众数,中位数,方差,标准差1.(2022·上海·曹杨二中模拟预测)第24届冬季奥运会于2022年2月4日至20日在北京举行,中国代表团取得了9枚金牌,4枚银牌,2枚铜牌的历史最好成绩.已知六个裁判为某一运动员这一跳的打分分别为95,95,95,93,94,94,评分规则为去掉六个原始分中的一个最高分和一个最低分,剩下四个有效分的平均数即为该选手的本轮得分.设这六个原始分的中位数为SKIPIF1<0,方差为SKIPIF1<0;四个有效分的中位数为SKIPIF1<0,方差为SKIPIF1<0.则下列结论正确的是(

)A.SKIPIF1<0,SKIPIF1<0 B.SKIPIF1<0,SKIPIF1<0C.SKIPIF1<0,SKIPIF1<0 D.SKIPIF1<0,SKIPIF1<0【答案】D【详解】将打分95,95,95,93,94,94按照从小到大排列为93,94,94,95,95,95,无论是否去掉一个最高分和最低分中位数都是SKIPIF1<0,故AB错误;根据SKIPIF1<0SKIPIF1<0;又SKIPIF1<0SKIPIF1<0SKIPIF1<0故选:D.2.(2022·四川·成都市锦江区嘉祥外国语高级中学有限责任公司模拟预测(文))冬末春初,乍暖还寒,人们容易感冒发热,若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产,某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热,下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为(

)(1)中位数为3,众数为2

(2)均值小于1,中位数为1(3)均值为3,众数为4

(4)均值为2,标准差为SKIPIF1<0A.(1)(3) B.(3)(4) C.(2)(3) D.(2)(4)【答案】D【详解】将7个数由小到大依次记为SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0.对于(1)选项,反例:SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0,满足中位数为3,众数为2,与题意矛盾,(1)选项不合乎要求;对于(2)选项,假设SKIPIF1<0,即该公司发生了群体性发热,因中位数为1,则SKIPIF1<0,平均数为SKIPIF1<0,矛盾,故假设不成立,即该公司没有发生群体性发热,(2)选项合乎要求;对于(3)选项,反例:SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0,满足众数为4,均值为3,与题意矛盾,(3)选项不合乎要求;对于(4)选项,假设SKIPIF1<0,即该公司发生群体性发热,若均值为2,则方差为SKIPIF1<0,即SKIPIF1<0,与(4)选项矛盾,故假设不成立,即该公司没有发生群体性发热,(4)选项合乎要求.故选:D3.(2022·广西·模拟预测(文))2022年6月6日是第27个“全国爱眼日”,为普及科学用眼知识,提高群众健康水平,预防眼疾,某区残联在残疾人综合服务中心开展“全国爱眼日”有奖答题竞赛活动.已知5位评委老师按百分制(只打整数分)分别给出某参赛小队评分,可以判断出一定有评委打满分的是(

)A.平均数为98,中位数为98 B.中位数为96,众数为99C.中位数为97,极差为9 D.平均数为98,极差为6【答案】D【详解】解:选项A:当打分结果为SKIPIF1<0时,满足平均数为98,中位数为98,所以A错误;选项B:当打分结果为SKIPIF1<0时,满足中位数为96,众数为99,所以B错误;选项C:当打分结果为SKIPIF1<0时,满足中位数为97,极差为9,所以C错误;选项D:假设没有评委打满分,结合极差为6可得总成绩SKIPIF1<0,则平均数SKIPIF1<0,与选项不符,故假设不成立,所以平均数为98,极差为6时,一定有评委打满分,故选:D.4.(2022·重庆八中模拟预测)已知1,SKIPIF1<0这5个数的平均数为3,方差为2,则SKIPIF1<0这4个数的方差为(

)A.1 B.SKIPIF1<0 C.SKIPIF1<0 D.2【答案】B【详解】∵1,SKIPIF1<0这5个数的平均数为3,方差为2,∴SKIPIF1<0,即SKIPIF1<0,∴SKIPIF1<0这4个数的平均数为SKIPIF1<0,∴SKIPIF1<0,即SKIPIF1<0,∴SKIPIF1<0这4个数的方差为SKIPIF1<0.故选:B.5.(2022·河南·南阳中学三模(文))某区创建全国文明城市指挥部办公室对所辖街道当月文明城市创建工作进行考评,工作人员在本区选取了甲,乙两个街道,并在这两个街道各随机抽取10个实地点位进行现场测评,下面的茎叶图是两个街道的测评分数(满分100分),下列说法正确的是(

)A.甲,乙两个街道的测评分数的极差相等B.甲,乙两个街道的测评分数的平均数相等C.街道乙的测评分数的众数为87D.甲、乙两个街道测评分数的中位数中,乙的中位数比较大【答案】D【详解】街道甲的测评分数的极差是SKIPIF1<0,街道乙的测评分数的的极差是SKIPIF1<0,两者不相等,故A错误;街道甲的测评分数的平均数为SKIPIF1<0,街道乙的测评分数的平均数为SKIPIF1<0,故B错误;街道乙的测评分数的众数为81,故C错误;街道甲的测评分数的中位数为SKIPIF1<0,街道乙的测评分数的中位数为SKIPIF1<0,故D正确,故选:D.6.(2022·安徽六安·一模(文))已知某样本的容量为100,平均数为80,方差为95.现发现在收集这些数据时,其中的两个数据记录有误,一个错将90记录为70,另一个错将80记录为100.在对错误的数据进行更正后,重新求得样本的平均数为SKIPIF1<0,方差为SKIPIF1<0,则(

)A.SKIPIF1<0,SKIPIF1<0 B.SKIPIF1<0,SKIPIF1<0 C.SKIPIF1<0,SKIPIF1<0 D.SKIPIF1<0,SKIPIF1<0【答案】A【详解】由题意,可得SKIPIF1<0,设收集的98个准确数据分别记为SKIPIF1<0,则SKIPIF1<0SKIPIF1<0,SKIPIF1<0SKIPIF1<0,所以SKIPIF1<0.故选:A7.(2022·山东·肥城市教学研究中心模拟预测)在对某中学高一年级学生每周体育锻炼时间的调查中,采用随机数法,抽取了男生SKIPIF1<0人,女生SKIPIF1<0人.已知男同学每周锻炼时间的平均数为SKIPIF1<0小时,方差为SKIPIF1<0;女同学每周锻炼时间的平均数为SKIPIF1<0小时,方差为SKIPIF1<0.依据样本数据,估计本校高一年级学生每周体育锻炼时间的方差为___.【答案】19【详解】根据平均数的计算公式,全班的平均数为SKIPIF1<0,由SKIPIF1<0,设男同学为SKIPIF1<0,女同学为SKIPIF1<0,则男同学的方差SKIPIF1<0,从而SKIPIF1<0,则女同学的方差SKIPIF1<0,从而SKIPIF1<0;所以全班同学的方差为SKIPIF1<0.故答案为:SKIPIF1<0.8.(2022·四川·石室中学三模(文))为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为10,样本方差为4,且样本数据互不相同,则样本数据中的最大值为______.【答案】13【详解】设样本数据由小到大依次为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,记SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0.由于SKIPIF1<0且SKIPIF1<0可知,SKIPIF1<0.若SKIPIF1<0,则SKIPIF1<0,得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0中要么有1个是4其余3个是0,要么4个都是1,这与样本数据互不相同矛盾;若SKIPIF1<0,则SKIPIF1<0,取SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0满足题意;若SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,只有SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0满足SKIPIF1<0,但此时不满足SKIPIF1<0;若SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,不满足SKIPIF1<0;综上可知,SKIPIF1<0,SKIPIF1<0,即样本数据的最大值为13.故答案为:139.(2022·江苏南京·模拟预测)已知样本数据SKIPIF1<0的平均数SKIPIF1<0与方差SKIPIF1<0满足如下关系式:SKIPIF1<0,若已知15个数SKIPIF1<0的平均数为6,方差为9;现从原15个数中剔除SKIPIF1<0这5个数,且剔除的这5个数的平均数为8,方差为5,则剩余的10个数SKIPIF1<0的方差为___________.【答案】SKIPIF1<0【详解】根据题目所给的条件SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,所以剩余10个数的平均数为5.SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,所以这10个数的方差为SKIPIF1<0.故答案为:SKIPIF1<0突破五:总体百分位数1.(2022·天津河西·三模)学校组织班级知识竞赛,某班的12名学生的成绩(单位:分)分别是:58、67、73、74、76、82、82、87、90、92、93、98,则这12名学生成绩的第三四分位数是(

)A.88分 B.89分 C.90分 D.91分【答案】D【详解】12名学生成绩由小到大排列为58、67、73、74、76、82、82、87、90、92、93、98,SKIPIF1<0,SKIPIF1<0这12名学生成绩的第三四分位数是SKIPIF1<0,故选:D2.(2022·天津市第四十七中学模拟预测)为了了解居民用电情况,通过抽样,获得了某城市SKIPIF1<0户居民的月平均用电量(单位:度),以SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0分组的频率分布直方图如下图.该样本数据的55%分位数大约是(

)A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.SKIPIF1<0【答案】C【详解】由直方图的性质可得:SKIPIF1<0,解得SKIPIF1<0,由已知,设该样本数据的55%分位数大约是SKIPIF1<0,由SKIPIF1<0,解得SKIPIF1<0.故选:C.3.(2022·全国·模拟预测)据某地区气象局发布的气象数据,未来某十天内该地区每天最高温度(单位:℃)分别为:31,29,24,27,26,25,24,26,26,23,则这组数据的第40百分位数为(

)A.27 B.26.5 C.25.5 D.25【答案】C【详解】先将这些数据按照从小到大进行排序,分别为23,24,24,25,26,26,26,27,29,31,又SKIPIF1<0,所以该组数据的第40百分位数为排序后的数列的第4个数和第5个数的平均数,即SKIPIF1<0,故选:C.4.(2022·海南华侨中学模拟预测)2022年4月24日是第七个“中国航天日”,今年的主题是“航天点亮梦想”.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数SKIPIF1<0的值可以是___________(写出一个满足条件的m值即可).【答案】7或8或9或10(填上述4个数中任意一个均可)【详解】7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为:6,7,7,8,8,9,10,则SKIPIF1<0,故第25百分位数为第二个数即7,所以7,6,8,9,8,7,10,m,第25百分位数为7,而SKIPIF1<0,所以7为第二个数与第三个数的平均数,所以SKIPIF1<0的值可以是7或8或9或10.故答案为:7或8或9或10.5.(2022·天津市宁河区芦台第一中学模拟预测)某射击运动员SKIPIF1<0次的训练成绩分别为:SKIPIF1<0,则这SKIPIF1<0次成绩的第SKIPIF1<0百分位数为__________.【答案】SKIPIF1<0【详解】该射击运动员SKIPIF1<0次的训练成绩从小到大依次为SKIPIF1<0,因为SKIPIF1<0,所以这SKIPIF1<0次成绩的第SKIPIF1<0百分位数为SKIPIF1<0.故答案为:SKIPIF1<0突破六:回归直线方程1.(2022·陕西·交大附中模拟预测(文))设某大学的女生体重SKIPIF1<0(单位:SKIPIF1<0)与身高SKIPIF1<0(单位:SKIPIF1<0)具有线性相关关系,根据一组样本数据SKIPIF1<0,用最小二乘法建立的回归方程为SKIPIF1<0,则下列结论中正确结论的个数是(

)①SKIPIF1<0与SKIPIF1<0具有正的线性相关关系;②回归直线过样本点的中心SKIPIF1<0;③若该大学某女生身高增加SKIPIF1<0,则其体重约增加SKIPIF1<0;④若该大学某女生身高为SKIPIF1<0,则可断定其体重必为SKIPIF1<0.A.1 B.2 C.3 D.4【答案】C【详解】由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故①正确;因为回归直线必过样本点的中心SKIPIF1<0,所以②正确;由线性回归方程的意义知,某女生的身高增加1cm,其体重约增加0.85kg,故③正确;当某女生的身高为170cm时,其体重估计值是58.79kg,这不是确定值,因此④不正确.故选:C.2.(2022·四川·成都七中模拟预测(文))根据一组样本数据SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,求得经验回归方程为SKIPIF1<0,且SKIPIF1<0.现发现这组样本数据中有两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则(

)A.变量x与y具有正相关关系B.去除两个误差较大的样本点后,重新求得的经验回归方程为SKIPIF1<0C.去除两个误差较大的样本点后,y的估计值增加速度变快D.去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为0.05【答案】A【详解】解:对A:SKIPIF1<0经验回归方程为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0变量SKIPIF1<0与SKIPIF1<0具有正相关关系,故选项A正确;对B:当SKIPIF1<0时,SKIPIF1<0,所以样本中心为SKIPIF1<0,SKIPIF1<0去掉两个样本点为SKIPIF1<0和SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0样本中心不变,SKIPIF1<0去除后重新求得的经验回归直线SKIPIF1<0的斜率为1.2,SKIPIF1<0SKIPIF1<0,解得SKIPIF1<0,故去除两个误差较大的样本点后,重新求得的回归方程为SKIPIF1<0,故选项B错误;对C:SKIPIF1<0,SKIPIF1<0去除两个误差较大的样本点后,SKIPIF1<0的估计值增加速度变慢,故选项C错误;对D:SKIPIF1<0SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为SKIPIF1<0,故选项D错误.故选:A.3.(2022·重庆八中模拟预测)某种活性细胞的存活率SKIPIF1<0(SKIPIF1<0)与存放温度SKIPIF1<0(℃)之间具有线性相关关系,样本数据如下表所示:存放温度SKIPIF1<0(℃)104SKIPIF1<0SKIPIF1<0存活率SKIPIF1<0(SKIPIF1<0)20445680经计算,回归直线的斜率为SKIPIF1<0,若这种活性细胞的存放温度为SKIPIF1<0℃,则其存活率的预报值为(

)A.32% B.33% C.34% D.35%【答案】C【详解】设回归直线方程为SKIPIF1<0,由表中数据可得,SKIPIF1<0.因为回归直线经过样本点中心SKIPIF1<0,则SKIPIF1<0.所以当SKIPIF1<0时,SKIPIF1<0.故选:C.4.(2022·江西赣州·一模(理))袁隆平院士是我国的杂交水稻之父,他一生致力于杂交水稻的研究,为解决中国人民的温饱和保障国家粮食安全做出了重大的贡献.某杂交水稻研究小组先培育出第一代杂交水稻,再由第一代培育出第二代,第二代培育出第三代,以此类推.已知第一代至第四代杂交水稻的每穗总粒数分别为197粒,193粒,201粒,209粒,且亲代与子代的每穗总粒数成线性相关.根据以上信息,预测第五代杂交水稻每穗的总粒数为(

)(注:①亲代是产生后一代生物的生物,对后代生物来说是亲代,所产生的后一代叫子代:②SKIPIF1<0,SKIPIF1<0)A.211 B.212 C.213 D.214【答案】C【详解】由题意,设亲代每穗总粒数SKIPIF1<0,子代的每穗总粒数SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0所以线性回归方程为SKIPIF1<0当SKIPIF1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论