




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题三概率与统计(理)
【考生存在问题报告】
(-)读图识图能力弱
学生面对一堆数据无从下手,主要原因是对数据、图表的直观印象和积累储备的知识经验不够;没有
形成“用数据说话”的统计观念;对抽象数据的数字特征理解不到位.
一月
七月
----平均♦低,■—平均♦离,温
【例1】(2020•湖北荆州中学高三期末)为考察A,B两种药物预防某疾病的效果,进行动物实验,分别得
到等高条形图如图所示,根据图中信息,在下列各项中,说法最佳的一项是()
A.药物B的预防效果优于药物A的预防效果B.药物A、B对该疾病均没有预防效果
C.药物A、B对该疾病均有显著的预防效果D.药物A的预防效果优于药物B的预防效果
【评析】试题设计的实际背景源于生活,考生比较熟悉,试题表征是通过给出一种高中课本没有介绍的新
的统计图——等高条形图,要求考生读懂统计图的内容.通过这样的设计要求考生读图、识图,对表征进
行分析,从而得出结论.这是考查数据分析的最基本的问题.
解答本题错误主要是读图识图能力弱,对图形的划分认识不明确,不知所措,找不到解决问题的方法;
其次,不会从图表中读取有用数据并进行判断.
(二)运算能力差
运算求解能力主要是指会根据法则、公式进行正确运算、变形和数据处理,能根据问题的条件寻找与
设计合理、简捷的运算途径,能根据要求对数据进行估计和近似计算.本专题中,学生运算能力弱主要体
现在不能根据问题的条件寻找与设计合理、简捷的运算途径,不能根据要求对数据进行估计和近似计算.
【例2】(2020•安徽高三期末)某市为创建全国文明城市,推出“行人闯红灯系统建设项目”,将针对闯红灯
行为进行曝光.交警部门根据某十字路口以往的监测数据,从穿越该路口的行人中随机抽查了200人,得到
如图示的列联表:
闯红灯不闯红灯合计
年龄不超过45岁67480
年龄超过45岁2496120
合计30170200
(1)能否有97.5%的把握认为闯红灯行为与年龄有关?
(2)下图是某路口监控设备抓拍的5个月内市民闯红灯人数的统计图.请建立V与%的回归方程y=bx+a,
并估计该路口6月份闯红灯人数.
A
E
Y
fae
直
附:片=_______"皿一直____
(〃+b)(c+d)(a+c)(b+d)
_n___
%%一〃%、
z-------
n_a=y-bx
^xf-nx9
i=l
2
P(K>k)0.0500.0250.0100.0050.001
k3.8415.0246.6357.87910.828
参考数据:Zy;=685,Z%%=1966
i=li=l
【评析】求解线性回归方程的3步骤
.屐赢数旨值散去亩温是而不爰工真看就
、作图_MM
,性相关关系
I________________________________________।
融算出E,5,第工整%的值,计算回归系数1制
1_______________________________________!
r写出线性回归直线方程歹=加+;
【例3】[2017年全国卷I文19]为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生
产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺
寸:
抽取次序12345678
零件尺寸9.9510.129.969.9610.019.929.9810.04
抽取次序910111213141516
零件尺寸10.269.9110.1310.029.2210.0410.059.95
经计算得了=正2>=997,s1772a•=、/(£>;—16/)工0.212,
16,=1y16/=|V16,=1
p616
£(Z-8.5)2«18.439,£(王一君(i—8.5)=—2.78,其中占为抽取的第,•个零件的尺寸,力=1,2,…,16.
Vi=\i=l
(1)求(x,.,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程
的进行而系统地变大或变小(若|川<025,则可以认为零件尺寸不随生产过程的进行而系统地变大或变
小).
(2)一天内抽检零件中,如果出现了尺寸在(元-3s茂+3s)之外的零件,就认为这条生产线在这一天
的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ii)在(元-3s,元+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺
寸的均值与标准差.(精确到0.01)
f(%一元)(%一,)
附:样本(不,%)(,=1,2,…,n)的相关系数r=It-I“二.VO.008x0.09•
2
思…2思—
n~~16n~~16
【评析】从运算方面看,学生不懂从s=-元)2=\R(£x;—16元2)a0.212中解出
\16,=|V16;=1
16-2.78
2(x,.-x)2=16x0.212%不会计算「的值,不懂根据保留小数点后两位的要求,
1=10.212x716x18.439
-2.78
实施近似处理以简化运算;不懂直接由厂=采用放缩方法判断是否满足|川<025;不
0.212x716x18.439
-115
会由亍=9.97和s“0.212计算出区间(元—3s,元+3s)的端点值9.334,10.606;计算x=恁>七时,不懂
15i=i
-1普,_1鉴,
得先做相反数相消处理或各项统一分离10后转化为X=10+77工X,计算;计算X=77XX,时,不懂得转
15i=i15j=i
16
化为-工”-*3,再利用F=J_£X,=9.97简化运算;ife52=-I[0,072+0.12+0.062+0.062+0.012+0.12+0.042
x=—16占15
+0.022+0.242++0.II2+0.112+02+0.022+0.032+0.072]=0.00813«0.008,不懂得各项统一提取
0.012的技巧;计算$2=七06*0.2122+16X9.972-9.222-15xl0.022]Bt,不懂得在保证精确度要求的
前提下作近似处理以简化运算.
(三)概念理解不透
概念理解不到位的有事件、模型的判断等;容易混淆的概念有互斥事件与对立事件、超几何分布与二
项分布、二项展开式的通项公式与〃次独立重复试验中事件A发生左次的概率
P,k)=C;pkQ-pTk等.
【例4】(2020•山西省长治市第二中学校高三期末)某校从参加某次知识竞赛的同学中,选取60名同学将
其成绩(百分制,均为整数)分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,
得到部分频率分布直方图(如图),观察图形中的信息,回答下列问题:
;频率/姐距
0.035
0.030
0.025
0.020
0.015
0.010
0.005
40306070SO90100分敦
(1)求分数[70,80)内的频率,并补全这个频率分布直方图;
(2)从频率分布直方图中,估计本次考试成绩的中位数;
(3)若从第1组和第6组两组学生中,随机抽取2人,求所抽取2人成绩之差的绝对值大于10的概率.
【评析】本题考查了利用样本估计总体的综合应用问题,以及古典概型及其概率的计算问题,对弈频率分
布直方图,应注意:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总
体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直
观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方
形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于L
(四)知识缺漏较严重,特别是“冷门知识”缺失
从学生认知的方面看,学生对相关的概念、公式理解掌握不到位,知识缺漏较严重,如对正态分布、
条件概率等概念不清楚.另一方面由于老师淡化章节阅读与思考、实习作业等教学,导致学生忽视了相关“冷
门知识”的学习,如相关系数等.
【例5】【2018年全国卷III理】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的
两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一
组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)
绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数并将完成生产任务所需时间超过m和不超过m的工人
数填入下面的列联表:
超过团不超过“1
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
.p_1«&一元产
0.0500.0100.001
k3.8416.63510.828
【评析】正态分布、非线性回归转化线性回归、相关系数、茎叶图的意义等,从教科书看,介绍较少,这
个问题应值得引起我们关注.在复习过程中,应关注阅读与思考、实习作业等教学,应注意对学生的认知
进行补缺补漏,再如正态分布、条件概率、相关系数、残差图、拟合效果等知识.
(五)审题析题不到位
审题析题不清是本专题解答错误的主要原因,主要包括题意不清,茫然作答;阅读肤浅,丢失信息;
条件欠缺,鲁莽下笔;图形不准,缺乏严密;方向不明,目标模糊等情况.审题不清的最主要原因在于学
生的阅读理解能力欠缺.
【例6】【2018年理新课标I卷】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要
对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据
检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为p(0<pu1),且各件产品
是否为不合格品相互独立.
(1)记20件产品中恰有2件不合格品的概率为『3),求八口)的最大值点.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品
的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;
(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
【评析】该题考查的是有关随机变量的问题,在解题的过程中,一是需要明确独立重复试验成功次数对应
的概率公式,再者就是对其用函数的思想来研究,应用导数求得其最小值点,在做第二问的时候,需要明
确离散型随机变量的可取值以及对应的概率,应用期望公式求得结果,再有就是通过期望的大小关系得到
结论.
面对试题中冗长的文字表述,学生方寸大乱,不知所措,从而失去读题、解题信心;对概率模型不清,
不能利用二项分布模型写出/(P)=C;o/(l-0)18;不能进行知识的交融运用,导致不能利用导数求
/(°)=C;op2(l-op最大值点po或利用导数求_f(p)后,不能合理的变形求最大值点°。;对于第(2)
不能灵活运用期望性质,导致无法求EX;未能准确题意,方向不明,目标模糊,导致回答问题含混不清、
词不达意.
(六)解题规范性较差
涉及本专题内容的考查,学生失误和失分最多的是会而不对、对而不全和全而不准,如不能用字母表
示事件,导致在利用简单事件表示复杂事件书写混乱;解答过程缺失关键步骤,丢三落四,导致丢分等.
【例7】(2020•全国高三专题练习(理))某校高三实验班的60名学生期中考试的语文、数学成绩都在
[100,150]内,其中语文成绩分组区间是:[100,110),[110,120),[120,130),[130,140),[140,150].
其成绩的频率分布直方图如图所示,这60名学生语文成绩某些分数段的人数%与数学成绩相应分数段的人
数y之比如下表所示:
分组区间[100,110)[110,120)[120,130)[130,140)[140,150]
x:y1:22:13:53:4
语文人数X243
数学人数y124
(1)求图中。的值及数学成绩在[130,140)的人数;
(2)语文成绩在[140,150]的3名学生均是女生,数学成绩在[140,150]的4名学生均是男生,现从这7名
学生中随机选取4名学生,事件M为:“其中男生人数不少于女生人数“,求事件"发生的概率;
(3)若从数学成绩在[130,150]的学生中随机选取2名学生,且这2名学生中数学成绩在[140,150]的人数
为X,求X的分布列和数学期望E(X).
【评析】本题主要考查了频率分布直方图的应用,以及离散型随机变量的分布列与数学期望的求解,其中
解答中认真审题,熟记频率分布直方图的性质,以及准确求解随机变量对应的概率,得到随机变量的分布
列是解答的关键,但是事件”可分为①2个男生,2个女生;②3个男生1个女生;③4个男生三种情况,
有些同学可能考虑问题不全面,造成失分.
2.求解离散型随机变量的数学期望的一般步骤为:
第一步是,,判断取值,,,即判断随机变量的所有可能取值,以及取每个值所表示的意义;
第二步是“探求概率”,即利用排列组合、枚举法、概率公式(常见的有古典概型公式、几何概型公式、互斥
事件的概率和公式、独立事件的概率积公式,以及对立事件的概率公式等),求出随机变量取每个值时的概
率;
第三步是“写分布列”,即按规范形式写出分布列,并注意用分布列的性质检验所求的分布列或某事件的概率
是否正确;
第四步是“求期望值”,一般利用离散型随机变量的数学期望的定义求期望的值,对于有些实际问题中的随机
变量,如果能够断定它服从某常见的典型分布(如二项分布X则此随机变量的期望可直接利用
这种典型分布的期望公式(石(X)="P)求得.因此,应熟记常见的典型分布的期望公式,可加快解题速度.
【命题专家现场支招】
(一)加强阅读理解能力培养与训练
统计与概率进一步强化应用意识的考查,已成高考命题改革的必然趋势,试卷试题文字阅读量的逐年
增加,或成高考试卷的发展趋势.复习中,应规范教学的阅读指导.应该呈现读题提取关键信息、析题形
成解题思路、解题示范规范表达、反思积淀解题经验的“四步曲''完整过程,才能充分发挥解题教学的效益.其
次,加强平时的阅读训练.需要适当增加平时作业习题的阅读量,尤其是应用性试题的读题训练,
提高学生的阅读理解能力及应试心态.
解答应用问题要过三关:一是事理关,即读懂题意,需要一定的阅读理解能力;二是文理关,即把文
字语言转化为数学的符号语言;三是数理关,即构建相应的数学模型,构建之后还需要扎实的基础知识和
较强的数理能力.除以上过“三关”外,对于概率与统计应用问题还应再过三关,即文字关、图表关、计算关.
[例1][2017年全国卷I理19]为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上
随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生
产的零件的尺寸服从正态分布.
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(〃-3。,〃+3b)之外的零件数,
求P(X21)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(〃-3b,〃+3b)之外的零件,就认为这条生产线在这一
天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(i)试说明上述监控生产过程方法的合理性;
(ii)下面是检验员在一天内抽取的16个零件的尺寸:
9.9510.129.969.9610.019.929.9810.04
10.269.9110.1310.029.2210.0410.059.95
116r-j~~16r-i16
经计算得了二^2X产乡S,s=』上£(七一君2=16元2)2«0.212,其中W为抽取的第,
16*1V6/=i\16,-=1
个零件的尺寸,,=1,2,…,16.用样本平均数元作为〃的估计值。,用样本标准差5作为b的估计值合,
利用估计值判断是否需对当天的生产过程进行检查?剔除3-33,4+33)之外的数据,用剩下的数据估计
〃和b(精确到0.01).
附:若随机变量Z服从正态分布则P(〃—3cr<Z<〃+3b)=0.9974,
0.997416=0.9592,V0.008»0.09.
【评析】数学期望是离散型随机变量中重要的数学概念,反应随机变量取值的平均水平.求解离散型随机变
量的分布列、数学期望时,首先要分清事件的构成与性质,确定离散型随机变量的所有取值,然后根据概
率类型选择公式,计算每个变量取每个值的概率,列出对应的分布列,最后求出数学期望.正态分布是一种
重要的分布,之前考过一次,尤其是正态分布的3b原则.
(二)强化图表的识别能力
高考试卷的解答题往往以频率分布表、频率分布直方图、柱形图、折线图、茎叶图五个样本频率分布
图表为载体,理科侧重考查随机变量的分布列及期望,文科侧重考查样本数字特征的应用,突出了对应用
意识、数据处理能力及创新能力的考查.复习过程中,应充分利用五个样本频率分布图表以及常用的统计
图,如雷达图、饼图等,让学生会从图表中读取有用数据,或根据问题需要选择合适图表,依据统计学中
的方法对数据进行分析,作出合理的决策.
[例2](2020•全国高三专题练习)一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记
忆测试,通过讲解io。个陌生单词后,相隔十分钟进行听写测试,间隔时间t(分钟)和答对人数y的统计
表格如下:
时间/(分钟)102030405060708090100
答对人数y987052363020151155
igy1.991.851.721.561.481.301.181.040.70.7
时间t与答对人数y的散点图如图:
.5。
2.20
答200,.
LK>o
K5igyi.50....
人LQ
敷1.00*.
SO
,05|♦♦
0.50
S。
-
O的Too~120°°°020~406080100~125
.(>40
附:=38500,2y.=342,=13.5,=10960,»Jgy=620.9,对于一组数据
(4,匕),(l/2,V2),……,其回归直线V=£+,”的斜率和截距的最小二乘估计分别为:
_〃__
£4.匕-nuv
BT------—,/7.请根据表格数据回答下列问题:
£-nu
Z=1
(1)根据散点图判断,y=s+Z?与lgy=c/+d,哪个更适宣作为线性回归类型?(给出判断即可,不
必说明理由)
(2)根据(1)的判断结果,建立V与/的回归方程;(数据保留3位有效数字)
(3)根据(2)请估算要想记住75%的内容,至多间隔多少分钟重新记忆一遍.(参考数据:1g2ao.3,
lg3ao.48)
(三)重视样本估计总体的思想
复习过程中,应让学生掌握,为了考察一个总体的情况,在统计中通常是从总体中抽取一个样本,用
样本的有关情况去估计总体的相应情况.这种估计大体分为两类:用样本的频率分布估计总体的分布、用
样本的数字特征估计总体的数字特征.其次,“预测与决策”与人们的生活休戚相关.随着社会的不断进步,
人们对许多实际问题会有多种解决方案,但哪种方案最有利于解决问题,需要进行科学的决策.而通过期
望、方差等的计算,并进行大小比较,就是其中的一种科学预测与决策的手段.
【例3】(2020•河南高三月考)2017年3月郑州市被国务院确定为全国46个生活垃圾分类处理试点城市之
一,此后由郑州市城市管理局起草公开征求意见,经专家论证,多次组织修改完善,数易其稿,最终形成
《郑州市城市生活垃圾分类管理办法》(以下简称《办法》).《办法》已于2019年9月26日被郑州市人民
政府第35次常务会议审议通过,并于2019年12月1日开始施行.《办法》中将郑州市生活垃圾分为厨余
垃圾、可回收垃圾、有害垃圾和其他垃圾4类.为了获悉高中学生对垃圾分类的了解情况,某中学设计了
一份调查问卷,500名学生参加测试,从中随机抽取了100名学生问卷,记录他们的分数,将数据分成7组:
[20,30),[30,40),[80,90],并整理得到如下频率分布直方图:
(1)从总体的500名学生中随机抽取一人,估计其分数不低于60的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的学生人数,
(3)学校环保志愿者协会决定组织同学们利用课余时间分批参加“垃圾分类,我在实践”活动,以增强学生
的环保意识.首次活动从样本中问卷成绩低于40分的学生中随机抽取2人参加,已知样本中分数小于40
的5名学生中,男生3人,女生2人,求抽取的2人中男女同学各1人的概率是多少?
【评析】1.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本
的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观.
2.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的
面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
(四)强化概率模型的识别与应用
复习过程中,应关注概率模型的识别与应用,一定要注意弄清题意,找出题中的关键字词,厘清各种
概率模型及适用范围.如超几何分布和二项分布是教材中两个重要概率分布,二项分布与超几何分布的区
别为,二项分布是有放回的抽样,每做一次事件,事件A发生的概率是相同的;超几何分布是不放回的抽
样,每做一次事件,事件A发生的概率是不相同的.
【例4】【2018年理数天津卷】已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层
抽样的方法从中抽取7人,进行睡眠时间的调查.
(I)应从甲、乙、丙三个部门的员工中分别抽取多少人?
(II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.
(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;
(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.
【评析】本题主要在考查超几何分布和分层抽样.超几何分布描述的是不放回抽样问题,随机变量为抽到的
某类个体的个数.超几何分布的特征是:①考查对象分两类;②已知各类对象的个数;③从中抽取若干个
个体,考查某类个体个数X的概率分布,超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,
其实质是古典概型.进行分层抽样的相关计算时,常利用以下关系式巧解:(1)=二春台=;三手三方;
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
(五)厘清事件及其概率
复习过程中,应厘清事件间的关系,准确计算相关事件的概率.特别要求学生能将复杂事件进行分解,
先分解为互斥事件,每个互斥事件又分解为两个相互独立事件的积事件.
【例5】(2020•辽宁高三月考)在2019年女排世界杯中,中国女子排球队以11连胜的优异战绩成功夺冠,
为祖国母亲七十华诞献上了一份厚礼.排球比赛采用5局3胜制,前4局比赛采用25分制,每个队只有赢得
至少25分,并同时超过对方2分时,才胜1局;在决胜局(第五局)采用15分制,每个队只有赢得至少
15分,并领先对方2分为胜.在每局比赛中,发球方赢得此球后可得1分,并获得下一球的发球权,否则交
换发球权,并且对方得1分.现有甲乙两队进行排球比赛:
(1)若前三局比赛中甲已经赢两局,乙赢一局.接下来两队赢得每局比赛的概率均为,,求甲队最后赢得整
2
场比赛的概率;
(2)若前四局比赛中甲、乙两队已经各赢两局比赛.在决胜局(第五局)中,两队当前的得分为甲、乙各
23
14分,且甲已获得下一发球权.若甲发球时甲赢1分的概率为乙发球时甲赢1分的概率为《,得分者获
得下一个球的发球权.设两队打了x(x<4)个球后甲赢得整场比赛,求x的取值及相应的概率p(%).
【评析】互斥事件概率加法公式:若A,B互斥,则P(A+B)=P(A)+P(B),独立事件概率乘法公式:若A,B相
互独立,则P(AB)=P(A)P(B).
(六)重视样本数字特征的含义
在复习中,应关注众数、中位数、平均数(期望)、方差与标准差有的含义,并能根据解决问题的需要
选择合理的数字特征说明问题.
【例6】(2020•河南高三期末)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),
[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中、的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的
方法抽取1:户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
【评析】该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图
计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心
运算,仔细求解,就可以得出正确结果.
(七)关注“冷门”知识的复习
高考是对高中阶段学习结果的大检阅,统计与概率的考查,在突出核心知识考查的同时,也关注知识点
的覆盖面.因此,在复习教学中,要全面检索高中阶段的所有知识,特别是不能忽视对所谓的“冷门知识”
的复习,如正态分布、条件概率、相关系数、残差图、拟合效果等.
【例7】【黑龙江省哈尔滨市第六中学2019届高三上期末】有如下四个命题:
①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分
别为45和44.
②相关系数r=-0.83,表明两个变量的相关性较弱.
③若由一个2x2列联表中的数据计算得K二的观测值k«4.103,那么有95%的把握认为两个变量有关.
④用最小二乘法求出一组数据[X=1,-.可的回归直线方程£=bx+6后要进行残差分析,相应于数
据(x“力),p=L….吗的残差是指%=%一(iiq+&).
以上命题“错误”的序号是
(A)规范答题表达形式
规范答题,一方面,思考问题要规范.也就是从知识的源头出发,弄清知识的来龙去脉.知识是怎么
要求的,就怎么想、怎么用、怎么写,不能模棱两可,要会运用知识进行思考;另一方面,书写要规范.书
写规范是一个重要的高考增分点,这一点应引起足够重视.如解题中应注意用字母表示事件,注意作答等.
【例8】(2020•广东高三期末)如表是我国2012年至2018年国内生产总值(单位:万亿美元)的数据:
年份2012201320142015201620172018
年份代号X1234567
国内生产总值y
8.59.610.41111.112.113.6
(单位:万亿美元)
(1)从表中数据可知x和V线性相关性较强,求出以%为解释变量V为预报变量的线性回归方程;
(2)已知美国2018年的国内生产总值约为20.5万亿美元,用(1)的结论,求出我国最早在那个年份才能赶上
美国2018年的国内生产总值?
77
参考数据:2>=76-3,£=326.2
i=li=l
参考公式:回归方程¥=院+£中斜率和截距的最小二乘估计公式分别为:
【评析】1、判断方程类型要注意充分利用散点图联想函数图象特征作出判断.
2、求回归方程时易计算失误,注意要强化计算能力.
3、注意借助于函数知识解决.
【新题好题针对训练】
一、选择题
1.(2020•广西柳州高级中学高三)某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所
示的频率分布直方图,其中自习时间的范围是[175,30],样本数据分组为[175,20],[20,22.5],[225,25],
[25,275],[275,30].根据直方图,这320名学生中每周的自习时间不足22.5小时的人数是()
A.68B.72C.76D.80
2.(2020・辽宁实验中学高三期末)某学生5次考试的成绩(单位:分)分别为85,67,m,80,93,其中m>0,
若该学生在这5次考试中成绩的中位数为80,则得分的平均数不可能为()
A.70B.75C.80D.85
3.(2020・重庆巴蜀中学高三月考)新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和
选择性考试(选择考).其中“选择考”成绩将计入高考总成绩,即“选择考”成绩根据学生考试时的原始卷面
分数,由高到低进行排序,评定为A、B、C、D、E五个等级.某试点高中2018年参加“选择考”总人数
是2016年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2016年
和2018年“选择考”成绩等级结果,得到如下图表:
2016年住校"afK-WttH.率
,E等at2%
针对该校“选择考”情况,2018年与2016年比较,下列说法正确的是()
A.获得A等级的人数减少了B.获得B等级的人数增加了1.5倍
C.获得D等级的人数减少了一半D.获得E等级的人数相同
4.(2020・湖北高三期末)某地有两个国家AAAA级旅游景区——甲景区和乙景区.相关部门统计了这两个景
区2019年1月至6月的月客流量(单位:百人),得到如图所示的茎叶图.关于2019年1月至6月这两个景
区的月客流量,以下结论里运的是()
甲景区乙景区
423
2445
56
652
A.甲景区月客流量的中位数为12950人
B.乙景区月客流量的中位数为12450人
C.甲景区月客流量的极差为3200人
D.乙景区月客流量的极差为3100人
5.(2020•四川高三期末)已知变量X、丁之间的线性回归方程为y=-0.7x+10.3,且变量x、V之间的一
-组相关数据如下表所示,则下列说法镇误的是()
X681012
y6m32
A.可以预测,当x=20时,y--3.7B.m=4
C.变量X、y之间呈负相关关系D.该回归直线必过点(9,4)
二、填空题
6.(2020.广东深圳中学高三期末)某工厂为了解产品的生产情况,随机抽取了100个样本.若样本数据再,
了2,…,Woo的方差为16,则数据2X]—1,2X2-1,...,2为00—1的方差为.
7.【广东省珠海一中等六校2018届高三第一次联考】一台仪器每启动一次都随机地出现一个5位的二进制
数A=叵正亚亚皿],其中A的各位数字中,/=1,ak(*=234,5:出现0的概率为:,出现1的概率为;.若
启动一次出现的数字为A=10101则称这次实验成功,若成功一次得2分,失败一次得一1分,贝依00次重复
实验的总得分*的方差为.
三、解答题
8.(2020•云南昆明一中高三期末)某花圃为提高某品种花苗质量,开展技术创新活动,在A,3实验地分别
用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,
将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80分及以上的花苗为优质花苗.
(1)用样本估计总体,以频率作为概率,若在A8两块实验地随机抽取3株花苗,求所抽取的花苗中优质
花苗数的分布列和数学期望;
(2)填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.
优质花苗非优质花苗合计
甲培育法20
乙培育法10
合计
附:下面的临界值表仅供参考.
。(片.人)0.0500.0100.001
k。3.8416.63510,828
(参考公式:K2=-------------------------,其中”=Q+J+c+d)
(a+Z?)(c+d)(a+c)(b+d)
9.(2020•四川高三期末)手机运动计步已经成为一种新时尚.某单位统计了职工一天行走步数(单位:百
步),绘制出如下频率分布直方图:
(1)求直方图中。的值,并由频率分布直方图估计该单位职工一天步行数的中位数;
(2)若该单位有职工200人,试估计职工一天行走步数不大于13000的人数;
镁数/组距
(3)在(2)的条件下,该单位从行走步数大于15000的3组职工中用分层抽样的方法选取6人参加远足
拉练活动,再从6人中选取2人担任领队,求这两人均来自区间(150,170]的概率.
10.(2020•河南高三期末)某品牌奶茶公司计划在A地开设若干个连锁加盟店,经调查研究,加盟店的个数
尤与平均每个店的月营业额y(万元)具有如下表所示的数据关系:
X246810
y20.920.21917.817.1
(1)求y关于尤的线性回归方程;
(2)根据(1)中的结果分析,为了保证平均每个加盟店的月营业额不少于14.6万元,则A地开设加盟店的个数
不能超过几个?
参考公式:线性回归方程,=鼠+£中的斜率和截距的最小二乘估计公式分别为
11.(202。广东高三期末)某房产中介统计了深圳市某高档小区从2018年12月至2019年11月当月在售二
手房均价(单位:万元/平方米)的散点图,如下图所示,图中月份代码1至12分别对应2018年12月至
2019年11月的相应月份.
根据散点图选择y=。+笈和y=C+dinx两个模型进行拟合,根据数据处理得到两个回归方程分别为
y=6.9057+0.0195尤和y=6.8639+0.10121nx,并得到以下一些统计量的值:
y=6.9057+0.0195xy=6.8639+0.10121nx
残差平方和加-yj
0.01485570.0048781
总偏差平方和Z(y—y)0.069193
z=l\
(1)请利用相关指数R2判断哪个模型的拟合效果更好;
(2)某位购房者拟于2020年5月份购买深圳市福田区s(504s4160)平方米的二手房(欲购房为其家庭首
套房).若该小区所有住房的房产证均已满3年,请你利用(1)中拟合效果更好的模型解决以下问题:
Ci)估算该购房者应支付的购房金额.(购房金额=房款+税费;房屋均价精确到0.01万元/平方米)
(ii)若该购房者拟用不超过760万元的资金购买该小区一套二手房,试估算其可购买的最大面积(精确到
1平方米)
附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按照房屋的计税价格进行征收.(计税价格
=房款)
征收方式见下表:
购买首套房面积s(平方米)s<9090<5<144s>144
契税(买方缴纳)的税率1%2%4%
参考数据:In2«0.69,ln3«1.10,ln7«2.83,lnl9«2.94,0al.41,6合1.73,旧土4.12,
2(%-%)
加士4.36,参考公式:相关指数长=1-4-----------
Z=1
12.(2020•湖南长沙一中高三月考)政府工作报告指出,2018年我国深入实施创新驱动发展战略,创新能
力和效率进一步提升;2019年要提升科技支撑能力,健全以企业为主体的产学研一体化创新机制.某企业为
了提升行业核心竞争力,逐渐加大了科技投入;该企业连续6年来的科技投入了(百万元)与收益V(百
万元)的数据统计如下:
科技投入x24681012
收益y5.66.512.027.580.0129.2
根据散点图的特点,甲认为样本点分布在指数曲线y=c-2.的周围,据此他对数据进行了一些初步处理,
如下表:
6666c
ZZ&-无)3-9)元)(z一)S(x-y)万)2
Z=11=11=11=1
43.54.5854.034.712730.470.0
[6
其中4=log2%,z=-^z;.
6i=i
(i)(i)请根据表中数据,建立y关于z的回归方程(保留一位小数);
(ii)根据所建立的回归方程,若该企业想在下一年的收益达到2亿,则科技投入的费用至少要多少(其中
log25a2.3)?
(2)乙认为样本点分布在二次曲线y=的周围,并计算得回归方程为y=0.92/-12.0,以及该回
归模型的相关指数火2=0.94,试比较甲、乙两位员工所建立的模型,谁的拟合效果更好.
附:对于一组数据(4,匕),(%,%),…,(出,匕),其回归直线方程/=应+向的斜率和截距的最小二乘
£(%-可(”-不)£(匕-疗
估计分别为方=上,------------,a^v-pu,相关指数:叱=1—与----------
£(4一力E(v,-v)2
i=\z=l
13.(2020.重庆高三期末)某地区在“精准扶贫”工作中切实贯彻习近平总书记提出的“因地制宜”的指导思想,
扶贫工作小组经过多方调研,综合该地区的气候、地质、地理位置等特点,决定向当地农户推行某类景观
树苗种植.工作小组根据市场前景重点考察了A,B两种景观树苗,为对比两种树苗的成活率,工作小组进
行了引种试验,分别引种树苗48各50株,试验发现有80%的树苗成活,未成活的树苗A,8株数之比
为1:3.
(1)完成2x2列联表,并据此判断是否有99%的把握认为树苗A,B的成活率有差异?
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 法院专项速递合同范本
- 旅馆宾馆转租合同范本
- 埃博拉出血热医院感染防控措施和转运工作流程
- 景观水池施工合同范本
- 音响舞台租赁合同范本
- 病句关联词搭配不当30题及答案
- 2025《上海市房屋租赁合同中介服务版》
- 2025标准办公室租赁合同的范本
- 市政碎石采购合同范本
- 预防医学(山东联盟)知到课后答案智慧树章节测试答案2025年春山东第二医科大学
- 2025春人教版历史七年级下册《第一单元 隋唐时期 繁荣与开放的时代》大单元整体教学设计2022课标
- 2025-2030中国孵化器行业市场发展前瞻及投资战略研究报告
- 铂耐药复发性卵巢癌诊治中国专家共识(2025年版)解读
- 2025-2030中国保健品行业市场发展分析及投资前景预测研究报告
- 经皮球囊扩张椎体后凸成形术(PKP)及病例分享
- 煤石油和天然气的综合利用课件高一下学期化学人教版
- NB/T 11524-2024矿用喷水灭火机器人通用技术要求
- 七年级下册道德与法治古诗词解析
- 糖尿病科普教育的社交媒体推广-洞察分析
- 自动喷水灭火系统的工作原理和应用
- 数学与科技的融合跨学科教学在小学数学中的实践
评论
0/150
提交评论