版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
考向43统计与统计案例
经典题型
经典题型一:随机抽样、分层抽样
经典题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图
经典题型三:百分位数
经典题型四:样本的数字特征
经典题型五:变量间的相关关系
经典题型六:线性回归
经典题型七:非线性回归
经典题型八:独立性检验
经典题型九:误差分析
知识点一、抽样
1、抽样调查
(I)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.
(2)个体:构成总体的每一个元素叫做个体.
(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样
本中个体的数目叫做样本容量.
2、简单随机抽样
(1)定义
一般地,设一个总体含有N个个体,从中逐个不放回地抽取”个个体作为样本(〃工N),如果每次抽
取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫
做简单随机样本.
(2)两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器
中,搅拌均匀后,每次从中抽取一个号签,连续抽取〃次,就得到一个容量为〃的样本.
②随机数法:即利用随机数表、随机数骰子或计算机产生的值机数进行:抽样.这里仅介绍随机数表法.随
机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的.
注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.
(3)抽签法与随机数法的适用情况
抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量
很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.
(4)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
只有四个特点都满足的抽样才是简单随机抽样.
3、分层抽样
(1)定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的
个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解.:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=裳等=髭琮舞”
注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取〃,=〃•乂(/=1,2,个个体
N
(其中i是层数,〃是抽取的样本容量,N,是第i层中个体的个数,N是总体容量).
知识点二、用样本估计总体
I、频率分布直方图
(1)频率、频数、样本容量的计算方法
、频率
(喻而x组距=频率.
、频数频数___
②样篇量=频率,鬣=样本容量,样本容量x频率=频数.
③频率分布直方图中各个小方形的面积总和等于I.
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为工,利用工左(右)侧矩形面积之
和等于0.5,即可求出工.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底
边中点的横坐标之和,即有x=NP[+NP]++七〃”,其中X”为每个小长方形底边的中点,心为每个小长
方形的面积.
3、百分位数
(1)定义
一组数据的第〃百分位数是这样一个值,它使得这组数据中至少有〃%的数据小于或等二这个值,且
至少有(10()-〃)%的数据大丁或等丁这个俏.
(2)计算一组〃个数据的的第〃百分位数的步骤
①按从小到大排列原始数据.
②计算i=.
③若,・不是整数而大于i的比邻整数/,则第〃百分位数为第/项数据;若i是整数,则第〃百分位数为
第i项与第"1项数据的平均数.
(3)四分位数
我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有
第25百分位数,第75百分位数.这三个分位数把一组由小到大徘列后的数据分成四等份,因此称为四分位
数.
4、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数;将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平
均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:〃个样本数据%,仁的平均数为嚏=%+叔+…,反应一组数据的平均水平,公式
n
变形:为为=疝.
r=l
5、标准差和方差
(1)定义
①标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.假设样本数据是内,占,…,天,
;表示这组数据的平均数,则标准差S=。[(K-7)2+(勺一;)2+…+(/-亍].
②方差:方差就是标准差的平方,即.”=匕(芭-]+(々-]+…+(.4)2].显然,在刻画样本数据
n
的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(2)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越
大:标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
(3)平均数、方差的性质
如果数据中七….…,怎的平均数为"方差为果,那么
①一组新数据玉+b,x2+b,xn+。的平均数为x+0,方差是『.
②一组新数据叼,ar,,……《与的平均数为",方差是,人2.
③一组新数据+b,ax=+b,,axlt+。的平均数为+〃,方差是.
知识点三、变量间的相关关系
1、变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于
相关关系的不确定性,在寻找变品之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收
集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.
注意:相关关系与函数关系是不同的.相关关系是一种非确定的关系.函数关系是一种确定的关系.
而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.
2、散点图
将样本中的〃个数据点(%,H)(i=L2,…描在平面直角坐标系中,所得图形叫做散点图.根据散点图
中点的分布可以直观地判断两个变量之间的关系.
(I)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它
称为正相关,如图(I)所示;
(2)如果散点图中的点散布在从左上角到右卜角的区域内,对于两个变量的这种相关关系,我们将它
称为负相关,如图(2)所示.
3、相关系数
若相应于变量x的取值吞,变量),的观测值为y(l工区〃),则变量不与),的相关系数
£(若7)(y一),)
i=l通常用,•来衡量x与),之间的线性关系的强弱,「
的范围为-1W/W1.
(I)当厂>0时,表示两个变量正相关;当厂V。时,表示两个变量负相关.
(2)卜|越接近i,表示两个变量的线性相关性越强;卜|越接近o,表示两个变量间几乎不存在线性相
关关系.当仍=1时,所有数据点都在一条直线上.
(3)通常当上|>0.75时,认为两个变量具有很强的线性相关关系.
知识点四、线性回归
1、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(xi,yi),(X2,力),…,(为”)%),其回归方程),=云+。的求法为
-幻(》-y)工七%~nxy
-----—=-4.....—
£(内-X)2
1-1J-I
a=y-bx
-i«—।"--
其中,x=—Yxy,y=-y>,.,(x,y)称为样本点的中心.
2、残差分析
对于预报变量y,通过观测得到的数据称为观测值月,通过回归方程得到的y称为预测俏,观测值减
去预测值等于残差,4称为相应于点(4上)的残差,即有4力.残差是随机误差的估计结果,通过对
残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差
分析.
(1)残差图
通过残差分析,残差点(知e)比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这
样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和。=才匹-%)2分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;
反之,不合适.
(3)相关指数
.(V,-y.)2
用相关指数来刻画回归的效果,其计算公式是:R2=>4
Z(x-y)2
r=1
R2越接近于1,说明残差的平方和越小,也表示回归的效果越好.
知识点五、非线性回归
解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线
性回归方程化归转化为我们熟悉的线性回归方程.
求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原
后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.
1、建立非线性回归模型的基本步骤:
(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它切之间的关系(是否存在非线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二
次函数、指数函数、对数函数、基函数模型等);
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程:
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常:则检查数据是否有误,或模型是否合适等.
知识点六、独立性检验
1、分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2x2列联表.
一般地,假设有两个分类变量X和K它们的取值分别为{.对,%2}和{),1,),2},其样本频数列联表(称
为2x2列联表)为
X力总计
aba+b
X2Cdc+d
总计a+cb+dci+b+c+d
从2x2列表中,依据,一与,的值可直观得出结论:两个变量是否有关系.
a+bc+d
2、等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示
列联表数据的频率特征.
(2)观察等高条形图发现,一与‘一相差很大,就判断两个分类变量之间有关系.
a+bc+d
3、独立性检验
(1)定义:利用独立性假设、随机变量K?来确定是否有一定把握认为“两个分类变量有关系”的方法
称为两个分类变量的独立性检验.
⑵公式:六=(〃+〃)(;:£“〃十万其中〃一+〃+c+d为样本容量.
(3)独立性检验的具体步骤如下:
①计算随机变量片的观测值3查下表确定临界值即:
0.50.400.250.150.100.050.0250.0100.0050.001
k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828
②如果8之及,就推断“x与y有关系”,这种推断犯错误的概率不超过〃(K?2%);否则,就认为在犯
错误的概率不超过〃(代>人))的前提下不能推断“x与y有关系
(2)两个分类变量x和y是否有关系的判断标准:
统计学研究表明:
当K?43.841时,认为X与y无关;
当六>3.841时,有95/的把握说X与y有关;
当六>6.635时,有99/的把握说X与丫有关;
当K?>10.828时,有99.9/的把握说X与丫有关.
,常用
常见的非线性回归模型
(I)指数函数型),=c4(〃>0且c>0)
两边取自然对数,ln.y=ln,rv),即1”=Inc+xln”,
令,,原方程变为}J=lnc+x'lna,然后按线性回归模型求出Ina,Inc.
x=x
(2)对数函数型y=Z?lnx+a
令卜V:=:,原方程变为y'=/M+a,然后按线性回归模型求出力,a.
x-Inx
(3)幕函数型y=ar"
两边取常用对数,lgy=1g(«x"),即Igy=〃lgx+lgo,
令,原方程变为/=心'+馆。,然后按线性回归模型求出〃,Iga.
"=lgx
(4)二次函数型),=bY+a
令[):=);,原方程变为y=然后按线性回归模型求出人,”•
X=x
(5)反比例函数型y=a+&型
x
y'=y
令1,原方程变为),'=公'+〃,然后按线性回归模型求出b,a.
x=—
经典题型练
经典题型一:随机抽样、分层抽样
1.(2022•全国-高三专题练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零
件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中
笫5行第6列开始向右读取数据,则得到的第6个样本编号是1)
32211834297864540732524206443812234356773578905642
84421253313457860736253007328623457889072368960804
32567808436789535577348994837522535578324577892345
A.623B.328C.253D.007
2.(2022•全国•高三专题练习)有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中随机
抽取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是()
A.总体是36个篮球B.样本是4个篮球
C.样本容量是4D.每个篮球被抽到的可能性不同
3.(2022•上海宝山•高三阶段练习)某个年级有男生180人,女生16。人,用分层抽样的方法从该年级
全体学生中抽取一个容审为68的样本,则此样本中女生人数为()
A.40B.36C.34D.32
4.(2022•江西•赣源中学高三阶段练习(文))2022年7月24日,搭载向天实验舱的长征五号4遥三运载
火箭,在我国文昌航天发射场成功发射,我国的航天事业又上了一个新的台阶.某校现有高一学生HXX)人,
高一学生XOO人,高三学生1200人,为了调查该校学生对我国航天事业的了解程度,现从三个年级中采用分
层抽样的方式抽取60人填写问卷调查,则高三年级有多少人被抽中()
A.16B.18C.20D.24
5.(2022•上海静安•二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市
联合举行.共有3个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为2250人,延庆冬奥村的
容量约1440人,张家口冬奥村的容量约2610人.为了解各冬奥村服务质量,现共准备了140份调查问卷,采
用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是()
A.58份B.50份C.32份D.19份
6.(2022•全国•高三专题练习)利用简单随机抽样的方法,从〃个个体(〃:>13)中抽取13个个体,若第二
次抽取时,余下的每个个体被抽到的概率为;,则在整个抽样过程中,每个个体被抽到的可能性为
7.(2022•重庆南开中学高三阶段练习)某中学为了掌握学校员工身体状况,偶尔会采用抽检的方式来收
集各部门员工的健康情况.为了让样本更具有代表性,学校对各部门采用分层抽样的方法进行抽检.已知
该校部门A、部门3、部门。分别有40、60、80人,各部门员工不存在交叉任职情况,若共抽检了90人,
则部门A抽检人数为.
经典题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图
8.(2022•辽宁朝阳-高三阶段练习)某市教育局为得到高三年级学生身高的数据,对高三年级学生进行
抽样调查,随机抽取了1000名学生,他们的身高都在A,B,C,。,E五个层次内,分男、女生统计得
到以下样本分布统计图,则(〕
女生身高频率分布直方图
A.样本中A层次的女生比相应层次的男生人数多
B.估计样本中男生身高的中位数比女生身高的中位数大
C.。层次的女生和E层次的男生在整个样本中频率相等
D.样本中"层次的学生数和C层次的学生数一样多
9.(2022•黑龙江•佳木斯一中三模(理))如图I为某省2019年1~4月份快递业务量统计图,图2为该
省2019年1~4月份快递业务收入统计图,对统计图理解不正确的是()
A.2019年1〜4月份快递业务量3月份最高,2月份最低,差值接近2000万件
B.从1〜4月份来看,业务量与'M务收入有波动,但整体保持高速增长
C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致
D.2019年1〜4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关
10.(2022•湖北孝感•高三阶段练习)2021年7月至2022年7月,我国居民消费价格保持平检,居民消
费价格涨跌幅如图所示,则(
全国居民消费价格涨跌幅
备注:同比增长率二岂月消^工黑费价格X100%,环比增长率
当月消费价格-上月同期消费价格
=-------上月同期消费价格-------X1i0n°n%o/'
A.2022年1月全国居民消费价格比2021年1月全国居民消费为格有所下降
B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升
C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%
D.2021年10月至2022年7月全国居民消费价格环比增长率的平均数为0.25%
经典题型三:百分位数
11.(2022•福建省福州华侨中学高三阶段练习)某读书会有5名成员,寒假期间他们每个人阅读的节本数
分别如下:3,5,4,2,I,则这组数据的60%分位数为()
A.3B.3.5C.4D.4.5
12.(2022•山东潍坊•高三阶段练习)从2,3,4,5,6,7,8,9中随机取两个数,这两个数一个比加大,
一个比小小的概率为堤,已知机为上述数据中的A%分位数,则4的取值可能为()
14
A.50B.60C.70D.80
13.(2022•安徽•高三开学考试)学校组织班级知识竞赛,某班的8名学生的成绩(单位:分)分别是:68、
63、77、76、82、88、92、93,则这8名学生成绩的75%分位数是()
A.88分B.89分C.90分D.92分
14.(2022•全国•高三专题练习)如图一所示,某市5月1日至10HPM2.5的日均值(单位:pg/mD变化
15.(2022•湖北武汉•高三开学考试)某校高三数学备课组老师的年龄(单位:岁)分别为:28,29,42,
32,41,56,45.48,55,59,则这组数据的第80百分位数为()
A.54.5B.55C.55.5D.56
经典题型四:样本的数字特征
16.(2022•河南•郑州四中高三阶段练习(文))运动员甲10次射击成绩(单位:环)如下:7,8,9,7,
4,8,9,9,7,2,则下列关于这组数据说法不正确的是().
A.众数为7和9B.平均数为7
C.中位数为7D.方差为/=4.8
17.(2022•全国•高三专题练习)在2022北京冬奥会单板滑雪U型场地技巧比赛中,6名评委给A选手
打出了6个各不相同的原始分,经过“去掉其中一个最高分和一个最低分''处理后,得到4个有效分.则经处
理后的4个有效分与6个原始分相比,一定会变小的数字特征是()
A.平均数B.中位数C.众数D.方差
18.(2022•江苏•南京市天印高级中学模拟预测)在发生某公共卫生事件期间,我国有关机构规定:该事
件在一段时间没有发生规模群体感染的标志为“连续10天每天新增加疑似病例不超过7人”.根据过去10天甲
、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()
A.甲地总体均值为3,中位数为4
B.乙地总体平均数为1,总体方差大于0;
C.丙地总体均值为2,总体方差为3
D.丁地中位数为3,众数为3
19.(2022•浙江•高三开学考试)某学校食堂为了解学生对食堂的满意度,从高一、高二两个年级分别随
机调查了10()名学生,根据学生对食堂的满意度评分,分别得到高一和高二学生满意度评分的频率分布直
若高一和高二学生的满意度评分中位数分别为小士,平均数分别为X,%,则()
A.x}>x2,yx>y2B.玉>%,y<y2
c.X.<A-2OI<y2D.X,>y2
20.(2022•全国•高三专题练习)为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展“学
习强国”知识测试,从全体测试人员中随机抽取了一部分人的测试成绩,得到频率分布直方图如图所示.假设
同组中的每个数据都用该组区间的中点值代替,则估计这部分人的测试成绩的平均数和中位数分别是()
A.85,87.5B.86.75,86.67C.86.75,85D.85,85
21.(2022•全国•高三阶段练习(理))某组样本数据的平方和+x:=160,平均数元=5,
则该组数据的方差/=()
35
A.1B.C.2D.
23
22.(2022•广东佛山•高三阶段练习)已知一组数据、,与,工3,%的平均数是3,方差是2,则由
1,2』-5,2々-5,2当-5,2七-5这5个数据组成的新的一组数据的方差是()
A.4B.6C.——D.—
55
23.(2022•四川省成都市第八中学校高三阶段练习(理))某班统计一次数学测验成绩的平均分与方差,
计算完毕才发现有个同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为s。新平均分
和新方差分别为京,小,若此同学的得分恰好为7,则()
A.X=X[,S2=s:B.x=Xi>$2<s;
c.X=r>5|D.$2=s:
24.(2022•全国•高三专题练习(文))某家庭记录了未使用节水龙头50天的日用水量数据(单位:„?)
和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,04)[0.4,0.51[0.5,0.6)[0.6,0.7]
频数3249265
日用水量[0,0.1)[0.1,0.2)[0.2,03)[03,0.4)[04,0.5)[0.5,0.6)
频数151310165
使用了节水龙头50天的日用水量频数分布表
(1)在图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)沽计该家庭使用节水龙头后,日用水量小于O.3n?的概率:
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所
在区间中点的值作代表.)
25.(2022•重庆十八中两江实验中学高三阶段练习)2022年3月5日,第十三屈全国人民代表大会第五次
会议在北京人民大会堂开幕,会议报告指出,2021年,国内生产总值和居民人均可支配收入明显增长.某
地为了解居民可支配收入情况,随机抽取100人,经统计,这100人去年可支配收入(单位:万元)均在区
间[4.5,105]内,按[4.5,5.5),[5.5,6.5),[6,5,7.5),[7.5,8.5),[8,5,9.5),[9.5,10.5]分成6组,频率分布直
(1)求。力的值,并估计这100位居民可支配收入的平均值(同一组中的数据用该组区间的中点值作代表);
(2)用样本的频率估计概率,从该地居民中抽取甲、乙、丙3人,若每次抽取的结果互不影响,求抽取的3人
中至少有两人去年可支配收入在[7.5,8.5)内的概率.
26.(2022•全国•高三专题练习)某中学高三年级有400名学生参加月考,用简单随机抽样的方法抽取了
•个容量为50的样本,得到数学成绩的频率分布直方图如图所示.
100110120130140150成绩/分
⑴求第四个小矩形的高;
(2)估算样本的众数、中位数和平均数.
27.(2022•北京市第一零九中学高三阶段练习)北京市某区针对高三年级的一次测试做调研分析,随机抽
取同时选考物理、化学的学生330名,下表是物理、化学成绩等级和人数的数据分布情况:
物理成绩等级ABC
化学成绩等级ABCABCABC
人数(名)11053255701531210
(1)从该区高三年级同时选考物理、化学的学生中随机抽取1人,已知该生的物理成绩等级为A,估计该生的
化学成绩等级为A的概率;
(2)从该区高三年级同时选考物理、化学的学生中随机抽取2人,以X表示这2人中物理、化学成绩等级均为
A的人数,求X的分布列和数学期望(以上表中物理、化学成绩等级均为A的频率作为每名学生物理、化学
成绩等级均为A的概率);
(3)汜抽取的330名学生在这次考试中数学成绩(满分15。分)的方差为卡,排名前50%的成绩方差为s:,
排名后50%的成绩方差为sj,则*不可能同时大于s:和耳,这种判断是否正确,并说明理由.
28.(2022•重庆•高三阶段练习)重庆轨道交通9号线一期己于今年1月25日开通运营,全长32.29公里,
从高滩岩站至兴科大道站一路经过23座车站.沙坪坝站是目前客流量最大的站点,某数学兴趣小组在沙坪
坝站作乘客流量来源地相关调查,从上车人群中随机选取了100名乘客,记录了他们从来源地到沙坪坝站所
花费时间/,得到下表:
时间,(min)[0,6)[6,0[12,18)[18,24)[24,30)[30,36)
人数(人)630351784
(1)从在沙坪坝站上车的乘客中任选•人,估计该乘客花费时间/小于18min的概率;
(2)估计所有在沙坪坝站上车的乘客花费时间/的中位数;
⑶已知,«0,6)的6人,其平均数和方差分别为5,1.5;12)的30人,其平均数和方差分别为8,9,
计算样本数据中fw[0,⑵的平均数和方差.
经典题型五:变量间的相关关系
29.(2022•四川省仁寿县文宫中学高三阶段练习(理))对于x,两变量,有四组样本数据,分别算出它
们的线性相关系数〃(如下),则线性相关性最强的是()
A.-0.82B.0.78C.-0.69D.0.87
30.(2022•上海嘉定・高三阶段练习)通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便
利店购买冷饮的人数的相关系数很高,甲认为这是巧合,两者其实没有关系:乙认为冷饮的某种摄入成分
导致了疾病;丙认为病人对冷饮会有特别需求:丁认为两者的相关关系是存在的,但不能视为因果,请判
断哪位成员的意见最可能成立()
A.甲B.乙C.丙D.T
31.(2022•四川•成都七中高三阶段练习(理))某统计部门对四组数据进行统计分析后,获得如图所示
的散点图.
3535
3030
2525
2020
1515
1010
55
0
v51015202530355101520253035
相关系数为〃相关系数为,2
3535
3030
2525
2020
1515
1010
55
0
51015202530355101520253035
相关系数为勺相关系数为々
下面关于相关系数的比较,正确的是()
A.弓<4<今B.弓<9<4<勺C.与D.rA<r2<ry<rx
32.(2022•上海交大附中高三阶段练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有
所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽
样的方法抽取20个作为样区,调查得到样本数据a,y)(i=12、20),其中七和其分别表示第,•个样区的
2020
植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:头),并计算得2七=60,£另=1200,
f=11=1
£|卜-4~=80,白丫-可=9000,工(七-加'厂亍)=800.
i=l;=1i=l
⑴估计该地区这种野生动物的数量;
⑵求样本(M,yJ(i=l,2,,20)的相关系数.(精确到0.01)
33.(2022•陕西•宝鸡市陈仓高级中学高三开学考试(理))对两个变量x,y进行线性相关检验,得线性
相关系数々=0.8995,对两个变量〃,u进行线性相关检验,得线性相关系数/«2=-09568,则卜.列判断正确
的是()
A.变量x与3,正相关,变量〃与u负相关,变量x与y的线性相关性较强
B.变量x与),负相关,变量〃与u正相关,变量x与y的线性相关性较强
C.变量x与),正相关,变量〃与u负相关,变量〃与-的线性相关性较强
D.变量x与),负相关,变量〃与v正相关,变量〃与I,的线性相关性较强
34.(2022•仝国•高三专题练习)甲、乙、丙、丁四位同学各自对工),两变量的线性相关性做试验,分别求得
样本相关系数,,如下表:
甲乙内T
r0.20-0.95-0.120.85
则试验结果中K)'两变量有更强线性相关性的是()
A.甲B.乙C.丙D.T
35.(2U22•全国•高二专题练习)近五年来某草场羊只数量与草地植被指数两变量间的关系如表所示,绘
制相应的散点图,如图所示:
年份12345
羊只数量/万只1.40.90.750.60.3
草地植被指数1.14.315.631.349.7
草地植被指数
60
50
40
30
20
10
O0.51L5羊只数出/万只
根据表及图得到以下判断:①羊只数量与草地植被指数成减函数关系;②若利用这五组数据得到的两变量
间的相关系数为人去掉第一年数据后得到的相关系数为弓,则用<同;③可以利用回归直线方程,准确地
得到当羊只数量为2万只时的草地植被指数.以上判断中正确的个数是
经典题型六:线性回归
36.(2022•河南安阳•高三阶段练习(文))某学习小组用计算机软件对一组数据(4y)(i=l,2,3,…,8)进
行I可归分析,甲同学首先求出回归直线方程),=2x+5,样本点的中心为(2,〃?).乙同学对甲的计算过程进行
检查,发现甲将数据(3,7)误输成|:7,3),数据(4,6)误输成(4,-6),将这两个数据修正后得到回归直线方程
9
=H+则实数上()
8「510C13
A.-B.—C.—D.—
5333
37.(2022•河南•商丘市第一高级中学高三开学考试(文))己知具有线性相关关系的变量乂y,设其样
1010
本点为4(4£)(i=l,2,3,10),回归直线方程为y=2x+a,若»>,=30,则〃=()
/=1;=1
A.40B.-17C.-170D.4
38.(2022•江西•高三开学考试(文))新能源汽车的核心部件是动力电池,电池成本占了新能源整车成
本很大的比例,从2022年年初开始,生产电池的某种有色金属的价格一路水涨船高.下表是2022年前5
个月我国某电池企业采购的该有色金属价格y(单位:千元/kg)与月份工的统计数据.
X12345
y1.73.04.46.07.4
已知y与x之间满足线性相关关系,且§=加+>由此方程预测到x=6时,尸8.82,贝山=()
A.1.38B.1.40C.1.42D.1.44
39.(2022•江苏镇江•高三开学考试)新能源汽车的核心部件是动力电池,碳酸锂是动力电池的主要成分,
从2021年底开始,碳酸钾的价格一直升高,下表是2022年我国某企业前5个月购买碳酸锂价格与月份的
统计数据.由下表可知其线性回归方程为»=Q28X+0.16,
月份代码x12345
碳酸锂价格y0.5a11.21.5
则表中"的值为()
A.0.5B.0.6C.0.7D.0.8
40.(2022•全国•模拟预测(文))2020年,国庆“遇上”中秋,中国人把这个“超长黄金周”过出了年味.假
期期间,全国各大旅游景点、车站、机场人头攒动的景象也吸引了世界的目光.外国媒体、专家和网友”实名
羡慕“,这一派热闹景象证明了抗疫的成功,也展示了中国经济复苏的劲头.抗疫的成功离不开国家强大的医
疗卫生体系,下表是某省2013年至2019年医疗卫生机构数y(单位:万个):
年份2013201420152016201720182019
年份代号/1234567
医疗卫生机构数4.24.34.54.74.84.84.9
(1)求关于/的线性回归方程丁=百+。(4,/;保留两位小数):
(2)规定若某年的实际医疗卫生机构数与估计值的差的绝对值不超过500个,则称该年是“吻合”年.利川(1)
的结果,假设2020年该省医疗卫生机构数的估计值为实际值,现从2013年至2020年这8年中任选3年,
其中“吻合”年的个数为X,求XI内分布列与数学期望.
参考数据:=132.2,7=4.5.
/=1
.—T
参考公式:线性回归方程),二初+“中斜率和撤距的最小二乘估L公式分别为:b=『----;—,
Z")一
/=1
a=y-bt.
41.(2022•贵州•高三阶段练习(理))某电商平台统计了其牌下一家专营店在2022年3月至7月的营业
收入〉’(单位:万),得到以下数据:
月份X34567
营业收入)'1012111220
(1)依据表中给出的数据,是否可用线性回归模型拟合y与工的关系?请计算相关系数r并加以说明(计算结
果精确到0.01);(若卜|20.75,则线性相关程度很高,可用线性|可归模型拟合)
(2)试用最小二乘法求出营业收入y与月份工的回归方程,并预测当48时该专营店的营业收入.
参考公式:相关系数「=7券-------:---------■,参考数据:>/10«3.162,线性回归方程;y=bx+a,其
历—)》(另-到2
Vr=11=1
♦一,)①-刃立出-疝.反
中人口----------=号---------,a=y-bx
£(怎-『)2力”位2
r=1i=1
42.(2022•江苏南京•高三阶段练习)笫五代移动通信技术(简称5G)是具有高速率、低时延和大连接
特点的新一代宽带移动通信技术,它具有更高的速率、更宽的帝宽、更高的可靠性、更低的时延等特征,
能够满足未来虚拟现实、超高清视频、智能制造、自动驾驶等用户和行业的应用需求.某机构统计了
人民CQ方尸共6家公司在5G通信技术上的投入x(千万元)与收益V(千万元)的数据,如下表:
投入X(千万元)578101113
收益y(千万元)111516222531
(1)若X与丁之间线性相关,求y关于X的线性回归方程.并估计若投入15千万元,收益大约为多少千万元?
(精确到0.01)
⑵现6家公司各派出一名代表参加某项宣传活动,该活动在甲,乙两个城市同时进行,6名代表通过抛掷一
枚质地均匀的骰子决定自己去哪个城市参加活动,规定:每人只抛掷一次,掷出正面向上的点数为135,6的
去甲城市,掷出正面向上的点数为2.4的去乙城市.求:
①A公司派出的代表去甲城市参加活动的概率:
②求6位代表中去甲城市的人数少于去乙城市的人数的概率.(用最简分数作答)
6用£(%-可(乂-为__
参考数据及公式:2七丫二1186,$=咛--------=J------------,a=^-bx
£片_欣2£(匕-寸
;=|1=1
43.(2022•全国•高三专题练习)随着时代的不断发展,社会对高素质人才的需求不断扩大,我国本科毕
业生中考研人数也不断攀升,2020年的考研人数是341万人,2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年冻品商场专柜租赁合同3篇
- 2024年度版权质押合同:涉及某影视作品的版权质押及贷款事宜3篇
- 2024专属房产交易中介合同
- 2024年度蜂蜜产业绿色发展合同3篇
- 2024年专业短途货物运输协议模板一
- 丧葬用品订货合同
- 2024年度供应商战略合作协议模板版B版
- 旅游地产交易合同模板
- 石油化工区外保温施工合同
- 赠与房产继承协议
- 量子计算与区块链
- 食品质量安全法律法规培训
- 国开2024年秋《休闲农业概论》形考任务1-4答案
- 2024年教师资格考试高级中学面试生物试题与参考答案
- 年终总结数据对比分析图表
- 2024-2025学年统编版初二上学期期末历史试卷及答案指导
- 一对一教学管理制度
- 一年级数学计算题专项练习1000题集锦
- 2024年2024年离婚协议书模板电子版
- 意义生活:符号学导论学习通超星期末考试答案章节答案2024年
- 人教版数学八年级上册 期末复习专项练习题(选择+填空)(含简单答案)
评论
0/150
提交评论