




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第02讲成对数据的统计分析
目录
01模拟基础练..................................................................2
题型一:变量间的相关关系.......................................................2
题型二:一元线性回归模型.......................................................3
题型三:非线性回归.............................................................5
题型四:列联表与独立性检验.....................................................7
题型五:误差分析..............................................................10
02重难创新练.................................................................13
03真题实战练.................................................................21
楞阳其础结:
II
题型一:变量间的相关关系
1.对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是()
35
3035
2530
2025
1520
1015
510
05
51015202530355101520253035
相关系数为八相关系数为七
3535
3030
2525
2020
1515
1010
55
51015202530355101520253035
相关系数为厂3相关系数为々
A.Q<0<A]<r3B.&v〃vOvq"
C.G<〃V0V《〈GD.r^<r2vOv4<rx
2.(2024.上海.三模)上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制
了如下的散点图,则下述大小关系正确的为().
-------------------->----------------------
相关系数八相关系数万X°相关系数八
>r>r弓
A.n23B.C.rx>r3>r2D.>4"
3.观察下列散点图,其中两个变量的相关关系判断正确的是()
埠•
35-3535-•
30-•…30-••:30-.
25-•:二.25-•:25•:.•••>
20-••2020-***-
15-1515-:・
io-••1010-•••
5•,55•]
~O5101520253035xO5101520253035x-05101520253035*
ab
A.。为正相关,。为负相关,c为不相关B.a为负相关,6为不相关,c为正相关
C.a为负相关,6为正相关,c为不相关D.a为正相关,6为不相关,c为负相关
4.(2024・四川凉山•三模)调查某校高三学生的身高X和体重y得到如图所示散点图,其中身高X和体重》
相关系数r=0.8255,则下列说法正确的是()
体重什
°身高x
A.学生身高和体重没有相关性
B.学生身高和体重呈正相关
C.学生身高和体重呈负相关
D.若从样本中抽取一部分,则这部分的相关系数一定是Q8255
题型二:一元线性回归模型
5.在2024年8月8日召开的中国操作系统产业大会上,国产操作系统银河麒麟发布了首个人工智能版本,
该系统通过多项技术创新实现了人工智能与操作系统的深度融合,可广泛应用于自动驾驶、医疗健康、教育
等多个领域,标志着中国在自主操作系统领域实现新突破.某新能源车企采用随机调查的方式并统计发现市
面上可以实现自动驾驶的新能源汽车上可为乘客提供的功能数目,与汽车上所安装的人工智能芯片个数二
线性相关,且根据样本点(3)«=1,2,3,4,5)求得的回归直线方程为夕=3+4,若(5,2)在回归直线上,则
4
=•
Z=1
6.(2024•江西•一模)已知变量y与x线性相关,由样本点(号》)(%=k=1,2,3,4,5)求得的回归方程为
y=-x+a,若点(七,%)在回归直线上,且%=2,元=3,贝Z%=________.
3z=i
7.题图所示是某地2014年至2020年生活垃圾无害化处理量(单位:万吨)的折线图.
注:年份代码1〜7分别对应年份2014~2020.
(1)由折线图看出,可用线性回归模型拟合y与f的关系,请用相关系数加以证明;
(2)建立y关于f的回归方程(系数精确到0.01),预测2022年某地生活垃圾无害化处理量.
附注:
77n_—
参考数据:EX-=9.32,1>%=40.17£(%_y)2=0.55,夕=2.646.
i=li=l\i=i
参考公式:相关系数r=I「一"_,回归方程5-&+R中斜率和截距的最小二乘法估计公式分
Vi=ii=i
-Z4-,)(%-,)_
别为g=上匕---------,a=y-bt.
如-疔
Z=1
8.(2024.高三.重庆・开学考试)传统燃油汽车与新能源汽车相比,有着明显的缺点:如传统燃油汽车在行
驶过程中会产生尾气排放和噪音污染,环保性能较差、能源效力较低等我国近几年着重强调可持续发展,
加大在新能源项目的支持力度,积极推动新能源汽车产业迅速发展某汽车制造企业对某地区新能源汽车的
销售情况进行调查,得到下面的统计表.
年份t20192020202120222023
年份代码x(x=f-2018)12345
销量y(万辆)1113182127
(1)统计表明销量y与年份代码x有较强的线性相关关系,求y关于x的线性同归方程,并预测该地区新能源
汽车的销量最早在哪一年能突破50万辆;
(2)该企业随机调查了该地区2023年的购车情况.据调查,该地区2023年购置新能源汽车与传统燃油汽车
的人数的比例大约为1:3.从被调查的2023年所有车主中按分层抽样抽取12人,再从12人中随机抽取3
人,记这3人中购置新能源汽车的人数为X,求X的分布列和期望.
参考公式:
对于一组数据(乙,%)(〃=1,2,3,,〃),其回归直线夕=放+近中斜率和截距的最小二乘估计公式分别为:
〃__
人2(占一元)(%一歹)Z玉乂一〃孙人
b=--------------=-.........,a=y-bx.
豆(乙-丁)2-应2
Z=1Z=1
题型三:非线性回归
9.(2024・四川内江•模拟预测)当前,人工智能技术以前所未有的速度迅猛发展,并逐步影响生活的方方
面面,人工智能被认为是推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司在这个领域逐
年加大投入,以下是近年来该公司对产品研发年投入额x(单位:百万元)与其年销售量y(单位:千件)
的数据统计表.
X(百万)12345
y(千件)0.511.535.5
(1)若该公司科研团队计划用方案①y=bx+a作为年销售量y关于年投资额x的回归分
析模型,请根据统计表的数据及参考公式,确定该经验回归方程;
(2)若该公司科研团队计划用方案②夕=作为年销售量y关于年投资额'的回归分析模型,
5
05127
J=e-^-的残差平方和EG,-%)?=01122,请根据统计表的数据及参考公式,比较两种模型的拟合效
Z=1
果哪种更好?并选择拟合精度更高的模型,预测年投入额为6百万元时,产品的销售量约为多少?(计算
结果保留到小数点后两位)
J(x,.-x)(x--7)Yx-y--nxyi(x--x-)2
参考公式及数据:b=-----------=---------,a=y-bx,R2=l-墨-------------,e2-27,9.68,e2-28«9.78
之(X厂可232比2£(%-寸
i=li=li=l
10.红铃虫是棉花的主要害虫之一,能对农作物造成严重伤害.每只红铃虫的平均产卵数y(个)和平均温
度工(℃)有关,现收集了7组数据,得到下面的散点图及一些统计量的值.
八产卵数
400-
350-.
300-
250-
200-
150-
100-•
50-■•
*
Q叭•]・I----1----1----1----1----1----1_>
口202224262830323436温度
(1)根据散点图判断,,=以+。与>=。*(其中e为自然对数的底数)哪一个更适合作为平均产卵数y(个)
关于平均温度工(℃)的回归方程类型?(给出判断即可,不必说明理由)并由判断结果及表中数据,求出,
关于x的回归方程;
附:回归方程y=bx+a中,b=
,(西-尤)2
i=l
参考数据(z=lny)
77__7__
()()()(,)
Z%-xy,-yZx,-xz-zXyz
i=\Z=1Z=1
52152347.333.62781.33.6
(2)现在有10根棉花纤维,其中有6根为长纤维,4根为短纤维,从中随机抽取3根棉花纤维,设抽到的长
纤维棉花的根数为X,求X的分布列.
11.(2024・山东济南.三模)近年来,我国众多新能源汽车制造企业迅速崛起.某企业着力推进技术革新,
利润稳步提高.统计该企业2019年至2023年的利润(单位:亿元),得到如图所示的散点图.其中2019
年至2023年对应的年份代码依次为1,2,3,4,5.
俨润兴亿元)
100
90•
80•
75•••
70
______।1__i।1___A
012345年份代码x
⑴根据散点图判断,>=。+取和y=c+滤哪一个适宜作为企业利润y(单位:亿元)关于年份代码X的回
归方程类型?(给出判断即可,不必说明理由)
⑵根据(1)中的判断结果,建立了关于X的回归方程;
⑶根据(2)的结果,估计2024年的企业利润.
参考公式及数据;
“__
八Zx/fxy
B=R-----,a=y-bx,
-nx
i=i
i=li=li=li=ii=l
£X;=55,=979,Zy,=390,f%%=1221,Zx/y,=4607.9
55555
题型四:列联表与独立性检验
12.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中新增了一项登山
活动,并对“学生喜欢登山和性别是否有关”做了一次调查,其中被调查的男女生人数相同,得到如图所示的
等高条形统计图,则下列说法中正确的有.
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
男女
□不喜欢□喜欢
①被调查的学生中喜欢登山的男生人数比喜欢登山的女生人数多
②被调查的女生中喜欢登山的人数比不喜欢登山的人数多
③若被调查的男女生均为100人,则可以认为喜欢登山和性别有关
④无论被调查的男女生人数为多少,都可以认为喜欢登山和性别有关
13.观察下面频率等高条形图,其中两个分类变量x,y之间的随机变量炉的观测值最小的是()
14.为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠
体内,一段时间后测量小白鼠的某项指标值,按[0,20),[20,40),[40,60),[60,80),[80,100]分组,绘制频率分
布直方图如图所示.试验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只.假
设小白鼠注射疫苗后是否产生抗体相互独立.
(1)填写下面的2x2列联表,并根据列联表及a=0.01的独立性检验,判断能否认为注射疫苗后小白鼠产生
抗体与指标值不小于60有关;
单位:只
指标值
抗体合计
小于60不小于60
有抗体
没有抗体
合计
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫
苗,结果又有20只小白鼠产生抗体.
(i)用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率P;
(ii)以(i)中确定的概率尸作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记100个人注
射2次疫苗后产生抗体的数量为随机变量X.求E(X)及P(X=k)取最大值时的k值.
(a+b)M)(2c)e+d)(其中〃=a+>+c+d为样本容量)
参考公式:z2=
参考数据:
a0.1000.0500.0100.005
Xa2.7063.8416.6357.879
15.某市销售商为了解A、B两款手机的款式与购买者性别之间是否有关系,对一些购买者做了问卷调查,
得到2x2列联表如表所示:
购买A款购买8款总计
女252045
男154055
总计4060100
(1)根据小概率之值。=0。1的独立检验,能否认为购买手机款式与性别有关?
(2)用购买每款手机的频率估计一个顾客购买该款手机的概率,从所有购买两款手机的人中,选出3人作为
幸运顾客,记3人中购买A款手机的人数为X,求X的分布列与数学期望.
参考公式:r=--(其中=+).临界值表:
(a+b)(c吗+d)(产a+c)(b+小d)
a0.100.050.0100.0050.001
Xa2.7063.8416.6357.87910.828
16.树德中学为了调查中学生周末回家使用智能手机玩耍网络游戏情况,学校德育处随机选取高一年级中
的100名男同学和100名女同学进行无记名问卷调查.问卷调查中设置了两个问题:①你是否为男生?②你是
否使用智能手机玩耍网络游戏?
调查分两个环节:
第一个环节:先确定回答哪一个问题,让被调查的200名同学从装有3个白球,3个黑球(除颜色外完全相
同)的袋子中随机摸取两个球,摸到同色两球的学生如实回答第一个问题,摸到异色两球的学生如实回答第
二个问题;
第二个环节:再填写问卷(只填“是"与"否”).
回收全部问卷,经统计问卷中共有70张答案为“是”.
(1)根据以上的调查结果,利用你所学的知识,估计该校中学生使用智能手机玩耍网络游戏的概率;
(2)据核查以上的200名学生中有30名男学生使用智能手机玩耍网络游戏,按照(1)中的概率计算,依据小概
率值a=0.15的独立性检验,能否认为中学生使用智能手机玩耍网络游戏与性别有关联;若有关联,请解释
所得结论的实际含义.
参考公式和数据如下:比2=--------、八ad、Jc)------,〃=a+b+c+d.
[a+b)[c+d)[a+c)[b+d)
a0.150.100.050.0250.005
xa2.0722.7063.8415.0247.879
题型五:误差分析
17.在建立两个变量y与X的回归模型时,分别选择了4个不同的模型,模型1、2、3、4的决定系数尺2依
次为0.20,0.48,0.96,0.85,则其中拟合效果最好的模型是()
A.模型1B.模型2C.模型3D.模型4
18.已知一系列样本点(4%我=1,2,3,)的一个经验回归方程为亍=2x+6,若样本点(1,-1)的残差为2,
则6=().
A.-1B.1C.-5D.5
19.(2024.广西贵港.模拟预测)下列说法中错误的是()
A.独立性检验的本质是比较观测值与期望值之间的差异
B.两个变量x,y的相关系数为「,若卜|越接近1,则x与y之间的线性相关程度越强
C.若一组样本数据(岑M)(?=l,2,3,...,n)的样本点都在直线y=0.98x+3上,则这组数据的相关系数
r为0.98
D.由一组样本数据(%,%)=求得的回归直线方程为y=o.98x+3,设%=0.98%+3,则
E(x-z)2
----------<1
Eu-y)2
i=l
20.两个变量y与彳的回归模型中,分别选择了4个不同模型,它们的决定系数〃如下,其中拟合效果最
好的模型是()
A,模型1(决定系数衣2为0.97)B.模型2(决定系数衣2为0.85)
C.模型3(决定系数月为0.40)D.模型4(决定系数我为0.25)
21.(2024•山东•一模)相关变量的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根
据图中所有数据,得到线性回归方程、=白无+4,相关系数为G;方案二:剔除点(10,21),根据剩下数据得
到线性回归直线方程:y=b2x+a2,相关系数为々.则()
193
1
1*
51015x
A.
B.0</;</;<1
C.
D.-1<r2<rx<Q
22.(2024・四川•模拟预测)下表是某工厂记录的一个反应器投料后,连续8天每天某种气体的生成量(L):
日期代码X12345678
生成的气体y(L)481631517197122
为了分析该气体生成量变化趋势、工厂分另।用两种模型:①$=6/+。,②亍=公+。对变量x和y的关系进
行拟合,得到相应的回归方程并进行残差分析,残差图如下:
888
注:残差9=》-%:经计算得2(玉-可(%-田=728,2aH=42,Z(z/4%-刃=6868,
z=li=lz=l
8i8
±(z.-可=3570,其中z,=x;,
z=l3/=1
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)若在第8天要根据(2)问求出的回归方程来对该气体生成量做出预测,那么估计第9天该气体生成量是
多少?(精确到个位)
8
2(专---歹)
附:回归直线的斜率和截距的最小二乘估计公式分别为:♦=『-----------,a=y-bx.
1=1
23.(2024・河北唐山・三模)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与
某类商品销售额(单位:亿元)的10年数据如下表所示:
第几年12345678910
居民年收入X32.231.132.935.737.138.039.043.044.646.0
商品销售额y25.030.034.037.039.041.042.044.048.051.0
依据表格数据,得到1'面一些统计二I:的值.
1010
i=l9i=l9
(%一元)(x,-x)(y,.-y)
10\)io
1=1i=l
379.6391247.624568.9m
(1)根据表中数据,得到样本相关系数”095.以此推断,V与x的线性相关程度是否很强?
(2)根据统计量的值与样本相关系数y0.95,建立V关于x的经验回归方程(系数精确到0.01);
⑶根据(2)的经验回归方程,计算第1个样本点(32.2,25.0)对应的残差(精确到0.01);并判断若剔除这
个样本点再进行回归分析,B的值将变大还是变小?(不必说明理由,直接判断即可).
附:样本(x,,y)(i=l,2,川的相关系数I,
卒f毕f
A/2.297»1.516,b=-----------a=y—bx.
之(不一可2
Z=1
1.中华人民共和国体育代表团参加夏季奥运会以来,中国健儿们不断取得好成绩,到今天成长为体育大国,
从2000年以来,金牌情况统计如下(不含中国香港、中国台湾):
中国体育代表团夏季奥运会获得金牌数
届数第27届第28届第29届第30届第31届第32届
届数代码/123456
2000年2004年2008年2012年2016年2021年
地点
悉尼雅典北京伦敦里约热内卢东京
金牌数(y)283248382638
根据以上数据,建立y关于联的线性回归方程,若不考虑其他因素,根据回归方程预测第33届(2024年巴
黎奥运会)中国体育代表团金牌总数为()
66
(R0精确到0.01,金牌数精确到1,参考数据:£&-亍)(%-歹)=1L00,17.50);参考公式:
i=lZ=1
t(4-7)(%-歹)_
回归方程$=a+凉中斜率和截距的最小二乘估计公式分别为:b=上一----------石=y-bT.
Z=1
A.29B.33C.37D.45
2.某运动制衣品牌为了使成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:cm),
图①为选取的15名志愿者身高与臂展的折线图,图②为身高(x)与臂展(y)所对应的散点图,并求得其回归
直线方程为9=116%-30.75,则下列结论中不正确的为()
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者身高和臂展成正相关关系
C.可估计身高为190cm的人臂展大约为189.65cm
D.身高相差10cm的两人臂展都相差11.6cm
3.(2024・高三・上海・单元测试)下图是某地区2010年至2019年污染天数V(单位:天)与年份力的折线
图.根据2010年至2014年数据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模
A.&<耳<"B.4<&<62,bx<b3<b2
7Vzs人人ZX人
C.d2<d3<d19bx<b3<b2D.a2<a3<a{,b3<b2<bx
4.在研究变量x与y之间的相关关系时,进行实验后得到了一组样本数据(4,人),(范,兀),…,(无6,%),
(6,27),利用此样本数据求得的经验回归方程为亍=T.5x+4,现发现数据(6,27)误差较大,剔除这对数据
6
后,求得的经验回归方程为,=-6X+21,且»=36,贝!]&=()
Z=1
A.13.5B.14C.14.5D.15
5.(2024•湖南邵阳•三模)某学习小组对一组数据=1,2,3,,7)进行回归分析,甲同学首先求出回
归直线方程y=5x+4,样本点的中心为(2,加).乙同学对甲的计算过程进行检查,发现甲将数据(2,3)误输成
(3,2),将这两个数据修正后得到回归直线方程,=依+7,则实数左=()
6.为考察两个变量x,»的相关性,搜集数据如表,则两个变量的线性相关程度()
X510152025
y103105110111114
555
(参考数据:ZX;=1375,Zy;=59051,工%%=8285)
1=1i=li=l
A.很强B.很弱C.无相关D.不确定
7.(2024・高三.上海•课堂例题)为了调查各参赛人员对主办方的满意程度,研究人员随机抽取了500名参
赛运动员进行调查,所得数据如下表所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽
到对主办方表示满意的男性运动员的概率为;;②在犯错误的概率不超过1%的前提下可以认为“是否对主办
方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”;
则正确命题的个数为()
男性运动员(人)女性运动员(人)
对主办方表示满意200220
对主办方表示不满意5030
注:
p(x2*0.6000.0500.0100.001
k2.7063.8416.63510.828
A.0B.1C.2D.3
8.(2024•福建宁德•三模)2024海娱两岸各民族欢度“三月三”暨福籽同心爱中华,福建省第H^一届“三月三”
畲族文化节活动在宁德隆重开幕.海峡两岸各民族同胞齐聚于此,与当地群众共同欢庆“三月三”,畅叙两岸
情.在活动现场,为了解不同时段的入口游客人流量,从上午10点开始第一次向指挥中心反馈入口人流量,
以后每过一个小时反馈一次.指挥中心统计了前5次的数据(i,%),其中i=1,2,3,4.5,%为第7次入口人流量
数据(单位:百人),由此得到'关于z•的回归方程5>=力窄式/+1)+5.已知y=9,根据回归方程(参考数据:
log23al.6,log?5。2.3),可顶测下午4点时入口游客的人流量为()
A.9.6B.11.0C.11.3D.12.0
9.(多选题)现统计具有线性相关关系的变量X,匕Z的力组数据,如下表所示:
变量123n平均数方差
XA%九3XnX
Y10玉10x210x31。匕y*
zZiZ2Z3z〃zb;
并对它们进行相关性分析,得到z=2x+q,z与x的相关系数是:,z=&y+“2,z与丫的相关系数是弓,
则下列判断正确的是()
附:经验回归方程y=fec+a中斜率和截距的最小二乘估计公式分别为方=『-----------,a^-bx,
ZUR
i=l
-a-元)(y-9)
相关系数I.TI“■
归XT归…丫
A.y=10xB.b;=10b:
=r
C.bx=10b2D.h\
10.(多选题)(2024.高三.河北保定.开学考试)某机构抽样调查一批零件的尺寸%和质量y,得到样本数
据=1,2,3,,20),并计算得该批零件尺寸和质量的平均值分别为3和60,方差分别为4和400,且
t(x,一可(y-歹)
20
»>,%=4320.则()(参考公式:相关系数「=IJ」〃.回归直战的方程是:y=bx^a,
4=1£(%-元)26(%-y)2
Z=1Z=1
八£(x,.-x)(y,.-y).
其中心=上―----------,a=y-bx)
£(不一可2
i=\
A.样本数据的相关系数为养9
B.样本数据y关于X的经验回归方程为夕=9%+33
C.样本数据所得回归直线的残差平方和为0
D.若数据X,均满足正态分布,则估计P(x45)=P(y240)
11.(多选题)(2024.福建泉州.一模)为了研究青少年长时间玩手机与近视率的关系,现从某校随机抽查
600名学生,经调查,其中有40%的学生近视,有20%的学生每天玩手机超过1小时,玩手机超过1小时的
学生的近视率为50%.用频率估计概率,则()
n(ad-be)2.、
(附:/-------------------------,其中九=a+b+c+d.)
(a+b)(c+d)(a+c)(Z?+d)
a0.100.050.010.0050.001
Xa2.7063.8416.6357.87910.828
A.如果抽查的一名学生近视,则他每天玩手机超过1小时的概率为《
B.如果抽查的一名学生玩手机不超过1小时,则他近视的概率为根
C.根据小概率值。=0.05的独立性检验,可认为每天玩手机超过1小时会影响视力
D.从该校抽查10位学生,每天玩手机超过1小时且近视的人数的期望为5
12.随着工业化以及城市车辆的增加,城市的空气污染越来越严重,空气质量指数API一直居高不下,对
人体的呼吸系统造成了的严重的影响.现调查了某市500名居民的工作场所和呼吸系统健康状况,得到2x2
列联表如下,则/=.(结果精确到0.001)
室外工作室内工作总计
有呼吸系统疾病150
无呼吸系统疾病100
总计200
13.(2024・重庆•三模)对具有线性相关关系的变量有一组观测数据(4力(,=1,2...10),亍=5,了=7,
其经验回归方程y=-3.2%+a,则在样本点(3,2.9)处的残差为.
14.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家
号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额》(单位:
亿元)对年盈利额、(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近io年年研发资金
投入额占和年盈利额%的数据.通过对比分析,建立了两个函数模型:①好"/?/,②其中a,
0,九,/均为常数,e为自然对数的底数.令%=片,v,=lnX(z=l,2,-,10),经计算得如下数据:
10102
X其(乙-元)2£(x-y)uV
Z=1Z=1
262156526805.36
101010(v)210
方(%-盯£;-vEa-元)(匕一支)
/=1Z=1Z=1i=\
112501302.612
请从相关系数的角度分析,模型拟合程度更好是;利用模型拟合程度更好的模型以及表中数据,
建立y关于x的回归方程为;(系数精确到o.oi)
X(无,一无)(%一y)t(工-丁)(%-丁)
附:①相关系数厂=1广1“,回归直线?=g+Rx中:b=----------,a=y-bx
之(七一元了之(y,一歹>
Vi=li=lT
15.(2024.高三.上海.开学考试)为了缓解高三学生学业压力,学校开展健美操活动,高三某班文艺委员调
查班级学生是否愿意参加健美操,得到如下的2x2列联表.
性别愿意不愿意
男生610
女生186
(1)根据该2x2列联表,并依据显著水平«=0.05的独立性检验,判断能否认为“学生性别与是否愿意参加健
美操有关”;
(2)在愿意参加的所有学生中,根据性别,分层抽样选取8位学生组织班级健美操队,并从中随机选取2人
作为领队,记这2人中女生人数为随机变量X,求X的分布及期望©X].
附:尸(/223.841)a0.05.
16.(2024•高三.广西贵港•开学考试)为了研究学生的性别和是否喜欢跳绳的关联性,随机调查了某中学的
100名学生,整理得到如下列联表:
男学生女学生合计
喜欢跳绳353570
不喜欢跳绳102030
合计4555100
(1)依据。=0.1的独立性检验,能否认为学生的性别和是否喜欢跳绳有关联?
(2)已知该校学生每分钟的跳绳个数X~N(170』00),该校学生经过训练后,跳绳个数都有明显进步.假设经
过训练后每人每分钟的跳绳个数都增加10,该校有1000名学生,预估经过训练后该校每分钟的跳绳个数在
[170,200]内的人数(结果精确到整数).
n(ad-be)2
附:%2=7------------------------IT,其中H=a+b+c+d.
a0.10.050.01
Xa2.7063.8416.635
若X〜,贝ij—XV"+0.6827,P(〃一2b«X<//+2cr)«0.9545,
P(〃-3crWXW〃+3o■卜0.9973.
17.为了了解高中学生课后自主学习数学时间(无分钟/每天)和他们的数学成绩(y分)的关系,某实验小
组做了调查,得到一些数据(表一).
编号12345
学习时间无3040506070
数学成绩y65788599108
(1)求数学成绩、与学习时间x的相关系数(精确到o.ooi);
(2)请用相关系数说明该组数据中、与x之间的关系可用线性回归模型进行拟合,并求出、关于'的回归直线
方程,并由此预测每天课后自主学习数学时间为100分钟时的数学成绩(参考数据:
555
ZX,y=22820,3y=435,Z4=38999,107.42211540,%的方差为200).
Z=1Z=1Z=1
(3)基于上述调查,某校提倡学生周末在校自主学习.经过一学期的实施后,抽样调查了220位学生.按照是否
参与周末在校自主学习以及成绩是否有进步统计,得到2x2列联表(表二).依据表中数据及小概率值
«=0.001的独立性检验,分析“周末在校自主学习与成绩进步”是否有关.
没有进步有进步合计
参与周末在校自主学习35130165
未参与周末不在校自主学习253055
合计60160220
〃元)(3-9)
附:方差:$2=工£(々-可2相关系数:r=H.
”汩、忙(D》(一)2
Vi=li=l
力--元)(%-y)
回归方程y=bx+a中斜率和截距的最小二乘估计公式分别为3=上―-----------,a=y-bx,
£(占-下『
Z=1
2
2_n(ad-bc)
“(q+6)(<;+4(々+09+弓)
a0.100.050.0100.0050.001
2.7063.8416.6357.87910.828
18.(2024.河北秦皇岛.三模)将保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中15
个区域进行编号,统计抽取到的每个区域的某种水源指标x,和区域内该植物分布的数量%«=1,2,…,15),得
15_15_15__
到数组(4,').已知Z(x,-x)2=45,£(%-y)2=8000,^(x,.-x)(x-y)=480.
Z=1Z=11=1
⑴求样本(%,M(i=1,2,…,15)的样本相关系数;
(2)假设该植物的寿命为随机变量X(X可取任意正整数),研究人员统计大量数据后发现,对于任意的keN*,
寿命为人+1的样本在寿命超过上的样本里的数量占比与寿命为1的样本在全体样本中的数量占比相同,均为
0.1,这种现象被称为“几何分布的无记忆性”.
⑴求尸(X")化eN*)的表达式;
(ii)推导该植物寿命期望E(X)的值(用上表示,x取遍1,2,…,女),并求当上足够大时,E(X)的直
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖南省湘西土家族苗族自治州花垣县2025届四下数学期末调研模拟试题含解析
- 武昌职业学院《C4D动画综合》2023-2024学年第二学期期末试卷
- 中医健康养生知识科普讲座
- 上消化道病人出血护理
- 广告传媒行业报告模板
- 学校文化建设与文化管理-培训课件
- 2025房地产经纪人协理-《房地产经纪综合能力》考前通关必练题库-含答案
- 心理健康与养生
- 2024江苏省建设工程施工图设计审查技术问答(结构、勘察专业)
- 四上数学9.1 植树问题
- 个人汽车押车合同范本
- 第十二讲 建设社会主义生态文明PPT习概论2023优化版教学课件
- 吉塔行星模拟课程
- 献身国防事业志愿书,空军
- 广东省建筑施工安全管理资料统一用表2021年版(原文格式版)
- 【企业招聘管理研究国内外文献综述】
- 筒子形成及卷绕成型分析
- 五年级道德与法治下册作业设计优秀案例
- 社会工作师职业资格考试
- 风电工程建设标准强制性条文
- MT/T 240-1997煤矿降尘用喷嘴通用技术条件
评论
0/150
提交评论