2024年高考复习数学第9章第3节成对数据的统计分析_第1页
2024年高考复习数学第9章第3节成对数据的统计分析_第2页
2024年高考复习数学第9章第3节成对数据的统计分析_第3页
2024年高考复习数学第9章第3节成对数据的统计分析_第4页
2024年高考复习数学第9章第3节成对数据的统计分析_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三节成对数据的统计分析

考试要求:掌握散点图、最小二乘法思想、回归分析以及独立性检验.

-------※必备知识-回顾教材重“四基—

一、教材概念-结论-性质重现

1.相关关系

两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,

这种关系称为相关关系.

2.散点图

将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的

图形,这样的统计图叫做地在图.利用散点图,可以判断两个变量是否相关,相

关时是正相关还是负相关.

3.正相关和负相关

⑴正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈

现增加的趋势,我们就称这两个变量正相关.

⑵负相关:如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,

则称这两个变量质相关.

微提醒■■■

相关关系与函数关系的区别与联系

(1)相同点:两者均是指两个变量的关系.

(2)不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.

②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.

4.线性相关和非线性相关

⑴一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附

近,我们就称这两个变量线性相关.

(2)一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变

量非线性相关或曲线相关.

5.样本相关系数一

变量x和变量y的样本相关系数r的计算公式如下:「=

他尸[三)"自5T)2

微提醒■■■

(1)当,>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关;当广

=0时,称成对样本数据间没有线性相关关系.

⑵样本相关系数r的取值范围为[-1,1];当|r|越接近1时,成对样本数据的线

性相关程度越强;当仍越接近。时,成对样本数据的线性相关程度越弱.

6.一元线性回归模型

Y=h'Y-4-cip

我们称-,为丫关于x的一元线性回归模型,其中丫称为因变

(E(e)=0,D(e)=a2

量或响应变量,x称为自变量或解释变量;。和人为模型的未知参数,。称为截

距参数,〃称为斜率参数;e是丫与法+。之间的随机误差.

7.线性回归方程与最小二乘法

回归直线方程过样本点的中心(后刃,是回归直线方程最常用的一个特征.

我们将夕=以+8称为y关于工的经验回归方程,也称经验回归函数或经验回归

公式,其图形称为经验回蚪直线.这种求经验回归方程的方法叫做最小二乘法,

E(a-,-xXyi-y)Sx.y,~nxy

求得的6,6叫做〃,。的最小二乘估计,共中f2’

31,一】

a=ybx.

8.刻画回归效果的方式

(1)残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或

体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带

状区域内,带状区域越窄,则说明拟合效果越好.

(2)残差平方和法:残差平方和

。,厂%)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果

越差.

9.独立性检验

(1)临界值/统计量也可以用来作相关性的度量,片越小说明变量之间越独立,

片越大说明变量之间越相关,片=房鬻怒诉.忽略户的实际分布与该近

似分布的误差后,对于任何小概率值a,可以找到相应的正实数以,使得P(£2口)

=。成立,我们称此为a的临界值,这个临界值就可作为判断广大小的标准.

(2)基于概率值a的检验规则:

当炉2刈时,我们就推断从)不成立,即认为X和丫不独立,该推断犯错误的概

率不超过a;当时,我们没有充分证据推断法不成立,可以认为X和y

独立.

这种利用炉的取值推断分类变量X和y是否独立的方法称为X2独立性检验,读

作“卡方独立性检验”,简称独立性检验.

二、基本技能-思想-活动经验

1.判断下列说法的正误,对的画“J”,错的画“X”.

(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.

(J)

(2)通过经验回归方程夕=&+6可以估计预报变量的取值和变化趋势.(V)

(3)经验回归方程夕=提+6中,若4<0,则变量x和),负相关.(X)

(4)因为由任何一组观测值都可以求得一个经验回归方程,所以没有必要进行相

关性检验.(X)

2.(多选题)关于回归分析,下列说法正确的是()

A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量

唯一确定

B.线性相关系数可以是正的也可以是负的

C.在回归分析中,如果户=1或厂=±1,说明x与),之间完全线性相关

D.样本相关系数/•£(—1,1)

ABC解析:选项D中,样本的相关系数应满足一故D错误,ABC都

正确.

3.以下四幅散点图所对应的样本相关系数的大小关系是()

35

30

25

20

15

10

5

0

(1)样本相关系数为Q

5

0

5

0

5

0

5

0

O5

1015202530

(3)样本相关系数为〃

35

30

25

20

15

10

5\

0

05101520253035

(4)样本相关系数为匕

A.r\>n>n>r4B.r4>ry>n>r\

C.n>n>r4>r2D.r\>r2>r4>n

C解析:由散点图的特征可知,(1)(3)为正相关,(2)(4)为负相关,所以n>0,

/3>0,r2V0,r4<0.

又(1)(2)中的散点更为集中,更接近于一条直线,故f2<T4,

所以/^</-4<0<r3<n.

4.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计

人数后,得到如下列联表:

优秀及格合计

甲班113445

乙班83745

合计197190

则随机变量好的值约为()

A.0.600B.0.828

C.2.712D.6.004

A解析:根据列联表中的数据,可得f=-*8=0600.故选A.

5.若变量),与x的非线性回归方程是9=2或一1,则当夕的值为2时,x的估计

值为.

-解析:由24一1=2,得x=2,即x的估计值为3

444

--------、关键能力•研析考点强“四翼7----------------

考点1相关关系的判断—基础性

「多维训练」

1.有以下五组变量:

①某商品的销售价格与销售量;②学生的学籍号与学生的数学成绩;③坚持每天

吃早餐的人数与患胃病的人数;④气温与冷饮箱售量;⑤电瓶车的重量和行驶每

千米的耗电量.

其中两个变量成正相关的是()

A.①③B.②④

C.②⑤D.④⑤

D解析:对于①,一般情况下,某商品的销售价格与销售量成负相关关系;对

于②,学生的学籍号与学生的数学成绩没有相关关系;对于③,一般情况下,坚

持每天吃早餐的人数与患胃病的人数成负相关关系;对于④,一般情况下,气温

与冷饮销售量成正相关关系;对于⑤,一般情况下,电㈱车的重量和行驶每千米

的耗电量成正相关关系.综上所述,其中两个变量成正相关的序号是④⑤.

2.两个变星的相关关系有①正相关、②负相关、③不相关,则下列散点图从左

到右分别反映的变量间的相关关系是()

A.①②③B.②③①

C.②①③D.①③②

D解析:对于(1),图中的点成带状分布,且从左到右上升,是正相关关系;对

于(2),图中的点没有明显的带状分布,是不相关的;对于(3),图中的点成带状分

布,且从左到右是下降的,是负相关关系.

解题通法

忽视散点图的结构特点导致错误

(1)两个变量具有正相关关系时,其散点图是从左下方到右上方的直线附近;

(2)两个变量具有负相关关系时,其散点图是左上方到右下方的直线附近.

考点2一元线性回归模型及其应用——基础性

「典例引领」

考向1线性回归分析

例U*维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个

指标越高,耐热水性能也越好.而甲醛浓度是影响缩醛化度y(克分子%)的重要因

素,在生产中常用甲醛浓度Mg/L)去控制这一指标,为此必须找出它们之间的关

系.现安排一批实验,获得如下数据:

甲醛浓度

18202224262830

Mg/L)

缩醛化度),

26.8628.3528.7528.8729.7530.0030.36

(克分子%)

(I)画散点图,并判断成对样本数据是否线性相关;

(2)求样本相关系数r(精确到0.01),并通过样本相关系数判断甲醛浓度与缩解化

度的相关程度和变化趋势的异同.

解:(1)画出散点图如图所示.

缩解化度),/克分于%

30・・•

28

26

18202224262830

甲醛浓度或(g/L)

由散点图可以看出,成对数据呈现出相关关系.

(小2\)_x=—168=2_4.,y_=2^02.—94

1=1

=4900.16,

£7蜡

i=l

=4144,

7

i=l

x5892,

T

r49OO.16-7X24X^^

2A—Try

所以r=2

(4144-7X24)X[S892-7X(^^)]

IE",,)'I可

由此推断,甲醛浓度与缩醛化度正线性相关,即甲酸浓度与缩酹化度有相同的变

化趋势,且相关程度很强.

解题通法

解这类问题先画出散点图,利用散点图观察两个变量之间的关系,若两个变量具

有相关关系,再利用样本相关系数r进行进一步的判断.

考向2非线性回归分析

例❷."红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃

虫的产卵数),(个)和温度M℃)的8组观测数据,制成图1所示的散点图.现用两

种模型①・勿(。>0,Q0),②jucf+d分别进行拟合,由此得到相应的非

线性回归方程并进行残差分析,进一步得到图2所示的残差图.

根据收集到的数据,计算得到如下值:

88

2a-x)2W9f

XZt

i=li=l

252.89646168422688

88

W(4.刃2(%-y)

i=li=l

(刘一£)

48.4870308

表中zi=lny;z—\

8

8

t=l

2=1

8

i=l

(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?请说明理由.

(2)根据(1)中所选择的模型,求出y关于x的非线性经验回归方程(计算过程中四

舍五入保留两位小数),并求温度为35°C时,产卵数),的预报值.

参考数据:e56,^273,©510=299,e579^327.

’产卵数W个

I140-

I120-*

60-

40-•

20■•

C1..........r

°182022242628303234温度打七

图⑴产卵数散点图

残差

30-----------------------------

20—K-------------------------------------------r——

昌20夯、冬26方芯电34温总f

-10-------------------*—1——

-20----------------------------

-30---------------------------

一模型①…一模琅②

图⑵两种模型的残差图

解:(1)应该选择模型①.

理由:模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模

型②带状宽度窄,所以模型①的拟合精度更高,回归方程的预报精度相应就会越

高.故选模型①比较合适.

⑵由⑴知,选用模型①,y=a,b\将两边取对数,得lny=(lnZ?)x+lna

令z=lny,z与温度x可以用经验回归方程来拟合,

2(肛—Z)(Zi—z)

则z=(ln6)x+lna,ln6=上―---------------=竺&0.29,

168

,一】

Ina=z-xln/?=2.89~0.29X25=-4.36.

于是有ln>>=0.29x-4.36,

所以产卯数y关于温度x的非线性经验回归方程为y=e°2%436.

当x=35时,),=e029X35-4.36=e5.7%327(个),

所以,在气温在35°C时,一个红铃虫的产卵数的预报值为327个.

解题通法

非线性回归分析的解题步骤

根据原始数据(XJ)作出散点图

根据散点图,选择恰当的拟合函数

作恰当的变换,将其转化成线性函

数,求经脸回归方程

在上面的底础上通过相应的变换,

即可拜非戏&经验何归方程

多维训练

某种昆虫的日产卵数和时间变化有关,现收集了该昆虫第1天到第5天的日产卵

数据:

第X天12345

日产卵数M个)612254995

对数据初步处理后得到了如图所示的散点图和表中的统计量的值.

xi555

i如W®」n%)

i=li=li=l4=1

155515.9454.75

(1)根据散点图,利用计算机模拟出该种昆虫日产卵数),关于X的经验回归方程

为),=e,+叫其中e为自然对数的底数),求实数小力的值(精确到0.1).

(2)根据某项指标测定,若日产卵数在区间(e6,e、上的时段为优质产卵期.利用

(1)的结论,估计在第6天到第10天中任取2天,其中哈有1天为优质产卵期的

概率.

解:⑴因为),=*限,两边取自然对数,得nv=a+bx.

令z?=lny,得

54.75-5X警X及弃693八/cc

因为加=S5——=0,693,

所以尻0.7.

因为6=五-8沅=*-0.7X3=1.088,

所以gl.l,即gl.l,加0.7.

(2)根据(1)得y=cl.l^.7x

由e6<eL,+0-7x<e8,

得7V」V号

所以在第6天到第10天中,第8,9天为优质产卵期.

从第6天到第10天中任取2天的所有可能结果有(6,7),(6,8),(6,9),(6,

10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10),共10种.

其中恰有1天为优质产卵期的有(6,8),(6,9),(7,8),(7,9),(8,10),(9,

10),共6种.

设从第6天到第10天中任取2天,其中恰有1天为优质产卵期的事件为A,

则P(A)=„

所以从第6天到第10天中任取2天,其中恰有1天为优质产卵期的概率为,

3

考点3残差分析---应用性

「典例引领」

例❸,近年来,中国电影市场蓬勃发展,连创票房奇迹,各地陆续新增了许多影

院.某市新开业的一家影院借助舒适的环境和较好的观影体验吸引越来越多的人

前来观影,该影院的相关负责人统计了刚开业7天内每一天前来观影的人次,用

(1)该影院的相关负责人分别用两种模型①y—a+Zu,②y—c・/(c,〃为大丁零

的常数)进行拟合,得到相应的经验回归方程并进行残差分析,得到如图所示的

残差图.根据残差图,比较模型①、②的拟合效果,应选择哪个模型?(给出判断

即可,不必说明理由)

(2)根据(1)的判断结果求y关于x的经验回归方程,并预测该影院开业第8天前

来观影的人次.

参考数据:

77

X

y2仙

i=li=l

41354704140

(3)根据(1)选择的模型按照某项指标测定,当残差J时,则称当天为

观影正常日,反之则称为“非观影正常日”.若从该影院开业的这7天中任选3

天进行进一步的数据分析,求这3天中含“非观影正常日”的概率.

解:(1)应该选择模型①.

(2)因为+

7

i=l

=4704,x=4,

7

i=l

=140,产=16,

—nxy

4704-7X4X135

所以B=33,

140-7X16

把样本数据中心点(4,135)代入9=4+RV,得式=3,

所以y关于x的经验回归方程为『=3+33占

把x=8代入上式得夕=3+33X8=267,

故该影院开业第8天前来观影的人次为267.

(3)从残差图易知,7天中有5天为“观影正常日”,记这5天为1,2,3,4,5,

2天“非观影正常日”为a,b,

所以从7天中选出3天的种数分三类:①(1,2,a),(1,2,b),(1,3,a),(1,

3,b),…,(4,5,d)t(4,5,b),共(4+3+2+l)X2=20种;

②(1,2,3),(1,2,4),…,(3,4,5),共10种;

③(a,b,1),(a,b,2)-,(a,b,5),共5种,

故总种数为35种,含“非观影正常日”的种数为25种,

所以这3天中含“非现影王常日”的概率为〃=冒=:.

解题通法

利用R2刻画回归效果:R[=]_q--------,R2越大,模型拟合效果越好,R2越

z(”一w

1-1

小,模型拟合效果越差.

「多维训练J

新型冠状病毒感染疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力

和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学

发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会

出现快速的增长.如表是小王同学记录的某国连续8天每日新型冠状病毒感染确

诊的累计人数.

口期代码XI2345678

累计确诊人数y481631517197122

为了分析该国累计感染人数的变化I省势,〃、王同学分别用两种模型:①夕

/②夕=4x+c对变量工和),的关系进行拟合,得到相应的经验回归方程并进行

残差分析,残差图如下(注:残差%=%一9):

经过计算得:

8

W(为_君

1=1

(»一刃=728,

8

2®")2

i=l

=42,

8

]々_刃

i=l

(_v~y)=6868,

8

W⑵-刃2

i=i

=3570,其中zi=x£,z=j

8

i=l

(l)根据残差图,比较模型①、②的拟合效果,应该选择哪个模型?请简要说明理

由.

(2)根据(I)问选定的模型求出相应的经验回归方程(系数均保留两位小数).

(3)由于时差,该国截至第9天新型冠状病毒感染确诊的累计人数尚未公布.小王

同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在第(2)

问求出的经验PJ归方程来对感染人数做出预测,那么估计该地区第9天新型冠状

病毒感染确诊的累计人数足多少?

解:(1)选择模型①,理由如下:根据残差图可以看出,

模型①的估计值和真实值相对比较接近,

模型②的残差相对比较大,所以模型①的拟合效果相对较好.

(2)由(1)可知y关于x的非线性经验回归方程为夕

令2=『,则夕=历+凡由所给的数据可得2=1X(1+4+9+16+25+36+49+64)

8

=25.5,

y=lx(4+8+16+31+51+71+97+122)=50,

8

B

6868,“

亡”2,

A-'

i«i

则a=y-方女50-1.92X25.5=1.04,

所以),关于x的非线性经验回归方程为夕=1.92?+1.04.

(3)将x=9代入非线性经验回归方程,可得夕=1.92X92+L04=156.56E57(人),

所以预测该地区第9天新型冠状病毒感染确诊的累计人数约为157人.

考点4列联表与独立性检验——琮合性

「典例引领」

例0,,某省进行高中新课程改革已经四年了,为了解教伸对新课程教学模式的使

用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问

卷调查.共调查了50人,其中有老教师20人,青年教师30人.老教师对新课

程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同

的有24人,不赞同的有6人.

(1)根据以上数据建立一个2X2列联表.

⑵依据小概率值a=0.001,能否认为青年教师和老教师在新课程教学模式的使

用上态度有差异?

解:(1)2义2列联表如下所示.

类别赘同不赞同合计

老教师101020

青年教师24630

合计341650

(2)零假设为M):青年教师和老教师在新课程教学模式的使用上态度没有差异.

由公式得)=端篙翳&.963V10.828口⑼,根据小概率值段0.001的

独立性检验,没有充分证据推断M)不成立,因此明以认为“°成立,即认为青年

老师与老年教师在新课程教学模式的使用上态度没有差异.

解题通法

列联表与独立性检验综合问题的求解方法及注意点

⑴利用”、求出好的值.再利用小概率。的值以及对应的临

界值来判断两个事件是否有关.

(2)解题时应注苣准确词算,不可错用公式,准确进行比较与判断.

「多维训练」

(2022•郑州期末)某电视台在周末晚间推出一档新的综艺节目,为了了解节目效

果,一次节目结束后,随机抽取了500名观众(其中男性300名)对节目评分(百分

制),将这300名男性观众的评分分组:[50,60),[60,70),(70,80),[80,90),

190,1001,得到如图所示的频率分布直方图.

(1)若把评分低于70分定为“不满意”,评分不低于70分定为“满意”.若从

女性观众的评分中随机抽取一份,“不满意”的概率为0.3,完成下面的2X2列

联表.

(2)根据(1)中表格的数据,米据“=0.05的独立性检验,能否认为对该综艺节目是

否满意与性别有关?

1频率/组距

0.()3

().025

0.02”

0.03

0.

5060708090100男性观众的评分

类别男性观众女性观众合计

满意

不满意

合计

解:(1)因为从女性观众的评分中随机抽取一份,“不满意”的概率为0.3,

所以女性观众不满意的人数为0.3X200=60,则女性观众满意的人数为200—60

=140.

由频率分布首方图可知,男性观众不满意的人数为300X(0.015+0.025)X10=

120,

则男性观众满意的人数为300—120=180,

故列联表如下:

类别男性观众女性观众合计

满意180140320

不满意12060180

合计300200500

(2)零假设为Ho:对该综艺节目是否满意与性别无关.

由⑴中表格中的数据可得,?=笔黑黑煤£2!=等H5.208>3.841=XO.O5,

八320X180X300X20024

根据小概率值a=0.05的独立性检验,我们推断Ho不成立,即认为对该综艺节

目是否满意与性别有关,此推断犯错误的概率不大于0.05.

课时质量评价(五十五)

A组全考点巩固练

1.(多选题)在下列各图中,两个变量具有线性相关关系的图是()

BC解析:A中各点都在一条直线上,所以这两个变量之间是函数关系,不是相

关关系;B,C所示的散点图中,样本点成带状分布,这两组变量具有线性相关

关系;D所示的散点图中,样本点成团状分别,不是带状分布,所以这两个变量

不具线性相关关系.综上,具有线性相关关系的是B和C.

2.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得如下

数据:

色差工212325272931

色度y151617212223

已知该产品的色差和色度之间满足线性相关关系,且夕=O.25X+8,现有一对测

量数据为(32,21.25),则该组数据的残差(测量值与预洌值的差)为()

A.0.65B.0.75

C.-0.75D.0.95

B解析:样本中心点坐标为(26,19),代入经验回归方程得6=12.5.所以?=0.25x

+12.5,将x=32代入,求解得到对应的预估值为20.5,因而其残差为21.25—

20.5=0.75.故选B.

3.对两个变量x,),进行线性相关检验,得线性相关系数门=0.7859,对两个变

量〃,。进行线性相关检验,得线性相关系数底=-0.9568,则下列判断正确的

是()

A.变量x与,,正相关,变量〃与。负相关,变量x与y的线性相关性较强

B.变量x与),负相关,变量〃与。正相关,变量x与y的线性相关性较强

C.变量x与),正相关,变量〃与。负相关,变量“与v的线性相关性较强

D.变量x与y负相关,变量u与v正相关,变量〃与u的线性相关性较强

C解析:由线性相关系数门=0.7859>0知x与),正相关;

由线性相关系数卷=一0.9568V0知负相关.

又|川Vg|,所以变量〃与v的线性相关性比x与),的线性相关性强.

4.为了检测某种新药的效果,现随机抽取100只小白鼠进行试验,得到如下2X2

列联表:

未治愈治愈合计

服用药物104050

未服用药物203050

合计307()100

则下列说法一定正确的是()

_______n(ad-bc)2

附:£=(其中〃=a+〃+c+d).

(a+b)(c+d)(a+c)(b+d)

临界值表:

a0.150.100.050.0250.0100.0050.001

Xa2.0722.7063.8415.0246.6357.87910.828

A.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用

新药有关”

B.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服川

新药无关”

C.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服

用新药有关”

D.在犯错误的概率不超过0.005的前提下,认为“小3鼠是否被治愈与是否服

用新药无关”

A解析:由列联表中数据,计算必=若襄噜=詈必-762,且3.841V4.762

人30x70x50x5021

<5.024,所以有95%的把握认为“小白鼠有无被感染与是否注射疫苗有关”.

5.设两个相关变量x和),分别满足r=i,y=23/=1,2,…,6.若相关变量

x和y可拟合为非线性经验回归方程9=2加气,则当x=7时,),的估计值为()

A.32B.63

C.64D.128

C解析:令zj=log2y=L1,则

元=々1+2+3+4+5+6)=3.5,2=工(0+1+2+3+4+5)=2.5,

66

2大产,—6£1

I___________70—6X3.5X2.5

所以1,

91-6X3.52

2元一6亍2

u=z-S-x=2.5-lX3.5=~l,

所以2=x-l,即夕=2川,所以当x=7时,y=27d=64.

6.在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了

N个学生(N=100/〃,wGN"),其中男女学生各半,男生中60%表示喜欢该学科,

其余表示小喜欢;女生中40%表示喜欢该学科,其余表示小喜欢.若在犯错误的

概率不超过0.001的前提下,认为性别与是否喜欢该学科有关,则可以推测N的

最小值为()

附.丫2=______n(ai)2______

•人(a+b)(c+d)(a+c)(b+d)

a0.0500.0100.001

Xa3.8416.63510.828

A.400B.300

C.200D.100

B解析:设男、女学生的人数分别为50,〃,50〃?,建立2X2列联表如下:

喜欢课程不喜欢课程合计

男生30m20m50/〃

女生20/7?30/775072/

合计50m506100/7?

2_100mx(30mx30m-20mx20m)2_

50mx50mx50mx507n

由题意可得,4m>10.828,解得〃>2.707,

又,〃£N*,所以〃7=3,N=300.故选B.

7.下列说法:①分类变量4与8的随机变量尤越大,说明“A与B有关系”的

可信度越大;②以模型丁=。m'.去拟合一组数据时,为了求出经验P1归方程,设z

=lny,将其变换后得到线性方程z=0.3x+4,贝Uc,k的值分别是e,和0.3;③

在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④

若变量x和y满足关系y=-0.1x+l,且变量y与z正相关,则x与z也正相关,

正确的个数是.

3解析:对于①,根据独立性原理知,分类变量4与8的随机变量必越大,说

明“A与8有关系”的可信度越大,所以①正确;

对于②,根据线性回归模型和对数的运算性质知,以模型y=ce辰去拟合一组数

据时,为了求出经验回口方程,设z=l”,将其变换后得到经验回以方程二=().3x

+4,则c,火的值分别是e“和。.3,所以②正确;

对于③,利用残差分析模型拟合效果时,在残差图中,残差点分布的带状区域的

宽度越狭窄,其模型拟合的精度越高,所以③正确;

对于④,若变量x和y满足关系》=-0.£+1,且变量y与Z正相关,则X与Z

是负相关,所以④错误.

综上,正确命题的序号是①②③,共3个.

8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与

另外500名未用血清的人一年中的感冒记录作比较,提出零假设儿:“这种血

消不能起到预防感冒的作用”,利用2X2列联表计算得为2a3.918,经查对临界

值表知P(必23.841)比0.05.则下列结论中,正确结论的序号是_______.

①在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作

用”;②若某人未使用该血清,则他在一年中有95%的可能性得感冒;③这种血

清预防感冒的有效率为95%;④有95%的把握认为这种血清不能起到预防感冒

的作用.

①解析:因为产=3.918>3.841,

所以对于①,在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感

冒的作用”,故①正确;

对于②,若某人未使用该血清,不能说“他在一年中有95%的可能性得感冒”,

故②错误;

对于③,这种血清有95%的可能性预防感冒,不是有效率为95%,故③错误;

对于④,有95%的把握认为这种血清能起到预防感冒的作用,故④错误.

9.为了调杳某地区中学生是否喜欢踢足球,用简单随机抽样的方法从该地区调

查了500名学生,调查结果如下:

项目男女合计

喜欢踢足球40V70

不喜欢踢足球X270Z

合计500

⑴求x,y,z的值;

⑵依据小概率值a=0.01的独立性检验,能否认为该地区的中学生是否喜欢踢足

球与性别有关?

解:(1)由列联表可得,>'=70-40=30,z=500—70=430,所以工=430—270=

160.

(2)零假设为M):该地区的中学生是否喜欢踢足球与性别无关.由列联表中的数

据可得,X2=500X(40X270—160X30)->9.9668>6.635=xo.oi

70x430x200x300

根据小概率值a=0.01的独立性检脸,我们推断M)不成立,即认为该地区的中

学生是否喜欢踢足球与性别有关,此推断犯错误的概,率不大于0.01.

10.(2022•中卫一模)医学中判断男生的体重是否超标有一种简易方法,就是用

一个人身高的厘米数减去105所得差值即为该人的标准体重.比如身高175cm

的人,其标准体重为175—105=70kg,一个人实际体重超过了标准体重,我们

就说该人体重超标了.已知某班共有30名男生,从这30名男生中随机选取6名,

其身高和体重的数据如表所示:

编号123456

身高x(cm)165171160173178167

体重y(kg)606362707158

(1)从这6人中任选2人,求恰有1人体重超标的概率:

(2)依据上述表格信息,用最小二乘法求出了体重y对身高x的经验回归方程:y

=0.65x+a,但在用经验回归方程预报其他同学的体重时,预报值与实际值吻合

不好,需要对上述数据进行残差分析,按经验,对残差在区间[-3.5,3.5]之外的

同学要重新采集数据.上述随机抽取的编号为3,4,5,6的四人中,有哪几位

同学要重新采集数据?

参考公式:残差击=>7—6为一%.

解:(1)由图表可知,编号1的标准体重为165—1()5=60;

编号2的标准体重为171—105=66;

编号3的标准体重为160—105=55:

编号4的标准体重为173—105=68;

编号5的标准体重为178-105=73;

编号6的标准体重为167-105=62.

故编号3,4两人体重超标,故从6人中任取两人有髭=15种取法,恰有一人体

重超标共有玛禺=8种情况,

故片总

(2)x=-X(1654-171+1604-1734-178+167)=169,

6

尸工X(60+63+62+70+71+58)=64,

6

因为经验回归直线必过样本中心(169,64),所以64=0.65X169+6,解得a=一

45.85,

则夕=0.65x-45.85.

残差分析:

邑=62—0.65X160+45.85=3.85;

e4=70-0.65X173+45.85=3.4;

€5=71-0.65X178+45.85=1.15;

66=58-0.65X167+45.85=-4.7.

故3号、6号需要重新采集数据.

B组新高考培优练

11.针对当下的“读书热”,某大学对“学生性别和喜欢读书是否有关”做了一

次调查,随机调查了4()名男生和50名女生,经统计得到如下的2X2列联表:

喜欢不喜欢合计

男a19

女38b

合计

则a-b=()

A.9B.10

C.11D.12

A解析;々=40-19=21,8=50-38=12,所以。-4=9.故选A.

12.为了研究某校男生的脚长x(单位:cm)和身高),(单位:cm)的关系,从该校随

机抽取20名男生,根据测量数据的散点图可以看出),与X之间有线性相关关

系.设y关于x的经验回归方程为9=旅+优已知

20

W项=460,

i=i

20

A,

i=l

=3240,6=4,该校某男生的脚长为25.5cm,据此估计其身高为()

A.164cmB.168cm

C.172cmD.176cm

C解析:£=翳=23,9=磴^=162,所以162=4X23+。,解得6=70.

所以经验回归方程为9=41+70,当x=25.5时,),=172.故选C.

13.福建省采用“3+1+2”新高考模式,其中“3”为全国统考科目语文、数学

和外语;“1”为考生在物理和历史中选择一门;“2”为考生在思想政治、地理、

化学和生物四门中再选择两门.某中学调查了高一年级学生的选科倾向,随机抽

取200人,其中选考物理的120人,选考历史的80人,统计各选科人数如表:

选择科目

思想政治地理化学生物

选考类别

物理类35509065

历史类50453035

则下列说法正确的是()

附.什_____

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论