线性回归分析与独立性检验 专项练习-2025届高三数学一轮复习_第1页
线性回归分析与独立性检验 专项练习-2025届高三数学一轮复习_第2页
线性回归分析与独立性检验 专项练习-2025届高三数学一轮复习_第3页
线性回归分析与独立性检验 专项练习-2025届高三数学一轮复习_第4页
线性回归分析与独立性检验 专项练习-2025届高三数学一轮复习_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024-2025学年度高三一轮复习41--线性回归分析与独立性

检验专项练习

一、单选题

1.(24-25高三上•四川绵阳•阶段练习)由一组样本数据得到经验

回归方程9=%+&,那么下列说法正确的是()

A.若相关系数,越小,则两组变量的相关性越弱

B.若3越大,则两组变量的相关性越强

C.经验回归方程9=%+4至少经过样本数据(冷X),(马,女),…”)中的一个

D.在经验回归方程9=标+4中,当解释变量x每增加1个单位时,相应的观测值y约

增加另个单位

2.(2024高三・北京・专题练习)2020年12月26日太原地铁2号线开通,在一定程度上缓解

了市内交通的拥堵状况,为了了解市民对地铁2号线开通的关注情况,某调查机构在地铁开

通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高

堆积条形图:

匚二]男性・女性匚二]35岁以卜・・35岁以上

根据图中信息,下列结论不一定正确的是()

A.样本中男性比女性更关注地铁2号线开通

B.样本中多数女性是35岁及以上

C.样本中35岁以下的男性人数比35岁及以上的女性人数多

D.样本中35岁及以上的人对地铁2号线的开通关注度更高

3.(24-25高三上•云南昆明•阶段练习)下列说法错误的是()

A.若随机变量X~N(MQ2),则当。较小时,对应的正态曲线“瘦高”,随机变量X的

分布比较集中

B.在做回归分析时,可以用决定系数夫2刻画模型的回归效果,若夫2越大,则说明模型

拟合的效果越好

C.在一元线性回归模型中,如果相关系数r=0.98,表明两个变量的相关程度很强

D.对于一组数据4,X",若所有数据均变成原来的2倍,则s?变为原来的2

4.(2024.浙江•一模)为研究光照时长x(小时)和种子发芽数量V(颗)之间的关系,某

课题研究小组采集了9组数据,绘制散点图如图所示,并对x,>进行线性回归分析.若在此

图中加上点P后,再次对x,y进行线性回归分析,则下列说法正确的是()

5.(24-25高三上•全国•阶段练习)研究数据表明,某校高中生的数学成绩与物理成绩、物

理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科

成绩作为样本,设数学、物理、化学成绩分别为变量x,y,z若x,y的样本相关系数为

y,Z的样本相关系一数为:4,则X、Z的样本相关一系数的最大值为()

男(XT)2t⑶-a

i=li=l

6.(2023•甘肃兰州•模拟预测)为了检测某种新药的效果,现随机抽取100只小白鼠进行试

验,得到如下2x2列联表:

未治愈治愈合计

服用药物104050

未服用药物203050

合计3070100

则下列说法一定正确的是()

n{ad—bcy

附:z2(其中〃=a+Z?+c+d).

(a+6)(c+d)(a+c)(Z>+d)

临界值表:

a0.150.100.050.0250.0100.0050.001

Xa2.0722.7063.8415.0246.6357.87910.828

A.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”

B.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药无关”

C.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药有

关”

D.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药无

关”

7.(24-25高三上•山西运城・开学考试)下列说法错误的是()

A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人

的样本,若样本中男生有30人,则该校高一年级女生人数是200

B.数据1,3,4,5,7,9,11,16的第75百分位数为10

C.在一元线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强

D.根据分类变量X与/的成对样本数据,计算得到*=3.937,根据小概率0=0.05值

的独立性检验(%。5=3.841),可判断X与丫有关联,此推断犯错误的概率不大于0.05

8.(22-23高三下•重庆北需•阶段练习)一医疗团队为研究治疗某种疾病的新药能否有助于7

天内治愈该疾病病人,在已患病的500例病人中,随机分为两组,实验组服用该新药,对照

组不服用该药,在其他治疗措施相同的情况下,统计7天内痊愈病例数,得到如下数据:

7天内未痊愈7天内痊愈

对照组30170

实验组20280

根据表格数据,下列结论正确的是()

n{ad-be)2

参考公式及数据:K2=其中“=a+b+c+d.

(a+b)(c+d)(a+c)(b+d)

a0.100.0100.001

Xa2.7066.63510.828

A.在犯错误的概率不大于0.01的前提下,可以认为服用该新药与7天内治愈病人无关

B.在犯错误的概率不大于0.001的前提下,可以认为服用该新药与7天内治愈病人无关

C.根据小概率值a=0.01的独立性检验,可以推断服用该新药与7天内治愈病人有关

D.根据小概率值。=0.001的独立性检验,可以推断服用该新药与7天内治愈病人有关

二、多选题

9.(24-25高三上•四川成都•期中)对于样本相关系数,下列说法正确的是()

A.样本相关系数可以用来判断成对样本数据相关的正负性

B.样本相关系数可以是正的,也可以是负的

C.样本相关系数越大,成对样本数据的线型相关程度越强

D.样本相关系数「?[1,1]

10.(2024•全国•模拟预测)下列说法中,正确的是()

A.某组数据的经验回归方程$=0.25x+L5一定过点(2,2)

B.若尸⑷=:,?(8)=(,P(叫=:,则事件A与事件B相互独立

326

C.甲、乙两个模型的决定系数玄分别约为0.90和0.80,则模型甲的拟合效果更好

D.残差平方和越大,则相应模型的拟合效果越好

11.(2024高三・全国・专题练习)已知变量x和变量>的一组成对样本数据(X,,%)(i=1,2,…

的散点落在一条直线附近,x=—Z%,y=—2%,相关系数为「,线性回归方程为y=bx+a,

几i=lni=l

n__n__

-y),工(占-尤)(y7)

则()参考公式:屋1i——z-.

JS(七一(y,一y)2X(七一x)2

A.当「越大时,成对样本数据的线性相关程度越强

B.当厂>0时,b>0

C.xn+,=x,%+1=亍时,成对样本数据(4片)。=1,2,…,〃/+1)的相关系数/满足/=r

D.x„+1=x,y“+i=y时,成对样本数据(x”yj«=1,2,…,〃,"+1)的线性回归方程?=+a

满足d=b

三、填空题

12.(24-25高三上•广东江门•阶段练习)已知X,y之间的一组数据:若y与4满足经验回

归方程y=b4^+a,则此曲线必过点.

X14916

y12.985.017.01

13.(24-25高三上•天津河西•阶段练习)下列命题正确的是.

①对于事件若A=且尸(A)=0.3,尸(8)=0.6,则尸(8同=1

②若随机变量J~N(2»2),P(J<4)=0.84,则尸(2<J<4)=0.16

③相关系数厂的绝对值越接近1,两个随机变量的线性相关程度越强

④在做回归分析时,残差图中残差点分布的带状区域的宽度越宽表示回归效果越差

14.(24-25高三上•山东济宁•阶段练习)某传媒公司针对“社交电商用户是否存在性别差异”

进行调查,共调查了40M〃eN*)个人,得到下侧列联表.已知/。5=3.841,若根据《=0.05的

独立性检验认为“社交电商用户存在性别差异”,则〃的最小值为.

是社交电商用户不是社交电商用户合计

男性8〃12M20〃

女性⑵8〃20n

合计20〃20〃40〃

参考公式:参=(〃+6)(0+0(口+3伍时/其中“=a+"c+d

四、解答题

15.(2024陕西西安.二模)近年来我国新能源汽车行业蓬勃发展,新能源汽车不仅对环境保

护具有重大的意义,而且还能够减少对不可再生资源的开发,是全球汽车发展的重要方

向.“保护环境,人人有责”,在政府和有关企业的努力下,某地区近几年新能源汽车的购买

情况如下表所示:

年份尢20192020202120222023

新能源汽车购买数量,(万辆)0.400.701.101.501.80

⑴计算y与x的相关系数『(保留三位小数);

(2)求y关于X的线性回归方程,并预测该地区2025年新能源汽车购买数量.

参考公式r=]JiI“-------,.=月七'a=y-bx-

\归(%-方£(—)2

Vi=lVi=li=l

5

参考数值:岳=3.6056,元)(%-歹)=3.6.

1=1

16.(2024高三.全国・专题练习)2024年巴黎奥运会上,我国乒乓球运动员取得了优异的成

绩,这激发了公众参与乒乓球运动的热情,为此,某社区成立了一个社区乒乓球协会.社区

乒乓球协会为了解性别是否会影响居民参与乒乓球运动的意愿,对居民是否愿意参加乒乓球

运动进行了抽样调查,从该社区的居民中随机抽取了100名进行调查,得到下表:

乒乓球运动

性别合计

参与不参与

男性401050

女性203050

合计6040100

(I)依据小概率值0=0.001的独立性检验,能否认为居民是否参与乒乓球运动与性别有关

联?

(2)为加强社区乒乓球协会的管理,社区决定从样本参与乒乓球运动的居民中按性别利用分

层随机抽样的方法抽取6名组成乒乓球协会管理员,并从这6名居民中选出2名担任协会会

长,记男性居民担任协会会长的人数为X,求随机变量X的分布列及数学期望.

2n^ad-bcy

附:,(a+6)(c+d)(a+c)(b+d)n-a+b+c+d.

a0.0500.0100.001

Xa3.8416.63510.828

17.(24-25高三上•江苏扬州•期中)中国是茶的故乡,茶文化源远流长,博大精深.某兴趣小

组,为了了解当地居民对喝茶的态度,随机调查了100人,并将结果整理如下:

不喜欢喝茶喜欢喝茶合计

35岁以上(含35岁)303060

35岁以下251540

合计5545100

(1)是否有90%的把握认为该地居民喜欢喝茶与年龄有关?

(2)以样本估计总体,用频率代替概率.该兴趣小组在当地喜欢喝茶的人群中,随机选出2人

参加茶文化艺术节.抽取的2人中,35岁以下的人数记为X,求X的分布列与期望.

w(ad-bc)"

参考公式:/=其中〃=a+Z?+c+d.

(a+6)(c+〃)(a+c)(b+d)

参考数据:

P(%2N%)0.100.050.0250.0100.0050.001

%2.7063.8415.0246.6357.87910,828

18.(24-25高三上•黑龙江哈尔滨•期中)为了了解高中学生课后自主学习数学时间(x分钟/

每天)和他们的数学成绩('分)的关系,某实验小组做了调查,得到一些数据(表一).

表一:

编号12345

学习时间X3040506070

数学成绩y65788599108

(1)请用相关系数说明该组数据中变量y与变量x之间的关系可以用线性回归模型拟合(结果

精确到0.001);

(2)求y关于x的经验回归方程,并由此预测每天课后自主学习数学时间为io。分钟时的数学

成绩;

(3)基于上述调查,某校提倡学生周六在校自主学习.经过一学期的实施后,抽样调查了220

位学生.按照是否参与周六在校自主学习以及成绩是否有进步统计,得到2x2列联表(表

二).依据表中数据及小概率值《=0.001的独立性检验,分析“周六在校自主学习与成绩进

步”是否有关.

表二:

没有进步有进步合计

参与周六在校自主学习35130165

未参与周六不在校自主学习253055

合计60160220

55___________

(参考数据:=22820,Zv=435,无,的方差为200,%的方差为230.8,J1154000/1074)

Z=11=1

附:r=l„M1„6=旦三~^y-bx,

1(―)[沙-歹)小々)

2

2n(ad-be)

(a+Z?)(c+d)(a+c)(Z?+d)

a0.100.050.0100.0050.001

Xa2.7063.8416.6357.87910.828

19.(2024・广东佛山.一模)某机构为了解市民对交通的满意度,随机抽取了100位市民进行

调查,结果如下:回答“满意”的人数占总人数的一半,在回答“满意”的人中,“上班族”的人

数是“非上班族”人数的]3;在回答“不满意”的人中,“非上班族”占1

(1)请根据以上数据填写下面2x2列联表,并依据小概率值《=0.001的独立性检验,分析能

否认为市民对于交通的满意度与是否上班存在关联?

满意不满意合计

上班族

非上班族

合计

(2)该机构欲再从全市随机选取市民,进一步征求改善交通现状的建议.规定:抽样的次数

不超过6次,若随机抽取的市民属于不满意群体,则抽样结束;若随机抽取的市民属于满意

群体,则继续抽样,直到抽到不满意市民或抽样次数达到6次时,抽样结束.以调查数据中

的满意度估计全市市民的满意度,求抽样次数X的分布列和数学期望.

附:

a0.10.050.010.0050.001

%2.7063.8416.6357.87910.828

n(ad-bc)

力2=-----------------------

参考公式:(a+6)(c+6/)(a+c)(6+1),其中〃=a+6+c+d

参考答案:

1.D

【分析】根据相关系数的含义可判断AB;根据回归直线的含义可判断CD;

【详解】对于A,若相关系数H越小,则两组变量的相关性越弱,A错误;

对于B,若H越大,则两组变量的相关性越强,另是回归直线的斜率,

它不反应两变量的相关性强弱,B错误;

对于C,经验回归方程y=各x+&不一定经过样本数据(石,%),优,%),…G",%)中的一个,

C错误;

对于D,在经验回归方程£=%+&中,当解释变量x每增加1个单位时,

若g>0,相应的观测值y约增加另个单位;若分<0,相应的观测值y约增加-W个单位;

故当解释变量x每增加1个单位时,相应的观测值y约增加5个单位,正确,

故选:D

2.C

【分析】通过对等高堆积条形图的分析,结合所列列联表及不等式性质,逐一对每个选项进

行推理判断即可.

【详解】设等高条形图对应2x2列联表如下:

35岁及以上35岁以下总计

男性aca+c

女性bdb+d

总计a+bc+da+b+c+d

根据第1个等高条形图可知,35岁及以上男性比35岁及以上女性多,即">8;

35岁以下男性比35岁以下女性多,即c>d.

根据第2个等高条形图可知,男性中35岁及以上的比35岁以下的多,即

女性中35岁及以上的比35岁以下的多,即6>d,

对于A,男性人数为a+c,女性人数为6+d,

因为a>6,c>d,所以a+c>b+<7,所以A正确;

对于B,35岁及以上女性人数为6,35岁以下女性人数为d,

因为6>d,所以B正确;

对于C,35岁以下男性人数为c,35岁及以上女性人数为6,

无法从图中直接判断》与c的大小关系,所以C不一定正确;

对于D,35岁及以上的人数为。+》,35岁以下的人数为c+d,

因为a>c,b>d,所以a+b>c+d,所以D正确.

故选:C.

3.D

【分析】根据正态分布曲线的性质,可得判定A正确;根据决定系数和相关系数的性质,

可得判定B正确,C正确;根据方差的性质,可判定D错误.

【详解】对于A中,若随机变量X~N(〃02),则当。较小时,对应的正态曲线“瘦高”,

随机变量X的分布比较集中,所以A正确;

对于B中,在做回归分析时,可以用决定系数4刻画模型回归效果,女越大,说明模型拟

合的效果越好,所以B正确;

对于C中,一元线性回归模型中,相关系数的绝对值越接近1,表明两个变量的相关性越强,

所以如果相关系数厂=0.98,表明两个变量的相关程度很强,所以C正确;

对于D,若所有数据均变成原来的2倍,则/变为原来的4倍,所以D正确.

故选:D.

4.C

【分析】从图中分析得到加入尸点后,回归效果会变差,再由决定系数,相关系数,残差平

方和及相关性的概念和性质作出判断即可.

【详解】对于A,加入尸点后,变量x与预报变量V相关性变弱,

但不能说x,丫不具有线性相关性,所以A不正确

对于B,决定系数越接近于1,拟合效果越好,所以加上点尸后,决定系数尺2变小,故B

不正确;

对于C,从图中可以看出尸点较其他点,偏离直线远,所以加上点尸后,回归效果变差.

所以相关系数厂的绝对值越趋于0,故C正确;

对于D,残差平方和变大,拟合效果越差,所以加上点尸后,残差平方和变大,故D不正

确;

故选:C.

5.B

支(--元)(-—-)

【分析】利用相关系数公式I,可看成两个"维向量的夹角公式,

应%-丁本(%_汾2

Vz=li=l

从而把相关系系数问题转化为向量夹角问题,即可得解.

【详解】设X=(X],%2,…,X“),V=(%,%,…,%),Z=(Z],Z2,…,z”),

则有X'=(xl-x,x2-x,--,xn-x),乎=(%-4为一%…,笫-y),Z'=(Z]-Z,Z2-Z,…,z“-z),

X(-—-)(--♦)

由相关系数公式r=,可知:r=cos,X:Y),

住(%-元茂(%一》了

Vi=li=l

设X,与V夹角为a,:r与z'夹角为夕,

12124

由x,y的样本相关系数为耳,所以cosa=gcos£=:

由这两个夹角均为锐角且尸>a,所以X,与Z,夹角的可能性是£-/a+?,

则X,与7夹角余弦值的最大值为cos(分-0,此时尤与z样本相关系数最大,

即cos(^-a)=cos6cosa+sin/sina=+=黑,

故选:B.

6.A

【分析】根据表中数据求出/的值,即可得答案.

【详解】解:由列联表中数据,计算/JOOxMO_800)2=旦4.762,

30x70x50x5021

且3.841<4.762<5.024,

所以有95%的把握认为“小白鼠是否被治愈与是否服用新药有关”

所以在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”.

故选:A.

7.C

【分析】利用分层抽样计算判断A;求出第75百分位数判断B;利用线性相关系数的意义

判断C;利用独立性检验的思想判断D.

50-30

【详解】对于A,该校高一年级女生人数是二「一,A正确;

500

9+11

对于B,由8x75%=6,得第75百分位数为二一=10,B正确;

对于C,线性回归方程中,线性相关系数「绝对值越大,两个变量的线性相关性越强,C错

误;

对于D,由/=3.937>3.841=x005,可判断x与>有关联,此推断犯错误的概率不大于0.05,

D正确.

故选:C

8.C

【分析】求出卡方值,和6.635,10.828比较即可根据小概率值。=0.01,。=0.001的独立性

检验判断.

[详解]力2=500x(30x280—170x20)2=250^京259>6,635,所以根据小概率值a=0.01的

200x300x50x45027

独立性检验,有充分证据推断服用该新药对7天内治愈病人有影响,

因此在犯错误的概率不大于0.01的前提下,可以推断服用该新药与7天内治愈病人有关,

故C正确,A错误.

=500x(30x280—170x20)2=空°9259<10828,所以根据小概率值a=0.001的独立

200x300x50x45027

性检验,没有充分证据推断服用该新药对7天内治愈病人有关,

因此在犯错误的概率不大于0.001的前提下,不可以推断服用该新药与7天内治愈病人有关,

故BD错误.

故选:C.

9.ABD

【分析】利用相关系数与成对样本数据间的相关关系逐项判断,可得出合适的选项.

【详解】对于A选项,样本相关系数可以用来判断成对样本数据相关的正负性,A对;

对于B选项,样本相关系数可以是正的,也可以是负的,B对;

对于C选项,样本相关系数的绝对值越大,成对样本数据的线性相关程度也越强,C错.

对于D选项,样本相关系数厂?[1,1],D对;

故选:ABD

10.BC

【分析】根据回归方程、独立事件、决定系数和残差平方和的相关知识依次判断各个选项即

可.

【详解】对于A,经验回归方程必过样本中心点(元丁),但小歹)未必是(2,2),A错误;

对于B,尸(AB)=P(A)P(B)=g,.•.事件A与事件B相互独立,B正确;

对于C,0.90>0.80,改越接近1,模型拟合效果越好,,模型甲的拟合效果更好,C正

确;

对于D,残差平方和越小,模型的拟合效果越好,D错误.

故选:BC.

11.BCD

【分析】根据线性相关、相关系数、线性回归方程等知识,对选项逐一分析,即可得到答案.

【详解】对于A,当越接近1时,成对样本数据的线性相关程度越强,故A错误;

对于B,当r>0时,成对样本数据正相关,相关系数「与符号3相同,贝汇>0,故B正确;

对于C,当x“+]=x,%+i=y时,将这组数据添加后,后》不变,

故相关系数厂的表达式中的分子和分母均不变,故C正确;

对于D,当%+1=-%+]=)时,将这组数据添加后,无,》不变,

故线性回归方程中的斜率的表达式中的分子和分母均不变,所以2=3,故D正确;

综上所述,正确的有B、C、D.

故选:BCD.

12.(6.25,4)

【分析】设"石,则》=邑+3根据回归方程性质可得回归直线所过定点.

【详解】由己知y=

设t=6,则Jr+6,

由回归直线性质可得(K了)在直线5=邑+&上,

11+2+3+4「_1+2.98+5.01+7.01,

又/=——-——=2.5,y=-------------------------=4,

44

所以点(2.5,4)在直线9=邑+3上,故点(6.25,4)在曲线正日五+&上.

故答案为:(6.25,4).

13.①③④

【分析】根据事件的包含关系结合条件概率定义可判断①;根据正态分布曲线的对称性可判

断②;根据相关系数厂的绝对值的含义可判断③;根据残差图残差点分布的带状区域的含义

判断④.

【详解】对于①,对于事件AB,A^B,即A发生必定有8发生,则尸(B|A)=1,①正确;

对于②,若随机变量J~N(2,*),PC<4)=0.84,贝|

P(2<J<4)=P©<4)-尸6<2)=0.84-0.5=0.34,②错误;

对于③,相关系数r的绝对值越接近1,两个随机变量的线性相关程度越强,正确;

对于④,在做回归分析时,残差图中残差点分布的带状区域的宽度越宽表示回归效果越差,

正确,

故答案为:①③④

14.3

Q

【分析】由题意,应用卡方公式得根据独立检验的结论确定〃的最小值•

【详解】由题设,零假设/:社交电商用户与性别无关,

4。%(⑵x⑵-8"8犷=§841,

而/

20nx20nx20nx20n5

贝3.841*9=2.400625,

8

所以根据夕=0.05的独立性检验认为是不是社交电商用户与性别有关,则〃的最小值3.

故答案为:3

15.(1)0.998

⑵2.54万辆

【分析】⑴利用所提供数据求百,刃占<)2$(%一斤代入参考公式求「即可;

i=li=l

(2)结合公式求由此可得回归方程,再利用回归方程进行预测.

2021x5+(—2)+(—l)+0+l+2二2。21,…+。7°+1」°+„

【详解】⑴7==1.10,

5

5_2

X卜-=(-2)2+(-1)2+02+12+22=10,

z=lV

2

刘f)=(-0.7)2+(-0.4)2+02+0.42+0.72=1.3

Z=1

X0.998.

a=y-bx=l.l-2021x0.36=-726.46,

所以丁关于1的线性回归方程是y=0.36%-726.46,

当x=2025时,y=0.36X2025-726.46=2.54(万辆),

该地区2025年新能源汽车购买数量约为2.54万辆.

16.⑴能

(2)分布列见解析;期望为:4

【分析】(1)进行零假设,利用公式计算/的值,根据独立性检验下结论;

(2)求随机变量X的取值及对应的概率,写出分布列,利用期望公式求解即可.

【详解】(1)零假设为居民是否参与乒乓球运动与性别无关联.

根据列联表中的数据,

100x(40x30-20xlO)2

得/'—«16,667>10.828="期,

50x50x60x403

根据小概率值&=0.001的独立性检验,我们推断名不成立,

即能认为居民是否参与乒乓球运动与性别有关联,此推断犯错误的概率不大于0.001.

(2)根据分层随机抽样的知识可知,随机抽取的6名居民中有男性4名,女性2名,

所以随机变量X的所有可能取值为0,1,2,

3"X=2)=罟2

尸(x=o)=者

A,…专5

所以X的分布列为

17.(1)没有90%的把握认为该地居民喜欢喝茶与年龄有关

2

(2)分布列见解析,j

【分析】(1)根据列联表计算得出/的值即可得出结论;

(2)易知X的所有取值可能为0,1,2,分别计算出对应概率可得分布列及其期望值.

【详解】(1)零假设为该地居民喜欢喝茶与年龄没有关系.

2

根据列联表中的数据,可以求得V=100(30x15-30x25)2=50^1515<2706.

60x40x55x4533

根据小概率值a=0」的/独立性检验,没有充分证据推断/不成立,因此可以认为/成

立,

即没有90%的把握认为该地居民喜欢喝茶与年龄有关.

(2)X的取值可能为0,1,2.

则P(X=0)=(|jP(X=1)=C;124/、1

V3=9;尸”=2)

9

所以X的分布列为:

4412

所以X的期望为E(X)=0x§+lxg+2x§=1.

18.(1)详见解析;

(2)£=L07X+33.5,140.5分.

⑶有关

【分析】(1)依据公式计算即可求得相关系数;

(2)利用最小二乘法求得回归方程,再令x=100即可得解;

(3)根据公式求得再对照临界值表即可得解.

30+40+50+60+70/-65+78+85+99+108

【详解】(1)%=---------------------------=50,y=-----------------------------=87,

5

2(%-元)(方一了)

Z=1

5555

^x,.y,,-5x-y

x

E%%一元Z%-9Zi+5x-y

_i=li=li=l_____________1=1

J次(x,-一元)2次(—一歹『J火(3一丁)2次(y,「5)2

V1=1Z=1Vz=li=l

5___________

又Zx*=22820,占的方差为200,%的方差为230.8,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论