成对数据的相关关系-高考数学复习_第1页
成对数据的相关关系-高考数学复习_第2页
成对数据的相关关系-高考数学复习_第3页
成对数据的相关关系-高考数学复习_第4页
成对数据的相关关系-高考数学复习_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题12.6成对数据的相关关系

1.变量的相关关系

⑴相关关系:两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相

关关系.

注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且

函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.

⑵线性相关、非线性相关

①线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这

两个变量线性相关.

②非线性相关:一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关

或曲线相关.

⑶散点图

将样本中的几个数据点(肛%)(i=1,2,…必)描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点

的分布可以直观地判断两个变量之间的关系.

①如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正

相关,如图(1)所示;

②如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负

相关,如图(2)所示.

①将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样得到的图叫作散点图;

②散点图具有直观简明的特点,可以根据散点图判断两个变量有没有相关关系.

⑷正相关、负相关

①正相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个

变量正相关;

②负相关:从整体上看,如果当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变

量负相关.

2.样本相关系数

⑴相关系数r的计算

变量x与变量y的样本相关系数r的计算公式如下:r=,♦屋8')(%一歹).

出匕(4-/)2位乙(九一7)2

⑵相关系数r的性质

①当r>0时,称成对样本数据正相关;

当r<0时,称成对样本数据负相关;

当r=0时,成对样本数据间没有线性相关关系.

②样本相关系数r的取值范围为[-1,1],当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近

0时,成对样本数据的线性相关程度越弱.

3.一元线性回归模型

⑴经验回归方程

我们将9=5久+a称为丫关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回

归直线,其中

t_邓=1(XL五)3-y)_E乙符%-n型

■=i(%-冗AXjtix^-nx2.

a—y—bx

⑵利用决定系数R2刻画回归效果

R2=1_宏呼L露R2越大,即拟合效果越好,R2越小,模型拟合效果越差.

⑶一元线性回归模型参数的最小二乘估计

①经验回归方程:如果散点图中点的分布从整体上大致在一条直线附近,就称这两个变量之间具有线性相

关关系,我们把这条直线称为经验回归直线(回归直线),借助最小二乘法得到的直线方程,=bx+a称为经

验回归方程(线性回归方程).

②经验回归方程的性质

i.经验回归直线一定过点(工,);

ii.y与x正相关的充要条件是的分>0;y与x负相关的充要条件是石<0;

iii.当%增大一个单位时,9增大石个单位,这就是回归系数B的实际意义.

4.列联表与独立性检验

(1)2x2列联表

如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2x2列联表.

XY合计

Y=0Y=1

x=0aba+b

X=1cdc+d

合计a+cb+dn=a+b+c+d

(2)独立性检验

2

①依据上述2x2列联表构造统计量X?nQad-bc)

(a+b)(c+d)(a+c)(b+d)'

忽略乂2的实际分布与该近似分布的误差后,对于任何小概率值a,可以找到相应的正实数%,

使得P(x2>%)=a成立.我们称为为a的临界值,这个临界值就可作为判断X?大小的标准.

②基于小概率值a的检验规则是:

当乂22/时,我们就推断/不成立,即认为X和丫不独立,该推断犯错误的概率不超过a;

当乂2<%时,我们没有充分证据推断为不成立,可以认为X和丫独立.

这种利用X?的取值推断分类变量X和丫是否独立的方法称为乂2独立性检验,读作“卡方独立性检验”,简

称独立性检验.

下表给出了X2独立性检验中几个常用的小概率值和相应的临界值

a

Xa

【重要结论】

1.线性回归直线一定经过样本点的中心@歹),据此性质可以解决有关的计算问题、判断结论的正确性.

y值,仅是一个预报值,不是真实发生的值.

X?的值可以判断两个分类变量有关的可信程度,若X?越大,则两分类变量有关的把握越大.

L【人教A版选择性必修三习题8.2第1题P120】如果发现散点图中所有的样本点都落在一条斜率为非

0实数的直线上,则下列说法错误的是()

A.解释变量和预报变量是一次函数关系B.决定系数#=1

C.残差平方和为0D.相关系数r=1

2.【人教A版选择性必修一习题8.3第5题P135】为了研究高三年级学生的性别和身高是否大于170cm

的关联性,同学甲调查了某中学高三年级所有学生,整理得到列联表1,同学乙从该校高三学生中获取容

量为40的有放回简单随机样本,由样本数据整理得到列联表2.

表1单位:人

身高

性别合计

<170crr>1705

女811697

男2875103

合计10991200

表2单位:人

身高

性别合计

<170cn>170cn

女15621

男91019

合计241640

(1)利用表1,通过比较不低于170cM的学生在女生和男生中的比率,判断该中学高三年级学生的性别和

身高是否有关联,如果有关联,请解释它们之间如何相互影响;

(II)利用表2,依据a=0.05的独立性检验,推断该中学高三年级学生的性别和身高是否有关联,并解释

所得结论的实际含义:

(Ill)以上两种方法得出的结论是否一致?如果不一致,你认为哪种方法得出的结论准确,原因是什么?

(X2=(a+b)(c+d)(a+c)(b+d),n=a+b+c+d)

P(x2>fco)0.1500.1000.0500.0250.010

2.0722.7063.8415.0246.635

考点一成对数据相关性与相关系数

【方法储备】

判断数据相关关系的方法:

1函数曲线的附近,变量之间就有相关关系.

2.样本相关系数法:若|r|的值越接近于1,说明变量之间的线性相关程度越高;当尸>0时,称成对样本数据

正相关;当厂<0时,称成对样本数据负相关.

3.经验回归方程法:在经验回归方程中,当时,正相关;当务<0时,负相关.

【典例精讲】

例1.(2023•天津市真题)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.8245,

下列说法正确的是()

A.花瓣长度和花萼长度没有相关性

B.花瓣长度和花萼长度呈现负相关

C.花瓣长度和花萼长度呈现正相关

D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245

例2.(2023•浙江省温州市月考)中国茶文化博大精深,茶水的口感与茶叶类型和水的温度有关为了建立

茶水温度y随时间久变化的函数模型,小明每隔1分钟测量一次茶水温度,得到若干组数据(%,乃),(冷)2),

…,(马,%),绘制了如图所示的散点图.小明选择了如下2个函数模型来拟合茶水温度y随时间x的变化情

况,函数模型一:y=人久+b(k<0,%20);函数模型二:y=kax+b(J<>0,0<a<l,x>0),下列说法正

确的是()

90-

8C-•

70-•♦.

Lilt1.

°I2345x

①变量y与久具有负的相关关系

②由于水温开始降得快,后面降得慢,最后趋于平缓,因此模型二能更好的拟合茶水温度随时间的变化情

③若选择函数模型二,利用最小二乘法求得到y=叱+b的图象一定经过点(元,歹)

④当x=5时,通过函数模型二计算得y=65.1,用温度计测得实际茶水温度为65.2,则残差为0.1

A.②③④B.①②④C.①③④D.①②③

【拓展提升】

练11(2023•广东省揭阳市月考)在由一组样本数据(久口为),(x2,y2),(xn,yn)(?i22,%i,%2,...,xn不全相

等)的点所构成的散点图中,若所有样本点(4%)(i=L2,…,⑶都在直线y=-2x+l上,则这组样本数据

中变量%,y的相关系数为()

A.-2B.-1C.1D.2

练12(2023•浙江省宁波市模拟)(多选)根据某地3月5日到3月15日的每天最高气温与最低气温数

A.5号到11号的最低气温与日期之间呈线性相关关系且为正相关

B.9号的最高气温与最低气温的差值最大

C.最高气温的众数为2TC

D.5号到15号的最低气温的极差比最高气温的极差大

考点二一元线性回归模型及其应用

【方法储备】

1.求线性回归万程的步骤:

⑴利用散点图或进行相关性检验判定两个变量具有线性相关关系;

⑵列表求出Q着々%;

⑶利用相应公式计算

⑷写出线性回归方程.

⑸经验回归方程的拟合效果,可以利用相关系数|r|判断,当|r|R2判断,炉越大,拟合效果越好.

2.利用回归方程可以进行预测和估计总体,回归方程将部分观测值所反映的规律进行延伸,是我们对有线

性相关关系的两个变量进行分析和控制、依据自变量的取值估计和预报因变量值的基础和依据.

3.非线性经验回归方程转化为线性经验回归方程的方法

如:①若9-a+byfx,设t=y/x,则夕—a+bt;②若满足对数式:y-a+blnx,设t=Inx,则产—a+bt;

C1X

③若满足指数式:y=cre,两边取对数解Iny=Inq+设z=lny,a=lnq,b=c2,贝!Jz=a+bx.

【典例精讲】

例3.(2023•湖南省长沙市模拟)若需要刻画预报变量w和解释变量x的相关关系,且从已知数据中知道

预报变量w随着解释变量久的增大而减小,并且随着解释变量x的增大,预报变量w大致趋于一个确定

的值,为拟合w和x之间的关系,应使用以下回归方程中的(b>0,e为自然对数的底数)()

A.w=bx+aB.w=—b\nx+aC.w=—by/~x+aD.iv=be~x+a

例4.(2023•江苏省无锡市月考)新能源汽车作为战略性新兴产业,代表汽车产业的发展方向.发展新能

源汽车,对改善能源消费结构、减少空气污染、推动汽车产业和交通运输行业转型升级具有积极意义.经

过十多年的精心培育,我国新能源汽车产业取得了显著成绩,产销量连续四年全球第一,保有量居全球首

位.

(1)已知某公司生产的新能源汽车电池的使用寿命家单位:万公里)服从正态分布N(60,16),问:该公司每

月生产的2万块电池中,大约有多少块电池的使用寿命可以超过68万公里?

参考数据:若随机变量己〜则p(〃一彳=0.683,^</Z+2CT)«0.955,

PQi—3<J<^</z+3c)x0.997.

(2)下表给出了我国2017〜2021年新能源汽车保有量y(单位:万辆)的数据.

年份20172018201920202021

年份代码X12345

新能源汽车保有量y153260381492784

经计算,变量x与y的样本相关系数勺笈0.946,变量/与y的样本相关系数宝=0985.

①试判断9-bx+a与y=bx2+a哪一个更适合作为y与比之间的回归方程模型?

②根据①的判断结果,求出y关于x的回归方程(精确到0.1),并预测2023年我国新能源汽车保有量.

参考数据:令力=青0=1,234,5),计算得歹=414,%%%=7704,£着为%=32094,建着号=979.

参考公式:在回归方程产=乱+a中,务==丁,a=y-bt.

【拓展提升】

练21(2023•江西省南昌市模拟)(多选)某同学用搜集到的六组数据(如%)(i=1,2,…,6)绘制了如下散点

图,在这六个点中去掉B点后重新进行回归分析,则下列说法正确的是()

Bf

0X

A.残差平方和变小B.相关系数r的绝对值越趋于1

C.决定系数W变小D.解释变量%与预报变量y相关性变弱

练22(2023•黑龙江省哈尔滨市模拟)碳中和是指国家、企业、产品、活动或个人在一定时间内直接或间

接产生的二氧化碳或温室气体排放总量,通过植树造林、节能减排等形式,以抵消自身产生的二氧化碳或

温室气体排放量,实现正负抵消,达到相对“零排放,”2020年9月22日,中国政府在第七十五届联合

国大会上提出:“中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030

年前达到峰值,努力争取2060年前实现碳中和.”某工厂响应国家号召,随着对工业废气进行处理新技

术不断升级,最近半年二氧化碳排放量逐月递减,具体数据如下表:

月份序号也)123456

碳排放量Pi(吨)1007050352520

并计算得弓=91,EtilnPi-73.1,£:=Jnpi=22.5,e4-87~130,e4-88~132.

(1)这6个月中,任取2个月,求已知其中1个月的碳排放量低于6个月碳排放量的平均值的条件下,另1

个月碳排放量高于6个月碳排放量的平均值的概率;

(2)若用函数模型p=po*t对两个变量月份t与排放量p进行拟合,根据表中数据,求出p关于t的回归

方程.

附:对于同一组数据(%1,为),(x2,y2)>...>On,%),其回归直线产=阪+a的斜率和截距的最小二乘估计公

式分别为:

rCxi-x)(yt-y)-

b=圾i(“为2'a=y-bx

考点三列联表与独立性检验

【方法储备】

独立性检验的一般步骤:

(1)独立性检验原理只能解决两个对象,且每个对象有两类属性的问题,所以对于一个实际问题,我们首

先要确定能否用独立性检验的思想加以解决;

(2)如果确实属于这类问题,要科学地抽取样本,样本容量要适当,不可太小;

(3)根据数据列出2x2列联表;

⑷提出假设飞:所研究的两类对象(X,Y)无关;

n^ad-bc)2

(5)根据公式计算乂2=的值;

(a+b)(c+d)(a+c)(b+d)

(6)比较乂2与临界值力,根据小概率原理肯定或者否定假设,即判断XX是否相关.

【典例精讲】

例5.(2023•湖南省长沙市期末)根据分类变量比与y的成对样本数据,计算得到x?=6.147.依据a=0.01的独立

性检验(的.01=6.635),结论为()

A.变量比与y不独立

B.变量久与y不独立,这个结论犯错误的概率不超过0.01

变量x与y独立

D.变量x与y独立,这个结论犯错误的概率不超过0.01

例6.(2022•湖南省长沙市期中)新能源汽车是指除汽油、柴油发动机之外的所有其他能源汽车,被认为

能减少空气污染和缓解能源短缺的压力.在当今提倡全球环保的前提下,新能源汽车越来越受到消费者的青

睐,新能源汽车产业也必将成为未来汽车产业发展的导向与目标.某机构从某地区抽取了500名近期购买新

能源汽车的车主,调查他们的年龄情况,其中购买甲车型的有200人,统计得到如下的频率分布直方图.

(1)将年龄不低于45岁的人称为中年,低于45岁的人称为青年,购买其他车型的车主青年人数与中年人

数之比为3:1.完成下列2x2列联表,依据a=0.005的独立性检验,能否认为购买甲车型新能源汽车与

(2)用分层抽样的方法从购买甲车型的样本中抽取8人,再从中随机抽取4人,记青年有X人,求X的分

布列和数学期望.

吗.v2_n(ad—bc)2.力―々工办.厂上〃

A(a+b)(c+d)(a+c)(b+d)

a0.1000.0500.0100.0050.001

2.7063.8416.6357.87910.828

【拓展提升】

练31(2023•陕西省西安市模拟)(多选)已知某学校高二年级男生人数是女生人数的2倍,该年级全部

男、女学生是否喜欢徒步运动的等高堆积条形图如下,下列说法正确的是

□喜欢徒步

II不喜欢徒步

a0.050.010.005

Xa3.8416.6357.879

A.参加调查的学生中喜欢徒步的男生比喜欢徒步的女生多;

B.参加调查的学生中不喜欢徒步的男生比不喜欢徒步的女生少;

C.若参加调查的学生总人数为300,则能根据小概率a=0.01的独立性检验,推断喜欢徒步和性别有关;

D.无论参加调查的学生总人数为多少,都能根据小概率a=0.01的独立性检验,推断喜欢徒步和性别有

美.

练32(2023•安徽省合肥市联考)针对“中学生追星问题”,某校团委正在对“性别与中学生追星是否有

关”做相关研究.现从本校随机抽取100名学生进行调查,得到下表:

性别

是否追星合计

男生女生

追星4570

不追星20

合计100

(1)请将上述2x2列联表补充完整,并依据a=0.01的独立性检验,能否认为性别与中学生追星有关联?

(2)根据是否追星,在样本的女生中,按照分层抽样的方法抽取9人作为研究小组.为了更详细地了解情况,

再从研究小组中随机抽取4人,求抽到追星人数X的分布列及数学期望.

n^ad-bc)2

参考公式:2n=a+b+c+d

x=(a+b)(c+d)(a+c)(b+d)'

下表给出了独立性检验中几个常用的小概率值和相应的临界值.

a0.0500.0250.0100.001

%3.84105.0246.63510.828

1.(2023•浙江省杭州市联考)足球是一项大众喜爱的运动,为了解喜爱足球是否与性别有关,随机抽取

了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人数的,,女性喜爱足球的

O

人数占女性人数的,,若本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”

的结论,则被调查的男性至少有人(*=…凿点Wd)

a0.100.050.010.0050.001

Xa2.7063.8416.6357.87910.828

A.10B.11C.12D.13

2.(2023•重庆市市辖区模拟)已知变量y关于光的回归方程为y=涉尸。.6,若对y=6丘-。6两边取自然

对数,可以发现my与久线性相关,现有一组数据如下表所示:

X12345

yee3e4e6e7

则当%=6时,预测y的值为()

A.9B.8C.e9D.e8

3.(2023•湖北省荆州市月考)5G技术对社会和国家十分重要.从战略地位来看,业界一般将其定义为继

蒸汽机革命、电气革命和计算机革命后的第四次工业革命.某科技集团生产48两种5G通信基站核心

部件,下表统计了该科技集团近几年来在4部件上的研发投入x(亿元)与收益y(亿元)的数据,结果如下:

研发投入x(亿元)12345

收益y(亿元)3791011

(1)利用相关系数r说明是否可以用线性回归模型拟合y与x的关系(当|r|G[0.75,1]时,可以认为两个变

量有很强的线性相关性);

(2)求出y关于光的线性回归方程,并利用该方程回答下列问题:

。)若要使生产A部件的收益不低于15亿元,估计至少需要投入多少研发资金?(精确到0.001亿元)

5)该科技集团计划用10亿元对A,B两种部件进行投资,对B部件投资x(l<x<6)亿元所获得的收益

y近似满足y=0.9%-5+3.7,则该科技集团针对4B两种部件各应投入多少研发资金,能使所获得的

总收益P最大.

£忆1(阳一团(力一9)

附:相关系数「=回归直线方程的斜率1=啊各])三严,截距。=歹一石记

,£之1(3一乃2]£21例一刃2Li=lixi-x)

【答案解析】

L【人教A版选择性必修三习题8.2第1题P120]

解:因为样本点都落在一条斜率为非。实数的直线上,所以相关系数r满足m=1,若直线的斜率为正,

则r=l;若斜率为负,则r=—1,故。错误;

直线对应的函数为一次函数,所以解释变量和预报变量是一次函数关系,故/正确;

决定系数和残差平方和都能反映模型的拟合程度,所以决定系数R2=l,残差的平方和为0,故8,C正

确.

故本题选D

2.1人教A版选择性必修一习题8.3第5题P135]

解:(I)女学生身高低于170cm,不低于170cm的频率分别为筮=0.835,招=0.165,

男学生身高低于170cm,不低于170cm的频率分别为温-0.272,^~0.728,

通过比较发现,如果从女生、男生中各随机选取一名学生,女生中身高低于170sl的概率大于男生中身

高低于170cm的概率,

故高三年级学生的性别和身高有关联,

故女生中身高低于170cm的频率是男生中身高低于170cm的频率的3倍以上,

所以女生身高更容易低于170cm;

所以依据a=0.05的独立性检验,没有95%的把握认为该中学高三年级学生的性别与身高有关系;

(III)不一致,第一种准确,第二种样本容量太少,随机性太大.

例1.解:根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误

散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,C选项正确;

由于r=0.8245是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,

即取出的数据的相关系数不一定是0.8245,D选项错误.

故选:C

例2.解:观察散点图,变量”与y具有负的相关关系,①正确,易得②正确,

若选择函数模型二,

利用最小二乘法求出的回归方程一定经过(后,歹),③错误;

残差=真实值-预测值,因此残差为0.1,④正确.

其中说法正确的是①②④.

故选8.

练11.解:••・直线2x+y-1=0的斜率k=—2,

且若所有本点(孙力)(i=1,2,3,…,孔)都在直线y=-2x+l±,

・•・说明这组数据的样本完全负相关,则相关系数达到最小值-1.

故选:B.

练12.解:由某地3月5日到3月15日的每天最高气温与最低气温(单位:。口数据,折线图,知:

在力中,5号到11号的最低气温与日期之间,在一条直线附近,成上升趋势,即呈线性相关关系且为正

相关,故/正确;

在8中,由图知,6号的最高气温与最低气温的差值最大,故8错误;

在C中,最高气温27。出现2次,次数最多,则众数为27。。故C正确;

在。中,5号到15号的最低气温的极差小于15-3-12,最高气温的极差为27-15=12,故最高气温

的极差大,故。错误

故选:AC.

例3.解:对于4因为y=x在定义域内单调递增且b>0,所以w随着久的增大而增大,不合题意,

故4错误;

对于B:因为y=lnx在定义域内单调递增且6>0,所以w随着x的增大而减小,

当解释变量X—+8,W00,不合题意,故3错误;

对于C:因为y=C在定义域内单调递增且。>0,所以卬随着x的增大而减小,

当解释变量久一+8,W00,不合题意,故C错误;

对于D:因为y=e-=(;尸在定义域内单调递减且0,所以w随着x的增大而减小,

当解释变量x->+8,wa,故。正确;

故选:D.

例4.解:(1)因为新能源汽车电池的使用寿命;〜N(60,42),

所以PG>68)==(丁2『〃+2。)x=0Q225,

所以20000X0.0225=450块,

则每月生产的2万块电池中,使用寿命超过68万公里的大约有450块;

(2)①因为IQI>I—

所以产=bx2+a更适合作为y与x之间的回归方程模型;

②因为干=停+22+;2+42+52=]],

刑务-戏=1M53_32094-5X11X414

则南后5979-5X1P24.9,

a=y-St=414-24.9x11=140.1,

所以y=24.9t+140.1=24.9/+140.1,

当尤=7时,y=24.9X49+140.1=1360.2万辆,

则2023年我国新能源汽车保有量约为1360.2万辆.

练21.解:由题图,去掉B点后,回归效果更好,

则残差平方和变小,故/正确;

相关系数r的绝对值|川越趋于1,故8正确;

决定系数产变大,故C错误;

解释变量久与预报变量y相关性增强,故。错误.

故选AB.

练22.解:(1)设4="1个月的碳排放低于6个月排放的平均值”,

B="1个月的碳排放高于6个月排放的平均值”,

则P(8|A)=鬻1

21

kt

(2)p=poe=>Inp=kt+lnp0,

则仁疆半丹她…32,

庆斤6t

7

Inpo—3.75+0.32X—=4.87,

所以回归方程为:Inp=—0.32t+4.87=>p=e4,87'e~032t«130e_032t.

例5.解:a=0.01时,Xa=6.635,则大于Xa时相关,不独立,

而X?=6.147<Xa=6,635,所以变量比与y独立,

但是这个结论犯错误的概率超过0.01,故4B,D错误,C正确.

故选C

例6.解:(1)由直方图可知,购买甲车型的青年人数为200(0.005+0.025+0.0325)x10=125人,中年

人数为200-125=75人,

购买其他车型的青年人数为(500-200)X言=225人,中年人数为300-225=75人,

可得2x2列联表:

青年中年合计

甲车型12575200

其他车型22575300

合计350150500

零假设%:购买甲车型新能源汽车与年龄无关.

因为2=500(125x75-225x75)2=经=g929>7879

X350x150x200x30014>'

根据小概率值a=0.005的独立性检验,我们推断/不成立,即认为购买甲车型新能源汽车与年龄有关,

此推断犯错误的概率不大于0.005.

(2)用分层抽样的方法从购买甲车型的样本中抽取8人,则青年有8x株=5人,中年有8x益=3人,

所以X的可能取值为1,2,3,4.

51鬃303

P(X=1)=塞。。=2)=骨=*慨

L87014

303CfCg51

P(X=3)=普I-P(X=4)=常=磊

L7014

8o

得分布列:

X1234

1331

P

147714

所以E(X)=lx=+2x5+3x#4x==|

练31.解:设高二年级总人数为3a,则根据等高堆积条形图可得:

喜欢不喜欢合计

男生1.4a0.6a2a

女生0.4a0.6aa

合计1.8a1.2a3a

对于A:参加调查的学生中喜欢徒步的男生人数为1.4a,喜欢徒步的女生人数为0.4a,所以N正确;

对于B-.参加调查的学生中不喜欢徒步的男生与不喜欢徒步的女生人数均为0.6a,所以2错误;

对于c与D.2_3a(1.4ax0.6a—0.4ax0.6a)2_a

•X2axaxl.8axl.2a4'

当3a=300时,x2=25>6,635,所以能根据小概率a=0.01的独立性检验,推断喜欢徒步和性别有关;

当总人数时,即不能根据小概率的独立性检验,

3a<3x4x6,635x?=jq<6,635a=0.01

推断喜欢徒步和性别有关,故C正确,。错误.

故选NC.

练32.解:(1)列联表补充为

性别

是否追星合计

男生女生

追星452570

不追星102030

合计5545100

零假设"oH■生别与中学生追星无关联,

2_100x(45x20-25x10)2

久—55x45x70x30«8.129>6.635=Xo.op

依据小概率值a=0.01的独立性检验,我们推断为不成立,即认为性别与中学生追星有关联,

此推断犯错误的概率不大于0.0L

(2)由题意知,9人中追星的有5人,不追星的有4人.

由题意可知,X的可能取值为0,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论