变量间的相关关系与统计案例_第1页
变量间的相关关系与统计案例_第2页
变量间的相关关系与统计案例_第3页
变量间的相关关系与统计案例_第4页
变量间的相关关系与统计案例_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

考点一变量间的相关关系1.(2018课标全国Ⅱ,18,12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)

的折线图.

A组

统一命题·课标卷题组五年高考为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根

据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:

=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:

=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解析

(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为

=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为

=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上

下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资

额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据

对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性

增长趋势,利用2010年至2016年的数据建立的线性模型

=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1

亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预

测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.方法总结利用回归直线方程进行预测是对总体的估计,此估计值不是准确值,把自变量代入

回归直线方程即可对因变量进行估计,但需注意自变量的取值范围.2.(2017课标全国Ⅰ,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30min

从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的

16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04

抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得

=

xi=9.97,s=

=

≈0.212,

≈18.439,

(xi-

)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过

程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统

地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(

-3s,

+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(

-3s,

+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数r=

.

≈0.09.解析本题考查统计问题中的相关系数及样本数据的均值与方差.(1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数为r=

=

≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于

=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(

-3s,

+3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为

×(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.

=16×0.2122+16×9.972≈1591.134,剔除第13个数据,剩下数据的样本方差为

×(1591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为

≈0.09.方法总结样本的数字特征.(1)样本数据的相关系数r,r=

反映样本数据的相关程度,|r|越大,则相关性越强.(2)样本数据的均值反映样本数据的平均水平;样本数据的方差反映样本数据的稳定性,方差越

小,数据越稳定;样本数据的标准差为方差的算术平方根.3.(2015课标Ⅰ,19,12分,0.14)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x

(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售

量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

(xi- )2

(wi- )2

(xi- )(yi- )

(wi- )(yi- )46.65636.8289.81.61469108.8表中wi=

,

=

wi.(1)根据散点图判断,y=a+bx与y=c+d

哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别

=

,

=

-

.解析

(1)由散点图可以判断,y=c+d

适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=

,先建立y关于w的线性回归方程.由于

=

=

=68, =

- 

=563-68×6.8=100.6,所以y关于w的线性回归方程为

=100.6+68w,因此y关于x的回归方程为

=100.6+68

.(3)(i)由(2)知,当x=49时,年销售量y的预报值

=100.6+68

=576.6,年利润z的预报值

=576.6×0.2-49=66.32.(ii)根据(2)的结果知,年利润z的预报值

=0.2(100.6+68

)-x=-x+13.6

+20.12.所以当

=

=6.8,即x=46.24时,

取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.评析本题主要考查变量间的相关关系及回归分析,正确求出回归直线方程是解题关键,考查

学生的运算求解能力,属中等难度题.考点二独立性检验1.(2018课标全国Ⅲ,18,12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产

任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,

每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任

务的工作时间(单位:min)绘制了如下茎叶图:

(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过

m的工人数填入下面的列联表;

超过m不超过m第一种生产方式

第二种生产方式

(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=

,

.解析本题考查统计图表的含义及应用、独立性检验的基本思想及其应用.(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分

钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种

生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第

二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效

率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二

种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于

茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关

于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所

需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知m=

=80.列联表如下:

超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2=

=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.思路分析

(1)根据茎叶图中的数据大致集中在哪个茎,作出判断;(2)通过茎叶图确定数据的中位数,按要求完成2×2列联表;(3)根据(2)中2×2列联表,将有关数据代入公式计算得K2的值,借助临界值表作出统计推断.方法总结解决此类问题的步骤:(1)审清题意:弄清题意,理顺条件和结论;(2)找数量关系:把图形语言转化为数字,找关键数量关系;(3)建立解决方案:找准公式,将2×2列联表中的数值代入公式计算;(4)作出结论:依据数据,借助临界值表作出正确判断.解后反思独立性检验问题的常见类型及解题策略:(1)已知分类变量的数据,判断两个分类变量的相关性,可依据数据及公式计算K2,然后作出判

断;(2)独立性检验与概率统计的综合问题,关键是根据独立性检验的一般步骤,作出判断,再根据

概率统计的相关知识求解.2.(2017课标全国Ⅱ,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收

获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:

(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;

箱产量<50kg箱产量≥50kg旧养殖法

新养殖法

(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:

,K2=

.解析本题考查了频率分布直方图及独立性检验.(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表:

箱产量<50kg箱产量≥50kg旧养殖法6238新养殖法3466K2=

≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,

旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度

较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养

殖法优于旧养殖法.解后反思解独立性检验问题的关注点:(1)两个明确:①明确两类主体;②明确研究的两个问题.(2)两个关键:①准确画出2×2列联表;②准确求解K2.考点一变量间的相关关系1.(2015湖北,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是

(

)A.x与y正相关,x与z负相关

B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关

D.x与y负相关,x与z正相关B组

自主命题·省(区、市)卷题组答案

C由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而

增大,减小而减小,所以z随x的增大而减小,x与z负相关,故选C.2.(2015福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家

庭,得到如下统计数据表:根据上表可得回归直线方程

=

x+

,其中

=0.76,

=

-

.据此估计,该社区一户年收入为15万元家庭的年支出为

(

)A.11.4万元

B.11.8万元

C.12.0万元

D.12.2万元收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8答案

B由统计数据表可得

=

=10.0,

=

=8.0,则

=8.0-0.76×10.0=0.4,所以回归直线方程为

=0.76x+0.4,当x=15时,

=0.76×15+0.4=11.8,故估计年收入为15万元家庭的年支出为11.8万元.故选B.3.(2015重庆,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民

币储蓄存款(年底余额)如下表:(1)求y关于t的回归方程

=

t+

;(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程

=

t+

中,

=

=

-

.年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810解析

(1)列表计算如下:这里n=5,

=

ti=

=3,

=

yi=

=7.2.又ltt=

-n

=55-5×32=10,lty=

tiyi-n

·

=120-5×3×7.2=12,从而

=

=

=1.2,

=

-

=7.2-1.2×3=3.6,故所求回归方程为

=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为

=1.2×6+3.6=10.8(千亿元).itiyi

tiyi11515226412337921448163255102550

153655120考点二独立性检验1.(2014江西,7,5分)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随

机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是

(

)表1成绩性别

不及格及格总计男61420女102232总计163652表2视力性别

好差总计

男41620

女122032

总计163652

表3智商性别

偏高正常总计

男81220

女82432

总计163652

表4阅读量性别

丰富不丰富总计男14620女23032总计163652A.成绩

B.视力

C.智商

D.阅读量答案

D

=

,令

=m,则

=82m,同理,

=m×(4×20-12×16)2=1122m,

=m×(8×24-8×12)2=962m,

=m×(14×30-6×2)2=4082m,∴

>

>

>

,则与性别有关联的可能性最大的变量是阅读量,故选D.2.(2014辽宁,18,12分)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽

样调查,调查结果如下表所示:(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方

面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随

机抽取3人,求至多有1人喜欢甜品的概率.附:χ2=

,

喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100解析

(1)将2×2列联表中的数据代入公式计算,得χ2=

=

=

≈4.762.由于4.762>3.841,所以有95%的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有

差异.(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a1,a2,b1),(a1,a2,b2),

(a1,a2,b3),(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)}.其中ai表示喜欢甜品的学生,i=1,2.bj表示不喜欢甜品的学生,j=1,2,3.Ω由10个基本事件组成,且这些基本事件的出现是等可能的.用A表示“3人中至多有1人喜欢甜品”这一事件,则A={(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,

b2,b3),(a2,b1,b3),(b1,b2,b3)}.事件A是由7个基本事件组成的,因而P(A)=

.x345678y4.02.5-0.50.5-2.0-3.0(2014湖北,6,5分)根据如下样本数据C组

教师专用题组得到的回归方程为

=bx+a,则

(

)A.a>0,b<0

B.a>0,b>0

C.a<0,b<0

D.a<0,b>0答案

A由题中数据知,b<0,∵

=

=

,

=

=

,∴

=

b+a,∴a=

-

b.又∵b<0,∴a>0,故选A.考点一变量间的相关关系1.(2018云南曲靖一中模拟)某件产品的定价x与销量y之间的关系如下表所示,根据数据,用最小

二乘法得出y与x的线性回归直线方程为

=6x+6,则表格中n的值为

(

)三年模拟A组

2016—2018年高考模拟·基础题组x13457y1020n3545A.25

B.30

C.40

D.45答案

C

=4,

=

,所以

=6×4+6,解得n=40.故选C.2.(2018广西桂林、贺州联考)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计

了某4天的用电量与当天气温,并制作了对照表:线性回归方程为

=-2x+

,预测当气温为-4℃时,用电量的度数为

(

)A.68

B.67

C.65

D.64气温(℃)181310-1用电量(度)24343864答案

A由题可得

=

=10,

=

=40,∵(

,

)在线性回归方程 =-2x+ 上,∴40=10×(-2)+

,解得

=60,故当x=-4时,

=-2×(-4)+60=68.故选A.3.(2016广西师范大学附中模拟,10)若回归直线方程的斜率的估计值是1.23,样本点的中心为(4,

5),则回归直线方程是

(

)A.

=1.23x+4

B.

=1.23x+5C.

=1.23x+0.08

D.

=0.08x+1.23答案

C由题意可设回归直线方程为

=1.23x+

,把(4,5)代入回归直线方程得5=1.23×4+

,解得

=0.08,所以回归直线方程是

=1.23x+0.08.4.(2017四川攀枝花模拟,4)根据如下样本数据:得到回归直线方程为

=10.5x+

,据此模型来预测当x=20时,

的值为

(

)A.210

B.210.5

C.211.5

D.212.5x24568y2040607080答案

C由表中数据可得

=

×(2+4+5+6+8)=5,

=

×(20+40+60+70+80)=54,∵(

,

)在回归直线

=10.5x+

上,∴54=10.5×5+ ,解得 =1.5,∴回归直线方程为

=10.5x+1.5.当x=20时,

=10.5×20+1.5=211.5.故选C.5.(2017四川资阳模拟,14)某厂在生产某产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据

如表所示.根据最小二乘法求得回归直线方程为

=0.7x+

.当产量为80吨时,预计需要生产能耗

吨.x30405060y20304050答案

59.5解析本题考查回归直线方程及其应用.由题中数据可得

=45,

=35,则有35=0.7×45+ ,解得

=3.5,即

=0.7x+3.5,则当x=80时,可得

=59.5.规律总结样本点的中心(

,

)必在回归直线方程上.6.(2018贵州凯里模拟)某超市在开业期间举行开业大酬宾活动,规定:一次性消费总额在区间[100,200)内者可以参与一次抽奖,根据统计发现参与一次抽奖的顾客的消费金额分布情况如下:(1)求参与一次抽奖的顾客消费金额的平均数与中位数(结果保留到整数);(2)若根据超市的经营规律,消费金额x与平均利润y满足以下关系:消费金额x(单位:元)100200300400平均利润y(单位:元)15254060试根据所给数据,建立y关于x的线性回归方程

=

x+

,并根据(1)中计算的结果估计平均每位顾客贡献给超市的利润.解析

(1)由所给频率分布直方图可知,这5组数据的频率分别为0.1,0.2,0.3,0.25,0.15,故这组数

据的平均数为110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153.∵0.1+0.2=0.3<0.5,0.1+0.2+0.3=0.6>0.5,∴这组数据的中位数为140+

×20≈153.(2)由所给数据可得

=

=250,

=

=35,b=

=0.15,

=

-

=-2.5,∴线性回归方程为

=0.15x-2.5.把x=153代入可得,平均每位顾客贡献给超市的利润为

=0.15×153-2.5=20.45(元).考点二独立性检验1.(2017贵州遵义质检,4)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是

愿意走人行天桥进行抽样调查,得到如下的2×2列联表:

男女总计走天桥402060走斑马线203050总计6050110由K2=

,算得K2=

≈7.8.参照附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.858得到的正确结论是

(

)A.有99%的把握认为“选择过马路的方式与性别有关”B.有99%的把握认为“选择过马路的方式与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”答案

A由K2≈7.8>6.635可得,有99%的把握认为“选择过马路的方式与性别有关”.2.(2016广西南宁二中模拟,14)为了判断高三的学生选修文科是否与性别有关,现随机抽取50

名学生,得到如下2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2=

≈4.844,则认为“选修文科与性别有关系”出错的可能性约为

.

理科文科总计男131023女72027总计203050答案

5%解析∵K2≈4.844>3.841,∴认为选修文科与性别有关,并且这种判断出错的可能性约为5%.3.(2018四川成都诊断)近年来,共享单车已经悄然进入了广大市民的日常生活,并慢慢改变了

人们的出行方式.为了更好地服务民众,某共享单车公司在其官方APP中设置了用户评价反馈

系统,以了解用户对车辆状况和优惠活动的评价.现从评价系统中选出200条较为详细的评价

信息进行统计,车辆状况和优惠活动评价的2×2列联表如下:

对优惠活动满意对优惠活动不满意合计对车辆状况满意10030130对车辆状况不满意403070合计14060200(1)能否在犯错误的概率不超过0.001的前提下认为对优惠活动满意与对车辆状况满意之间有

关系?(2)为了回馈用户,公司通过APP向用户随机派送骑行券.用户可以将骑行券用于骑行付费,也可

以通过APP转赠给好友.某用户共获得了5张骑行券,其中只有2张是一元券.现该用户从这5张

骑行券中随机选取2张转赠给好友,求选取的2张中至少有1张是一元券的概率.P(K2≥k)0.1500.1000.0500.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828参考数据:参考公式:K2=

,其中n=a+b+c+d.解析

(1)由2×2列联表的数据,可得K2=

=

≈8.48<10.828.因此,在犯错误的概率不超过0.001的前提下,不能认为对优惠活动满意与对车辆状况满意之间

有关系.(2)把2张一元券分别记作A,B,其余3张券分别记作a,b,c,则从5张骑行券中随机选取2张的所有情况为{A,a},{A,b},{A,c},{B,a},{B,b},{B,c},{A,B},{a,b},

{a,c},{b,c},共10种.记“选取的2张中至少有1张是一元券”为事件M,则事件M包含的基本事件个数为7,所以P(M)=

.所以从5张骑行券中随机选取2张转赠给好友,选取的2张中至少有1张是一元券的概率为

.4.(2017云南大理统考,18)某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游

泳是否与性别有关,该学校对100名高一新生进行问卷调查,得到如下列联表:已知在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为

.(1)请将上述列联表补充完整;(2)判断是否有99.9%的把握认为喜欢游泳与性别有关,并说明你的理由;(3)已知在被调查的5名学生中有3名喜欢游泳,现从这5名学生中随机抽取2人,求恰有1人喜欢

游泳的概率.下面的临界值表仅供参考:

喜欢游泳不喜欢游泳合计男生

10

女生20

合计

P(K2≥k0)0.100.050.0250.0100.0050.001k2.7063.8415.0246.6357.87910.828参考公式:K2=

,其中n=a+b+c+d.解析

(1)因为在100人中随机抽取1人抽到喜欢游泳的学生的概率为

,所以喜欢游泳的学生人数为100×

=60,其中女生有20人,则男生有40人,列联表补充如下:

喜欢游泳不喜欢游泳合计男生401050女生203050合计6040100(2)因为K2=

≈16.67>10.828,所以有99.9%的把握认为喜欢游泳与性别有关.(3)把5名学生中喜欢游泳的3名学生分别记为a,b,c,另外2名分别记为1,2,任取2名学生,则所以

可能情况为(a,b)、(a,c)、(a,1)、(a,2)、(b,c)、(b,1)、(b,2)、(c,1)、(c,2)、(1,2),共10种.其中恰有1人喜欢游泳的可能情况为(a,1)、(a,2)、(b,1)、(b,2)、(c,1)、(c,2),共6种,所以恰有1人喜欢游泳的概率为

=

.1.(2017贵州凯里适应性考试)某公司某件产品的定价x与销量y之间的数据统计表如下,根据数

据,用最小二乘法得出y与x的线性回归直线方程为

=6.5x+17.5,则表格中n的值应为

(

)B组

2016—2018年高考模拟·综合题组时间:30分钟

 分值:45分一、选择题(共5分)x24568y3040n5070A.45

B.50

C.55

D.60答案

D本题考查线性回归方程.

=

=5,

=

=

,把(

,

)代入线性回归方程,得

=6.5×5+17.5,解得n=60.2.(2018广西桂林联考)“双十一”期间,某网店店主对其商品的上架时间x(分钟)和销售量y

(件)的关系作了统计,得到如下数据:经计算,

=125,

=400,

(xi-

)(yi-

)=5752,

(xi-

)2=2864.(1)从满足xi>

的数据xi中任取两个,求所取两个数据都满足|xi-x|≤15的概率;(2)该店主发现上架时间与销售量线性相关,请你帮助店主求出上架时间与销售量的线性回归

方程(保留三位小数),并预测商品上架1000分钟时的销售量.上架时

间xi94100114120124127133136138142147销售量yi335352376393400404418420422436444二、解答题(共40分)解析

(1)由表知满足xi>

的数据有6个,分别为127,133,136,138,142,147.从中任取两个的所有结果为{127,133},{127,136},{127,138},{127,142},{127,147},{133,136},{133,138},{133,142},{133,147},{136,138},{136,142},{136,147},{138,142},{138,147},{142,147},共15种.其中两个数据都满

足|xi-

|≤15的结果有6种,故所求概率P=

=

.(2)设线性回归方程为

=

x+

.由题知

=

=

≈2.008,∴ =

- 

=400-2.008×125=149.000,∴线性回归方程为

=2.008x+149.000,当x=1000时,

=2.008×1000+149.000=2157,故商品上架1000分钟时的销售量约为2157件.3.(2017贵州贵阳适应性考试,18)2017年1月1日,作为贵州市打造“千园之城”27个示范性公

园之一的泉湖公园正式开园.元旦期间,为了活跃气氛,主办方设置了水上挑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论