高考数学一轮复习专题十一概率与统计5变量间的相关关系统计案例综合篇课件新人教A版_第1页
高考数学一轮复习专题十一概率与统计5变量间的相关关系统计案例综合篇课件新人教A版_第2页
高考数学一轮复习专题十一概率与统计5变量间的相关关系统计案例综合篇课件新人教A版_第3页
高考数学一轮复习专题十一概率与统计5变量间的相关关系统计案例综合篇课件新人教A版_第4页
高考数学一轮复习专题十一概率与统计5变量间的相关关系统计案例综合篇课件新人教A版_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

考点一变量间的相关关系1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系.

与函数关系不同,相关关系是一种非确定性关系.(2)在散点图中,点散布在从左下角到右上角的区域内,两个变量的这种相

关关系称为①正相关

,点散布在从左上角到右下角的区域内,两个变

量的相关关系称为②负相关

.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.考点清单(2)回归直线方程(i)最小二乘法:通过求Q=

(yi-bxi-a)2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做③最小二乘法

.(ii)回归方程:方程

=

x+

是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中

,

是待定参数.

(3)相关系数r

(ii)当r>0时,表明两个变量④正相关

;当r<0时,表明两个变量⑤负相关

.r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近

于0,表明两个变量之间几乎不存在线性相关关系.当r的绝对值大于或等

于0.75时,认为两个变量有很强的线性相关关系.(4)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方

法.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同

确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为解释变量,因变量y称为预报变量.考点二独立性检验1.分类变量:变量的不同“值”表示个体所属的不同类别,像这样的

变量称为分类变量.2.列联表:列出两个分类变量的⑥频数表

,称为列联表.假设有两个分

类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表

(称为2×2列联表)为:

y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d可构造一个随机变量K2=

,其中n=a+b+c+d为样本容量.3.独立性检验利用独立性假设、随机变量⑦

K2

来确定是否有一定把握认为“两个

分类变量有关系”的方法称为两个分类变量的独立性检验.两个分类变量X和Y是否有关系的判断标准:统计学研究表明:当K2≤3.841时,认为X与Y无关;当K2>3.841时,有95%的把握说X与Y有关;当K2>6.635时,有99%的把握说X与Y有关;当K2>10.828时,有99.9%的把握说X与Y有关.考法一线性回归分析的应用知能拓展例1下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的

折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无

害化处理量.附:参考数据:

yi=9.32,

tiyi=40.17,

=0.55,

≈2.646.参考公式:相关系数r=

,回归方程

=

+

t中斜率和截距的最小二乘估计公式分别为

=

,

=

-

.解题导引解析(1)由折线图中数据和附注中参考数据得

=4,

(ti-

)2=28,

=0.55,

(ti-

)(yi-

)=

tiyi-

yi=40.17-4×9.32=2.89,r≈

≈0.99.

(4分)因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可

以用线性回归模型拟合y与t的关系.

(6分)(2)由

=

≈1.331及(1)得

=

=

≈0.10,

=

-

=1.331-0.10×4≈0.93.所以,y关于t的回归方程为

=0.93+0.10t.

(10分)将2016年对应的t=9代入回归方程得

=0.93+0.10×9=1.83.所以预测2016年我国生活垃圾无害化处理量约为1.83亿吨.(12分)方法总结求线性回归方程的步骤(1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系;(2)利用公式

=

,

=

-

求得回归系数;(3)写出回归直线方程.经典例题以下为教师用书专用例

(2019广东深圳第二次调研,18)某网店经销某商品,为了解该商品的

月销量y(单位:千件)与当月售价x(单位:元/件)之间的关系,收集了5组数据

进行了初步处理,得到下表:x56789y864.53.53(1)统计学中用相关系数r来衡量两个变量之间线性相关关系的强弱,

若|r|∈[0.75,1],则认为相关性很强;若|r|∈(0.25,0.75),则认为相关性一般;

若|r|∈[0,0.25],则认为相关性较弱.请计算相关系数r,并说明y与x之间的线

性相关关系的强弱(精确到0.01);(2)求y关于x的线性回归方程;(3)根据(2)中的线性回归方程,估计当售价x定为多少时,月销售额最大?

(月销售额=月销售量×当月售价)参考数据:

≈12.85.参考公式:相关系数r=

,线性回归方程

=

x+

中,

=

,

=

-

.解析(1)由表中数据和附注中的参考数据得,

=7,

=5,

(1分)

(xi-

)2=10,

(yi-

)2=16.5.

(2分)

(xi-

)(yi-

)=-12.5,r=

≈-0.97.

(3分)因为|r|≈|-0.97|∈[0.75,1],所以说明y与x的线性相关关系很强.

(5分)(2)由(1)可知

=

=

=-1.25,

(7分)∴

=

-

=5-(-1.25)×7=13.75,

(8分)∴

=-1.25x+13.75.

(9分)(3)由题意可知,月销售额的预估值

=1000·

·x=-1250x2+13750x(元)或者

=

·x=-1.25x2+13.75x(千元).

(10分)则当x=5.5时,

取到最大值,即该店主将售价定为5.5元/件时,可使网店的月销售额最大.(12分)考法二独立性检验的应用例2

(2019湘东六校联考,19)市教育部门为研究高中学生的身体素质与

课外体育锻炼时间的关系,对该市某校200名高中学生平均每天的课外体

育锻炼时间进行了调查,数据如下表:平均每天锻炼的时间(分钟)[0,10)[10,20)[20,30)[30,40)[40,50)[50,60]总人数203644504010将学生日均课外体育锻炼时间在[40,60]内的学生评价为“课外体育

达标”.(1)请根据上述表格中的统计数据填写下面2×2列联表,并通过计算判断

是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性

别有关;

课外体育不达标课外体育达标合计男

20110合计

(2)从上述课外体育不达标的学生中,按性别用分层抽样的方法抽取10名学生,再从这10名学生中随机抽取3人了解他们锻炼时间偏少的原因,

记所抽取的3人中男生的人数为随机变量X,求X的分布列和数学期望;(3)将上述调查所得到的频率视为概率来估计全市的情况,现在从该市所

有高中学生中抽取4名学生,求其中恰好有2名学生课外体育达标的概率.参考公式:K2=

,其中n=a+b+c+d.P(K2≥k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828附:解题导引(1)把数据代入公式计算K2;(2)求出X=0,1,2,3时的概率,列分布列并求数学期望;(3)设4名学生中课外体育达标的人数为ξ,由ξ~B

求P(ξ=2).解析(1)

课外体育不达标课外体育达标合计男603090女9020110合计15050200K2=

≈6.061<6.635,所以在犯错误的概率不超过0.01的前提下不能判断“课外体育达标”与

性别有关.

(4分)(2)易知,所抽取的10名学生中,男生有10×

=4名,女生有10×

=6名.X可取0,1,2,3.P(X=0)=

=

,P(X=1)=

=

,P(X=2)=

=

,P(X=3)=

=

.∴X的分布列为X0123P

E(X)=0×

+1×

+2×

+3×

=

.

(9分)(3)设所抽取的4名学生中,课外体育达标的人数为ξ,由(1)中表格可知学生

课外体育达标的频率为

=

,将频率视为概率,∴ξ~B

,∴P(ξ=2)=

×

×

=

.∴恰好有2名学生课外体育达标的概率为

.

(12分)方法总结独立性检验的一般步骤:(1)独立性检验原理只能解决两个对象,每个对象有两类属性的问题,所以

对于一个实际问题,我们要首先确定能否用独立性检验的思想加以解决;(2)如果确实属于这类问题,要科学地抽取样本,样本容量要适当,不可太

小;(3)根据数据列出2×2列联表;(4)提出假设H0:所研究的两类对象(X,Y)无关;(5)根据公式计算K2=

(n=a+b+c+d)的值;(6)比较观测值k与临界值表中相应的检验水平,根据小概率原理肯定或者

否定假设,即判断X、Y是否相关.经典例题以下为教师用书专用例

(2018河南开封一模,19)近年来我国电子商务行业迎来蓬勃发展的新

机遇,2017年双十一期间,某购物平台的销售业绩高达1271亿元人民币.

与此同时,相关管理部门推出了针对电商的商品和服务的评价体系,现从

评价系统中选出200次成功交易,并对其评价进行了统计,其中对商品的

好评率为0.6,对服务的好评率为0.75,对商品和服务都作出好评的交易为

80次.(1)完成下面的2×2列联表,并回答是否有99%的把握认为商品好评与服务

好评有关;

对服务好评对服务不满意合计对商品好评

对商品不满意

合计

200(2)若将频率视为概率,某人在该购物平台上进行的3次购物中,设对

商品和服务全好评的次数为随机变量X.①求对商品和服务全好评的次数X的分布列;②求X的数学期望和方差.附:P(K2≥k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828

K2=

,其中n=a+b+c+d.解析(1)由题意可得关于商品和服务评价的2×2列联表如下:

对服务好评对服务不满意合计对商品好评8040120对商品不满意701080合计15050200

K2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论