版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人教A版(新教材)高中数学选择性必修第三册PAGEPAGE18.1.2样本相关系数课标要求素养要求1.结合实例,会通过相关系数比较多组成对数据的相关性.2.了解样本相关系数与标准化数据向量夹角的关系.通过学习样本相关系数,提升数学抽象及数据分析素养.自主梳理1.相关系数r的计算对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),对数据作进一步的“标准化”处理,用sx=eq\r(\f(1,n)\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2),sy=eq\r(\f(1,n)\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)分别除xi-eq\o(x,\s\up6(-))和yi-eq\o(y,\s\up6(-))(i=1,2,…,n,eq\o(x,\s\up6(-))和eq\o(y,\s\up6(-))分别为x1,x2,…,xn和y1,y2,…,yn的均值),得eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(x1-\o(x,\s\up6(-)),sx),\f(y1-\o(y,\s\up6(-)),sy))),eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(x2-\o(x,\s\up6(-)),sx),\f(y2-\o(y,\s\up6(-)),sy))),…,eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(xn-\o(x,\s\up6(-)),sx),\f(yn-\o(y,\s\up6(-)),sy))),为简单起见,把上述“标准化”处理后的成对数据分别记为(x1′,y1′),(x2′,y2′),…,(xn′,yn′),则变量x和变量y的样本相关系数r的计算公式如下:r=eq\f(1,n)(x1′y1′+x2′y2′+…+xn′yn′)=eq\f(\o(∑,\s\up16(n),\s\do16(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up16(n),\s\do16(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up16(n),\s\do16(i=1))(yi-\o(y,\s\up6(-)))2))=eq\f(\o(∑,\s\up16(n),\s\do16(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up16(n),\s\do16(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)\r(\o(∑,\s\up16(n),\s\do16(i=1))yeq\o\al(2,i)-n\o(y,\s\up6(-))2)).2.相关系数r的性质(1)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.(2)样本相关系数r的取值范围为〖-1,1〗.当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.3.样本相关系数与标准化数据向量夹角的关系r=eq\f(1,n)x′·y′=eq\f(1,n)|x′||y′|cosθ=cosθ(其中x′=(x1′,x2′,…,xn′),y′=(y1′,y2′,…,yn′),|x′|=|y′|=eq\r(n),θ为向量x′和向量y′的夹角).判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就可利用线性相关系数r来判断.|r|越接近1,它们的散点图越接近一条直线,两个变量之间的相关关系越强.自主检验1.思考辨析,判断正误(1)相关系数是研究变量之间线性相关程度的量.(√)(2)若r=±1,则说明x,y之间具有完全的线性关系.(√)(3)若r=0,则说明成对样本数据间是函数关系.(×)〖提示〗若r=0,则说明成对样本数据间没有线性相关关系.(4)样本相关系数r的范围是(-∞,+∞).(×)〖提示〗样本相关系数的范围是〖-1,1〗.2.下面对相关系数r描述正确的是()A.r>0表明两个变量负相关B.r>1表明两个变量正相关C.r只能大于零D.eq\b\lc\|\rc\|(\a\vs4\al\co1(r))越接近于0,两个变量相关关系越弱〖答案〗D〖解析〗因r>0表明两个变量正相关,故A错误;又因r∈〖-1,1〗,故B,C错误;两个变量之间的相关系数r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表示两个变量之间的线性相关性越弱,故D正确.3.(多选题)下面的各图中,散点图与相关系数r符合的是()〖答案〗ACD〖解析〗因为相关系数r的绝对值越接近1,线性相关程度越高,且r>0时正相关,r<0时负相关,故观察各选项,易知B不符合,A,C,D均符合.故选ACD.4.下列说法正确的是________(填序号).(1)若变量间的关系是非确定性关系,则因变量不能由自变量唯一确定(2)线性相关系数可以是正的或负的(3)如果样本一的相关系数r1=-0.9,样本二的相关系数r2=0.7,因r1<r2,故样本二的变量的线性相关性强(4)线性相关系数r∈(-1,1)〖答案〗(1)(2)〖解析〗∵|r|越接近于1,表明两个变量的线性相关性越强,∴(3)错;∵相关系数|r|≤1,∴(4)错误.题型一线性相关性的检验〖例1〗现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x(分)与入学后第一次考试的数学成绩y(分)如下:学生号12345678910x12010811710410311010410599108y84648468696869465771请问:这10名学生的两次数学成绩是否具有线性相关关系?解eq\o(x,\s\up6(-))=eq\f(1,10)(120+108+…+99+108)=107.8,eq\o(y,\s\up6(-))=eq\f(1,10)(84+64+…+57+71)=68,eq\o(∑,\s\up16(10),\s\do14(i=1))xeq\o\al(2,i)=1202+1082+…+992+1082=116584,eq\o(∑,\s\up16(10),\s\do14(i=1))yeq\o\al(2,i)=842+642+…+572+712=47384,eq\o(∑,\s\up16(10),\s\do14(i=1))xiyi=120×84+108×64+…+99×57+108×71=73796.所以相关系数为r=eq\f(73796-10×107.8×68,\r((116584-10×107.82)(47384-10×682)))≈0.7506.由此可看出这10名学生的两次数学成绩具有线性相关关系.思维升华利用相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器.〖训练1〗假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:x23456y2.23.85.56.57.0已知eq\o(∑,\s\up16(5),\s\do14(i=1))xeq\o\al(2,i)=90,eq\o(∑,\s\up16(5),\s\do14(i=1))yeq\o\al(2,i)=140.78,eq\o(∑,\s\up16(5),\s\do14(i=1))xiyi=112.3.(1)求eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-));(2)对x,y进行线性相关性检验.解(1)eq\o(x,\s\up6(-))=eq\f(2+3+4+5+6,5)=4,eq\o(y,\s\up6(-))=eq\f(2.2+3.8+5.5+6.5+7.0,5)=5.(2)eq\o(∑,\s\up16(5),\s\do14(i=1))xiyi-5eq\a\vs4\al(\o(x,\s\up6(-)))eq\a\vs4\al(\o(y,\s\up6(-)))=112.3-5×4×5=12.3,eq\o(∑,\s\up16(5),\s\do14(i=1))xeq\o\al(2,i)-5eq\o(x,\s\up6(-))2=90-5×42=10,eq\o(∑,\s\up16(5),\s\do14(i=1))yeq\o\al(2,i)-5eq\o(y,\s\up6(-))2=140.78-125=15.78,所以r=eq\f(12.3,\r(10×15.78))≈0.979.所以x与y之间具有很强的线性相关关系.题型二判断线性相关的强弱〖例2〗维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.甲醛浓度x18202224262830缩醛化度y26.8628.3528.7528.8729.7530.0030.36求样本相关系数r并判断它们的相关程度.解列表如下ixiyixeq\o\al(2,i)yeq\o\al(2,i)xiyi11826.86324721.4596483.4822028.35400803.722556732228.75484826.5625632.542428.87576833.4769692.8852629.75676885.0625773.562830.0078490084073030.36900921.7296910.80∑168202.9441445892.01364900.16eq\o(x,\s\up6(-))=eq\f(168,7)=24,eq\o(y,\s\up6(-))=eq\f(202.94,7),r=eq\f(\o(∑,\s\up16(7),\s\do14(i=1))xiyi-7\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\r(\o(∑,\s\up16(7),\s\do14(i=1))xeq\o\al(2,i)-7\o(x,\s\up6(-))2)\r(\o(∑,\s\up16(7),\s\do14(i=1))yeq\o\al(2,i)-7\o(y,\s\up6(-))2))=eq\f(4900.16-7×24×\f(202.94,7),\r(4144-7×242)\r(5892.0136-7×\b\lc\(\rc\)(\a\vs4\al\co1(\f(202.94,7)))\s\up12(2)))≈0.96.由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.思维升华当相关系数|r|越接近1时,两个变量的相关关系越强,当相关系数|r|越接近0时,两个变量的相关关系越弱.〖训练2〗以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.房屋大小x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据的散点图;(2)求相关系数r,并作出评价.解(1)图略.(2)列表如下:ixiyixeq\o\al(2,i)yeq\o\al(2,i)xiyi111524.813225615.042852211021.612100466.56237638018.46400338.561472413529.218225852.643942510522110254842310∑545116609752756.812952eq\o(x,\s\up6(-))=eq\f(545,5)=109,eq\o(y,\s\up6(-))=eq\f(116,5)=23.2,r=eq\f(\o(∑,\s\up16(5),\s\do14(i=1))xiyi-5\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\r(\o(∑,\s\up16(5),\s\do14(i=1))xeq\o\al(2,i)-5\o(x,\s\up6(-))2)\r(\o(∑,\s\up16(5),\s\do14(i=1))yeq\o\al(2,i)-5\o(y,\s\up6(-))2))=eq\f(12
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论