版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人教A版(新教材)高中数学选择性必修第三册PAGEPAGE18.1.2样本相关系数学习目标1.结合实例,了解样本相关系数的统计含义.2.了解样本相关系数与标准化数据向量夹角的关系.3.结合实例,会通过样本相关系数比较多组成对样本数据的相关性.导语散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对成对样本数据的相关程度进行定量分析呢?这就是我们这节课要研究的内容.一、样本的相关系数问题1设x1,x2,…,xn和y1,y2,…,yn的均值分别为eq\x\to(x)和eq\x\to(y).将数据以(eq\x\to(x),eq\x\to(y))为零点进行平移,得到平移后的成对数据(x1-eq\x\to(x),y1-eq\x\to(y)),(x2-eq\x\to(x),y2-eq\x\to(y)),…,(xn-eq\x\to(x),yn-eq\x\to(y)),并绘制散点图,则绘制的散点图有什么特征?你能利用正负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?〖提示〗散点图(略),发现正相关时散点大多数分布在第一象限、第三象限,负相关时散点大多数分布在第二象限、第四象限.构造一个量:Lxy=eq\f(1,n)〖(x1-eq\x\to(x))(y1-eq\x\to(y))+(x2-eq\x\to(x))(y2-eq\x\to(y))+…+(xn-eq\x\to(x))(yn-eq\x\to(y))〗.一般情形下,Lxy>0表明成对样本数据正相关;Lxy<0表明成对样本数据负相关.问题2你认为Lxy的大小一定能度量出成对样本数据的相关程度吗?〖提示〗因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小.为了消除度量单位的影响,需要对数据作进一步的“标准化”处理,用sx=eq\r(\f(1,n)\i\su(i=1,n,)xi-\x\to(x)2),sy=eq\r(\f(1,n)\i\su(i=1,n,)yi-\x\to(y)2)分别除xi-eq\x\to(x)和yi-eq\x\to(y)(i=1,2,…,n,eq\x\to(x)和eq\x\to(y)分别为x1,x2,…,xn和y1,y2,…,yn的均值),得eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(x1-\x\to(x),sx),\f(y1-\x\to(y),sy))),eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(x2-\x\to(x),sx),\f(y2-\x\to(y),sy))),…,eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(xn-\x\to(x),sx),\f(yn-\x\to(y),sy))),为简单起见,把上述“标准化”处理后的成对数据分别记为(x1′,y1′),(x2′,y2′),…,(xn′,yn′),则变量x和变量y的样本相关系数r的计算公式为r=eq\f(1,n)(x1′y1′+x2′y2′+…+xn′yn′)=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2)).知识梳理样本相关系数:r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\r(\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)\r(\i\su(i=1,n,y)\o\al(2,i)-n\x\to(y)2)).注意点:样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映出成对样本数据的变化特征.当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.例1假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:x23456y2.23.85.56.57.0计算y与x之间的样本相关系数(精确到0.001,已知eq\i\su(i=1,5,x)eq\o\al(2,i)=90,eq\i\su(i=1,5,y)eq\o\al(2,i)≈140.8,eq\i\su(i=1,5,x)iyi=112.3,eq\r(79)≈8.9,eq\r(2)≈1.4).解∵eq\x\to(x)=eq\f(2+3+4+5+6,5)=4,eq\x\to(y)=eq\f(2.2+3.8+5.5+6.5+7.0,5)=5.eq\i\su(i=1,5,x)iyi-5eq\x\to(x)eq\x\to(y)=112.3-5×4×5=12.3,eq\i\su(i=1,5,x)eq\o\al(2,i)-5eq\x\to(x)2=90-5×42=10,eq\i\su(i=1,5,y)eq\o\al(2,i)-5eq\x\to(y)2=140.8-125=15.8,∴r=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\r(\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2\i\su(i=1,5,y)\o\al(2,i)-5\x\to(y)2))=eq\f(12.3,\r(10×15.8))=eq\f(12.3,\r(158))=eq\f(12.3,\r(2)×\r(79))≈eq\f(12.3,1.4×8.9)≈0.987.反思感悟利用样本相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,有时需要借助计算器.跟踪训练1现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x(分)与入学后第一次考试的数学成绩y(分)如表所示:学生号12345x120108117104103y8464846869学生号678910x11010410599108y6869465771计算y与x之间的样本相关系数(精确到0.001,已知eq\i\su(i=1,10,x)eq\o\al(2,i)=116584,eq\i\su(i=1,10,y)eq\o\al(2,i)=47384,eq\i\su(i=1,10,x)iyi=73796).解eq\x\to(x)=eq\f(1,10)(120+108+…+99+108)=107.8,eq\x\to(y)=eq\f(1,10)(84+64+…+57+71)=68,所以样本相关系数为r=eq\f(73796-10×107.8×68,\r(116584-10×107.8247384-10×682))≈0.751.二、相关关系的强弱知识梳理样本相关系数r的取值范围为〖-1,1〗.当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.注意点:当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系.当r=0时,表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系.例2(1)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,正确的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3〖答案〗A〖解析〗由给出的四组数据的散点图可以看出,题图1和题图3是正相关,样本相关系数大于0,题图2和题图4是负相关,样本相关系数小于0,题图1和题图2的样本点集中在一条直线附近,所以相关性更强,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1.(2)两个变量x,y的样本相关系数r1=0.7859,两个变量u,v的样本相关系数r2=-0.9568,则下列判断正确的是()A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强〖答案〗C〖解析〗由样本相关系数r1=0.7859>0知x与y正相关,由样本相关系数r2=-0.9568<0知u,v负相关,又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强.反思感悟线性相关强弱的判断方法(1)散点图:散点图只是粗略作出判断,其图象越接近直线,相关性越强.(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强.跟踪训练2某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:x2468y30405070(1)画出(x,y)的散点图;(2)计算x与y之间的样本相关系数,并刻画它们的相关程度.解(1)画出(x,y)的散点图如图所示.(2)eq\x\to(x)=5,eq\x\to(y)=47.5,eq\i\su(i=1,4,x)eq\o\al(2,i)=120,eq\i\su(i=1,4,y)eq\o\al(2,i)=9900,eq\i\su(i=1,4,x)iyi=1080,故样本相关系数r=eq\f(\i\su(i=1,4,x)iyi-4\x\to(x)\x\to(y),\r(\i\su(i=1,4,x)\o\al(2,i)-4\x\to(x)2\i\su(i=1,4,y)\o\al(2,i)-4\x\to(y)2))=eq\f(1080-4×5×47.5,\r(120-4×529900-4×47.52))≈0.9827.由样本相关系数r≈0.9827,可以推断生产原料耗费与销售额这两个变量正线性相关,且相关程度很高.三、样本相关系数的实际应用例3以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.房屋大小x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据的散点图;(2)求样本相关系数r,并作出评价.(精确到0.01,已知eq\i\su(i=1,5,x)eq\o\al(2,i)=60975,eq\i\su(i=1,5,y)eq\o\al(2,i)=2756.8,eq\i\su(i=1,5,x)iyi=12952)解(1)画出散点图如图所示.(2)eq\x\to(x)=eq\f(545,5)=109,eq\x\to(y)=eq\f(116,5)=23.2,r=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\r(\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)\r(\i\su(i=1,5,y)\o\al(2,i)-5\x\to(y)2))=eq\f(12952-5×109×23.2,\r(60975-5×1092)\r(2756.8-5×23.22))=eq\f(308,\r(1570)×\r(65.6))≈0.96,由此可知,新房屋的销售价格和房屋的大小这两个变量正线性相关,且相关程度很强.反思感悟当样本相关系数|r|越接近1时,两个变量的相关关系越强,当样本相关系数|r|越接近0时,两个变量的相关关系越弱.跟踪训练3在一组成对样本数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组成对样本数据的样本相关系数为-1,则所有的样本点(xi,yi)(i=1,2,…,n)满足的方程可以是()A.y=-eq\f(1,2)x+1 B.y=x-1C.y=x+1 D.y=-x2〖答案〗A〖解析〗∵这组成对样本数据的样本相关系数为-1,∴这一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)线性相关,且是负相关.∴可排除B,C,D,故选A.1.知识清单:(1)样本相关系数.(2)相关关系的强弱.(3)相关关系的实际应用.2.方法归纳:数形结合.3.常见误区:样本相关系数绝对值的大小与相关程度的关系.1.(多选)对两个变量的样本相关系数r,下列说法正确的是()A.|r|越大,相关程度越大B.|r|越小,相关程度越大C.|r|趋近于0时,没有线性相关关系D.|r|越接近1时,线性相关程度越强〖答案〗AD〖解析〗对于A,|r|越大,相关程度越大,A正确;对于B,|r|越小,相关程度越小,B错误;对于C,|r|趋近于0时,线性相关关系越弱,C错误;对于D,|r|越接近1时,线性相关程度越强,D正确.2.给定y与x的一组成对样本数据,求得相关系数r=-0.690,则()A.y与x线性不相关B.y与x正线性相关C.y与x负线性相关D.以上都不对〖答案〗C〖解析〗因为r=-0.690<0,所以y与x负线性相关.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程审图合同3篇
- 方合同是可以违约么3篇
- 新版采购年度框架协议合同3篇
- 旅游度假楼房转租租赁合同
- 教育培训合同范本3篇
- 收款合同范本3篇
- 教育培训机构劳动合同执行校长3篇
- 尽职调查法律合规指导合同3篇
- 新鲜鸡蛋采购契约3篇
- 携手同行共筑学子未来承诺书3篇
- JBT 14685-2023 无油涡旋空气压缩机 (正式版)
- 2024年辽宁生态工程职业学院单招职业技能测试题库各版本
- 中秋国庆慰问品采购投标方案
- 20K607 防排烟及暖通防火设计审查与安装
- 《统计建模与R软件》书本课后习题答案
- 2024年安徽合肥市建设工程监测中心有限责任公司招聘笔试参考题库含答案解析
- 滑雪指导员理论考试复习题库(含答案)
- 几何画板在初中二次函数教学中的应用研究
- 带你听懂中国传统音乐智慧树知到期末考试答案2024年
- 南京市秦淮区2022-2023七年级上学期期中语文试卷及答案
- 学校归属感量表
评论
0/150
提交评论