




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
4.1成对数据的统计相关性新知初探·课前预习——突出基础性教材要点要点一相关关系1.散点图:由坐标系及散点形成的数据图.2.相关关系:如果两个变量之间的关系近似地表现为一条________,则称它们有线性相关关系,简称为相关关系.3.函数关系:如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们线性相关,这实际上就是函数关系.4.相关系数:一般地,对于n个成对观测数据(x1,y1),(x2,y2),…,(xn,yn),当数据{xi},{yi}(i=1,2,…,n)的标准差都不为0❶时,我们称r=eq\f(\i\su(i=1,n,)(xi-x)(yi-y),\r(\i\su(i=1,n,)(xi-x)2\i\su(i=1,n,)(yi-y)2))=eq\f(\i\su(i=1,n,x)iyi-n\a\vs4\al(x)y,\r((\i\su(i=1,n,x)eq\o\al(\s\up1(2),\s\do1(i))-nx2)(\i\su(i=1,n,y)eq\o\al(\s\up1(2),\s\do1(i))-ny2)))为{xi},{yi}的相关系数.批注❶当标准差为0时,数据{xi},{yi}(i=1,2,…,n)全部相同,表明数据离散程度为0.5.相关系数的性质:(1)rxy值范围是[-1,1].当0<rxy<1时,称{xi}和{yi}________;当-1<rxy<0时,称{xi}和{yi}________;当rxy=0时,称{xi}和{yi}不相关.(2)|rxy|越接近于1时,变量x,y的线性相关程度越高❷,这时数据(x1,y1),(x2,y2),…,(xn,yn)分散在一条直线附近.(3)|rxy|越接近于0时,变量x,y的线性相关程度________.(4)rxy具有对称性,即rxy=ryx.(5)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.批注❷统计经验告诉我们,当rxy>0.8时,y有随着x的增加而增加的趋势,这时我们认为{xi}和{yi}是高度正相关的;当rxy<0.8时,y有随着x的增加而减少的趋势,这时我们认为{xi}和{yi}是高度负相关的.要点二相关系数与向量夹角把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),向量夹角的大小可以用余弦来刻画,我们就用余弦来刻画两个向量的相关关系.设a=(x1-x,x2-x,…,xn-x),b=(y1-y,y2-y,…,yn-y),从而有cos〈a,b〉=eq\f(a·b,|a||b|)=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-x)(yi-y),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-x)2·\o(∑,\s\up6(n),\s\do4(i=1))(yi-y)2)).❸当夹角在[0,π2)当夹角在(π2,π]当夹角为π2时,余弦值为0批注❸用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式本质上是一致的.基础自测1.判断正误(正确的画“√”,错误的画“×”)(1)若两个变量正相关,则样本相关系数大于0小于1.()(2)相关系数越大,两个变量的相关性就越强.()(3)若相关系数r=0,则两变量x,y之间没有关系.()2.下列两个量之间的关系是相关关系的是()A.匀速直线运动中时间与位移的关系B.学生的成绩和身高C.儿童的年龄与体重D.物体的体积和质量3.若变量y与x之间的样本相关系数r=-0.9832,则变量y与x之间()A.具有很弱的线性相关关系B.具有较强的线性相关关系C.它们的线性相关关系还需要进一步确定D.不确定4.如图所示的两个变量具有相关关系的是________(填序号).题型探究·课堂解透——强化创新性题型1线性相关关系例1某零售店近5个月的销售额和利润额资料如下表所示:商店名称ABCDE销售额x/千万元35679利润额y/百万元23345(1)根据上表数据作出散点图;(2)观察散点判断利润额y关于销售额x是否具有线性相关关系.如果具有线性相关关系,那么是正相关还是负相关?方法归纳两个变量是否线性相关的判断方法巩固训练1某个男孩的年龄与身高的统计数据如下表所示.年龄x(岁)123456身高y(cm)788798108115120(1)画出散点图;(2)判断y与x是否具有线性相关关系.题型2相关系数例2互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:日期1日2日3日4日5日外卖甲日接单:x(百单)529811外卖乙日接单:y(百单)2310515据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关性强弱进行判断.(若|r|>0.8,则可认为y与x有较强的线性相关关系)方法归纳相关系数可以反映两个变量之间的线性相关程度,即散点集中于一条直线的程度,其符号反映了相关关系的正负性.用相关系数能够较准确的判断相关的程度.巩固训练2科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如下表:x(年龄/岁)26563949615327584160y(脂肪含量/%)14.531.421.226.334.629.617.833.525.935.2根据上表中的样本数据,计算样本相关系数(精确到0.01),并推断它们的相关关系及相关程度.参考数据及公式:eq\i\su(i=1,10,)xiyi=13527.8,eq\i\su(i=1,10,)xeq\o\al(\s\up1(2),\s\do1(i))=23638,eq\i\su(i=1,10,)yeq\o\al(\s\up1(2),\s\do1(i))=7759.6,eq\r(43)≈6.56,eq\r(2935)≈54.18,相关系数r=eq\f(\i\su(i=1,n,x)iyi-n\a\vs4\al(x)y,\r(\i\su(i=1,n,x)eq\o\al(\s\up1(2),\s\do1(i))-nx2)·\r(\i\su(i=1,n,y)eq\o\al(\s\up1(2),\s\do1(i))-ny2)).题型3多组成对数据的相关性例3某电器销售公司的管理人员认为,月销售收入是广告费用的函数.下面是该公司近8个月的月销售收入与广告费用数据,试分析其月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.月销售收入x/万元电视广告费用y/万元报纸广告费用z/万元9651.590229541.5922.52.59533.3943.52.3942.54.29432.5题型4相关系数与向量夹角例4用向量夹角分析例3中月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.4.1成对数据的统计相关性新知初探·课前预习[教材要点]要点一2.直线5.(1)正相关负相关(3)越低[基础自测]1.(1)√(2)×(3)×2.解析:A、D是函数关系;B是不相关关系;C是相关关系,故选C.答案:C3.解析:变量y与x之间的样本相关系数r=-0.9832,|r|=0.9832,接近1,样本相关系数的绝对值越大,相关性越强,∴变量y与x之间有较强的线性相关关系,故选B.答案:B4.解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.答案:②③题型探究·课堂解透例1解析:(1)散点图如图所示:(2)由散点图可知,所有散点接近一条直线排列,所以利润额与销售额是线性相关关系,由图可知当销售额增加时,利润额呈现增加的趋势,所以是正相关.巩固训练1解析:(1)散点图如图所示.(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.例2解析:由题意知,x=eq\f(5+2+9+8+11,5)=7,y=eq\f(2+3+10+5+15,5)=7,样本相关系数r=eq\f(\i\su(i=1,5,)(xi-x)(yi-y),\r(\i\su(i=1,5,)(xi-x)2\i\su(i=1,5,)(yi-y)2))=eq\f(66,77)≈0.857>0.8.故可认为y与x有较强的线性相关关系.巩固训练2解析:x=eq\f(1,10)(26+56+39+49+61+53+27+58+41+60)=47,y=eq\f(1,10)(14.5+31.4+21.2+26.3+34.6+29.6+17.8+33.5+25.9+35.2)=27,r=eq\f(\i\su(i=1,10,x)iyi-10\a\vs4\al(x)y,\r(\i\su(i=1,10,x)eq\o\al(\s\up1(2),\s\do1(i))-10x2)·\r(\i\su(i=1,10,y)eq\o\al(\s\up1(2),\s\do1(i))-10y2))=eq\f(13527.8-10×47×27,\r(23638-10×472)×\r(7759.6-10×272))=eq\f(8378,6\r(43)×4\r(2935)),因为eq\r(43)≈6.56,eq\r(2935)≈54.18,所以r=eq\f(8378,6×6.56×4×54.18)≈0.98,由样本相关系数r≈0.98,可以推断人体脂肪含量和年龄的相关程度很强.例3解析:由题意可得x≈93.75,y≈3.1875,z≈2.475,seq\o\al(\s\up1(2),\s\do1(x))=eq\f(1,8)eq\o(∑,\s\up6(8),\s\do4(i=1))(xi-x)2=eq\f(1,8)[(96-93.75)2+(90-93.75)2+…+(94-93.75)2]≈3.188,seq\o\al(\s\up1(2),\s\do1(y))=eq\f(1,8)eq\o(∑,\s\up6(8),\s\do4(i=1))(yi-y)2=eq\f(1,8)[(5-3.1875)2+(2-3.1875)2+…+(3-3.1875)2]≈0.809,seq\o\al(\s\up1(2),\s\do1(z))=eq\f(1,8)eq\o(∑,\s\up6(8),\s\do4(i=1))(zi-z)2=eq\f(1,8)[(1.5-2.475)2+(2-2.475)2+…+(2.5-2.475)2]≈0.727,sxy=eq\f(x1y1+x2y2+…+x8y8,8)-eq\a\vs4\al(x)y=eq\f(1,8)(96×5+90×2+…+94×3)-93.75×3.1875≈1.297,sxz=eq\f(x1z1+x2z2+…+x8z8,8)-eq\a\vs4\al(x)z=eq\f(1,8)(96×1.5+90×2+…+94×2.5)-93.75×2.475≈-0.031,所以rxy=eq\f(sxy,sxsy)=eq\f(1.297,\r(3.188)×\r(0.809))≈0.808,rxz=eq\f(sxz,sxsz)=eq\f(-0.031,\r(3.188)×\r(0.727))≈-0.020.上述结果表明月销售收入与电视广告费用之间正相关程度高,月销售收入与报纸广告费用之间呈负相关关系.例4解析:由于x≈93.75,y≈3.1875,z≈2.475,将例3表中的三组数据分别减去x,y,z.记x=(x1-x,x2-x,…,x8-x),y=(y1-y,y2-y,…,y8-y),z=(z1-z,z2-z,…,z8-z).则可得x=(2.25,-3.75,1.25,-1.75,1.25,0.25,0.25,0.25),y=(1.8125,-1.1875,0.8125,-0.6875,-0.1875,0.3125,-0.6875,-0.1875),z=(-0.975,-0.475,-0.975,0.025,0.825,-0.175,1.725,0.025),于是有cos〈x,y〉=eq\f(2.25×1.8125+(-3.75)×(-1.1875)+…+0.25×(-0.1875),\
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 聘用暑假工协议书
- 比亚迪试驾协议书
- 自闭症儿童安全协议书
- 高端手工女鞋定制行业深度调研及发展项目商业计划书
- 高端护肤品限时折扣平台行业跨境出海项目商业计划书
- 金融科技人才发展指数研究企业制定与实施新质生产力项目商业计划书
- 拆除老房子协议书
- 创意礼品定制店企业制定与实施新质生产力项目商业计划书
- 卡通造型包子行业深度调研及发展项目商业计划书
- 金融科技创新竞赛行业深度调研及发展项目商业计划书
- 《中小学生端午节安全教育主题班会》课件
- 高级网络技术试题及答案
- (高清版)TDT 1042-2013 土地整治工程施工监理规范
- 男朋友申请表
- 高中心理健康:我心换你心——心理主题:人际交往 课件(22张PPT)
- 高清元素周期表(专业版)
- 北京中考英语作文模板
- 订单运作与产品交付流程
- 糖尿病视网膜病变PPT课件
- 储油罐制作安装施工方案(完整版)
- 盐酸西替利嗪的合成工艺改进
评论
0/150
提交评论