样本相关系数 教学设计_第1页
样本相关系数 教学设计_第2页
样本相关系数 教学设计_第3页
样本相关系数 教学设计_第4页
样本相关系数 教学设计_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教学设计

课程基本信息学科数学年级高二学期秋季课题8.1.2样本相关系数教科书书名:人教A版(2019版)教材出版社:人民教育出版社教学目标1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系。2.结合实例,会通过样本相关系数比较多组成对数据的相关性。教学内容重点:样本相关系数的含义,通过相关系数比较多组成对数据的相关性;难点:样本相关系数的定义合理性、样本相关系数与标准化数据向量夹角的关系。教学过程一、知识回顾在一次对人体脂肪含量百分比和年龄的关系的研究中,研究人员获得了一组样本数据:(其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.)根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?预设:由散点图可知,人体的脂肪含量与年龄之间呈正相关关系,这种相关性是强还是弱呢?散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小。能否像引入平均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?二、知识建构:探求刻画相关关系程度的数字特征1、回忆必修二中关于标准差的定义?如何理解标准差的定义?标准差研究的对象是一组数据,首先对数据关于均值进行平移,得到新的一组数据,则新的这组数据均值为0,标准差定义中的刻画的是样本数据偏离均值的程度,而则是各个数据偏离均值的程度叠加的效果,最后,对叠加效果进行标准化,并统一数据的量纲单位,便得到标准差的定义.2、类比标准差的定义探求刻画相关关系程度的数字特征①类比标准差的定义,将成对样本数据关于均值平移,得到新的样本数据:原始成对样本数据平移后的成对样本数据并作出对应的散点图:从散点图可知,绝大多数的散点分布在第一、三象限,散点的横纵坐标符号相同,这个规律是由年龄与人体脂肪含量呈线性正相关关系决定的,一般地,如果两个变量线性正相关,则平移后的散点大多数分布在第一、三象限,散点的横纵坐标符号相同;如果两个变量线性负相关,则平移后的散点大多数分布在第二、四象限,散点的横纵坐标符号相反。思考:根据以上分析,类比标准差的定义过程,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?一般情形下,表明成对样本数据正相关,表明成对样本数据负相关。思考:你认为,的大小一定能度量出成对样本数据的相关程度吗?预设:在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高的单位由米改为厘米,计算两种情况下的值,的值变为原来的100倍。但单位的改变并不会导致体重与身高之间相关程度的改变,因此,不能直接由的大小度量出成对样本数据的相关程度。为什么会出现这种情况呢?这是由两种情况的数值变化的幅值不同引起的,为了消除幅值的影响,我们需要对数据进一步标准化处理。而标准差本身反映了变量的幅值变化程度,因此,我们可以将平移后的数据除以变量的标准差。得到一组新的数据,仿照的构造,可以得到。我们称为变量和变量的样本相关系数。相关系数定义消除了两个变量变化幅度的影响,对同组数据平移或伸缩时,不会影响相关系数的值.样本标椎差的定义与样本相关系数的定义对比表:三、知识建构:探求样本相关系数的取值范围样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映成对样本数据的变化特征.样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?为此,我们先考察一下r的取值范围.1、思考:观察r的结构,联系二维向量、三维向量数量积的坐标表示,你有什么发现?答:将向量的维数推广到维,维向量的数量积的定义为,其中为向量的夹角.类似于平面或空间向量的坐标表示,对于向量和,我们有2、思考:从向量的角度如何理解相关系数?思考:当|r|=1时,成对样本数据之间具有怎样的关系呢?小结:关于相关系数,我们应该知道的:1、两个随机变量的相关性可以通过成对样本数据进行分析,样本相关系数可以反映两个随机变量之间的线性相关程度.2、.3、的符号反映了相关关系的正负性.为正时,表明变量和线性正相关;为负时,表明变量和线性负相关.4、的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.当越接近于1时,成对样本数据的线性相关程度越强;当越接近于0时,成对样本数据的线性相关程度越弱.小结:总体相关系数与样本相关系数的关系四:知识运用:回归情境问题例1:根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度?解:先画出散点图,如下图所示:观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关。根据样本相关系数的定义由,计算得,,可以推断脂肪含量和年龄这两个变量正线性相关,且相关性很强.例2:有人收集了某城市居民年收入(即所有居民在一年内收人的总和)与A商品销售额的10年数据,如下表所示.画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断居民年收入与A商品销售额的相关程度和变化趋势的异同.解:画出成对样本数据的散点图.从散点图看,A商品销售额与居民年收人的样本数据呈现出线性相关关系.由样本数据计算得样本相关系数r≈0.95.由此可以推断,A商品销售额与居民年收人正线性相关,即A商品销售额与居民年收人有相同的变化趋势,且相关程度很强.例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如表下所示.体重与身高、臂展与身高分别具有怎样的相关性?五、课堂练习1.由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的相关关系?为什么?答.样本相关系数可以反映变量之间相关的正负性及线性相关的程度,但由于样本数据的随机性,样本相关系数往往不能确切地反映变量之间的相关关系。一般来说,样本量越大,根据样本相关系数推断变量之间相关的正负性及线性相关的程度越可靠,而样本量越小则越不可靠。一个极端的情况是,无论两个变量之间是什么关系,如果样本量取2,则计算可得样本相关系数的绝对值都是1(在样本相关系数存在的情况下),显然据此推断两个变量完全线性相关是不合理的。2.已知变量x和变量y的3对随机观测数据(2,2),(3,-1),(5,-7),计算两个变量的样本相关系数.能据此推出这两个变量几乎处处线性相关吗?为什么?3.画出下列成对数据的散点图,并计算样本相关系数.据此,请你谈谈样本相关系数在刻画两个变量间相关关系上的特点.(1)(-2,-3),(-1,-1),(0,1),(1,3),(2,5),(3,7);(2)(0,0),(1,1),(2,4),(3,9),(4,16);(3)(-2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论