第七章统计案例知识点清单 高二上学期数学北师大版(2019)选择性必修第一册_第1页
第七章统计案例知识点清单 高二上学期数学北师大版(2019)选择性必修第一册_第2页
第七章统计案例知识点清单 高二上学期数学北师大版(2019)选择性必修第一册_第3页
第七章统计案例知识点清单 高二上学期数学北师大版(2019)选择性必修第一册_第4页
第七章统计案例知识点清单 高二上学期数学北师大版(2019)选择性必修第一册_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2/2新教材北师大2019版数学选择性必修第一册第七章知识点清单目录第七章统计案例§1一元线性回归§2成对数据的线性相关性§3独立性检验问题2/2第七章统计案例§1一元线性回归一、曲线拟合和直线拟合1.如果变量之间存在着某种关系,那么其散点图中的点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述.这样近似描述的过程称为曲线拟合.2.若在两个变量X和Y的散点图中,所有点看上去都在一条直线附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为直线拟合.二、一元线性回归方程1.最小二乘法对于给定的两个变量X和Y,可以把其成对的观测值(x1,y1),(x2,y2),…,(xn,yn)表示为平面直角坐标系中的n个点.现在希望找到一条直线Y=a+bX,使得对每一个xi(i=1,2,…,n),由这个直线方程计算出来的值a+bxi与实际观测值yi的差异尽可能小.为此,希望[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2达到最小.换句话说,我们希望a,b的取值能使上式达到最小.这个方法称为最小二乘法.2.线性回归方程直线方程Y=a^+b^X称作Y关于X的线性回归方程,相应的直线称作Y关于X的回归直线,a^,其中,b^=x1y1+a^=y-b^xx=y=三、线性回归方程的求解与运用1.确定研究对象,明确哪个变量是X,哪个变量是Y.2.画出X和Y的散点图,观察它们之间是否存在线性关系.3.若数据呈线性关系,则选用线性回归方程.4.按一定规则(如最小二乘法)估计回归方程的系数.5.对变量值的预测,即X取某值时,对Y的值进行预测.§2成对数据的线性相关性一、相关系数1.相关系数一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),记r=i=1n(xi−x2.相关系数r的特征(1)样本(线性)相关系数r的取值范围为[-1,1].(2)|r|值越接近1,随机变量之间的线性相关程度越强;|r|值越接近0,随机变量之间的线性相关程度越弱.(3)当r>0时,两个随机变量的值总体上变化趋势相同,此时称两个随机变量正相关;当r<0时,两个随机变量的值总体上变化趋势相反,此时称两个随机变量负相关;当r=0时,此时称两个随机变量线性不相关.二、两个随机变量相关性的判断1.利用散点图判断两个随机变量的相关性(1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二、第四象限,对应的成对数据异号的居多.(2)如果散点落在一条直线附近,则认为这两个变量线性相关.2.利用相关系数判断两个随机变量的相关程度相关系数r是从数值上来判断变量间的线性相关程度的,是定量分析.|r|刻画了样本点集中于某条直线的程度.|r|值越接近1,散点图中的样本点分布越接近一条直线,两个变量的线性相关程度越强.三、非线性相关问题1.有时根据所测量的数据作出两个随机变量的散点图后,发现这些散点并非分布在某一条直线附近,而是在某一条曲线附近,此时,我们需要根据曲线的形状,选择适当的函数模型来拟合,再通过变量代换,利用线性回归模型得到两个变量间的非线性回归方程.常见的非线性回归模型如下:曲线方程曲线(曲线的一部分)变换公式变换后的线性函数Y=axb(幂函数曲线) c=lna,v=lnX,u=lnYu=c+bvY=aebX(指数曲线) c=lna,u=lnYu=c+bXY=ae c=lna,v=1Xu=lnYu=c+bvY=a+blnX v=lnXy=a+bv§3独立性检验问题一、独立性检验1.2×2列联表:设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B2×2列联表如下:ABB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d二、独立性检验的基本思想1.统计量χ2χ2=n(ad−bc)2.在变量A,B独立的前提下,当样本量很大时,χ2近似服从一个已知的分布.当χ2较大时,说明变量之间不独立.在统计中,用以下结果对变量的独立性进行判断.(1)当χ2≤2.706时,没有充分的证据判断变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ2>2.706时,有90%的把握判断变量A,B有关联;(3)当χ2>3.841时,有95%的把握判断变量A,B有关联;(4)当χ2>6.635时,有99%的把握判断变量A,B有关联.三、独立性检验的应用应用独立性检验解决实际问题大致包括以下几个主要环节:(1)根据抽样数据整理出2×2列联表;(2)计算χ2的值,并与相关数值进行比较;(3)根据检验规则得出推断结论.注意,上述几个环节的内容可以根据不同情况进行调整.例如,有些时候,分类变量的抽样数据列联表是问题中给定的.四、独立性检验与统计、概率的综合应用独立性检验与统计、概率的综合应用主要表现为以统计图表为载体,考查统计分析、概率的计算,以及构建两个分类变量列2×2列联表等.解题时注意要认真审题,通过频率分布直方图等图表的统计功能确定分类变量的值,构建或完善2×2列联表,从而对事件进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论