张德存-统计学-6_第1页
张德存-统计学-6_第2页
张德存-统计学-6_第3页
张德存-统计学-6_第4页
张德存-统计学-6_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节相关分析概述一、变量间的关系二、散点图与相关关系种类三、相关系数一、变量间的关系㈠问题的提出㈡函数关系与相关关系STAT《统计学》第六章相关与回来分析联系与相互影响是普遍的现象受教育的水平工作后的收入预防疾病支出疾病的发病率事物相互间关系的质的说明:自然的、社会的、经济的、心理的…事物相互间关系的量的分析:两变量或多变量间的数量关系。在可以说明的质的关系基础上进行相关分析和回来分析一、变量间的关系㈠问题的提出㈡函数关系与相关关系STAT《统计学》第六章相关与回来分析出租汽车费用与行驶里程:总费用=行驶里程每公里单价家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。确定性关系函数关系非确定性关系相关关系第一节相关分析概述一、变量间的关系二、散点图与相关关系种类三、相关系数二、散点图与相关关系种类㈠散点图㈡相关种类散点图(Scatterdiagram):在平面直角坐标系上标识两变量间关系的统计图。设一个变量为X,另一变量为Y,则散点图上所描绘的就是下列数据数值:(X1,Y1)、(X2,Y2)、(X3,Y3)、…(Xn,Yn)。STAT《统计学》第六章相关与回来分析XY散点图矩阵三维散点图二、散点图与相关关系种类㈠散点图㈡相关种类线性正相关无(不)相关线性负相关非线性相关第一节相关分析概述一、变量间的关系二、散点图与相关关系种类三、相关系数三、相关系数㈠协方差㈡相关系数STAT《统计学》第六章相关与回来分析协方差(covariance):两个变量与其均值离差乘积的平均数,是相互关系的一种度量。总体协方差:样本协方差:COV

xySTAT《统计学》第六章相关与回来分析对协方差的理解Ⅰ为正Ⅱ为负Ⅲ为正Ⅳ为负协方差为大的正值时,表示强的正线性相关关系。STAT《统计学》第六章相关与回来分析对协方差的理解协方差接近于零时,表示很小或没有线性相关关系。STAT《统计学》第六章相关与回来分析对协方差的理解协方差为大的负值时,表示强的负线性相关关系。STAT《统计学》第六章相关与回来分析协方差为大的正值时,表示强的正线性相关关系。协方差接近于零时,表示很小或没有线性相关关系。协方差为大的负值时,表示强的负线性相关关系。对协方差的理解似乎是这样cmkgmmkg大于基本结论:协方差受计量单位影响,从而不能真实反映相关的程度。三、相关系数㈠协方差㈡相关系数相关系数(correlationcoefficient):度量变量间相关关系的一类指标的统称。就参数统计而言,常用的是皮尔逊积矩相关系数(Pearson):即协方差与两变量标准差乘积的比值,是没有量纲的、标准化的协方差。总体相关系数样本相关系数相关系数的常用算法:相关系数取值在-1与1之间。相关系数是一种对称测量。相关系数无量纲,可以进行比较。相关关系不等于因果关系;相关系数只度量变量间的线性关系,因此,弱相关不确定表明变量间没有关系;极端值可能影响相关系数。留意相关关系成立的数据范围。警惕虚假相关运用相关系数时应留意的问题:STAT其次节一元线性回来分析一、回来分析概述二、一元线性回来模型三、回来估计误差四、判定系数一、回来分析概述㈠回来的含意㈡自变量与因变量㈢回来分析的种类STAT《统计学》第六章相关与回来分析回来:退回regression1877年弗朗西斯•高尔顿爵士遗传学探讨回来线平均身高回来分析(regression):通过一个或几个变量的变更去说明另一变量的变更。包括找出自变量与因变量、设定数学模型、检验模型、估计预料等环节。STAT《统计学》第六章相关与回来分析一、回来分析概述㈠回来的含意㈡自变量与因变量㈢回来分析的种类STAT《统计学》第六章相关与回来分析自变量(independentvariable):说明变量,给定的或可以限制的、用来说明、预料应变量的变量。因变量(dependentvariable):响应变量,由自变量来说明其变更的变量。XYXY••••••••一、回来分析概述㈠回来的含意㈡自变量与因变量㈢回来分析的种类回来分析分类按自变量个数分类一元回来简洁回来多元回来复回来按方程式特征分类线性回来非线性回来一元线性回来SimpleLinearregressionSTAT《统计学》第六章相关与回来分析其次节一元线性回来分析一、回来分析概述二、一元线性回来模型三、回来估计误差四、判定系数二、一元线性回来模型㈠模型的基本形式㈡最小二乘法㈢模型的假定总体一元线性回来模型:模型参数误差项假定:E()=0总体一元线性回来方程:STAT《统计学》第六章相关与回来分析一元线性回来方程的几何意义一元线性回来线的可能形态截距斜率1为正1为负1为0STATSTAT《统计学》第六章相关与回来分析样本一元线性回来方程:(估计的回来方程)总体未知参数以样本统计量估计总体参数回归系数回归系数二、一元线性回来模型㈠模型的基本形式㈡最小二乘法㈢模型的假定最小二乘法(Leastsquaresmethod):以极小化为目标的求估计方程的过程。残差(Residual):e求a、b的公式:STAT《统计学》第六章相关与回来分析STAT《统计学》第六章相关与回来分析最小二乘法估计的优良性质:残差之和为零;所拟合直线通过样本散点图的重心;误差项与说明变量不相关;a与b分别是总体回来系数的无偏估计量;a与b均为听从正态分布的随机变量;二、一元线性回来模型㈠模型的基本形式㈡最小二乘法㈢模型的假定一元线性回来模型的假定其次节一元线性回来分析一、回来分析概述二、一元线性回来模型三、回来估计误差四、判定系数三、回来估计误差㈠SST、SSR与SSE㈡MSE与SeSST(Sumofsquaresoftotal):总的平方和SSR(Sumofsquaresofregression):回来平方和SSE(Sumofsquaresoferrors):误差平方和SST=SSR+SSE三、回来估计误差㈠SST、SSR与SSE㈡MSE与SeMSE(Meansquaresoferrors):估计的均方误差,是总体误差项的方差的估计量。Se:回来估计标准差,总体误差项标准差的估计量,是计算样本回来系数a、b标准差的要素。其次节一元线性回来分析一、回来分析概述二、一元线性回来模型三、回来估计误差四、判定系数四、判定系数㈠判定系数的概念与意义㈡判定系数的计算㈢判定系数与r、SeSTAT《统计学》第六章相关与回来分析判定系数(Coefficientofdetermination):估计的回来方程拟合优度的度量,表明Y的变异性能被估计的回来方程说明的部分所占比例。r2未判定系数STAT《统计学》第六章相关与回来分析当SSR=SST时,为完全的拟合,残差平方和为0,判定系数为1。判定系数的意义当SSE=SST时,为最差的拟合,残差平方和最大,判定系数为0。判定系数的意义四、判定系数㈠判定系数的概念与意义㈡判定系数的计算㈢判定系数与r、Se判定系数的计算STAT《统计学》第六章相关与回来分析四、判定系数㈠判定系数的概念与意义㈡判定系数的计算㈢判定系数与r、Se判定系数与相关系数STAT《统计学》第六章相关与回来分析判定系数与相关系数判定系数的平方根即皮尔逊积矩相关系数。判定系数无方向性,相关系数则有方向,其方向与样本回来系数b(b1)相同。判定系数说明变量值的总离差平方和中可以用回来线来说明的比例,相关系数只说明两变量间关联程度及方向。相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。STAT《统计学》第六章相关与回来分析估计标准差越小,则变量间相关程度越高,回来线对Y的说明程度越高。判定系数与估计标准差第三节回来的显著性检验与预料应用一、回来的显著性检验二、回来方程的估计、预料应用一、回来的显著性检验㈠检验的意义㈡相关系数的检验(t检验)㈢回来系数的检验(t检验)㈣回来方程的检验(F检验)由于样本的相应统计量(相关系数、判定系数、回来系数等)具有随机性,因此,我们须要对其进行显著性检验,以验证是否可以据此推断总体的参数。STAT《统计学》第六章相关与回来分析一、回来的显著性检验㈠检验的意义㈡相关系数的检验(t检验)㈢回来系数的检验(t检验)㈣回来方程的检验(F检验)相关系数检验的目的:总体是否犹如r?提出假设;确定检验统计量;给定显著性水平,确定临界值;确定原假设的拒绝规则;计算检验统计量并做出决策。检验的程序:统计理论已经证明STAT《统计学》第六章相关与回来分析检验统计量落入拒绝域中,故拒绝原假设,接受备择假设。即可以认为明显地不等于零,相关关系是显著的。一、回来的显著性检验㈠检验的意义㈡相关系数的检验(t检验)㈢回来系数的检验(t检验)㈣回来方程的检验(F检验)回来分析中我们最关切的是:X与Y是否有真正的相关关系。即:STAT《统计学》第六章相关与回来分析回来系数的检验提出假设;确定检验统计量;给定显著性水平,确定临界值;确定原假设的拒绝规则;计算检验统计量并做出决策。STAT《统计学》第六章相关与回来分析统计理论已经证明检验统计量落入拒绝域中,故拒绝原假设,接受备择假设。即可以认为b明显地不等于零,X与Y是显著的。一、回来的显著性检验㈠检验的意义㈡相关系数的检验(t检验)㈢回来系数的检验(t检验)㈣回来方程的检验(F检验)F检验是基于F分布进行的,是方差分析内容之一。均方回来均方误差STAT《统计学》第六章相关与回来分析当1=0时,SSR=0,则F值=0。当10时,SSR>0,则F值>0。当我们设1=0时,则较大的F值将推翻这一假设。故拒绝原假设,接受备择假设,即认为回来方程是显著的。第三节回来方程的显著性检验与预料应用一、回来方程的显著性检验二、回来方程的估计、预料应用二、回来方程的估计、预料应用㈠点估计㈡区间估计估计的前提:回来方程经过检验,证明X和Y的关系在统计上是显著的。回来分析的点估计:对于给定的X值,求出Y平均值的一个估计值或Y的一个个别值。若x=169,则:STAT《统计学》第六章相关与回来分析运用点估计应留意的问题:利用点估计得到的Y平均值的点估计值和Y的一个个别值其结果是相同的。点估计不能供应估计量的精确度。在样本自变量取值范围之外进行预料要特殊谨慎。STAT《统计学》第六章相关与回来分析二、回来方程的估计、预料应用㈠点估计㈡区间估计回来分析的区间估计:对于给定的X值,求出Y的平均值的置信区间或Y的一个个别值的预料区间。STAT《统计学》第六章相关与回来分析

Y的平均值的置信区间估计总体的回来模型:样本回来方程:假如样本回来方程通过检验,则:假如给定x=x0,则有:分布形态?可以证明,ŷ0是听从正态分布的,其数学期望:其方差:其标准差:STAT《统计学》第六章相关与回来分析对于给定的x=x0

,Y的1-置信区间为:也就是:自由度为n-2的t分布的水平双侧分位数若令=0.05,则有t/2(n-2)

=2.31当时,得到最小值。当时,的值随的减少或增加而逐步增大。

Y的个别值的置信区间估计对于给定的X=X0,假如要预料Y的一个个别值Y0的置信区间,则其相应的残差为:Y的个别值相对于其平均值的方差当X=X0时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论