统计基础 课件 第七章 相关分析和回归分析_第1页
统计基础 课件 第七章 相关分析和回归分析_第2页
统计基础 课件 第七章 相关分析和回归分析_第3页
统计基础 课件 第七章 相关分析和回归分析_第4页
统计基础 课件 第七章 相关分析和回归分析_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计基础Startingfromtheimportanceofstatistics,thischapterstudiesthemeaningofstatistics,severalstagesofstatisticalworkprocess,andhasamoreintuitiveunderstandingofwherestatisticaldatacomefrom;相关分析|相关系数|回归分析

|回归方程总目录123统计概述统计调查统计整理4总量指标与相对指标5平均指标与变异指标678抽样推断相关分析与回归分析时间数列9指数分析相关分析和回归分析Statisticalbasis第7章Learnthemeaningofstatistics,severalstagesofstatisticalworkprocess,andhaveamoreintuitiveunderstandingofwherestatisticaldatacomefrom;7第一节相关分析第二节回归分析1.能熟练运用相关分析方法进行分析;2.能熟练运用简单回归直线方法开展回归分析;3.能运用时间数列分析方法和回归分析方法进行简单统计预测。

能力(技能)目标目标要求1.掌握相关关系的概念、种类及相关关系的计算方法;2.掌握回归的概念及简单回归直线方程的求法;3.掌握估计标准误差的涵义及计算公式;4.掌握几种常用的预测方法及其应用条件。

知识目标第一节相关分析一、相关关系的概念事物或现象间在数量上存在着相互依存、相互制约的关系,这种关系可以分为两种类型,一种是确定性关系,即函数关系:变量之间客观存在的确定性的数量对应关系,当自变量取一个值时,因变量就有一个完全确定的值与之对应。相关关系是客观现象之间确实存在着的数量相互依存关系。它是一种变量之间的不严格、不确定的关系,受着随机因素的影响。相关关系概念第一节相关分析一、相关关系的概念出租汽车费用与行驶里程家庭收入与恩格尔系数家庭收入高,则恩格尔系数低。总费用=行驶里程x每公里单价确定性关系函数关系非确定性关系相关关系第一节相关分析一、相关关系的概念函数关系的例子函数关系可以用数学表达式来反映圆的面积(S)与半径之间的关系可表示为:一

系第一节相关分析一、相关关系的概念商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度之间的关系(x)父亲身高(y)与子女身高(x)之间的关系……相关关系的例子现象间不存在一一对应的依存关系第一节相关分析二、相关关系的分类不完全相关是指两个变量的关系介于完全相关和完全不相关之间,在统计学中,一般的相关关系指的就是这种关系,相关分析的主要对象是不完全的相关关系完全不相关又称零相关,指两个变量的数值之间不存在任何依存关系,彼此独立,互不影响。完全相关是指一个变量的数量完全由另一个变量的数量变化所确定,即函数关系。(一)按相关程度划分第一节相关分析二、相关关系的分类(一)按相关程度划分两种现象中一个现象的数量变化,另一现象的数量变化而确定。即函数关系1.完全相关如yc=a+bx函数关系是相关关系的一个特例第一节相关分析二、相关关系的分类(一)按相关程度划分两种现象之间的关系,介于完全相关和不相关之间。如农作物产量与播种面积之间的关系。2.不完全相关第一节相关分析二、相关关系的分类(一)按相关程度划分两种现象的数量各自独立,互不影响。如家庭收入多少与孩子多少之间不存在相关关系股票价格的高低与气温的高低是不相关的。3.不相关第一节相关分析二、相关关系的分类(二)按相关的形式来分线性相关又称直线相关,是指当自变量变动时,因变量随之发生大致均等的变动,从图形上看,近似地表现为一条直线。非线性相关也称曲线相关,是指当自变量变动时,因变量也随之发生变动,但这种变动不是均等的,从图形上看,近似地表现为一条曲线。第一节相关分析二、相关关系的分类线性相关两个变量之间,当自变量X值发生变动时,因变量Y值发生大致均等的变动。在相关图上观察点的分布大致呈现为一条直线。(正比例关系)非线性相关两个变量之间,当自变量X值发生变动时,因变量Y值发生不均等的变动。在相关图上观察点的分布表现为抛物线、双曲线、指数曲线等非线性形式。

第一节相关分析二、相关关系的分类(三)按相关方向来分正相关是当自变量的数值增加或减少时,因变量的数值也相应增加或减少。负相关是当一现象量增加(减少)另一现象数量减少(增加)。第一节相关分析二、相关关系的分类正相关两个变量的变动方向大体上相同时,即自变量X值增加(或减少),因变量Y也相应的增加(或减少)如家庭消费支出随收入增加而增加。负相关两个变量的变动方向相反。即自变量X值增加(或减少),因变量Y随之相应的减少(或增加)如商品价格降低,其销售量会增多。

第一节相关分析二、相关关系的分类(四)按相关的因素多少来分单相关也叫简单相关,是指两个变量的相关关系,复相关是指三个或三个以上变量之间的相关关系。第一节相关分析二、相关关系的分类相关关系的图示完全正线性相关

完全负线性相关

负线性相关

正线性相关

不相关

非线性相关第一节相关分析三、相关分析的任务1确定现象之间有无相关关系2判定相关关系的方向和密切程度3确定相关关系的表现形式2确定因变量估计值误差的程度第一节相关分析四、相关关系及程度的测定定性分析定性分析是依据研究者的理论知识、专业知识和实践经验,对客观现象之间是否存在相关关系,以及有何种相关关系做出判断1.相关表2.相关图定量分析变量之间相关关系的定量分析主要通过相关系数分析进行。相关系数(r)概念用来测定变量间相关密切程度的指标。第一节相关分析四、相关关系及程度的测定首先需要定性分析变量之间是否有客观存在的性质上的联系,否则会出现无关事物之间的虚假关系(喝牛奶与得癌症)。在定性判断的基础上,再进行定量分析。1.定性分析(1)简单相关表:是一种反映变量之间相关关系的统计表。将一个变量(一般为自变量)按大小顺序排序,然后再将另一个变量(一般为因变量)的对应值排列而成的表格。2.简单相关表和相关图第一节相关分析四、相关关系及程度的测定简单相关表举例将一系列的成对观察值排列在统计表中,就形成了简单相关表。如下表:按耕作深度分组(厘米)单产(吨/公顷)810121416186.07.57.89.110.812.0第一节相关分析四、相关关系及程度的测定某地居民家庭月收入和消费支出原始资料可见,随着家庭月收入的提高,居民的消费支出也有相应提高的趋势,两者之间存在明显的正相关关系。排列整理后的相关表5300150036006500180060004200280012002000750018004000920020008800620030001500250010987654321消费支出月收入家庭编号单位:元月收入1500180020002500300040006200750088009200消费支出1200150018002000280036004200530060006500第一节相关分析四、相关关系及程度的测定一般以直角坐标系的横轴代表变量X,纵轴代表变量Y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。(2)相关图消费支出家庭月收入第一节相关分析四、相关关系及程度的测定相关图举例相关图是利用直角坐标,将变量值用相对应的坐标点描绘出来,从坐标点的分布状况观察变量之间的相互关系的图形。如下图:第一节相关分析四、相关关系及程度的测定点与点之间不可用线段连接。因为,这些坐标点本来就都是一些独立的试验点,正是在这个意义上,相关图也叫散点图。0201自变量应置于横轴上。否则,容易给人造成错觉,不易判断是正相关还是负相关;绘制相关图时需注意的问题第一节相关分析四、相关关系及程度的测定3.分组相关表分组相关表是将相关资料分组后,排列在一张表格上,观察现象之间相关关系的表格。如下表:按产量分组(千件)平均成本(元/件)50以下50-6060-7070-8090-1007273686764第一节相关分析四、相关关系及程度的测定对存在相关关系的变量,需要进一步测定相关程度。英国统计学家卡尔·皮尔逊设计了一个用于测定变量之间线性相关程度和相关方向的统计指标––相关系数(r),公式为:(二)相关程度的判定第一节相关分析四、相关关系及程度的测定相关系数的取值范围:-1≤r≤1。1.当|γ|=1;完全线性相关2.当0<|γ|<1存在相关0<|γ|<0.3;微弱0.3<|γ|<0.5;低度相关;0.5<|γ|<0.8;显著相关;0.8<|γ|<1;高度相关。3.当γ>0正相关;γ<0负相关。利用相关系数判别相关密切程度的方法第一节相关分析四、相关关系及程度的测定随堂训练为了了解某公司员工的工龄与其工作效率之间的相关性,该公司人力资源部进行了一项研究,其目的是想依据研究成果预计员工的工作效率,随机抽取样本如下:计算相关系数,说明相关程度。解:r=0.3531,微弱相关员工工龄效率分数小叶16老王205小蒋63小李85小孙22小徐12老唐154小朱83第一节相关分析四、相关关系及程度的测定序号机床使用年限X年维修费Y1240022540335204464054740656007580086700967601069001188401291080合计608520第一节相关分析四、相关关系及程度的测定序号机床使用年限X年维修费YX²

xy1240041600008002254042916001080335209270400156044640164096002560547401654760029606560025360000300075800256400004000867003649000042009676036577600456010690036810000540011884064705600672012910808111664009720合计608520352642880046560

r=0.8913,包含了两方面的内容:即两个变量相关的方向和相关的程度。正负号说明了相关的方向,具体数字说明了相关的程度。第一节相关分析四、相关关系及程度的测定使用相关系数判定时应注意以下问题相关关系不等于因果关系;x

y随机变量相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系;极端值可能影响相关系数。警惕虚假相关第二节回归分析一、回归分析的概念与特点回归分析是对具有相关关系的变量之间数量变化的一般关系进行测定,选择一个合适的数学模型,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。(一)回归分析的概念第二节回归分析一、回归分析的概念与特点(1)相关分析是回归分析的基础和前提。(2)相关关系决定回归分析如果缺少对现象之间的相关关系作判断,就不能作回归分析,即使勉强做了,有时也没有实际意义。①相关的类型决定回归的类型②相关的性质决定回归系数③现象相关的密切程度决定回归预测的准确程度④回归分析是相关分析的深入和继续。相关分析仅仅说明现象之间是否具有关系,它们之间的关系密切程度如何。只有通过回归分析,建立了回归方程,才能从数量上反映变量之间的联系形式,才可进行相应的回归预测,使相关分析具有实际意义。第二节回归分析一、回归分析的概念与特点回归分析的步骤根据预测目标,确定自变量和因变量建立回归预测模型进行相关分析检验回归预测模型,计算预测误差计算并确定预测值第二节回归分析二、简单直线回归分析就是根据初步确定的直线相关关系类型,拟合一个恰当的直线数学模型,进行一些较精确的计算分析。即yc=a+bx简单直线回归分析的特点:1.确定哪个是自变量,哪个是因变量;2.自变量x和因变量y不能互换;3.回归系数a、b具有实际经济意义;4.自变量是给定的值,因变量是估计值。第二节回归分析二、简单直线回归分析1.确定自变量和因变量;2.整理资料;3.判断相关性质及密切程度;4.确定回归模型;5.求参数a、b;6.确定直线回归方程;7.直线回归预测简单直线回归方程确定第二节回归分析二、简单直线回归分析随堂训练某农场单位面积施肥费用与单位产量之间的关系如下表,要求绘制散点图,计算相关系数,求回归直线方程。序号单位面积施肥费用(元)单产(KG)1234546485254587207668169601020合计2584282第二节回归分析二、简单直线回归分析绘制相关图第二节回归分析二、简单直线回归分析计算相关系数r计算参数a、b的值直线方程为:第二节回归分析三、估计标准误差估计标准误差是因变量的估计值与实际观察值之间的平均误差大小的指标。用来说明回归方程的代表性大小的统计指标。其值越小说明估计的值越接近实际值,估计的越准确。一元线性回归的估计标准误差用公式表示为:第二节回归分析三、估计标准误差Sy:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论