若因变量y与自变量x之间为线性关系时称为一元线性回归对于具有课件_第1页
若因变量y与自变量x之间为线性关系时称为一元线性回归对于具有课件_第2页
若因变量y与自变量x之间为线性关系时称为一元线性回归对于具有课件_第3页
若因变量y与自变量x之间为线性关系时称为一元线性回归对于具有课件_第4页
若因变量y与自变量x之间为线性关系时称为一元线性回归对于具有课件_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第一节 变量间的相关关系一)相关关系的概念二)相关关系的种类新课导入 :某车间工人的基本情况:在这里,在这个车间的所有9名工人(总体)中,我们一方面可以了解职工工资总额、生活支出总数、平均工时数等,现在我们要分析的是工资、一周工时及生活支出和食用支出比例等方面的关系,有没有什么关联。 序号工资 一周工时 生活支出 食用支出比例 年龄 123456789850840830820810800795790785 494847464544434241 600590590587585570562560590 20%22%22.5%23%23.5%24%26%26.5%27% 3029452622485

2、22324 现象间的依存关系大致可以分成两种类型:函数关系指现象间所具有的严格的确定性的依存关系相关关系指客观现象间确实存在,但数量上不是严格对应的依存关系一)相关分析的概念相关分析的概念1)函数关系1. 定义当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。2.函数关系特点(1)是一一对应的确定关系;(2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量xy 3.函数关系的例

3、子某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价)圆的面积与半径之间的关系可表示为S = r2 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3 2)相关关系 相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系1. 定义: 当一个或几个相互联系的变量取一定数值时,与之相对应

4、的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种关系称为具有不确定性的相关关系。现象之间客观存在的不严格、不确定的数量依存关系。相关关系的概念相关关系的特点:变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个各观测点分布不同. xy 相关关系和函数关系的区别和联系 1.区别: (1)相关关系与函数关系的根本区别在于相依变量间的关系值是否确定. (2)相关关系的研究中各变量的地位是对等,函数关系时自变量和因变量必须是明确. (3)相关关系所涉及的变量均为随机变量,而函数关系的自变量和因变量都是确定性变

5、量 2.联系: (1)由于存在观察或测量误差,函数关系所具有的确定性对应关系在实际中往往通过相关关系表现出来. (2)为了更好地研究相关变量间的内在联系和数量变动比例关系,往往借助函数关系表达式对相关关系作近似描述. (3)有时,函数关系也可看作是相关关系的特例.即完全相关.二)相关关系的种类相关关系按相关程度分类按相关方向分类按相关形式分类按所研究变量多少分类(1)正相关:两个相关现象间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。 例如收入与消费的关系。(2)负相关:当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)趋势变化

6、,即反方向变化。 例如物价与消费的关系。1)按相关的方向可划分为:正相关,负相关(1)当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关。(2)当两种相关现象之间的关系不表现为直线关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关。2)按相关的形式可划分为: 线性相关,非线性相关(1)当只研究两个变量时,它们之间的相关,称为单相关。(2)当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。例如,某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。(3)在某一现象与多种现象相关的场合,假定其他变量不变,只考察其中两个变量的相关关系称为偏相

7、关。例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。3)按相关关系涉及的变量多少可划分为: 单相关,复相关和偏相关相关关系的图示不相关负线性相关正线性相关非线性相关完全负线性相关完全正线性相关 第二节 简单线性相关分析一)相关表与相关图二)相关系数一)相关表与相关图1)相关表 一种统计表,它是直接根据现象之间的原始资料,将一变量的若干变量值按从小到大的顺序排列,并将另一变量的值与之对应排列形成的统计表。 将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。简单相关表分组相关表单变量分组相关表双变量分组相关表 某市1996年 2

8、003年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。 从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。序号年份工资性现金支出(万元)x城镇储蓄存款余额(万元)y11996 50012021997 54014031998 62015041999 73020052000 90028062001 97035072002 105045082003 1170510 (1)简单相关表单变量分组相关表自变量分组并计算次数,而对应的因变量不分组,只计算其平均值。单变量分组相关表的特点:使冗长的资料简化,能够更清

9、晰地反映出两变量之间相关关系。双变量分组相关表:自变量和因变量都进行分组而制成的相关表,这种表形似棋盘,故又称棋盘式相关表。(2)分组相关表分组相关表就是将原始数据进行分组而编制的相关表。根据分组的情况不同,分组表有两种: 1、单变量分组表:只根据一个变量进行分组,另一个变量不进行分组,只是计算出次数和平均数,这种表叫做单变量分组表。 按体重分组(千克)人数(人)每组平均身高(厘米)62.5以上217060-62.5316757.5-602516355-57.53816252.5-558716050-52.512915847.5-509115545-47.52415445以下1151合计400

10、-企业按销售额分组(万元)流通费用率(%)4以下9.654 87.688 127.2512 167.0016 206.8620 246.7324 286.6428 326.6032 366.58 例: 简单分组相关表双变量分组表概念:是对自变量和因变量都进行分组而编制的相关表。例如: 400个大学生身高和体重相关表按体重分组(千克)按身高分组(厘米)150以下150154154158158-16216216616617017及以上合计62.5以上226062.53357.5604678255557.5161483852.555282028254875052.5332442451212947.5

11、50330282010914547.5212102445以下1合计59749412568254002)相关图1、相关图:利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,而将两变量相对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形。2、相关图被形象地称为相关散点图3、因素标志分了组,结果标志表现为组平均数,所绘制的相关图就是一条折线,这种折线又叫相关曲线。散点图 二)相关系数 1.相关系数的概念: 是指在线性相关的条件下,用以反映两变量间线性相关程度和相关方向的统计分析指标.用r表示 2)相关系数的计算 样本相关系数的计算公式或化简为关于相关系数的几点说明(1) r

12、的取值范围是 -1,1(2)|r|=1,为完全相关r =1,为完全正相关r =-1,为完全负正相关(3) r = 0,不存在线性相关关系(4)-1r0,为负相关;0r1,为正相关(5)|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切相关程度评价标准0| r |0.3为微弱相关0.3| r |0.5为低度相关0.5| r |0.8为显著相关0.8| r |1为高度相关相关系数的计算计算公式:序号产品产量(千吨)生产费用(万元)11.2621.44384474.422.0864.00739617233.1809.61640024843.811014.441210041855.01152

13、5.001322557566.113237.2117424805.277.213551.841822597288.016064.00256001280合计36.4880207.541042144544.6相关系数计算表根据上表计算: 例:下表是有关15个地区某种食物需求量和地区人口增加量的资料。 第三节 一元线性回归分析一)回归分析的概念二)回归分析的方法三)估计标准差四)可化为线性回归的非线性回归五)相关分析与回归分析的特点一)回归分析的概念 “回归”这个统计学术语,最早采用者是英国遗传学家高尔登,他把这种统计分析方法应用于研究生物学的遗传问题,指出生物后代有回复或回归到其上代原有特性的倾向

14、。高尔登的学生皮尔逊继续研究,把回归与数学方法联系起来,把代表现象之间一般数量关系的直线或曲线称为回归直线或回归曲线。从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度回归方程一词是怎么来的二)回归分析的方法回答“变量之间是什么样的关系?”方程中运用1 个数字的因变量(响应变量)被预测的变量1 个或多个数字的或分类的自变量 (解释变量)用于预测的变量3.主要用于预测和估计当只涉及一个自变量时

15、称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型 对于只涉及一个自变量的简单线性回归模型可表示为 y = a + x + e模型中,y 是 x 的线性函数(部分)加上误差项线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异性和 称为模型的参数一元线性回归模型对于经判断具有线性关系的两个变量y与x,构造一元线性回

16、归模型为:假定E()=0,有总体一元线性回归方程:建立回归直线模型最小平方法基本数学要求:整理得到由两个关于a、b的二元一次方程组成的方程组:进一步整理,有:例:根据表人均销售额与利润率资料,求其一元线性回归方程。 人均销售额与利润率资料 解:首先,根据表中合计栏的资料求出标准方程组中所需数据;其次,将求出的数据代入公式,求出a、b的值:再次,将a、b的值代入回归方程得:最后,由回归方程可得相应的回归估计值, 如表所示。直线回归方程的计算序号产品产量(千吨)生产费用(万元)11.2621.44384474.422.0864.00739617233.1809.61640024843.811014

17、.441210041855.011525.001322557566.113237.2117424805.277.213551.841822597288.016064.00256001280合计36.4880207.541042144544.6已知n=13,可求代入公式有:回归方程为 y =54.22286 + 0.52638 x 结果表明人均国民收入每增加1元,人均消费金额平均增加0.53元。三)估计标准误差(1)根据因变量实际值和估计值的离差计算计算公式 计算公式又可写为: 估计标准误 根据回归方程得出因变量的估计值。这个数值和实际数值之间就可能会产生误差额,这就是估计值对于实际值的误差,在

18、统计学当中,我们用标准差指标来反映误差值在这一章中,我们也用这样的计算原理来计算:(2)根据a、b两个参数值计算估计标准误差 第一种计算方法含义很明显,计算公式和过程都表明了估计标准误差是用平均误差来表现的。但是计算比较麻烦,需要计算出所有的估计值。如果已经有了直线回归方程的参数值,可用一个比较简单的计算公式,即:1999年伊春林区16个林业局木材剩余物和年木材采伐量资料第二步:模型估计已知n=16,可求代入公式有:回归方程为 结果表明伊春林区年采伐量每增加1万立方米,将平均产生0.404万立方米的剩余物。第三步:预测假设乌伊岭林业局2004年计划采伐木材20万m3,求木材剩余物的点预测值。估计标准差四)可化为线性回归的非线性回归当因变量和自变量间的关系是指数曲线型时,通常采用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论