华农统计学原理第五章课件_第1页
华农统计学原理第五章课件_第2页
华农统计学原理第五章课件_第3页
华农统计学原理第五章课件_第4页
华农统计学原理第五章课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章相关分析与回归分析第一节变量间的相关关系第二节简单线性相关分析第三节一元线性回归分析

第一节变量间的相关关系一)相关关系的概念二)相关关系的种类新课导入:某车间工人的基本情况:在这里,在这个车间的所有9名工人(总体)中,我们一方面可以了解职工工资总额、生活支出总数、平均工时数等,现在我们要分析的是工资、一周工时及生活支出和食用支出比例等方面的关系,有没有什么关联。

序号工资一周工时生活支出食用支出比例年龄12345678985084083082081080079579078549484746454443424160059059058758557056256059020%22%22.5%23%23.5%24%26%26.5%27%302945262248522324现象间的依存关系大致可以分成两种类型:函数关系指现象间所具有的严格的确定性的依存关系相关关系指客观现象间确实存在,但数量上不是严格对应的依存关系一)相关分析的概念相关分析的概念1)函数关系1.定义当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。2.函数关系特点(1)是一一对应的确定关系;(2)设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量

xy

3.函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为y=px(p为单价)圆的面积与半径之间的关系可表示为S=r2

企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1x2x3

2)相关关系

相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系1.定义:当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种关系称为具有不确定性的相关关系。现象之间客观存在的不严格、不确定的数量依存关系。相关关系的概念相关关系的特点:变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量

x取某个值时,变量y的取值可能有几个各观测点分布不同.

xy

相关关系和函数关系的区别和联系

1.区别:(1)相关关系与函数关系的根本区别在于相依变量间的关系值是否确定.(2)相关关系的研究中各变量的地位是对等,函数关系时自变量和因变量必须是明确.(3)相关关系所涉及的变量均为随机变量,而函数关系的自变量和因变量都是确定性变量

2.联系:

(1)由于存在观察或测量误差,函数关系所具有的确定性对应关系在实际中往往通过相关关系表现出来.(2)为了更好地研究相关变量间的内在联系和数量变动比例关系,往往借助函数关系表达式对相关关系作近似描述.(3)有时,函数关系也可看作是相关关系的特例.即完全相关.二)相关关系的种类相关关系按相关程度分类按相关方向分类按相关形式分类按所研究变量多少分类(1)正相关:两个相关现象间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。例如收入与消费的关系。(2)负相关:当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)趋势变化,即反方向变化。例如物价与消费的关系。1)按相关的方向可划分为:

正相关,负相关(1)当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关。(2)当两种相关现象之间的关系不表现为直线关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关。2)按相关的形式可划分为:

线性相关,非线性相关(1)当只研究两个变量时,它们之间的相关,称为单相关。(2)当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。例如,某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。(3)在某一现象与多种现象相关的场合,假定其他变量不变,只考察其中两个变量的相关关系称为偏相关。例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。

3)按相关关系涉及的变量多少可划分为:

单相关,复相关和偏相关相关关系的图示

不相关

负线性相关

正线性相关

非线性相关

完全负线性相关完全正线性相关

第二节简单线性相关分析一)相关表与相关图二)相关系数一)相关表与相关图1)相关表一种统计表,它是直接根据现象之间的原始资料,将一变量的若干变量值按从小到大的顺序排列,并将另一变量的值与之对应排列形成的统计表。

将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。简单相关表分组相关表单变量分组相关表双变量分组相关表

某市1996年—2003年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。序号年份工资性

现金支出(万元)x城镇储蓄存款余额(万元)y119965001202199754014031998620150419997302005200090028062001970350720021050450820031170510

(1)简单相关表①单变量分组相关表自变量分组并计算次数,而对应的因变量不分组,只计算其平均值。单变量分组相关表的特点:使冗长的资料简化,能够更清晰地反映出两变量之间相关关系。②双变量分组相关表:自变量和因变量都进行分组而制成的相关表,这种表形似棋盘,故又称棋盘式相关表。(2)分组相关表分组相关表就是将原始数据进行分组而编制的相关表。根据分组的情况不同,分组表有两种:1、单变量分组表:只根据一个变量进行分组,另一个变量不进行分组,只是计算出次数和平均数,这种表叫做单变量分组表。

按体重分组(千克)人数(人)每组平均身高(厘米)62.5以上217060-62.5316757.5-602516355-57.53816252.5-558716050-52.512915847.5-509115545-47.52415445以下1151合计400--企业按销售额分组(万元)流通费用率(%)4以下9.654~87.688~127.2512~167.0016~206.8620~246.7324~286.6428~326.6032~366.58

例:简单分组相关表双变量分组表概念:是对自变量和因变量都进行分组而编制的相关表。例如:400个大学生身高和体重相关表按体重分组(千克)按身高分组(厘米)150以下150—154154—158158--162162—166166—17017及以上合计62.5以上2260—62.53357.5—6046782555—57.5161483852.5—552820282548750—52.5332442451212947.5—503302820109145—47.5212102445以下1合计59749412568254002)相关图1、相关图:利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,而将两变量相对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形。2、相关图被形象地称为相关散点图3、因素标志分了组,结果标志表现为组平均数,所绘制的相关图就是一条折线,这种折线又叫相关曲线。散点图

二)相关系数

1.相关系数的概念:

是指在线性相关的条件下,用以反映两变量间线性相关程度和相关方向的统计分析指标.用r表示

2)相关系数的计算

样本相关系数的计算公式或化简为关于相关系数的几点说明(1)r的取值范围是[-1,1](2)|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关(3)

r=0,不存在线性相关关系(4)-1

r<0,为负相关;0<r

1,为正相关(5)|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切相关程度评价标准0<|r|≤0.3为微弱相关0.3<|r|≤0.5为低度相关0.5<|r|≤0.8为显著相关0.8<|r|≤1为高度相关相关系数的计算计算公式:序号产品产量(千吨)生产费用(万元)11.2621.44384474.422.0864.00739617233.1809.61640024843.811014.441210041855.011525.001322557566.113237.2117424805.277.213551.841822597288.016064.00256001280合计36.4880207.541042144544.6相关系数计算表根据上表计算:

例:下表是有关15个地区某种食物需求量和地区人口增加量的资料。

第三节一元线性回归分析一)回归分析的概念二)回归分析的方法三)估计标准差四)可化为线性回归的非线性回归五)相关分析与回归分析的特点一)回归分析的概念

“回归”这个统计学术语,最早采用者是英国遗传学家高尔登,他把这种统计分析方法应用于研究生物学的遗传问题,指出生物后代有回复或回归到其上代原有特性的倾向。高尔登的学生皮尔逊继续研究,把回归与数学方法联系起来,把代表现象之间一般数量关系的直线或曲线称为回归直线或回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论