统计-第七章课件_第1页
统计-第七章课件_第2页
统计-第七章课件_第3页
统计-第七章课件_第4页
统计-第七章课件_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关与回归分析第7章

实例1:

中国妇女生育水平的决定因素是什么?妇女生育水平除了受计划生育政策影响以外,还可能与社会、经济、文化等多种因素有关。1、影响中国妇女生育率变动的因素有哪些?2、各种因素对生育率的作用方向和作用程度如何?3、哪些因素是影响妇女生育率主要的决定性因素?4、如何评价计划生育政策在生育水平变动中的作用?5、计划生育政策与经济因素比较,什么是影响生育率的决定因素?6、如果某些地区的计划生育政策及社会、经济、文化等因素发生重大变化,预期对这些地区的妇女生育水平会产生怎样的影响?

据世界卫生组织统计,全球肥胖症患者达3亿人,其中儿童占2200万人,11亿人体重过重。肥胖症和体重超常早已不是发达国家的“专利”,已遍及五大洲。目前,全球因”吃”致病乃至死亡的人数已高于因饥饿死亡的人数。

(引自《光明日报》刘军/文)问题:肥胖症和体重超常与死亡人数真有显著的数量关系吗?这些类型的问题可以运用相关分析与回归分析的方法去解决。实例2:全球吃死的人比饿死的人多?

第7章相关与回归分析7.1

相关分析7.2

一元线性回归分析7.1相关与回归的基本概念一、相关关系的概念二、相关系数三、相关

一、相关关系的概念

◆确定性的函数关系

Y=f(X)◆不确定性的统计关系—相关关系

Y=f(X)+ε(ε为随机变量)◆没有关系

变量间关系的图形描述:坐标图(散点图)

1.变量间的相互关系函数关系函数关系当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。

当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。即现象之间客观存在的不严格、不确定的数量依存关系。相关关系ε为随机变量,记为:Y=F(X)+ε为影响Y的除X外的其他随机因素。(相关关系)相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品的消费量(y)与物价(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系

2、相关关系的类型●

从涉及的变量数量看

简单相关多重相关(复相关)●

从变量相关关系的表现形式看

线性相关——散布图接近一条直线(左图)

非线性相关——散布图接近一条曲线(右图)●

从变量相关关系变化的方向看正相关——变量同方向变化

A

同增同减(A)负相关——变量反方向变化一增一减(B)B●从变量相关的程度看

完全相关(B)

不完全相关(A)C

不相关(C)

●总体相关系数

对于所研究的总体,表示两个相互联系变量相关程度的总体相关系数为:

总体相关系数反映总体两个变量X和Y的线性相关程度。

特点:对于特定的总体来说,X和Y的数值是既定的总体相关系数是客观存在的特定数值。二、相关系数

样本相关系数

通过x和y的样本观测值去估计样本相关系数变量x和y的样本相关系数通常用表示特点:样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的,是对总体相关系数的估计,它是个随机变量。

相关系数的特点:

相关系数的取值在-1与1之间。当r=0时,表明x与y没有线性相关关系。当时,表明x与y存在一定的线性相关关系:

若表明x与y为正相关;

若表明x与y为负相关。当时,表明x与y完全线性相关:

若r=1,称x与y完全正相关;若r=-1,称x与y完全负相关。相关关系的测度

(相关系数)

样本相关系数的计算公式可化简为:

使用相关系数的注意事项:▲x和y都是相互对称的随机变量,所以▲相关系数只反映变量间的线性相关程度,不能说明非线性相关关系。▲相关系数不能确定变量的因果关系,也不能说明相关关系具体接近于哪条直线。相关系数判断的标准在大多数情况下,0<|r|<1,即X与Y的样本观测值之间存在着一定的线性关系。通常判断的标准是:|r|<0.3称为微弱相关,0.3≤|r|<0.5称为低度相关,0.5≤|r|<0.8称为显著相关,0.8≤|r|<1称为高度相关或强相关。表

我国人均国民收入与人均消费金额数据单位:元年份人均国民收入人均消费金额年份人均国民收入人均消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相关系数计算【例】在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们收集到1981~1993年的样本数据(xi

,yi),i=1,2,…,13,数据见表,计算相关系数。(计算结果)解:根据样本相关系数的计算公式有人均国民收入与人均消费金额之间的相关系数为0.9987,两者之间高度正相关.三、Spearman等级相关系数当变量不满足正态分布要求或不是数量型变量时,简单线性相关系数不宜使用,可以用Spearman等级相关系数作相关性分析。对于样本容量为n的变量x和y,如果取值都可以分为n个等级,而且样本的n个单位分别不重复地属于x和y的不同等级,没有两个单位取相同等级的情况,并且用

表示样本单位属于x的等级与y的等级的级差。Spearman等级相关系数

为:

Spearman等级相关系数的特性样本等级相关系数的取值范围:

时,说明样本等级完全正相关;

时,样本等级完全负相关;

时,说明样本等级不相关;

时,越接近1,正相关程度越高;当

时,越接近-1,负相关程度越高。可以证明:Spearman等级相关系数是简单线性相关系数的特例。7.2一元线性回归分析一、相关分析与回归分析的联系二、总体回归函数与样本回归函数三、回归系数的普通最小二乘估计四、拟合优度度量

一、相关分析与回归分析的联系回归的古典意义:

高尔顿遗传学的回归概念

父母身高与子女身高的关系:

无论高个子或低个子的子女都有向人的平均身高回归的趋势

回归的现代意义:一个因变量对若干解释变量依存关系的研究回归的目的(实质):

由固定的自变量去估计因变量的平均值样本总体自变量固定值估计因变量平均值

相关分析与回归分析的联系●共同的研究对象:都是对变量间相关关系的分析●只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义。●相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析●相关分析中相关系数的确定建立在回归分析的基础上。

二、总体回归函数与样本回归函数

若干基本概念●

y的条件分布:y在x取某固定值条件下的分布。●对于x的每一个取值,都有y的条件期望与之对应,在坐标图上y的条件期望的点随x而变化的轨迹所形成的直线或曲线,称为回归线。●如果把y的条件期望表示为x的某种函数:,这个函数称为回归函数。●如果其函数形式是只有一个自变量的线性函数,如,称为一元线性回归函数。

总体回归函数(PRF)

概念:将总体因变量y的条件均值表现为自变量x的某种函数,这个函数称为总体回归函数(简记为PRF)。表现形式:(1)条件均值表现形式(2)个别值表现形式(随机设定形式)

样本回归函数(SRF)概念:

●y的样本观测值的条件均值随自变量x而变动的轨迹,称为样本回归线。

●如果把因变量y的样本条件均值表示为自变量x的某种函数,这个函数称为样本回归函数(简记为SRF)。表现形式:线性样本回归函数可表示为或者

样本回归函数与总体回归函数的关系

——相互联系

●样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。●和是对总体回归函数参数的估计。●是对总体条件期望的估计●残差e在概念上类似总体回归函数中的随机误差u。回归分析的目的:用样本回归函数去估计总体回归函数。样本回归函数与总体回归函数的关系

——相互区别

●总体回归函数虽然未知,但它是确定的;样本回归线随抽样波动而变化,可以有许多条。●样本回归线还不是总体回归线,至多只是未知总体回归线的近似表现。●总体回归函数的参数虽未知,但是确定的常数;样本回归函数的参数可估计,但是随抽样而变化的随机变量。●总体回归函数中的是不可直接观测的;而样本回归函数中的是只要估计出样本回归的参数就可以计算的数值。

三、回归系数的普通最小二乘估计回归系数估计的思想:为什么只能对未知参数作估计?

参数是未知的、不可直接观测的、不能精确计算的

能够得到的只是变量的样本观测值结论:只能通过变量样本观测值选择适当方法去近似地估计回归系数。前提:

u是随机变量其分布性质不确定,必须作某些假定,其估计才有良好性质,其检验才可进行。原则:

使参数估计值“尽可能地接近”总体参数真实值

回归系数的最小二乘估计基本思想:

希望所估计的偏离实际观测值的残差越小越好。可以取残差平方和作为衡量与偏离程度的标准——最小二乘准则估计式:

序号能源消耗量(十万吨)x工业总产值(亿元)yx2y2xy12345678910111213141516353840424952545962646568697172762425242832313740414047504951485812251444160017642401270429163481384440964225462447615041518457765766255767841024961136916

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论