统计学-相关与回归分析课件_第1页
统计学-相关与回归分析课件_第2页
统计学-相关与回归分析课件_第3页
统计学-相关与回归分析课件_第4页
统计学-相关与回归分析课件_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关分析与回归分析是现代统计学中非常重要的内容,在自然、管理科学和社会经济领域有着十分广泛的应用。在分析变量之间关系的时,常用的基本模型:(1)相关模型;(2)回归模型实践中到底使用哪种模型取决于研究者的研究目的和数据的收集方式和条件。相关分析:变量X和Y都被视为随机变量,服从二元分布;经典的回归分析:通常变量x不是随机变量,在事先选好的值中取值,变量Y是随机变量,在变量x的给定值处有相应的观测值。例1:太阳镜的日销售数量Y与日最高气温X之间的关系例2:人均消费与人均GDP的关系相关分析与回归分析是现代统计学中非常重要的内容,在自然、管理1相关分析与回归分析相关分析

用一个指标来表明现象间相互依存关系的密切程度。回归分析

根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间关系。相关分析所研究的变量是对等关系;回归分析所研究的两个变量不是对等关系。因果相关分析与回归分析相关分析2统计学-相关与回归分析课件3本章内容一、相关关系的概念和分类二、线性相关关系的识别三、一元线性回归分析四、多元线性回归分析五、非线性回归分析相关分析NewNew本章内容一、相关关系的概念和分类相关分析NewNew4一、相关关系的概念和分类一、函数关系和相关关系二、相关关系的分类

相关程度、相关方向、相关形式、

变量多少、相关性质一、相关关系的概念和分类一、函数关系和相关关系5二、线性相关关系的识别(一)散点图(例子)

最简单、最直观的识别方法,但难以给出相关的程度.(二)直线相关系数

直线相关系数的设计思想

总体相关系数与Pearson相关系数相关系数的检验

二、线性相关关系的识别(一)散点图(例子)6三、一元线性回归分析变量y对x的一元线性回归总体模型

一元线性回归方程

一元线性经验回归方程

估计方法:普通最小二乘估计

、标准误差

—的估计模型评价:可决系数、显著性检验12预测方法:点预测,区间预测将代入回归方程得=181.5830+0.4414×10000=4595.5628(元)

一元线性回归模型的概念New三、一元线性回归分析变量y对x的一元线性回归总体模型一元线7四、多元线性回归分析基本概念:回归系数、被解释变量(因变量)、解释变量(自变量)、多元回归、随机误差项。四、多元线性回归分析基本概念:回归系数、被解释变量(因变量)8统计学-相关与回归分析课件9基本假设解释变量是确定性变量,不是随机变量,且要求矩阵X中的自变量列之间不相关,样本容量的个数应大于解释变量的个数。独立、同分布、零均值正态分布的假定条件:

基本假设解释变量是确定性变量,不是随机变量,且要求矩阵X中的10参数估计与一元线性回归方程的参数估计原理一样,应该使得估计值与观测值y之间的残差在所有样本点上达到最小,即使Q达到最小参数的最小二乘估计值为:另外,参数估计与一元线性回归方程的参数估计原理一样,应该使得估计11模型评价-拟合优度一般不再用可决系数而是用修正的可决系数模型评价-拟合优度一般不再用可决系数12模型评价-显著性检验1整个回归方程的检验模型评价-显著性检验1整个回归方程的检验13模型评价-显著性检验2单个回归系数的检验模型评价-显著性检验2单个回归系数的检验14EXCEL演示和解释EXCEL演示和解释15五、非线性回归分析线性回归模型的结构特点:(1)被解释变量是解释变量的线性函数—变量线性(2)被解释变量也是参数的线性函数—参数线性根据实际分析建立的模型往往不符合上述线性特点,称为非线性模型。如:柯布—道格拉斯生产函数处理非线性回归模型的方法有两种:(1)把非线性关系转化为线性关系,然后再运用线性回归的分析方法进行估计。(2)利用非线性最小二乘法直接估计非线性模型转换成线性模型的常用方法:直接和间接代换法

五、非线性回归分析线性回归模型的结构特点:16统计学-相关与回归分析课件17统计学-相关与回归分析课件18

函数关系:对一个或几个变量任意一个取值,另一个变量都有唯一确定值与之相对应,这种关系确定性的关系称为函数关系。如某种商品的销售额Y与该商品的销售量X以及价格P之间的关系可以表示为Y=PX,这就是一种函数关系。一般把作为影响因素的变量称为自变量;把发生对应变化的变量称为因变量。Y是因变量,P与X是自变量。函数关系函数关系:对一个或几个变量任意一个取值,另一19

相关关系:当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化,这种不确定的相互关系,称为相关关系如:劳动生产率与工资水平的关系,家庭支出和收入的关系,人的体重和身高的关系。相关关系不能用函数精确表达,但经常用一定的函数形式去近似地描述。相关关系相关关系:当一个或几个相互联系的变量取一定数20按相关程度划分

完全相关:当一种现象的数量变化完全由另一个现象的数量变化所确定时,这两种现象间的关系为完全相关。即函数关系。

不相关:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。

不完全相关:两个现象之间的关系介于完全相关和不相关之间,称为不完全相关。(主要表现形式,主要研究对象,常简称为相关,即狭义的相关)按相关程度划分完全相关:当一种现象的数量变化21

正相关:当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为正相关。如家庭支出随家庭收入的提高而增加。

负相关:当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为负相关。如商品流转的规模越大,流通费用水平则越低。按相关方向划分正相关:当一个现象的数量由小变大,另一个现象22按相关形式划分线性相关:当两种相关现象之间的关系大致呈现为直线关系时,称之为线性相关。如人均消费与人均收入通常呈线性关系非线性相关:如果两种相关现象之间,并不表现为直线的关系,而是近似于某种曲线关系,则这种关系称为非线性相关。散点图按相关形式划分线性相关:当两种相关现象之间的关系大致呈现为直23单相关:一个变量对另一个变量的相关关系,称为单相关。复相关:当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。如某种商品的需求与其价格水平及人们收入水平之间的相关关系就是一种复相关。偏相关:在某一变量与多种变量相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为偏相关。按变量多少划分单相关:一个变量对另一个变量的相关关系,称为单相关。按变量多24真实相关:当两种现象之间的相关确实具有内在的联系时,称之为“真实相关”。虚假相关:当两种现象之间的相关只是表面存在,实质上并没有内在的联系时,称之为“虚假相关”。按相关性质划分真实相关:当两种现象之间的相关确实具有内在的25散点图:又称相关图,它是以直角坐标系的横轴代表变量X,纵轴代表变量Y,将两个变量相对应的数值用坐标点的形式描述出来,用来反映两变量之间相关关系的图形。

散点图散点图:又称相关图,它是以直角坐标系的横轴代表变量X,纵轴26相关图相关图27数据散点图数据散点图28散点图散点图29设计思想设计思想30总体相关系数二维随机变量总体(X,Y),随机变量X和Y的总体相关系数:

(数)性质:(1)(2)的充分必要条件是存在常数和使得以概率1成立。

协方差总体相关系数二维随机变量总体(X,Y),随机变量X和Y的31统计学-相关与回归分析课件32(随机变量)(数)样本相关系数例9.2Pearson相关系数,样本相关系数(随机变量)(数)样本相关系数例9.2Pearson相关系数33例子EXCEL:

pearson()correl()例子EXCEL:34图9.5从二元总体中抽取的一个随机样本为什么要检验?图9.5从二元总体中抽取的一个随机样本为什么要检验?35相关系数检验1.要检验的假设:或2.检验方法一—t检验

检验统计量(原假设成立时)例9.3相关系数检验1.要检验的假设:363.检验方法二——直接利用R的分布总体相关系数检验更简单的方法:直接查R分布的临界值表,即相关系数临界值表(附表九).例9.33.检验方法二——直接利用R的分布例9.337例9.3法一:t统计量显著性水平0.05,查表得到临界值:由于,所以否定原假设,接受备择假设,表明总体相关系数显著不为零,即人均国内生产总值与人均销售金额之间确实存在着线性相关关系。方法二:例9.3法一:t统计量方法二:38普通最小二乘估计正规方程组:

求解正规方程组得:例子普通最小二乘估计正规方程组:求解正规方程组得:例子39例子回归方程:Excel:

Slope();intercept();steyx()例子回归方程:Excel:Slope();inter40可决系数可决系数41估计标准误差例子估计标准误差例子42例子newExcel函数:Steyx()Excel函数:RSQ()例子newExcel函数:Steyx()Excel函43显著性检验1例子显著性检验1例子44显著性检验2显著性检验245例子例子46相关分析

函数关系与相关关系相关关系的分类

完全、不完全、不相关;正相关、负相关;线性相关、非线性相关;单相关、复相关、偏相关线性相关的识别

散点图(如何用EXCEL画?)相关系数及其检验

总体相关系数(数)样本相关系数(Pearson)相关分析函数关系与相关关系47相关分析(续)(随机变量)(数)或者直接查R

的分布的临界值表,即相关系数临界值表(附表九).相关分析(续)(随机变量)(数)或者直接查R的分布的临48总体模型样本模型模型的两部分;自变量(解释变量),因变量(被解释变量)回归系数;回归系数的意义假设条件:独立同分布,均值为0,方差为一元线性回归方程(直线)一元线性经验回归方程几何解释:截距和斜率一元线性回归分析—概念

总体模型一元线性回归分析—概念49普通最小二乘估计(OLS)实际值与相应点的估计值(拟合值)残差;残差平方和的无偏估计斜率和Pearson相关系数的关系一元线性回归—估计方法OLS

无偏估计例子普通最小二乘估计(OLS)一元线性回归—估计方法OLS50一元线性回归模型评价

一元线性回归模型的拟合优度

可绝系数(判定)

正确认识其作用;

拟合程度,解释力度

与Pearson相关系数的关系一元线性回归模型回归系数的显著性检验(正确认识)

假设独立同分布整个回归方程的检验—方差分析(F检验)回归系数的显著性检验—t检验注意:当常数项时,上述估计和检验不再成立!例子例9.5综合最常用指标一元线性回归模型评价一元线性回归模型的拟合优度注意:当常51一元线性回归模型预测

点预测Excel:

trend(),forecast()区间预测

Y的均值的区间估计

Y的个别值的区间估计(预测区间)注:条件是独立同正态分布,P230-231三点结论.一元线性回归模型预测点预测52多元线性回归分析

总体模型样本模型(独立同分布,均值为0)普通最小二乘估计(OLS)的无偏估计:无偏估计方差为多元线性回归分析总体模型无偏估计方差为53多元线性回归模型评价

多元线性回归模型的拟合优度

可绝系数(判定)

正确认识其作用多元线性回归模型回归系数的显著性检验(正确认识)

假设独立同分布整个回归方程的检验—方差分析(F检验)回归系数的显著性检验—t检验注意:当常数项时,上述估计和检验不再成立!例9.7例9.8多元线性回归模型评价多元线性回归模型的拟合优度注意:当常54非线性回归模型

参数线性和变量线性非线性回归模型

柯布—道格拉斯生产函数非线性转换成线性模型的常用方法

直接代换法

间接代换法非线性回归模型参数线性和变量线性55例子

EXCEL演示例子EXCEL演示56例子

【例9.2】数据集UN中保存的是193个国家或地区(大多是联合国成员国)2001的数据。ln(Fertility)和ln(PPgdp)分别是是出生率(每千人)的对数和人均GDP的对数,Purban是城镇人口比率,试以ln(Fertility)为因变量做回归分析。EXCEL演示例子【例9.2】数据集UN中保存的是193个国家或地区57相关分析与回归分析是现代统计学中非常重要的内容,在自然、管理科学和社会经济领域有着十分广泛的应用。在分析变量之间关系的时,常用的基本模型:(1)相关模型;(2)回归模型实践中到底使用哪种模型取决于研究者的研究目的和数据的收集方式和条件。相关分析:变量X和Y都被视为随机变量,服从二元分布;经典的回归分析:通常变量x不是随机变量,在事先选好的值中取值,变量Y是随机变量,在变量x的给定值处有相应的观测值。例1:太阳镜的日销售数量Y与日最高气温X之间的关系例2:人均消费与人均GDP的关系相关分析与回归分析是现代统计学中非常重要的内容,在自然、管理58相关分析与回归分析相关分析

用一个指标来表明现象间相互依存关系的密切程度。回归分析

根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间关系。相关分析所研究的变量是对等关系;回归分析所研究的两个变量不是对等关系。因果相关分析与回归分析相关分析59统计学-相关与回归分析课件60本章内容一、相关关系的概念和分类二、线性相关关系的识别三、一元线性回归分析四、多元线性回归分析五、非线性回归分析相关分析NewNew本章内容一、相关关系的概念和分类相关分析NewNew61一、相关关系的概念和分类一、函数关系和相关关系二、相关关系的分类

相关程度、相关方向、相关形式、

变量多少、相关性质一、相关关系的概念和分类一、函数关系和相关关系62二、线性相关关系的识别(一)散点图(例子)

最简单、最直观的识别方法,但难以给出相关的程度.(二)直线相关系数

直线相关系数的设计思想

总体相关系数与Pearson相关系数相关系数的检验

二、线性相关关系的识别(一)散点图(例子)63三、一元线性回归分析变量y对x的一元线性回归总体模型

一元线性回归方程

一元线性经验回归方程

估计方法:普通最小二乘估计

、标准误差

—的估计模型评价:可决系数、显著性检验12预测方法:点预测,区间预测将代入回归方程得=181.5830+0.4414×10000=4595.5628(元)

一元线性回归模型的概念New三、一元线性回归分析变量y对x的一元线性回归总体模型一元线64四、多元线性回归分析基本概念:回归系数、被解释变量(因变量)、解释变量(自变量)、多元回归、随机误差项。四、多元线性回归分析基本概念:回归系数、被解释变量(因变量)65统计学-相关与回归分析课件66基本假设解释变量是确定性变量,不是随机变量,且要求矩阵X中的自变量列之间不相关,样本容量的个数应大于解释变量的个数。独立、同分布、零均值正态分布的假定条件:

基本假设解释变量是确定性变量,不是随机变量,且要求矩阵X中的67参数估计与一元线性回归方程的参数估计原理一样,应该使得估计值与观测值y之间的残差在所有样本点上达到最小,即使Q达到最小参数的最小二乘估计值为:另外,参数估计与一元线性回归方程的参数估计原理一样,应该使得估计68模型评价-拟合优度一般不再用可决系数而是用修正的可决系数模型评价-拟合优度一般不再用可决系数69模型评价-显著性检验1整个回归方程的检验模型评价-显著性检验1整个回归方程的检验70模型评价-显著性检验2单个回归系数的检验模型评价-显著性检验2单个回归系数的检验71EXCEL演示和解释EXCEL演示和解释72五、非线性回归分析线性回归模型的结构特点:(1)被解释变量是解释变量的线性函数—变量线性(2)被解释变量也是参数的线性函数—参数线性根据实际分析建立的模型往往不符合上述线性特点,称为非线性模型。如:柯布—道格拉斯生产函数处理非线性回归模型的方法有两种:(1)把非线性关系转化为线性关系,然后再运用线性回归的分析方法进行估计。(2)利用非线性最小二乘法直接估计非线性模型转换成线性模型的常用方法:直接和间接代换法

五、非线性回归分析线性回归模型的结构特点:73统计学-相关与回归分析课件74统计学-相关与回归分析课件75

函数关系:对一个或几个变量任意一个取值,另一个变量都有唯一确定值与之相对应,这种关系确定性的关系称为函数关系。如某种商品的销售额Y与该商品的销售量X以及价格P之间的关系可以表示为Y=PX,这就是一种函数关系。一般把作为影响因素的变量称为自变量;把发生对应变化的变量称为因变量。Y是因变量,P与X是自变量。函数关系函数关系:对一个或几个变量任意一个取值,另一76

相关关系:当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化,这种不确定的相互关系,称为相关关系如:劳动生产率与工资水平的关系,家庭支出和收入的关系,人的体重和身高的关系。相关关系不能用函数精确表达,但经常用一定的函数形式去近似地描述。相关关系相关关系:当一个或几个相互联系的变量取一定数77按相关程度划分

完全相关:当一种现象的数量变化完全由另一个现象的数量变化所确定时,这两种现象间的关系为完全相关。即函数关系。

不相关:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。

不完全相关:两个现象之间的关系介于完全相关和不相关之间,称为不完全相关。(主要表现形式,主要研究对象,常简称为相关,即狭义的相关)按相关程度划分完全相关:当一种现象的数量变化78

正相关:当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为正相关。如家庭支出随家庭收入的提高而增加。

负相关:当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为负相关。如商品流转的规模越大,流通费用水平则越低。按相关方向划分正相关:当一个现象的数量由小变大,另一个现象79按相关形式划分线性相关:当两种相关现象之间的关系大致呈现为直线关系时,称之为线性相关。如人均消费与人均收入通常呈线性关系非线性相关:如果两种相关现象之间,并不表现为直线的关系,而是近似于某种曲线关系,则这种关系称为非线性相关。散点图按相关形式划分线性相关:当两种相关现象之间的关系大致呈现为直80单相关:一个变量对另一个变量的相关关系,称为单相关。复相关:当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。如某种商品的需求与其价格水平及人们收入水平之间的相关关系就是一种复相关。偏相关:在某一变量与多种变量相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为偏相关。按变量多少划分单相关:一个变量对另一个变量的相关关系,称为单相关。按变量多81真实相关:当两种现象之间的相关确实具有内在的联系时,称之为“真实相关”。虚假相关:当两种现象之间的相关只是表面存在,实质上并没有内在的联系时,称之为“虚假相关”。按相关性质划分真实相关:当两种现象之间的相关确实具有内在的82散点图:又称相关图,它是以直角坐标系的横轴代表变量X,纵轴代表变量Y,将两个变量相对应的数值用坐标点的形式描述出来,用来反映两变量之间相关关系的图形。

散点图散点图:又称相关图,它是以直角坐标系的横轴代表变量X,纵轴83相关图相关图84数据散点图数据散点图85散点图散点图86设计思想设计思想87总体相关系数二维随机变量总体(X,Y),随机变量X和Y的总体相关系数:

(数)性质:(1)(2)的充分必要条件是存在常数和使得以概率1成立。

协方差总体相关系数二维随机变量总体(X,Y),随机变量X和Y的88统计学-相关与回归分析课件89(随机变量)(数)样本相关系数例9.2Pearson相关系数,样本相关系数(随机变量)(数)样本相关系数例9.2Pearson相关系数90例子EXCEL:

pearson()correl()例子EXCEL:91图9.5从二元总体中抽取的一个随机样本为什么要检验?图9.5从二元总体中抽取的一个随机样本为什么要检验?92相关系数检验1.要检验的假设:或2.检验方法一—t检验

检验统计量(原假设成立时)例9.3相关系数检验1.要检验的假设:933.检验方法二——直接利用R的分布总体相关系数检验更简单的方法:直接查R分布的临界值表,即相关系数临界值表(附表九).例9.33.检验方法二——直接利用R的分布例9.394例9.3法一:t统计量显著性水平0.05,查表得到临界值:由于,所以否定原假设,接受备择假设,表明总体相关系数显著不为零,即人均国内生产总值与人均销售金额之间确实存在着线性相关关系。方法二:例9.3法一:t统计量方法二:95普通最小二乘估计正规方程组:

求解正规方程组得:例子普通最小二乘估计正规方程组:求解正规方程组得:例子96例子回归方程:Excel:

Slope();intercept();steyx()例子回归方程:Excel:Slope();inter97可决系数可决系数98估计标准误差例子估计标准误差例子99例子newExcel函数:Steyx()Excel函数:RSQ()例子newExcel函数:Steyx()Excel函100显著性检验1例子显著性检验1例子101显著性检验2显著性检验2102例子例子103相关分析

函数关系与相关关系相关关系的分类

完全、不完全、不相关;正相关、负相关;线性相关、非线性相关;单相关、复相关、偏相关线性相关的识别

散点图(如何用EXCEL画?)相关系数及其检验

总体相关系数(数)样本相关系数(Pearson)相关分析函数关系与相关关系104相关分析(续)(随机变量)(数)或者直接查R

的分布的临界值表,即相关系数临界值表(附表九).相关分析(续)(随机变量)(数)或者直接查R的分布的临105总体模型样本模型模型的两部分;自变量(解释变量),因变量(被解释变量)回归系数;回归系数的意义假设条件:独立同分布,均值为0,方差为一元线性回归方程(直线)一元线性经验回归方程几何解释:截距和斜率一元线性回归分析—概念

总体模型一元线性回归分析—概念106普通最小二乘估计(OLS)实际值与相应点的估计值(拟合值)残差;残差平方和的无偏估计斜率和Pearson相关系数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论