《回归分析》 课件全套 李扬 第1-7章 绪论、一元线性回归-广义线性回归_第1页
《回归分析》 课件全套 李扬 第1-7章 绪论、一元线性回归-广义线性回归_第2页
《回归分析》 课件全套 李扬 第1-7章 绪论、一元线性回归-广义线性回归_第3页
《回归分析》 课件全套 李扬 第1-7章 绪论、一元线性回归-广义线性回归_第4页
《回归分析》 课件全套 李扬 第1-7章 绪论、一元线性回归-广义线性回归_第5页
已阅读5页,还剩547页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

缘起与发展变量间的关系研究内容建模思路小结与评注回归分析之绪论应用回归分析李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院

1/47缘起与发展变量间的关系研究内容建模思路小结与评注统计学与回归分析图

1:统计学研究思路示意图李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院2

/

47缘起与发展变量间的关系研究内容建模思路小结与评注目录缘起与发展变量间的关系研究内容建模思路小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院3

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起与发展变量间的关系研究内容建模思路小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院4

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起“回归”的概念最早出现在生物遗传学领域,其中作出巨大贡献的两位学者就是达尔文(Darwin)和他的表弟高尔顿(Galton)。

1859年,达尔文发表了《OntheOriginofSpecies》(《物种起源》)一书,开创了生物学发展史上的新纪元,引起了整个人类思想的巨大革命。图

2:Darwin(1809-1882)(左)

Galton(1822-1911)(右)李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院5

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起在自然选择理论思想的引导下,达尔文的表弟高尔顿(Galton)先后完成了兔子模型、甜豌豆模型等论证实验,试图对人类遗传规律进行研究。图

3:甜豌豆模型实验(左)兔子模型实验(右)李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院6

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起1885

年,通过允诺保密并提供奖金的方式,高尔顿获得了205

对夫妇及其928位成年子女的遗传特征数据,包括身高、眼睛颜色、脾气、艺术才能、疾病等。其中身高数据见下表:图

4:高尔顿实验数据李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院7

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院8

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起

李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院9

/

47缘起与发展变量间的关系研究内容建模思路小结与评注发展图

5:回归分析发展历程李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院10

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系发展:最小二乘法的提出回归分析中经典的最小二乘法最早出现于天文学与地理测量学领域的研究。1801年,意大利天文学家皮亚齐(Piazzi)发现了第一颗小 行星谷神星,经过40天的跟踪观测后,由于谷神星运行至太 阳背后,使得皮亚齐失去了谷神星的位置。为利用皮亚齐的观测数据寻找谷神星的运行轨道,1805年勒 让德(Legendre)在一本关于计算彗星轨道的书籍中首次发 表了最小二乘法清晰和简明的阐述。1809年,高斯(Gauss)发表了著作《关于绕日行星运动的 理论》。书中声称他自1799年以来就使用最小二乘方法,并 且其提出的正态误差理论也成功地将最小二乘法与概率原理 和正态分布联系起来。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院11

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系小故事:高斯与勒让德之争图

6:高斯与勒让德之争最小二乘法的提出,曾在高斯与勒让德两位大数学家之间引发了优先权之争,其知名度仅次于牛顿和莱布尼兹之间关于微积分发明的优先权之争。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院12

/

47缘起与发展变量间的关系研究内容建模思路小结与评注发展图

7:回归分析发展历程李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院13

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系发展:19世纪-20世纪初19世纪80年代1885年,高尔顿完成了人类遗传研究实验,获得了205

对夫妇及其928

位成年子女的遗传特征数据。借由实验中的身高数据,

高尔顿发现,

当父母身高走向极 端,子女的身高不会象父母身高那样极端化,其身高要比父 母们的身高更接近平均身高,即有“回归”到平均数去的趋 势,“回归”的概念由此诞生。20世纪初马尔可夫(Markov)于1900年证明了在经典线性回归的假定下,最小二乘估计量是具有最小方差的性质。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院14

/

47缘起与发展变量间的关系研究内容建模思路小结与评注发展图

8:回归分析发展历程李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院15

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系发展:20世纪50-70年代20世纪50年代1953年,Box提出“稳健”(Robustness)的概念。James和

Stein

发现,最小二乘估计并不具有不可容许性。20世纪60年代1962年Horel提出了岭回归估计;

1965年,Massy提出了主成分回归估计。在稳健概念的基

上,1964年,Huber提出了基于位置参M估 计量,同年提出极小极大理论也为解决参数估计的效率问题 奠定理论基

。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院16

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系发展:20世纪50-70年代20世纪70年代1970年,Schweppe

提出加权最小二乘估计方法,并将该方法应用于电力系统的状态估计中。1972年,Nelder放宽对因变量随机误差的正态分布要求,提出广义线性模型;Gallant于1975年提出非线性回归的概念。1978年,Koenker

和Bassett提出分位回归模型以研究自变量 与因变量条件分位数的关系;

AIC、Cp准则也分别于1971、

1973年问世。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院17

/

47缘起与发展变量间的关系研究内容建模思路小结与评注发展图

9:回归分析发展历程李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院18

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系发展:20世纪80年代-21世纪初20世纪80年代1983年,Wold提出偏最小二乘法,不但放宽n

>p的假定,也使得每一个系数估计更易解释。Baron于1986年提出利用逐步回归的思想实现对变量的选择。最小截尾二乘法LTS(Least

Truncated

Square)、最小中位数 二乘法LMS(LeastMedianSquare)、S估计、MM估计都是这 一时期提出的。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院19

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系发展:20世纪80年代-21世纪初20世纪90年代Tibshirani于1996年提出了利用Lasso罚函数实现变量选择的思想,解决了高维情况下回归系数的估计问题。21世纪初Fan于2001年提出的SCAD方法以及2007年Zhang提出的MCP 法均属于基于罚函数的变量选择方法,区别在于罚函数形式 不同。Zou于2006年提出的Adaptive

Lasso

法同样可以用于变量选择,该方法下得到的估计具有Oracle性质。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院20

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起与发展变量间的关系研究内容建模思路小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院21

/

47缘起与发展变量间的关系研究内容建模思路小结与评注函数关系

李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院22

/

47缘起与发展变量间的关系研究内容建模思路小结与评注函数关系图

10:销售量(万件)与销售额(万元)函数关系图李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院23

/

47缘起与发展变量间的关系研究内容建模思路小结与评注统计关系统计关系书籍单价Y

与书籍页数X

间的关系房屋价格Y

与房屋面积X

间的关系居民消费额Y

与居民收入X

间的关系李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院24

/

47缘起与发展变量间的关系研究内容建模思路小结与评注统计关系−2.50.02.5−440xy图

11:x与y的相关关系李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院25

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系统计关系与函数关系的区别通过上述示例可以发现,统计关系与函数关系的区别在于:函数关系是一种确定性的关系,当其中一个变量给定,另一 个变量的取值确定;统计关系则是一种非确定性的关系,当 一个变量变化时,另一变量的取值有一定的随机性。从研究方法看,客观现象的函数关系可以用数学分析的方法 研究;而研究客观现象的统计关系,则必须借助于统计学中 的相关与回归分析方法。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院26

/

47缘起与发展变量间的关系研究内容建模思路小结与评注统计关系的刻画

李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院27

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系相关分析与回归分析的区别一是变量的地位不同。在回归分析中,变量有因变量和自变 量之分,因变量处于被解释的地位。研究人员希望讨论自变 量对因变量的影响。在相关分析中,变量的地位平等,研究 变量A和变量B的相关关系与研究变量B和变量A的相关关系 是等价的。二是变量的类型存在差异。回归分析中,

因变量为随机变 量,自变量可以是随机变量也可以是非随机变量,而相关分 析中变量都是随机变量。三是研究目的不完全相同。相关分析的研究目的是为了探究 两类变量间相关关系,而回归分析一方面研究自变量对因变 量的影响并对现象进行解释,另一方面也可实现预测与控制 的功能。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院28

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起与发展变量间的关系研究内容建模思路小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院29

/

47缘起与发展变量间的关系研究内容建模思路小结与评注研究内容线性回归分析对回归模型中参数估计方法的研究对回归模型检验与诊断的研究对回归模型选择的研究非线性回归分析参见文献Bates

and

Watts(1988)李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院30

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系研究内容:估计方法19世纪初,最小二乘法的提出在估计回归系数过程中发挥了重要作用。极大似然估计、加权最小二乘估计等方法在不同条件下亦可用于回归模型参数的估计。为解决在假设不满足情况下最小二乘估计量失效的问题,一 些改进的参数估计方法应运而生,比如岭回归估计、主成分 回归估计等。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院31

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系研究内容:检验与诊断在回归分析中,对模型进行检验与诊断是必要工作之一。估计模型对观测数据的拟合效果是否良好?回归系数在总体 中是否与零有显著差异?这些问题可以通过对参数进行假设 检验来回答。回归模型建立在一些假设基

上,通过检验与诊断判别数据 是否满足基本假设对估计方法的选择与数据处理具有重要意 义。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院32

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系研究内容:模型选择在实证研究中,研究人员根据研究目标事先确定了因变量与 自变量范围,并不意味着该模型一定具有合理性。针对同一 个因变量,不同的自变量组合可以建立不同的模型。变量选择是依据某种评价准则从众多备选模型中选择最优结 果的过程。常用的经典模型选择准则有AIC、BIC、Cp等,还 有一些基于惩罚函数的新兴的模型选择方法等。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院33

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起与发展变量间的关系研究内容建模思路小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院34

/

47缘起与发展变量间的关系研究内容建模思路小结与评注建模思路图

12:回归分析建模思路示意图李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院35

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系建模思路:描述统计例1.2

安斯库姆(Anscombe)曾于1973年构造了四组数据,见下表。请读者分别根据这四组数据建立回归模型,

并对此进行分析。X1Y1X2Y2X3Y3X4Y444.2643.1045.3986.5855.6854.7455.7385.7667.2466.1366.0887.7174.8277.2676.4488.8486.9588.1486.7788.4798.8198.7797.1187.04108.04109.14107.4685.25118.33119.26117.8185.561210.84129.13128.1587.91137.58138.741312.7486.89149.96148.10148.841912.5李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院36

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系建模思路:描述统计

李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院37

/

47研究内容建模思路小结与评注缘起与发展

变量间的关系建模思路:描述统计图

13:安斯库姆数据散点图李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院38

/

47缘起与发展变量间的关系研究内容建模思路小结与评注建模思路图

14:回归分析建模思路示意图李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院39

/

47缘起与发展变量间的关系研究内容建模思路小结与评注建模思路:示例例1.1研究者希望利用回归分析对某地区某行业中产品的产量与生产总成本间的关系进行研究。为实现研究目标,从当地企业中按照某种抽样方法随机抽取了20家企业,获取数据见表1。请利用表中的数据建立产量与生产费用间的回归模型,并进行简要分析。编号产量生产费用编号产量生产费用1782401122370622065971218656332025981312137142066511428189652658731512336462106541625973575216017122425810830818117330921763919973201017968820108307李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院40

/

47缘起与发展变量间的关系研究内容建模思路小结与评注建模思路:示例研究目标为对某地区某行业的生产损耗进行影响因素分析根据研究目标设置指标变量,收集数据将生产损耗的直接表达生产费用作为因变量自变量的选择一方面需要从众多影响因素中,另一方面也需要考虑变量的可测性这一环节需要多次推敲,不妨向该领域专家进行咨询李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院41

/

47缘起与发展变量间的关系研究内容建模思路小结与评注建模思路:示例通过描述统计方法观察变量间的关系

李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院42

/

47缘起与发展变量间的关系研究内容建模思路小结与评注建模思路:示例

李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院43

/

47缘起与发展变量间的关系研究内容建模思路小结与评注建模思路:示例

李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院44

/

47缘起与发展变量间的关系研究内容建模思路小结与评注缘起与发展变量间的关系研究内容建模思路小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院45

/

47缘起与发展变量间的关系研究内容建模思路小结与评注小结与评注本章从回归概念的缘起与发展、变量间的关系出发,重点介 绍了回归分析的研究内容与建模思路,以便于读者从宏观上 对本书内容有所了解。重视描述统计与推断统计相结合,可以帮助研究者在建模流程中少走弯路,更快得到科学、客观、合理的分析结果。本书讨论的回归分析主要基于非随机自变量的假定。然而在回归分析的大框架中,自变量同样可以为随机变量。李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院46

/

47缘起与发展变量间的关系研究内容建模思路小结与评注谢谢!李扬/林存洁/王菲菲/孙韬/廖军回归分析之绪论中国人民大学统计学院47

/

47一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注回归分析之一元线性回归应用回归分析李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归中国人民大学统计学院48

/

59一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注目录一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注中国人民大学统计学院49

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注中国人民大学统计学院50

/

59一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型

参数估计方法参数估计性质模型推断模型预测小结与评注成绩案例

中国人民大学统计学院51

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法成绩案例散点图中国人民大学统计学院52

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法一元线性回归模型

中国人民大学统计学院53

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型

参数估计方法参数估计性质模型推断模型预测小结与评注模型假定

正态性假定中国人民大学统计学院54

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型

参数估计方法参数估计性质模型推断模型预测小结与评注模型假设

在正态性假设下有中国人民大学统计学院55

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法回归分析思想图示中国人民大学统计学院56

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法回归分析思想图示中国人民大学统计学院57

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注中国人民大学统计学院58

/

59一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法最小二乘估计思想

中国人民大学统计学院59

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法最小二乘估计思想中国人民大学统计学院60

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法其他类似估计中国人民大学统计学院61

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法最小二乘估计

中国人民大学统计学院62

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法最小二乘估计

上式可以简化成中国人民大学统计学院63

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型

参数估计方法参数估计性质模型推断模型预测小结与评注成绩案例

中国人民大学统计学院64

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注成绩案例

中国人民大学统计学院65

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法极大似然估计

中国人民大学统计学院66

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注中国人民大学统计学院67

/

59一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注线性性

中国人民大学统计学院68

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注无偏性

中国人民大学统计学院69

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法方差、协方差的性质

中国人民大学统计学院70

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法最佳线性无偏估计高斯-马尔可夫定理:当高斯-马尔可夫条件成立时,最小二乘估计的最佳线性无偏估计,即在所以线性无偏估计中,最小二乘估计量的方差最小。非线性的无偏估计?中国人民大学统计学院71

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注中国人民大学统计学院72

/

59一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计方法参数估计性质模型推断模型预测小结与评注一元线性回归模型t

检验

中国人民大学统计学院73

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法什么是P

值?

中国人民大学统计学院74

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法双侧检验的P

值中国人民大学统计学院75

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法左侧检验的P

值中国人民大学统计学院76

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法右侧检验的P

值中国人民大学统计学院77

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型

参数估计方法参数估计性质模型推断模型预测小结与评注检验准则

中国人民大学统计学院78

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计方法参数估计性质模型推断模型预测小结与评注一元线性回归模型F

检验F

检验是根据平方和分解式,直接从回归效果检验回归方程的显著性。平方和分解式为:

中国人民大学统计学院79

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法SST

=

SSR

+

SSE中国人民大学统计学院80

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法方差分析表中国人民大学统计学院81

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法样本相关系数中国人民大学统计学院82

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法样本相关系数中国人民大学统计学院83

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法样本相关系数中国人民大学统计学院84

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法样本相关系数

中国人民大学统计学院85

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法样本相关系数检验

中国人民大学统计学院86

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法三种检验的关系相关系数检验与回归系数显著性的t

检验为等价关系回归系数显著性t

检验与回归方程显著性F

检验为等价关系思考:为什么会有这种等价关系?中国人民大学统计学院87

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型

参数估计方法参数估计性质模型推断模型预测小结与评注决定系数

中国人民大学统计学院88

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注残差概念

中国人民大学统计学院89

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注残差图中国人民大学统计学院90

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注残差图中国人民大学统计学院91

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法残差的性质中国人民大学统计学院92

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法改进的残差标准化残差,使得残差具有可比性:标准化残差,使得残差具有可比性:

中国人民大学统计学院93

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法回归系数的区间估计中国人民大学统计学院94

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注中国人民大学统计学院95

/

59一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型

参数估计方法参数估计性质模型推断模型预测小结与评注单值预测

中国人民大学统计学院96

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归模型预测小结与评注一元线性回归模型

参数估计方法

参数估计性质

模型推断区间预测-因变量新值的区间预测

从而得中国人民大学统计学院97

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归模型预测小结与评注一元线性回归模型

参数估计方法

参数估计性质

模型推断区间预测-因变量新值的区间预测

中国人民大学统计学院98

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归模型预测小结与评注一元线性回归模型

参数估计方法

参数估计性质

模型推断区间预测-因变量新值的区间预测

中国人民大学统计学院99

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归模型预测小结与评注一元线性回归模型

参数估计方法

参数估计性质

模型推断区间预测-因变量新值的区间预测

中国人民大学统计学院100

/

59

李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法区间估计-计算

中国人民大学统计学院101

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归模型推断模型预测小结与评注一元线性回归模型

参数估计方法

参数估计性质例2.1-模拟数据的生成

中国人民大学统计学院102

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归模型推断模型预测小结与评注一元线性回归模型

参数估计方法

参数估计性质例2.2-数值模拟的流程中国人民大学统计学院103

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注中国人民大学统计学院104

/

59一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归参数估计性质模型推断模型预测小结与评注一元线性回归模型

参数估计方法小结与评注本章介绍了一元回归模型适用场景以及回归模型未知参数的估计、最小二乘估计的性质、回归方程的显著性检验、回归系数的区间估计、残差分析的基本概念和方法、回归模型的主要应用等问题。一元线性回归模型比较简单,但是可以让读者对回归分析方法的思想有一个初步了解,也为后面推广到多元线性回归打下基础。中国人民大学统计学院105

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归一元线性回归模型参数估计方法参数估计性质模型推断模型预测小结与评注谢谢!中国人民大学统计学院106

/

59李扬/林存洁/王菲菲/孙韬/廖军回归分析之一元线性回归多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归应用回归分析李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院107

/

105多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性目录多元线性回归模型参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数类别型自变量分段线性回归实例分析小结与评注李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院108

/

105多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性点球成金李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院109

/

105多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性电影《点球成金》讲述了奥克兰田径棒球队总经理比利·比恩(BillyBeane)如何利用分析技术组建一支有竞争力的球队的故事。这部电影是根据迈克尔·刘易斯2003

年出版的同名非小说类书籍《点球成金:赢得不公平游戏的艺术》改编1。1/

qinyn/BANA7038/moneyball.html李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院110

/

105多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性取因变量为回合数(runs,R),散点图y

轴为因变量,x

轴为各自变量2:2/

qinyn/BANA7038/moneyball.html李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院111

/

105中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质

模型推断化肥成分含量与农作物产出关系某种化肥含氮、磷和钾三种主要成分。为了研究该肥料三种成分不同含量对某种农作物产量的影响,对每亩农作物施用一定量的该种化肥,得到了该作物每亩收成以及该化肥各主要成分含量的数据,如表1所示。李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院112

/

105中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质

模型推断化肥成分含量与农作物产出关系表1:某农作物每亩收成与对应施用化肥中氮、磷和钾含量数据

氮含量(X1,单位:千克)磷含量(X2,单位:克)

0.798

10000.062钾含量(X3,单位:千克)

30.098作物收成(Y

,单位:千克/亩)332.6241.90510527.58032.130355.7912.16811053.39429.476352.4673.60811580.22132.402383.8593.31212104.94931.783386.8693.98712631.64134.154409.3873.56013157.67532.994413.1295.33013684.94135.203438.5384.26414209.86934.454440.7725.20314737.58933.058446.0856.12715263.56735.016468.6546.60715791.73134.251474.2626.78316316.15236.695496.3498.19816842.49438.940524.1048.05517368.23135.296511.2138.37617895.01539.075542.6278.49018421.73637.222542.0859.86318948.28640.972575.7918.91319475.25041.055583.57512.61020001.47039.361592.589李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院113

/

105中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质

模型推断化肥成分含量与农作物产出关系图1:氮、磷和钾含量数据与农作物产量三维图。其中,(a)图的自变量为氮、磷含量;(b)图的自变量为氮、钾含量;(c)图为磷、钾含量李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院114

/

105多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数类别型自变量分段线性回归实例分析小结与评注李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院115

/

105多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性引言李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院116

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性引言李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院117

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性模型简介李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院118

/

105

(1)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性模型简介李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院119

/

105称

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性模型假定李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院120

/

105

(4)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性模型假设李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院121

/

105正态性假定(5)从而有模型(3)满足(6)

(7)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性模型解释李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院122

/

105为了对多元线性回归模型以及对应的回归系数进行解释,使用服装销售研究中的员工薪资、宣传费用和流动资金三个变量对服装销售量的影响这一实例,给出回归方程的几何解释以及各回归系数的实际含义。(8)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性模型解释李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院123

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数类别型自变量分段线性回归实例分析小结与评注李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院124

/

105多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性最小二乘估计李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院125

/

105

(9)其中,

为离差平方和。(10)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性最小二乘估计李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院126

/

105利用式(10)对各参数求偏导并令其等于0,即(11)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性最小二乘估计李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院127

/

105有

(12)称

(13)为经验回归方程。多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性极大似然估计李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院128

/

105由式(7)有似然函数

取对数并分别对参数β

和σ2

求偏导,并令其等于0

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性极大似然估计李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院129

/

105

(14)

模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质例3.1李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院130

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性回归拟合值与残差李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院131

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性回归拟合值与残差李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院132

/

105

(18)称(19)

(20)为回归残差向量。

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性回归拟合值与残差李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院133

/

105由式(17)有

则(21)因而有(22)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性回归拟合值与残差李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院134

/

105由式(11)可知,残差满足

(23)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性估计性质李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院135

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院136

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院137

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院138

/

105由

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院139

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院140

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院141

/

105性质5

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院142

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性估计性质李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院143

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院144

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院145

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院146

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院147

/

105从而有

作变换,令

有故有

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院148

/

105

所以

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数类别型自变量分段线性回归实例分析小结与评注李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院149

/

105多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性引言李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院150

/

105

模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质F

检验李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院151

/

105

模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质F

检验李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院152

/

105类似于一元线性回归检验,这里仍使用总离差平方和的分解式,即简记为

(24)其中,进而构造F

检验统计量(25)

模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质F

检验李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院153

/

105表2:方差分析表模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质F

检验李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院154

/

105

模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质t

检验李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院155

/

105

(26)由性质(6)有

(27)

(28)模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质t

检验李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院156

/

105

(29)其中,

模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质t

检验李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院157

/

105

模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质偏F

检验李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院158

/

105

(30)

(31)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性拟合优度李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院159

/

105类似于一元线性回归模型,可以定义关于多元线性回归模型的样本决定系数

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性拟合优度李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院160

/

105(33)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性置信区间李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院161

/

105由性质(6)及式(28),可得

(34)

(35)

模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质例3.2李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院162

/

105例3.1

中已经得到了某农作物每亩产量与某化肥氮、磷和钾含量之间的线性估计方程。这里将对模型以及各回归系数的估计结果分别进行F检验和t

检验,并计算相应的拟合优度。检验结果见表3。表3:参数估计以及模型推断结果模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型

参数的估计与性质例3.2李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院163

/

105

多元线性回归模型

参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数

类别型自变量

分段线性多元线性回归模型参数的估计与性质模型推断中心化与标准化相关阵与偏相关系数类别型自变量分段线性回归实例分析小结与评注李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院164

/

105多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性引言李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院165

/

105在多元线性回归模型的使用场景中,常常会遇到自变量之间具有不同度量单位的情形。例如,对于距离这一变量而言,有的数据记录采用的是以米为单位,而有的则可能是以千米为单位,再如对于商品价格而言,有的数据记录采用的是以人民币元为单位,也有的可能是以美元为单位。在分析类似数据时,得到的结果可能会不一致,对分析结果的比较也会带来影响,因此需要对数据进行预处理,例如:中心化(centralization)和标准化(normalization)。多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院166

/

105记(36)则经验回归方程(13)等价于

(37)

多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性图2:数据中心化效果示意图李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院167

/

105中心化称式(37)为中心化经验回归方程。中心化经验回归方程中的常数项为

0,中心化是将样本中心移到坐标原点,因而方程中没有截距项,而其他回归系数的最小二乘估计值则保持不变。显然,这是因为坐标的平移变换不会改变直线的斜率,图2为数据中心化处理的示意图。多元线性回归模型

参数的估计与性质模型推断中心化与标准化

相关阵与偏相关系数

类别型自变量

分段线性标准化李扬/林存洁/王菲菲/孙韬/廖军多元线性回归中国人民大学统计学院168

/

105在多元线性回归模型中,由于自变量X1,·

·

·

,Xp

所用单位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论