![江西财经大学统计学第九章相关与回归分析_第1页](http://file4.renrendoc.com/view10/M00/26/0F/wKhkGWenglKAcHqjAAB9CUAiLu4637.jpg)
![江西财经大学统计学第九章相关与回归分析_第2页](http://file4.renrendoc.com/view10/M00/26/0F/wKhkGWenglKAcHqjAAB9CUAiLu46372.jpg)
![江西财经大学统计学第九章相关与回归分析_第3页](http://file4.renrendoc.com/view10/M00/26/0F/wKhkGWenglKAcHqjAAB9CUAiLu46373.jpg)
![江西财经大学统计学第九章相关与回归分析_第4页](http://file4.renrendoc.com/view10/M00/26/0F/wKhkGWenglKAcHqjAAB9CUAiLu46374.jpg)
![江西财经大学统计学第九章相关与回归分析_第5页](http://file4.renrendoc.com/view10/M00/26/0F/wKhkGWenglKAcHqjAAB9CUAiLu46375.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
STAT
第九章相关与回归分析统计实例STAT统计实例
账单与小费的关系在西方国家,餐饮等服务行业有一条不成文的规定,即发生餐饮等服务消费时须给侍者一定数额的小费。许多人都听说小费应是账单的16%左右,是否真的如此?统计实例STAT
我们必须关注的问题是:
1.账单与小费之间是否确实有关?
2.若有关,则属于何种关系?
3.如何根据账单来推算小费的数额?本章的重点就是根据成对出现的样本数据做出一些推论。并力求描述账单与小费之间的数量关系,这样就能找出人们留小费时所应遵循的规则。第九章相关与回归分析STAT
本章重点
1.相关关系与回归方程概述;
2.相关关系的测定;
3.回归方程的拟合:方程的拟合;拟合优度的判定指标:判定系数,估计标准误
4.回归方程的应用(估计与预测)。
本章难点
1.积差法相关系数的计算;
2.拟合优度的判定。第九章相关与回归分析STAT第一节相关关系概述一、问题的提出
1.单个变量的研究
分布、平均及标准差、推断等;
2.多个变量的研究
有无关系、何种关系、如何推算变量间的影响。(1)计件工资与产量;(2)原材料消耗与产量、单位产量消耗和原材料价格;(3)粮食产量与施肥量;(4)香烟消费与癌症发生率;(5)血压与年龄;(6)父母身高与子女身高;(7)家庭收入与打屁股次数;(8)工资增加与酒价上涨第九章相关与回归分析STAT二、变量间的相互关系(一)函数关系
1.定义:完全确定的(数量)关系。一一对应关系!(1)某一变量的变动可由另一(组)变量的变动完全解释;
计件工资(y)与产量(x)
y=f(x)=10x;原材料消耗总额(y)与产量(x1)、单位产量消耗(x2)和原材料价格(x3)
y=x1·x2·x3。(2)y
被解释变量(因变量);x
解释变量(自变量)。(二)相关关系
1.定义:不完全确定的关系。统计关系,平均对应关系!第九章相关与回归分析STAT身高(y)与体重(x);
A:x=60kg、y=1.70m;B:x=60kg、y=1.72m;
C:x=60kg、y=1.68m;D:x=60kg、y=1.65m。
表述:y=f(x)+
2.相关关系的成因(1)某些影响因素尚未被认识;(2)虽已认识但无法测量;(3)测量误差。
某种水果2元/斤:购买额y=2x
购买量
y=4元、x=2斤
y=2x+=2×1.9+0.2=4元
3.数量关系的表现形式第九章相关与回归分析STAT(1)单一因果关系粮食产量与施肥量;(2)互为因果关系身高与体重;(3)伴随关系教师的薪金与酒价。三、相关关系的种类(一)按相关的程度分
1.完全相关:函数关系;
2.不相关:没有关系;[例]苏格兰:虱子数与健康状况。
3.不完全相关。(二)按相关的方向分
1.正相关:变量的变动方向一致(同增同减);
2.负相关:变量的变动方向相反(一增一减)。第九章相关与回归分析STAT(三)按相关的形式分
1.线性相关;
2.非线性相关。相关程度密切相关程度不密切第九章相关与回归分析STAT(四)按影响因素的多少分
1.单(简)相关:只有一个自变量。
学习成绩与学习时间;血压与年龄;亩产量与施肥量。
2.复(多元)相关:两个或两个以上的自变量;
经济增长与人口增长、科技水平、自然资源、管理水平等之间的关系;体重与身高、食欲、睡眠时间之间的关系。
3.偏相关:就多个变量测定其中两个变量的相关程度而假定其他变量不变。
就y=ax1+bx2+,研究y与x1之间的关系,假定x2不变。第九章相关与回归分析STAT第二节线性相关关系的测定[目的]测定变量间的相关方向与密切程度。一、相关图表(一)相关表
1.单变量分组相关表:自变量分组且计算次数,因变量只计算平均数。第九章相关与回归分析STAT
2.双变量分组相关表:对自变量与因变量均进行分组。注:自变量X轴;因变量Y轴。(二)相关图:散点图。
不足:难以精确反映相关的密切程度。第九章相关与回归分析STAT●横轴代表各省份田地种植水稻比例,上海为最高,约90%。●纵轴代表各省份居民倾向集体主义的比例,上海、江西和重庆为前三位。第九章相关与回归分析STAT二、(线性)相关系数※(计算方法:积差法,方差法)(一)积差法计算公式变型公式:协方差是两个随机变量相互关系(“互动性”)的一种统计测度。第九章相关与回归分析STAT(二)协方差sxy的作用
1.显示x与y之间的相关方向。(一)
+
+(三)
–
–
sxy
>0
正相关:r>0第九章相关与回归分析STAT[负相关](二)
–
+(四)
+
–
Sxy
0
负相关:r0第九章相关与回归分析STAT
2.显示x与y之间的相关程度。第九章相关与回归分析STAT[负相关]第九章相关与回归分析STAT[判定两变量是否存在相关关系]第九章相关与回归分析STAT[归纳]sxy的作用第一,显示x与y之间的相关方向第二,显示x与y之间的相关密切程度(同一变量水平下)问题:如果变量x>p,y>q(即不同一变量水平下)
;且sxy
>spq
能否认为x与y之间的相关程度一定会高于p与q?
第九章相关与回归分析STAT(三)sx、sy的作用
1.使不同变量的协方差标准化直接对比。第九章相关与回归分析STAT[例]甲、乙两人有关食量与体重资料如下(单位:斤)第九章相关与回归分析STAT
150152160
-0.76-0.381.13第九章相关与回归分析STAT
2.使第九章相关与回归分析STAT附:r的变型计算公式推导第九章相关与回归分析STAT[r的变型计算公式推导]第九章相关与回归分析STAT[r的变型计算式]第九章相关与回归分析STAT(四)线性相关的判断准则
[例]为了解营业员每人月平均销售额(万元)和利润率(%)之间的关系,特从100家商店中随机抽取10家,得到如下资料,试计算样本相关系数。第九章相关与回归分析STAT计算过程:第九章相关与回归分析STAT经计算得:x=50,y=110.8,x2=294,y2=1465,
xy=654.9,n=10答:人均销售额与利润率之间存在着高度的正相关关系。第九章相关与回归分析STAT问:若令人均销售额为y,利润率为x,则r的取值是否改变
?第九章相关与回归分析STAT(五)样本相关系数的特性
1.两变量均为随机变量。
2.两变量的地位是平等的rxy=ryx。
3.其接近于1的程度与样本容量n有关。
n
小,r1。特例:当n=2时,r=1。
[例]样本(x,y)为(6,12.6),(1,3.0),n=2。第九章相关与回归分析STAT一些人相信手掌生命线的长度可以来预测他们的寿命。M.E.Wilson和L.E.Mather在《美国医学协会学报上》发表的一封信中,通过对尸体的研究对此给予了驳斥。死亡时的年龄与手掌生命线的长度被一起记录下来。作者得出死亡时的年龄与生命线的长度不存在显著相关的结论。手相术失传了,手也就放下了。看手相:第九章相关与回归分析STAT(六)线性相关的显著性检验(不讲)
1.t检验(R.A.Fisher检验)(1)提出假设:H0:=0
H1:0
(2)计算检验统计量;(3)将检验统计量与临界值比较,如检验统计量的绝对值大于临界值,则拒绝原假设;反之亦反。
2.r检验法:查《相关系数检验表》,在给定下,若rr
(n-2),则拒绝H0。第九章相关与回归分析STAT
[例]为了解营业员每人月平均销售额(万元)和利润率(%)之间的关系,特从100家商店中随机抽取10家,得到如下资料,试计算样本相关系数并进行检验(=0.05)。
解:提出假设:H0:=0
H1:0已知:r=0.987,n=10所以,拒绝原假设而接受备择假设,即检验结果表明,月平均销售额与利润率之间确实存在着线性相关关系。第九章相关与回归分析STAT[r检验法]
已知:r=0.987,n=10
n-20.050.016780.7070.6660.6320.8340.7980.765相关系数检验表第九章相关与回归分析STAT第三节回归分析一、回归分析概述(一)概念
1.相关分析的不足:无法表明两变量之间的数量规律无法从一个变量(x)的变化来推测另一个变量(y)的变化。第九章相关与回归分析STAT
2.回归分析:通过一个(些)变量的变化解释另一变量的变化y=a+bx、
y=ax1+bx2
。
英国生物学家F·Galton
首次提出。父辈身高
子辈身高
xy
y=f(x)+
人类平均身高(二)回归分析的种类
1.按自变量的多少分(1)简单(一元)回归:自变量只有一个。
y=a+bx
(2)复(多元)回归:自变量为2个或2个以上。
y=0+1x1+2x2+…+nxn第九章相关与回归分析STAT
2.按回归方程式的特征分(1)线性回归:因变量为自变量的线性函数。
y=a+bx
(2)非线性回归:因变量为自变量的非线性函数。第九章相关与回归分析STAT(三)回归分析的步骤
1.确定自变量和因变量。消费支出(y,果)国民收入(x,因);
自变量筛选问题:
■消除无关的变量。农副产品出口额=-107.66+0.13社会商品零售总额+0.22
农副产品收购额
社会商品零售总额与农副产品出口额无直接关系,更不是影响农副产品出口额的原因。
■消除不重要的变量。生产资料进口额=0.73轻工业投资+0.18生产消费等
轻工业投资对生产资料进口额虽有影响,但不重要,或不第九章相关与回归分析STAT完全,应选择全社会固定资产投资额。■消除不独立的变量。农业总产值=0.78+0.24粮食产量+0.05农机动力-0.21
受灾面积粮食产量受农机动力和受灾面积的影响,它们存在相关性。
2.确定样本回归方程消费支出y与收入x的回归方程:y=a+bx=200+0.70x
3.统计检验:
(1)回归模型的显著性检验,即反映回归方程对样本观测值的拟合优度如何。判定系数检验
(2)回归参数的显著性检验,即检验变量y与变量x之间能否用线性关系来描述。线性相关检验
4.预测或控制。已知
x确定y:估计或预测;已知y确定x:控制第九章相关与回归分析STAT回归分析与相关分析的关系
(1)联系:
■两者具有互为补充关系;■两者存在计算上的联系。
(2)区别:
■两者在关心变量性质上不同;
■两者的任务和目的不同;■两者的使用范围不同。应用相关与回归分析应注意的问题
■必须以定性分析为基础。
■要注意变量间相关关系发生作用的范围。如施肥量与农作物产量;由爱生恨
■应用回归方程时不能一概认为自变量与因变量存在因果关系。第九章相关与回归分析STAT二、一元线性回归方程的拟合(一)总体回归模型→Y=A+BX+第九章相关与回归分析STAT总体回归方程→E(Y)=A+BX第九章相关与回归分析STAT回归模型建立的假定条件:
1.
y是随机变量,y的分布是正态分布,y的平均值在给定x的值的回归线上。
2.对于任何x值,y分布的方差相等,即具有同方差,即Var()=
2
。
3.随机误差项的期望值为零,即;随机误差项是相互独立的,不存在序列相关。即cov(i,
j)=0,(i≠j)。
4.对多元线性回归模型,y=a+b1x1+b2x2+…+bkxk+,各个变量是相互独立的,不存在多重共线性,即cov(xi,xj)=0,(i≠j)。第九章相关与回归分析STAT样本回归方程的拟合思想:
抽样N
n,第九章相关与回归分析STAT(二)样本回归方程的拟合
从总体中随机取样,获取一组样本观察值。第九章相关与回归分析STAT图示:步骤:1.拟合样本回归方程;2.样本回归方程的拟合优度第九章相关与回归分析STAT(三)样本回归方程的拟合方法
常用方法:最小二乘法(OLS法)基本思路:使残差平方和最小的直线“最优直线”。第九章相关与回归分析STAT总可以设法找到一对a、b的取值,使Q为最小值。第九章相关与回归分析STAT[整理]相关系数r与回归系数b之间的关系:第九章相关与回归分析STAT(1)两者是同向的;(2)r反映变量的相关方向与密切程度;
b反映某一变量变动一个单位时另一变量的平均变动量。第九章相关与回归分析STAT
[例]为研究收入与食品支出的关系,随机抽取了10户家庭的样本(百元),请拟合样本回归方程。第九章相关与回归分析STAT解:通过散点图可近似看出收入与食品支出之间呈线性关系,故设两者有关系
经济意义:当收入为0时,亦须有217.26元的食品支出,收入每增加100元,食品支出平均增加20.23元。第九章相关与回归分析STAT
参数a、b的经济含义是:
a代表直线的起点值,为直线的纵轴截距,它表示x=0时y的常数项。
b称为回归系数,表示自变量x增加一个单位时因变量y的平均增加值。回归系数的正负号与相关系数是一致的,因此回归系数的正负号可用来判断两变量相关的方向,也可利用b求相关系数r
。估计与预测:第九章相关与回归分析STAT利用b求相关系数r解:第九章相关与回归分析STAT三、回归方程的方差分析(回归方程的拟合优度)(一)总离差平方和的分解第九章相关与回归分析STAT由:第九章相关与回归分析STAT(二)判定系数(可决系数)→回归模型拟合程度的测度指标第九章相关与回归分析STAT■判定系数的作用
r2越接近与1,说明模型越有效,r2越接近与0,模型越无效。第九章相关与回归分析STAT■判定系数r2与相关系数r的关系第九章相关与回归分析STAT■相关系数也从另一角度说明了回归直线的拟合优度,相关系数越接近±1,说明回归直线对观测数据的拟合优度越高,但需谨慎!因为r的绝对值总是大于r2
的值(0和1除外)。
例:
r=0.5时,r2=0.25→只能解释总变差的25%第九章相关与回归分析STAT(三)估计标准误差
1.定义:观测值与回归值之间的平均离差。均方残差的平方根
→说明各观测值在直线周围的分散程度。可看作是排除了x对y的线性影响后,y随机波动大小的一个估计量。实际意义上,它反映了用估计的回归方程预测因变量y时预测误差的大小。
2.公式注:由于求a、b参数时有两个方程的约束,所以n-2第九章相关与回归分析STAT图示:第九章相关与回归分析STAT估估计标准误差与判定系数r2的关系:
作为回归模型拟合优度的判断和评价标准,估估计标准误差显然不如判定系数r2,判定系数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 购销合同室外灯具购销合同
- 合同终止退款协议
- 大数据运营合作协议
- 合同之自行车棚施工合同
- 影视制作项目委托制作协议
- 翻译服务合同翻译服务合同
- 行政协议行政合同
- 三农村环境整治与改善社区参与方案
- 宾馆承包经营合同
- 公司内部股权转让代持协议
- GB/T 657-2011化学试剂四水合钼酸铵(钼酸铵)
- 橡胶坝工程施工质量验收评定表及填表说明编制于
- 抗日战争胜利题材话剧剧本范文
- GB/T 22328-2008动植物油脂1-单甘酯和游离甘油含量的测定
- 录用offer模板参考范本
- FZ/T 25001-1992工业用毛毡
- 儿童气管插管医学课件
- 《上消化道出血诊疗指南》讲稿
- 内燃机车无火回送操作方法
- 电商部售后客服绩效考核表
- 小提琴协奏曲《梁祝》谱
评论
0/150
提交评论