第八讲 相关分析和回归分析_第1页
第八讲 相关分析和回归分析_第2页
第八讲 相关分析和回归分析_第3页
第八讲 相关分析和回归分析_第4页
第八讲 相关分析和回归分析_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八讲

相关与回归分析

10/24/20231一种强有力的基于数据的预测模型工具建立反映一个变量的变化与其他相关变量变化的具体公式线性回归

LinearProgramming10/24/20232问题的引出10/24/20233案例1:研究考试成绩与复习时间的关系

你希望自己的应用统计考多少分?

需要花多少时间复习?10/24/20234案例2:为了确定周末版报纸的日发行量某大型报业公司想发行周末版,但在作出决定之前,必须确定周末版的日发行量,这个报纸当前在三个城市的日报日发行量分别为:200,000、400,000和600,000份,为了预测该报纸周末版的日发行量,该公司的市场部收集了本国35个报纸的日报日发行量与其周末版的日发行量的数据

10/24/20235案例3:分析影响信用卡支付倾向因素CONSUMERRESEARCH是一家专门从事社会调查和咨询服务的研究机构,能够为各个用户提供消费者态度和行为方面的资料。在该机构最近组织的有关消费者使用信用卡支付倾向的调查资料中,希望分析年收入、家庭成员和年信用卡支付金额的关系。

10/24/20236教学目的和要求■通过本讲学习,学生应该熟练掌握简单相关和回归分析方法的基本概念,基本步骤和应用,对多元相关和回归分析方法有一个初步的了解。

10/24/20237本讲内容★相关和回归分析的基本概念★两变量间线性关系的测度★简单线性回归分析模型及其估计步骤系数的检验模型效果的评价模型的应用★多元相关和回归分析★应注意的几个问题

10/24/20238相关和回归分析的基本概念♦函数关系和相关关系♦线性关系和非线性关系♦相关分析的目的♦回归分析的目的

10/24/20239函数关系和相关关系●函数关系:两变量的数量表现在一定条件下是完全确定的。●相关关系(统计关系):两变量的数量表现尽管存在着密切关系,但却不是完全确定的。

10/24/202310相关关系的种类按涉及变量的多少可分简单相关关系(一个自变量和一个因变量)多元相关关系(多元相关关系:一个因变量和多个自变量)按两变量关系在图形上的形态可分线性相关非线性相关按两变量变动的方向可分正相关负相关10/24/202311分析相关关系的定量方法10/24/202312相关分析和回归分析的目的

相关分析的目的描述变量间相关分析的密切程度回归分析的目的在因变量和自变量之间建立一个数学模型,根据这个模型描述因变量如何随自变量的变化而变化。是因果关系吗?请思考10/24/202313相关分析(相关关系的测度)散点图协方差相关系数10/24/202314散点图10/24/20231535家报纸的日报日发行量与其周末版的日发行量的散点图10/24/202316协方差定义(教材243页)描述两变量间协变关系密切程度的一个量数公式作用缺点10/24/202317相关系数(教材248页)定义公式取值范围10/24/202318相关系数绝对值的含义r10/24/202319相关系数的显著性检验BySPSS10/24/202320回归(Regression)的由来回归(Regression)一词始于英国统计学家S.F.Galton。他和他的学生,英国著名统计学家K.Pearson研究了儿子身高Y与父母平均身高X之间的关系。他们收集了1078对夫妇和儿子(每对夫妇只取一个儿子)的身高,并用一条直线描述Y与X之间的关系。常识告诉我们,若父母平均身高较高,其子身高也应该较高。反过来若父母平均身高较矮,其子身高也应该矮。但是Galton的研究发现,如果双亲属于高个类(高于这1078对夫妇的平均身高),其子比他们再高的概率就比较小,即儿子有较大概率比双亲个子矮。反过来,如果双亲个子矮,其子以较大概率比双亲个子高。所以,平均身高偏高或偏矮的夫妇,其子的身高都有“向中心回归”的现象。基于这个事实,Galton把他们所求出的描述儿子与双亲身高关系的直线叫做回归直线。虽然“回归”这种现象并无普遍性,但历史上就一直沿用了这个术语。10/24/202321简单线性回归分析模型及其估计步骤系数的检验模型效果的评价模型的应用10/24/202322简单线性回归模型及估计简单线性回归模型及方程简单线性回归方程参数的估计步骤

简单线性回归方程参数的估计方法普通最小二乘法10/24/202323简单线性回归模型(总体)因变量自变量参数随机误差10/24/202324总体线性回归模型的图示YX实际观察值实际观察值10/24/202325总体线性回归模型总体线性回归方程10/24/202326样本线性回归方程10/24/202327建立线性回归模型的步骤确定研究的问题定性和定量分析相结合,正确选择变量搜取样本资料(数据资料)设样本回归方程(如:)估计未知参数(计算统计量)得到样本回归方程检验回归方程用模型预测因变量10/24/202328拟合样本线性回归方程的方法(P250)----最小二乘法实际观察值与样本回归线上的点的距离的平方和最小XYe1e2e3e4最小10/24/202329样本回归系数的计算公式回归系数的含义10/24/202330回归系数计算公式(教材251页)首先计算两个数值:再计算两个回归系数10/24/202331LinearRegressionModelTodemonstratethis,wewillexaminetherelationshipbetween:hoursofstudyforanexamthescoreonthatexamThequestionis:isthenumberofhoursofstudyagoodpredictoroftheexamscore?exampleone:10/24/202332LinearRegressionModelThescoresfor20randomlyselectedstudentsare:10/24/202333ScatterplotNoticethattheY-axishasbeenadjustedtoshowjustscoresbetween50and10010/24/202334ScatterplotItappearsthatastraightlinecanreasonably“fit”thesedata10/24/202335案例2:10/24/202336散点图10/24/202337判断回归模型拟合优良的指标可决系数10/24/202338总变差,已解释变差,未解释变差的关系YiYXi总变差未解释变差已解释变差=+SSTSSESSR=+10/24/202339可决系数定义:已解释变差与总变差的比值,在估计Yi时,在总变差中可被X解释的比率,它越大,说名Y与X的关系越密切,回归模型效果好公式:10/24/202340案例1的可决系数和相关系数10/24/202341案例2的可决系数和相关系数10/24/202342相关系数:

可决系数的平方根10/24/202343相关系数和可决系数的关系共同点不同点10/24/202344案例1的可决系数和相关系数10/24/202345案例2的可决系数和相关系数10/24/202346估计标准误(度量模型效果的指标之一)

(衡量y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论