第七相关与回归分析.ppt_第1页
第七相关与回归分析.ppt_第2页
第七相关与回归分析.ppt_第3页
第七相关与回归分析.ppt_第4页
第七相关与回归分析.ppt_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一节相关和回归分析的基本概念,一、函数关系和相关关系,1 .函数关系对应于一个或几个变量取一定值时另一个变量具有确定值,这种确定的数量依赖关系称为函数关系。 (函数关系),(1)是一对一的确定关系(2)设定两个变量x和y,变量y随变量x一起变化,完全依赖于x,在变量x取某值时,y取与确定关系相应的值,则y被称为x的函数,表示为y=f,是2 .一个或多个变量(1)变量间的关系不能用函数关系正确表现;(2)一方的变量的可取值不能唯一决定另一方的变量(相关关系),相关关系的例子商品的消费量(y )和居民收入(x )的关系商品销售额(y )和广告费支出(x )的关系粮食亩产量(y )和施肥量(x1

2、),降雨量(x2 )的关系(2)相关分析需要利用函数关系的公式进行研究,相关关系是函数关系是相关分析的工具,二是相关类型、相关关系、自变量个数的多少、相关的密切程度、一元相关学习成绩和学习时间与血压和年龄亩产量和施肥量的多变量相关的经济增长和人口增长、与科技水平、自然资源、管理水平等的关系方向(线性)、和线性相关收入和支出非线性相关施肥量和农产量,完全相关不完全相关不完全相关,正相关和增减负相关一增减,三、相关分析的主要内容相关分析是统一分析两种以上现象之间的数量不确定依赖关系。 具体地说,1、判断现象间有无相关关系以及具体的表现形式2、确定相关关系的密切度和方向3、与检查现象统一相关的显着性

3、4、广义上相关分析包括回归分析。 定性分析根据研究者的理论知识和实践经验,判断客观现象之间是否存在相关关系,以及存在什么样的关系。 定量分析通过例如根据定性分析创建相关表,创建相关图,并且通过校正相关系数的方法确定现象之间的相关的方向、形式以及密度。 第二节相关分析的方法,一、相关关系的判断,(一)相关表判断1 .简单相关表:资料不分组(将自变量数列有序排列后观察相应的因素变量值的变化,判断相关与否方向2 .分组相关表: (1)单变量分组(2)2变量组关联表(将自变量原因变量全部组合起来制作的关联表)。 注意:参数排列成纵列,变量排列成横列。单变量组关联表:修正参数组且次数,变量仅修正平均。2

4、、2变量组关系表:将参数和因素变量同时分组。 注:参数x轴原因变量y轴。(2)通过校正散布图判定(scatter diagram )、(3)相关系数来进行判定。 它使用相关的两个变量的具体数值,以恒定的方式来校正反映变量之间的相互关系的统一校正数值(相关系数),并解释变量之间的相关的密切性。 常用的是皮尔逊线性相关系数。 二、相关系数的修正运算、1、意思、说明两变量间线性相关的密切度的统一修正分析指标。 用r表示。 也称为用积差法修正的相关系数。 (1)皮尔逊线性相关系数r,r,通常,当相关系数的绝对值小于0.3时,解相关或微弱相关为0 . (2)线性单相关系数r的校正公式(过程),(1)校正

5、自变量数列的标准偏差,(2)校正变量的标准偏差,(3)校正两者的协方差协方差,表示x和y两个变量相对于各自平均值的公共平均方差,(1)积差法式: (2)积差法展开式: (3)简单指示x和y之间的相关方向的正相关性,其中,您可以通过使用试着根据下列资料校正线性相关系数:、r,例如,某企业某产品的生产量与单位成本的资料,校正线性相关系数,在理论上进行定性判断, 在确定两个变量之间是否存在关系(例如,散点图)之后,可以根据实际数据和校正条件确定公式的选择。 注意:在校正相关系数时,没有必要确定自变量和因变量,所以x、y的确定是任意的。 相关系数校正表,r=-0.9091即单位成本与产量之间具有高线性

6、负相关关系。 解,答:即发票消费额与芯片之间存在高度的正线性相关关系。 关于相关系数的解释,1、相关系数为0,不一定没有相关,只能说明没有线性相关。 2 .根据平均数进行相关分析和根据个体数据进行相关分析,相关程度不同。 例如,在一些研究中,个人收入和教育成对数据产生了0.4的线性相关系数,但是使用区域平均,线性相关系数为0.7。 3 .相关系数具有对称性。 注意事项: (1)注意实际意义进行相关回归分析具有实际意义,不能将不相关的两种现象用于相关回归分析。 例如,据说孩子很长,公园的小树也很长。 求出孩子和小树的相关关系是没有意义的,从孩子的身高来推测小树的高度更可笑。 (2)注意虚假相关关

7、系的两个物体之间能够纠正相关系数,未必能证明物体之间有内在关系,例如,发现对在校儿童鞋的大小和阅读技能有很强的相关关系。 但是,学习新词不是扩大脚步,而是与第三要因年龄相关。 孩子长大后,他们的阅读能力提高,长大后也不能穿原来的鞋了。 (3)利用散布图,对性质不明的2组数据,首先制作散布图,用图看它们的关系的有无、关系的密切度、正相关还是负相关、直线相关还是曲线相关后进行相关分析。 (4)注意变量范围相关分析和回归式只能适用于生成样本的原始数据范围内,但是如果出了这个范围,就不能说明两变量的相关关系和回归关系。另外,在例如相关系数的显着性检验的情况下,总体相关系数是未知的且通常存在样本相关系数

8、r作为近似的估计。 r的值随样本的不同而不同,随机变量能否用r来说明整体相关度需要考察样本r的可靠性,即显着的检验。 成立了r的采样分布服从正态分布的假设,用正态分布进行验证。 然而,r采样分布的研究表明,这种假设风险很大,因此通常会进行r用的t检验,这种检验可以应用于小样本,也可以应用于大样本。 检查步骤(1) (2)校正检查的统一校正量(3)进行判断,假设: H0: H1: 0校验的统一校正量,根据显着性水平0.05,t(n-2)=2.160是t=48.385t(15-2)=2.160,拒绝H0,该食物需求量和地区人口增加量之间的(3)斯皮尔曼类相关系数的校正,1 .类相将相关的数量标记和

9、质量标记的具体表现按类排列,形成x和y两个序列,测量这两个序列之间的相关度,得到的相关系数是类相关系数。 常用的有斯皮尔曼相关系数、肯特相关系数等。 2 .等级相关的优缺点:简单易行、应用广泛、不能精确校正测量的标志(即用顺序尺度校正测量的现象)的缺点:精度比用积差法校正的相关系数稍差,3 .斯皮尔曼等级相关系数的校正、校正步骤; 等级通过该校正运算,对与观察值对应的每个等级差d校正D2代入式,由此校正两组资料间的等级相关系数,要校正等级相关系数,必须首先将原数据变换为等级。 在本例中,若甲组的最低点为68分,则可以将其等级数设为1,70分的等级数为2,72分的3,依次类推。 如果两个数值相等

10、,则将该值替换为平均位置数。 等级相关系数修正表,第三节回归分析的基本问题,“回归”一词来源于生物学。 英国的生物学家戈尔顿,根据1078年父子身高的散布图显示,高个子的父母有比低个子父母高的孩子的倾向。 但是,平均来说,个子高的孩子矮,个子矮的孩子高。 这种遗传性的身高域一般是平均退化的现象,戈尔顿被称为回归。 一、回归分析的含义(一)回归分析的目的:探讨变量间的不确定性数量关系。 (二)回归分析的概念及实质1 .回归分析概念:一种测量两个以上具有相关关系的变量之间的数量变化,并根据一定的模型,给出参数值来推断或预测原因变量的统一修正分析方法。 2、回归分析的本质:在相关分析的基础上研究现象

11、之间的数量变化规律。 二、回归分析与相关分析的不同,(1)在相关分析中,变量x变量y处于平等地位,无需确定变量、原因变量,回归分析必须区别。 变量之间存在前后因果关系时,容易确定的变量之间相互是因果关系,没有明显的因果关系时,根据研究目的决定。 (2)在相关分析所涉及的变量x和y都是随机变量的回归分析中,由于变量y是随机变量,所以给出变量x。 (3)相关分析主要记述变量间有无关系密切度如何回归分析进一步明确了变量x对变量y的影响大小,可以根据回归方程式进行预测或推测,有很强的应用性(4)没有明显因果关系的两个变量x和y中的两个次相关系数只有一个,即相关系数具有对等性。 (5)线性回归方程中,自

12、变量的系数被称为回归系数,具有与相关系数相同的编号,并且还可以表示相关方向。三、回归分析的内容;(1)根据研究目的和变量之间的内在联系,确定参数和原因变量例的粮食产量(y )施肥量(x )消费支出(y )国民收入(x )火灾损失额(y )火灾发生地和最近的消防站之间的距离(x )。 (2)确定回归分析模型的类型和公式(3)创建模型(解析残奥仪表) (4)评价回归分析模型(5)预测例消费和收入的回归公式: y=a bx=200 0.15x已知x确定y :估计或预测,4,42 .多元回归分析模型是指多个自身(增加了自变量的数量) (2)线性回归和非线性回归:按变量间的相互关系的形态分别为1 .线性

13、回归模型是指变量间的关系呈直线性倾向的模型形态2 .非线性回归模型是指变量间的关系为曲线趋势的模型形态上述4种状况交叉而成的单纯线性回归和单纯非线性回归多元线性回归和多元非线性回归等不同类型,与五、一元(简单)线性回归模型结合;(1)描述变量y如何依赖于自变量x和误差项的方程式称为回归模型(2) 一元线性回归模型是其中Y= X Y反映x的线性函数部分和误差项线性部分反映由x的改变导致的y的改变的误差项是随机变量,而其中x和y之间的线性关系以外的随机元素反映对y的影响,且x和y之间的线性关系不能解释的变异性的值是固定的,因此x和y是非确定性的在回归估计方程、和回归模型中,x是自变量并且是可控的,

14、其中y表示随机变量在上面提到的一阶线性回归模型的两端具有数学期望,即一阶线性回归方程: E(Y)= X的模型指示y的期望值是x的线性函数。 其中,和是未定系数,是表示每当参数x变动1单位时由变量y引起的平均变动值的回归系数。 由于整体回归残奥仪表之和未知,因此需要使用样本数据进行估计。 得到一阶线性回归估计方程,(6)方程的残奥参数估计方法最小二乘法必须使实际值和估计值的偏差最小,以便最理想地拟合直线,因此使用数学方法,即“方差平方和最小”的原理来拟合最佳直线。 最小二乘法:通过使y的实际值与y的预测值的垂直方差的平方和最小而确定的回归式。 根据上述讨论,最小二乘法满足的条件通过将回归方程代入

15、a、b残奥计来导出:对两个方程式进行整理而求出,b回归系数反映每当自变量x变动(增加或减少)时变量平均变动的b单位的量。 (7)回归分析的应用,在修正相关系数时,列举了企业产量和单位成本两组数据,通过修正运算,得出了这两个变量呈现高负相关的结论。 那么,进一步开展研究,看看它们之间有什么样的数量关系。产量的变动对成本的具体影响如何呢? 我们可以用最小二乘法求得残奥仪表,进行判断和预测。 例3回归分析校正算表为了进行回归分析,必须确定自变量和原因变量,在没有明显的因果关系的情况下,理论上可以拟合2个回归方程式,根据需要进行选择。 另一方面,变量之间有明显的因果关系时,必须以“要因”为参数,以“果”为要因变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论