回归-时间序列判别分析课件_第1页
回归-时间序列判别分析课件_第2页
回归-时间序列判别分析课件_第3页
回归-时间序列判别分析课件_第4页
回归-时间序列判别分析课件_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析

时间序列

判别分析

回归分析1回归分析是由一个(或一组)非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型和所进行的统计分析,称为回归分析。如果这个模型是线性的,就称为线性回归分析。研究两个变量间的相关关系的回归分析,称为一元回归分析。回归分析2一元线性回归模型在一元回归分析里,我们要考察的是随机变量与非随机变量之间的相互关系。虽然和之间没有确定的函数关系。但是我们可以借助函数关系来表达它们之间的统计规律性。用以近似地描述具有相关关系的变量间的联系的函数,称为回归函数。

一元线性回归模型在一元回归分析里,我们要考察3由于与之间不存在完全确定的函数关系,因此必须把随机波动产生的影响考虑在内。于是有一元线性回归模型的一般形式为其中是固定的未知参数,也称为回归系数,自变量是非随机可精确观测的,是均值为0,方差为的随机变量,在模型中它代表其他随机因素对Y产生的影响。由于与之间不存在完全确定的函4一元线性回归分析的主要任务是用样本值对回归系数和作点估计;对作假设检验;在处对作预测,并对作区间估计。记,则,称为对的回归直线方程。一元线性回归分析的主要任务是用样本值对回归系数5的无偏估计为残差平方和参数的置信水平为的置信区间为的无偏估计为残差平方和参数的置信水平为6参数的置信水平为的置信区间为参数的置信水平为的置信区间为参数的置信水平为的置信区间为参数7用的回归值作为的预测值,同时的置信水平为的预测区间为用的回归值8用最小二乘法寻找参数的估计值,使离差平方和达极小

经整理后,得正规方程组用最小二乘法寻找参数的估计值,使9得到的解为:我们记:则解可以表示为:得到的解为:10多元线性回归模型有多个自变量的线性回归模型称为多元线性回归模型。假定是一个可以观测的随机变量,为k个自变量,且有现假定对于变量与自变量已得到n组观测数据如下:多元线性回归模型有多个自变量的线性回归模型称11与观测值表与观测值表12在理论模型式(1)下,可以认为表中数据满足若记则上式可用矩阵表示为在理论模型式(1)下,可以认为表中数据满足若记则上式可用矩阵13未知参数估计式为于是,有经验回归方程为的无偏估计为于是,有经验回归方程为未知参数14对于给定自变量,用来预测称为的点预测,的的置信区间为对于给定自变量,用来预15用spss进行回归分析某牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。为此,销售部的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以及同期其它厂家生产的同类牙膏的市场平均销售价格,分析牙膏销售量与其它因素的关系,为制订价格策略和广告投入策略提供数量依据。用spss进行回归分析某牙膏制造企业为了更好地拓展产品市场,16牙膏销售量与销售价格、广告费用等数据牙膏销售量与销售价格、广告费用等数据17首先在spss中导入数据,由于差价是根据厂家自己定价和其他厂家平均价决定的,所有灵活性更好,将差价作为x1,将广告费作为x2,销量作为y。在spss中画出y与x1的散点图。以便我们观察y与x1的关系。首先在spss中导入数据,由于差价是根据厂家自己定价和18

由图中我们大致可以看出差价x1与销量y是线性关系。

画出y与x2的散点图,由图中我们大致可以看出差价x1与销量y是线性关系。19我们大致的也可以看出y与x2也是线性关系。所以我们可以认为y与x1、x2的关系是线性的。即:y=ax1+bx2+c

所以我们在spss中做多元回归分析,得到结果如下。我们大致的也可以看出y与x2也是线性关系。20其中R方=0.886表示y的88.6%可以有模型确定。回归-时间序列判别分析课件21

F=104.967>F0.05(2,29)=3.33,显著性水平sig0<0.05。所以可以认为模型是可以用的。

22回归-时间序列判别分析课件23所以我们可以得到回归方程Y=1.588X1+0.563X2+4.407

所以我们就可以根据x1、x2的值来预测销量y。

由上面的回归方程我们可以看到x2的系数靠近0,也就是说其实销量Y的值跟x2的线性关系不是那么明显的,即说明这个回归方程式可以改进的,其实我们可以从y跟x2的散点图在x2=6.5的时候是有一定的弯曲的,所以我们对模型进行改进y=ax2+bx2*x2+c所以我们可以得到回归方程24用spss得到改进的结果

由上面我们可以看出R方=0.905比上面的要大说明,拟合的效果要好。用spss得到改进的结果25

F=82.941>F0.05(3,29)=2.93,显著性水平sig大约等于0<0.05。所以可以认为模型是可以用的。回归-时间序列判别分析课件26

由上面的表我们可以知道:Y=1.307X1-3.696X2+0.349X2*X2+17.324

这样我们就得到了回归方程,我们可以根据差价和广告费投入只能大致的进行销量估计。因为我们从回归方程中可以看到,当我们进行大量的广告费投入的话,根据回归方程算出销量是大幅增加的,但是现实生活中我们不可能无限制的增加。回归-时间序列判别分析课件27时间序列所谓时间序列,是指观察或记录到的一组按时间顺序排列的数据,经常用X1,X2,…Xn表示。序列包含了产生该序列的系统的历史行为的全部信息。基本思想:根据系统有限长度的运行记录(观察数据),建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模型,并借以对系统的未来行为进行预报时间序列分析简称时序分析,是一种根据动态数据揭示系统动态结构和规律的统计方法,是统计学科的一个分支。时间序列所谓时间序列,是指观察或记录到的一组按时间顺序排列的28用spss进行时间序列分析

数据来自中国统计出版社出版的《中国统计年鉴》,数据年限为1978—2004年。用时间序列分析,我国未来两年末从业人员人数和三产业从业人员数有什么样的发展趋势?用spss进行时间序列分析数据来自中国统计出版社出版的29数据:数据:30通过spss分析得到发展趋势图通过spss分析得到发展趋势图31将数据导入spss,得到结果如下将数据导入spss,得到结果如下32回归-时间序列判别分析课件33同时spss给出了预测值同时spss给出了预测值34判别分析判别分析和聚类分析的区别

聚类分析:是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称。它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。判别分析判别分析和聚类分析的区别35

判别分析:是根据多种因素(指标)对事物的影响来实现对事物的分类,从而对事物进行判别分类的统计方法。判别分析适用于已经掌握了历史上分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出分类的规律性(判别函数)来指导未来的分类判别分析:是根据多种因素(指标)对事物的影响来实现对事36用spss做判别分析:

为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。用spss做判别分析:371991年30个省、市、自治区城镇居民月平均收人数据表x1:人均生活费收入

x6:人均各种奖金、超额工资

x2:人均国有经济单位职工工资x7:人均各种津贴(国有+集体)x3:人均来源于国有经济单位标准工资x8:人均从工作单位得到

的其他收入x4:人均集体所有制工资收入

x9:个体劳动者收入x5:人均集体所有制职工标准工资1991年30个省、市、自治区城镇居民月平均收人数据表x38回归-时间序列判别分析课件39

将数据导入spss,为了分组我们引入一个新的变量分组,1、2、3分别代表组G1、G2、G3,这样我们用spss的判别分析得到结果如下。

这表说明我们有28个变量已经分组占93.3%,有两个没有分组。将数据导入spss,为了分组我们引入一个40

这个是建立函数情况,说明用两个函数就可以对模型进行统计。回归-时间序列判别分析课件41

这个是函数的假设性检验,在0.05的显著性水平下是显著的。回归-时间序列判别分析课件42这个是未标准化是函数系数,即:Y1=0.736x1+0.544x2-0.321x3+0.075x4+0.184x5+0.180x6-0.026x7+0.249x8-0.077x9Y2=0.123x1+0.097x2+0.24x3+0.061x4+0.579x5+0.564x6+0.474x7+0.327x8+0.224x9回归-时间序列判别分析课件43最后我们得到的结果是,广东属于第三类,西藏属于第一类。最后我们得到的结果是,广东属于第三类,西藏属于第一类。44回归-时间序列判别分析课件45回归-时间序列判别分析课件46

回归分析

时间序列

判别分析

回归分析47回归分析是由一个(或一组)非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型和所进行的统计分析,称为回归分析。如果这个模型是线性的,就称为线性回归分析。研究两个变量间的相关关系的回归分析,称为一元回归分析。回归分析48一元线性回归模型在一元回归分析里,我们要考察的是随机变量与非随机变量之间的相互关系。虽然和之间没有确定的函数关系。但是我们可以借助函数关系来表达它们之间的统计规律性。用以近似地描述具有相关关系的变量间的联系的函数,称为回归函数。

一元线性回归模型在一元回归分析里,我们要考察49由于与之间不存在完全确定的函数关系,因此必须把随机波动产生的影响考虑在内。于是有一元线性回归模型的一般形式为其中是固定的未知参数,也称为回归系数,自变量是非随机可精确观测的,是均值为0,方差为的随机变量,在模型中它代表其他随机因素对Y产生的影响。由于与之间不存在完全确定的函50一元线性回归分析的主要任务是用样本值对回归系数和作点估计;对作假设检验;在处对作预测,并对作区间估计。记,则,称为对的回归直线方程。一元线性回归分析的主要任务是用样本值对回归系数51的无偏估计为残差平方和参数的置信水平为的置信区间为的无偏估计为残差平方和参数的置信水平为52参数的置信水平为的置信区间为参数的置信水平为的置信区间为参数的置信水平为的置信区间为参数53用的回归值作为的预测值,同时的置信水平为的预测区间为用的回归值54用最小二乘法寻找参数的估计值,使离差平方和达极小

经整理后,得正规方程组用最小二乘法寻找参数的估计值,使55得到的解为:我们记:则解可以表示为:得到的解为:56多元线性回归模型有多个自变量的线性回归模型称为多元线性回归模型。假定是一个可以观测的随机变量,为k个自变量,且有现假定对于变量与自变量已得到n组观测数据如下:多元线性回归模型有多个自变量的线性回归模型称57与观测值表与观测值表58在理论模型式(1)下,可以认为表中数据满足若记则上式可用矩阵表示为在理论模型式(1)下,可以认为表中数据满足若记则上式可用矩阵59未知参数估计式为于是,有经验回归方程为的无偏估计为于是,有经验回归方程为未知参数60对于给定自变量,用来预测称为的点预测,的的置信区间为对于给定自变量,用来预61用spss进行回归分析某牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。为此,销售部的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以及同期其它厂家生产的同类牙膏的市场平均销售价格,分析牙膏销售量与其它因素的关系,为制订价格策略和广告投入策略提供数量依据。用spss进行回归分析某牙膏制造企业为了更好地拓展产品市场,62牙膏销售量与销售价格、广告费用等数据牙膏销售量与销售价格、广告费用等数据63首先在spss中导入数据,由于差价是根据厂家自己定价和其他厂家平均价决定的,所有灵活性更好,将差价作为x1,将广告费作为x2,销量作为y。在spss中画出y与x1的散点图。以便我们观察y与x1的关系。首先在spss中导入数据,由于差价是根据厂家自己定价和64

由图中我们大致可以看出差价x1与销量y是线性关系。

画出y与x2的散点图,由图中我们大致可以看出差价x1与销量y是线性关系。65我们大致的也可以看出y与x2也是线性关系。所以我们可以认为y与x1、x2的关系是线性的。即:y=ax1+bx2+c

所以我们在spss中做多元回归分析,得到结果如下。我们大致的也可以看出y与x2也是线性关系。66其中R方=0.886表示y的88.6%可以有模型确定。回归-时间序列判别分析课件67

F=104.967>F0.05(2,29)=3.33,显著性水平sig0<0.05。所以可以认为模型是可以用的。

68回归-时间序列判别分析课件69所以我们可以得到回归方程Y=1.588X1+0.563X2+4.407

所以我们就可以根据x1、x2的值来预测销量y。

由上面的回归方程我们可以看到x2的系数靠近0,也就是说其实销量Y的值跟x2的线性关系不是那么明显的,即说明这个回归方程式可以改进的,其实我们可以从y跟x2的散点图在x2=6.5的时候是有一定的弯曲的,所以我们对模型进行改进y=ax2+bx2*x2+c所以我们可以得到回归方程70用spss得到改进的结果

由上面我们可以看出R方=0.905比上面的要大说明,拟合的效果要好。用spss得到改进的结果71

F=82.941>F0.05(3,29)=2.93,显著性水平sig大约等于0<0.05。所以可以认为模型是可以用的。回归-时间序列判别分析课件72

由上面的表我们可以知道:Y=1.307X1-3.696X2+0.349X2*X2+17.324

这样我们就得到了回归方程,我们可以根据差价和广告费投入只能大致的进行销量估计。因为我们从回归方程中可以看到,当我们进行大量的广告费投入的话,根据回归方程算出销量是大幅增加的,但是现实生活中我们不可能无限制的增加。回归-时间序列判别分析课件73时间序列所谓时间序列,是指观察或记录到的一组按时间顺序排列的数据,经常用X1,X2,…Xn表示。序列包含了产生该序列的系统的历史行为的全部信息。基本思想:根据系统有限长度的运行记录(观察数据),建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模型,并借以对系统的未来行为进行预报时间序列分析简称时序分析,是一种根据动态数据揭示系统动态结构和规律的统计方法,是统计学科的一个分支。时间序列所谓时间序列,是指观察或记录到的一组按时间顺序排列的74用spss进行时间序列分析

数据来自中国统计出版社出版的《中国统计年鉴》,数据年限为1978—2004年。用时间序列分析,我国未来两年末从业人员人数和三产业从业人员数有什么样的发展趋势?用spss进行时间序列分析数据来自中国统计出版社出版的75数据:数据:76通过spss分析得到发展趋势图通过spss分析得到发展趋势图77将数据导入spss,得到结果如下将数据导入spss,得到结果如下78回归-时间序列判别分析课件79同时spss给出了预测值同时spss给出了预测值80判别分析判别分析和聚类分析的区别

聚类分析:是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称。它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。判别分析判别分析和聚类分析的区别81

判别分析:是根据多种因素(指标)对事物的影响来实现对事物的分类,从而对事物进行判别分类的统计方法。判别分析适用于已经掌握了历史上分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出分类的规律性(判别函数)来指导未来的分类判别分析:是根据多种因素(指标)对事物的影响来实现对事82用spss做判别分析:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论