时间序列判别分析(PPT 47页).ppt_第1页
时间序列判别分析(PPT 47页).ppt_第2页
时间序列判别分析(PPT 47页).ppt_第3页
时间序列判别分析(PPT 47页).ppt_第4页
时间序列判别分析(PPT 47页).ppt_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,回归分析 时间序列 判别分析,回归分析 是由一个(或一组)非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型和所进行的统计分析,称为回归分析。如果这个模型是线性的,就称为线性回归分析。研究两个变量间的相关关系的回归分析,称为一元回归分析。,一元线性回归模型,在一元回归分析里,我们要考察的是随机变量 与非随机变量 之间的相互关系。虽然 和 之间没有确定的函数关系。但是我们可以借助函数关系来表达它们之间的统计规律性。用以近似地描述具有相关关系的变量间的联系的函数,称为回归函数。,由于 与 之间不存在完全确定的函数关系,因此必须把随机波动产生的影响考虑在内。于是有一元线性回归模型的一

2、般形式为,其中 是固定的未知参数,也称为回归系数,自变量 是非随机可精确观测的, 是均值为0,方差为 的随机变量,在模型中它代表其他随机因素对Y产生的影响。,一元线性回归分析的主要任务是用样本值对回归系数 和 作点估计;对 作假设检验;在 处对 作预测,并对 作区间估计。,记 ,则 ,称为 对 的回归直线方程。,的无偏估计为,残差平方和,参数 的置信水平为 的置信区间为,参数 的置信水平为 的置信区间为,参数 的置信水平为 的置信区间为,用 的回归值 作为 的预测值,同时 的置信水平为 的预测区间为,用最小二乘法寻找参数 的估计值,使离差平方和达极小 经整理后,得正规方程组,得到的解为: 我们

3、记: 则解可以表示为:,多元线性回归模型,有多个自变量的线性回归模型称为多元线性回归模型。假定 是一个可以观测的随机变量, 为k个自变量,且有,现假定对于变量 与自变量 已得到n组观测数据如下:,与 观测值表,在理论模型式(1)下,可以认为表中数据满足,若记,则上式可用矩阵表示为,未知参数 估计式为,于是,有经验回归方程为,的无偏估计为,于是,有经验回归方程为,对于给定自变量 ,用,来预测,称 为 的点预测, 的 的置信区间为,用spss进行回归分析,某牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等之间的关

4、系,从而预测出在不同价格和广告费用下的销售量。为此,销售部的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以及同期其它厂家生产的同类牙膏的市场平均销售价格,分析牙膏销售量与其它因素的关系,为制订价格策略和广告投入策略提供数量依据。,牙膏销售量与销售价格、广告费用等数据,首先在spss中导入数据,由于差价是根据厂家自己定价和其他厂家平均价决定的,所有灵活性更好,将差价作为x1,将广告费作为x2,销量作为y。在spss中画出y与x1的散点图。以便我们观察y与x1的关系。,由图中我们大致可以看出差价x1与销量y是线性关系。 画出y与x2的散点

5、图,,我们大致的也可以看出y与x2也是线性关系。 所以我们可以认为y与x1、x2的关系是线性的。即: y=ax1+bx2+c 所以我们在spss中做多元回归分析,得到结果如下。,其中R方=0.886表示y的88.6%可以有模型确定。,F=104.967F0.05(2,29)=3.33,显著性水平sig00.05。所以可以认为模型是可以用的。,所以我们可以得到回归方程 Y=1.588X1+0.563X2+4.407 所以我们就可以根据x1、x2的值来预测销量y。 由上面的回归方程我们可以看到x2的系数靠近0,也就是说其实销量Y的值跟x2的线性关系不是那么明显的,即说明这个回归方程式可以改进的,其

6、实我们可以从y跟x2的散点图在x2=6.5的时候是有一定的弯曲的,所以我们对模型进行改进 y=ax2+bx2*x2+c,用spss得到改进的结果,由上面我们可以看出R方=0.905比上面的要大说明,拟合的效果要好。,F=82.941F0.05(3,29)=2.93,显著性水平sig大约等于00.05。所以可以认为模型是可以用的。,由上面的表我们可以知道: Y=1.307X1-3.696X2+0.349X2*X2+17.324 这样我们就得到了回归方程,我们可以根据差价和广告费投入只能大致的进行销量估计。因为我们从回归方程中可以看到,当我们进行大量的广告费投入的话,根据回归方程算出销量是大幅增加

7、的,但是现实生活中我们不可能无限制的增加。,时间序列,所谓时间序列,是指观察或记录到的一组按时间顺序排列的数据,经常用X1,X2,Xn表示。序列包含了产生该序列的系统的历史行为的全部信息。 基本思想: 根据系统有限长度的运行记录(观察数据),建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模型,并借以对系统的未来行为进行预报 时间序列分析简称时序分析,是一种根据动态数据揭示系统动态结构和规律的统计方法,是统计学科的一个分支。,用spss进行时间序列分析,数据来自中国统计出版社出版的中国统计年鉴,数据年限为19782004年。用时间序列分析,我国未来两年末从业人员人数和三产业从业人员数

8、有什么样的发展趋势?,数据:,通过spss分析得到发展趋势图,将数据导入spss,得到结果如下,同时spss给出了预测值,判别分析,判别分析和聚类分析的区别 聚类分析:是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称。它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。,判别分析:是根据多种因素(指标)对事物的影响来实现对事物的分类,从而对事物进行判别分类的统计方法。判别分析适用于已经掌握了历史上分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出分类的规律性(判别函数)来指导未来的分类,用spss做判别分析: 为研究1991年中国城镇居

9、民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。,1991年30个省、市、自治区城镇居民月平均收人数据表,x1:人均生活费收入 x6:人均各种奖金、超额工资 x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到 的其他收入 x4:人均集体所有制工资收入 x9:个体劳动者收入 x5:人均集体所有制职工标准工资,将数据导入spss,为了分组我们引入一个新的变量分组,1、2、3分别代表组G1、G2、G3,这样我们用spss的判别分析得到结果如下。 这表说明我们有28个变量已经分组占93.3%,有两个没有分组。,这个是建立函数情况,说明用两个函数就可以对模型进行统计。,这个是函数的假设性检验,在0.05的显著性水平下是显著的。,这个是未标准化是函数系数,即: Y1=0.736x1+0.544x2-0.321x3+0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论