统计数据分析技术...ppt_第1页
统计数据分析技术...ppt_第2页
统计数据分析技术...ppt_第3页
统计数据分析技术...ppt_第4页
统计数据分析技术...ppt_第5页
免费预览已结束,剩余166页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于统计的传统数据分析技术,1,目录,统计学的含义 收集数据 整理与分析 描述统计 推断统计 常用统计分析软件,数学家的幽默,统计学家调侃数学家:你们不是说若且,则吗!那么想必你若喜欢一个女孩,那么这个女孩喜欢的男生你也喜欢吧? 数学家反问道:那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均不过是五十度而已!”,3,统计学,统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识(不列颠百科全书),统计研究的基本环节,5,统计设计,收集数据,整理与分析,资料积累 开发应用,统计学理论与相关实质性学科理论,描述

2、统计 推断统计,统计调查、实验,案例,1.正常条件下新生婴儿的性别比为107::10 2.投掷一枚均匀的硬币,出现正面和反面的频率各位1/2;投掷一枚骰子出现16点的频率各位1/6 3.施肥量对农作物的产量的影响,统计设计,根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 搞好统计设计不仅要有统计学的一般理论和方法为指导,而且还要求设计者对所要研究的问题本身具有深刻的认识和相关的学科知识。,7,收集数据,统计数据的收集有两种基本方法。 对于大多数自然科学和工程技术研究来说,有可能通过有控制的

3、科学实验去取得数据,这时可以采用实验法。 对于社会经济现象来说,一般无法进行重复实验,要取得有关数据就必须进行调查观察。 海量数据的积累!,8,整理与分析,描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。推断统计是现代统计学的主要内容。,9,统计资料的积累、开发与应用,对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 如

4、何更好地将统计数据和统计方法应用于各自的研究领域是应用统计学研究的一个重要方面。,10,数学与统计学的联系,数学与统计学都是研究数量规律的,都要利用各种公式进行运算。 数学中的概率论,为统计学提供了数量分析的理论基础。统计学中的理论统计学以抽象的数量为研究对象,其大部分内容也可以看作是数学的分支。,11,统计学与数学的区别,从研究对象看,数学以最一般的形式研究数量的联系和空间形式。统计学特别是应用统计学则总是与客观的对象联系在一起的。 从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计本质上是归纳的方法。统计学家特别是应用统计学家需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统

5、计的方法,而且还要掌握某一专门领域的知识。,12,收集数据,数据来源,直接来源:第一手资料 统计调查(普查、抽样调查) 统计实验(实验设计) 间接来源:第二手资料 企业业务数据与客户数据 政府部门统计数据(例如统计局) 商务数据服务公司 万维网上的相关数据(WWW),14,总体和样本,总体:又称母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用 N 表示。 样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数(容量)用 n 表示。 总体是唯一的、确定的,而样本是不确定的、可变的、随机的。,15,总体参数和样本统计量,总体参

6、数:反映总体数量特征的指标。其数值是唯一的、确定的。 样本统计量:根据样本分布计算的指标,是随机变量。,16,数据的类型,横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。 时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。 例如,2008年全国各省市自治区的国内生产总值就属于横截面数据。而“十一五”期间我国历年的国内生产总值就属于时间序列数据。 面板数据:横截面数据与时间序列数据交织在一起。 非结构化数据,17,面板数据,所谓“面板数据”也称为“平行数据”,是指对不同时刻的截面个体作连续观测所得到的多维时间序列数据。

7、 例如,在研究生产成本与企业规模和技术进步的关系时,选择不同规模企业在不同时间上的数据作为样本观测值,这些观测值数据就是面板数据。,18,非结构化数据,相对于结构化数据(即存储在数据库中,可以用二维表结构来逻辑表达的数据)而言,不方便用数据库二维表来表现的数据即称为非结构化数据。 包括所有格式的办公文档、文本、图片、各类报表、图像和音频/视频信息等等。 据调查,现在人们所使用的数据有 80% 是非结构化的,而非结构化的数据又往往同结构化的数据结合在一起。,19,整理与分析,20,统计数据分析方法,描述统计 推断统计 常用统计分析软件,21,统计数据分析方法,统计学探索客观现象数量规律性的过程,

8、22,反映客观现象的统计数据,描述统计学 (统计数据的收集、整理、显示和分析),推断统计学 (利用样本信息和概率论对总体数量特征进行估计并检验),概率论(分布理论、大数定律、中心极限定理),总体内在的数量规律,描述统计的作用,对事物的全局认识和大局把握 描述粗略分布形状 描述现象基本特征和基本框架,23,描述统计,数据整理 集中趋势和离中趋势 相关分析,24,数据整理,数据分组 统计指标 统计表和统计图,按照研究的目的,将搜集到的原始数据进行加工,从中提取有用的信息,并搜索其中的数量规律性。,数据分组,统计数据的分组,26,分组是将总体所有单位按一定的标准区分为若干部分,分组的目的:概括数据,

9、清晰条理,如何分组?,27,将具有共性的个体归入同一组,将总体内部个体间的差异通过组别区分开来,统计数据的分组,空间数列是按不同地区标志进行的分组。例如人口按省、市、自治区分组; 品质数列是按现象的性质、类别标志进行的分组。例如人口按性别和民族分组; 时间数列按时间发生的先后顺序分组。例如我国解放后各年的人口数字;GDP 变量数列是按某一数量标志大小顺序进行的分组。例如某企业按工资收入的多少分组;,28,次数分配,29,数据观察值在各组中的个数称为次数,各组间的次数称为次数分配。次数分配描述了总体的结构和特征。 例如:某企业非熟练工人的月工资额(百元)数据如下表所示,应如何分组?,30,变量次

10、数分配的编制,1、将原始资料顺序排序 2、确定组数与组距 3、将各个数据按其数值大小归入相应的组内 4、确定组限,31,确定组数与组距,如果数据分布比较均匀、对称,即中间数值次数多,大小极端值次数少,考虑用以下公式来确定组数: Sturges 提出的经验公式 组数1+3.322log n。式中, n 表示总次数, log 表示以10为底的对数。 在不等距分组情况下,要比较各组次数或分析总体结构,要消除由组距不等造成的影响。为此需计算单位组距的次数,即频数密度。 组距(观察值中的最大数值观察值中的最小数值)/组数,32,分组计算,组数1+3.322log n =5.9(n=30) 分6组 组距:

11、每组区间的宽度 (观察值中的最大数值 观察值中的最小数值)/组数 =(128-84)/6=7.3,33,分6组,组距7,84,85,87,91,91,94,95, 96,97,99,101,101,103,103 计算不方便,34,结合实际数据,比较计算组距值(7.3),组距为10比较好计算且方便, 分组的组数相应从6减少为5。最小值为83,下限从80开始,,35,按5组,10元作为组距,计算次数。,组限:区间界限 80-89 求次数分配表和直方图,36,次数分配表,37,作图,38,用excel作直方图,39,分组数据的图示(直方图的绘制),40,某电脑公司销售量分布的直方图,我一眼就看出来

12、了,销售量在170180之间的天数最多!,销售量(台),次数曲线,用直线线段连接直方图各组条形顶端中值,形成一条平滑的曲线,即次数曲线。 常见的四种次数曲线:正态分布曲线,偏态曲线,J形曲线和U形曲线。,41,正态分布曲线,偏态曲线,J形曲线,U形曲线,正偏(右偏),负偏(左偏),累计次数分布,42,统计表和统计图,一个完整的统计表要求有:表号、表名、分组标志或说明、指标名称及数值; 统计图有条形图、线形图、圆饼图、立体图、枝叶图等;,43,示例数据,44,线形图(Line graph),45,(亿元),条形图 (Bar chart),46,(亿元),圆饼图 (Pie chart),47,环形

13、图(doughnut chart),环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示 与饼图类似,但又有区别 饼图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环 用于结构比较研究 用于展示分类和顺序数据,48,环形图,49,多变量数据雷达图(radar chart),也称为蜘蛛图(spider chart) 显示多个变量的图示方法 在显示或对比各变量的数值总和时十分有用 假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比 可用于研究多个样本之间的相似程度,50,多变量数据雷达图(雷达图的制

14、作), 设有n组样本S1,S2, , Sn,每个样本测得P个变量X1,X2 , , XP,要绘制这P个变量的雷达图,其具体做法是,51,先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示 将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图,多变量数据雷达图 (例题分析),52,【例】2003年我国城乡居民家庭平均每人各项生活消费支出构成数据如表。试绘制雷达图,多变量数据雷达图 (例题分析),53,54,散点图(Scatte

15、r Diagram),55,集中趋势和离中趋势,集中趋势的计量 离中趋势的计量 偏斜度和峰度的计量,56,次数分配后有两个特征,集中趋势的计量。 集中趋势反映一组数据中各数据所 具有的共同趋势,即资料中各数据 聚集的位置 离中(离散)趋势的计量,57,算术平均值,简单算术平均数计算公式: 它反映数据集中的主要测度。,58,加权算数平均数,59,算数平均值的好性质一,数据观察值与均值的离差值之和为零 此性质表明均值是个数值的重心,60,算数平均值的好性质二,观察值与均值的离差平方和最小, 为任意数。,61,均值的缺点,均值易受极端值的影响,某个极端大值或极端小值都会影响均值的代表性。同时还影响其

16、对集中趋势测度的准确性,62,中位数,63,将数据观察值 按其变量值由小到大的顺序排序为 如果个数为奇数,中位数所在位置 位置上的数值为成为中位数; 用 表示中位数,,6 , 7, 8, 9,12,15,18,举例,1987年美国家庭收入中位数大约是30800美元。收入直方图有一个长的右尾部,且平均数较高一些,为37000美元。在处理长尾的分布时,统计学家常常使用中位数而不用平均数,理由在于在某些情况下,平均数过多地注意了分布的极端尾部的小百分比的事例。,64,众 数,众数是一组资料中出现此书最多的那个数值,也反映数据集中的程度。 20,15, 18,20,20,22,20,23 20,20,

17、15,19, 19, 20,19,25 10,11,13,16,15,25 ,8,12,65,66,对称分布平均数与中位数相同,众数,平均数,中位数,67,均值是数据分布的平衡点或重心,中位数把这个分布划分为两半 众数正好是分布的顶端,68,长左尾部负偏态左偏态,平均数小于中位数,几何均值,凡是变量值乘积等于总比率或总速度的现象都可以用几何平均数来计算平均率或平均速度。 主要用于指数和平均发展速度的计算,用 表示,公式为:,69,表示变异(离散)程度的特征数,70,离散程度的测度,离散程度的测度的主要方法是:极差和方差 极差 极差也称为全距,是一组数据的最大值和最小值的差:,71,例如:天气预

18、报,方差,方差是观察值与其均值离差平方和的均值,又有总体方差和样本方差之分;,72,标准差,标准差是方差的正平方根,73,总体标准差,样本标准差,数据分布特征和描述统计量,74,因变量(Y)与自变量(X)之间的关系,75,根据因变量与自变量之间的关系不同,可以分为两种类型:,函数关系,统计关系,变量之间的关系,76,函数关系:变量之间依一定的函数形成的一一对应关系,若两个变量分别记做Y与X,则当Y与X之间存在函数关系时,X值一旦被指定,Y值就是唯一确定的。,函数关系,77, 函数关系的例子 某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价) 圆的面积(S)与

19、半径之间的关系可表示为S = r2 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3,变量之间的关系,78,统计关系:两个变量之间存在某种关系,但变量Y并不是由变量X唯一确定的,它们之间没有严格的一一对应关系。两个变量间的这种关系就是统计关系,亦称相关关系。两个变量之间若存在线性关系称为线性相关,存在非线性关系称为曲线相关,通常通过适当的变量变换,曲线相关可转换为线性相关。,相关关系,79, 相关关系的例子 商品的消费量(y)与居民收入(x)之间的关系 商品的消费量(y)与物价(x)之间的关系 商品销售额(y)与广告

20、费支出(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系 父亲身高(y)与子女身高(x)之间的关系,总体相关系数,80,样本相关系数,81,样本相关系数,82,样本相关系数,83,相关关系的测度(相关系数取值及其意义),84,r,相关性的可视化,85,Scatter plots showing the similarity from 1 to 1.,86,示例,为研究股票收益与风险之间的关系,抽选了美国15种股票,计算它们在19561980年间的平均收益率和标准差如表(美国15种股票平均收益率与标准差),试

21、计算收益率与风险之间的相关系数。,计算结果为:r0.6376,说明了平均收益越大风险也越大。,推断统计,87,参数估计,假设检验,方差分析,回归分析,时间序列分析,推 断 性 统 计 学,相关分析与回归分析,88,相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。,回归分析,是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。,回归模型的类型,89,一个自变量,两个以上自变量,回归模型,多元回归,一元回归,线性回归,非线性回归,

22、线性回归,非线性回归,一元线性回归模型,统计关系的特征,90,统计关系 特征,观测点散布在统计关系直线的周围,此种情况说明Y的变化除了受自变量X影响以外,还受其他因素的影响。,因此试图建立这样一个回归模型,通过对此模型 所作的一些假设,可以体现出上述统计关系所刻划的特征。,因变量Y随自变量X有规律的变化,而统计关系直线描述了这一变化的趋势。,一元线性回归模型假设,根据统计关系特征,可以进行下述假设:,91,假设,(2)这些Y的概率分布的均值, 有规律的随X变化而变化,(1)对于自变量的每一水平X, 存在着Y的一个概率分布;,一元线性回归模型,92,Y与X具有统计 关系而且是线性,建立 回归模型

23、,Yi=0+1Xi+i (i=1,2,n),其中,(X i,Yj)表示(X,Y)的第i个观测值,0 , 1为参数,0+1Xi为反映统计关系直线的分量, i为反映在统计关系直线周围散布的随机分量 iN (0,2)。,一元线性回归模型,对于任意Xi值有:,93, Yi服从正态分布,E(Yi)=0+1Xi;,各Yi间相互独立 YiN(0+1Xi,2),一元线性回归方程,94,最小二乘法,Y与X之间 为线性关系,选出一条最能反 映Y与X之间关系 规律的直线,一元线性回归方程,95,Yi=0+1Xi+i 0和1均未知,根据样本数据 对0和1 进行估计,0和1的估计 值为b0和b1,建立一元线性回归方程,

24、一元线性回归方程,96,一般而言,所求的b0和b1应能使每个样本观测点(X i,Y i) 与回归直线之间的偏差尽可能小,即使观察值与拟 合值的误差平方和Q达到最小。,回归方程原理图,一元线性回归方程,97,令,Q达到最小值 b0和b1称为最小二乘估计量,微积分中极值 的必要条件,令偏导数为0,解方程,一元线性回归方程,98,多元线性回归分析,多元线性回归的基本思想是什么? 多元线性回归的模型与一元线性回归有什么异同? 与一元线性回归相比,多元线性回归的检验有何特殊之处?,多元线性回归分析的定义,100,多元线性回归分析:研究因变量(被解释变量)与两个或两个以上自变量(解释变量)之间的回归问题,

25、称为多元回归分析。,线性回归 自变量个数 大于等于2,多元 线性 回归,多元线性回归模型,101,若因变量与解释变量,具有线性关系,它们之间的线性回归模型可表示为(其中b0,b1,bk为回归系数,u为随机扰动项 ):,多元线性回归的基本理论,多元线性回归模型,102,将n个观察数据代入上述模型,则问题转化为:,多元线性回归的基本理论,多元线性回归模型,103,多元线性回归的基本理论,写为矩阵形式:,多元线性回归模型,104,多元线性回归的基本理论,即:,其中,Y, u是n维向量,b是k维向量,x是mk矩阵,多元线性回归模型,105,多元线性回归的基本理论,基本假定:,多元线性回归模型,106,

26、多元线性回归的基本理论,参数的最小二乘估计,107,采用最小二乘估计回归系数b,令:,取最小值,参数的最小二乘估计,108,Q在最小值处偏导数为0,得:,采用最小二乘估计回归系数b,参数的最小二乘估计,109,采用最小二乘估计回归系数b,整理得:,求解该联立方程组即可得,时间序列分析,对时间序列的分析方法有哪几种?它们分别有什么优点和缺点? 如何进行时间序列的预测? 简单外推模型 平滑技术 季节调整,时间序列的成分,111,一个时间序列中往往由几种成分组成,通常假定是四种独立的成分趋势、循环、季节和不规则。下面我们仔细研究其中的每一种成分。,时间序列的 四种独立成分,趋势,循环,季节,不规则,

27、趋势成分,112,在一段较长的时间内,时间序列往往呈现逐渐增加或减少的总体趋势。时间序列逐渐转变的性态称为时间序列的趋势。 趋势通常是长期因素影响的结果,如人口总量的变化、方法的变化等等,趋势成分,时间序列的 长期动向,长期 影响因素,循环成分,113,时间序列常常呈现环绕趋势线上、下的波动。 任何时间间隔超过一年的,环绕趋势线的上、下波动,都可归结为时间序列的循环成分。,循环成分,围绕长期趋势线 的上下波动,季节成分,114,许多时间序列往往显示出在一年内有规则的运动,这通常由季节因素引起,因此称为季节成分。,季节成分,季节因素引起的一年内 有规则的运动,季节成分,115,例如,一个游泳池制

28、造商在秋季和冬季各月有较低的销售活动,而在春季和夏季各月有较高的销售量 。 铲雪设备和防寒衣物的制造商的销售却正好相反。,季节成分,116,季节成分也可用来描述任何持续时间小于一年的、有规则的、重复的运动。 例如,每天的交通流量资料显示在一天内的“季节”情况,在上、下班拥挤时刻出现高峰,在一天的休息时刻和傍晚出现中等流量,在午夜到清晨出现小流量。,季节成分的扩展,不规则成分,117,时间序列的不规则成分是剩余的因素,它用来说明在分离了趋势、循环和季节成分后,时间序列值的偏差。 不规则成分是由那些影响时间序列的短期的、不可预期的和不重复出现的因素引起的。它是随机的、无法预测的。,不规则成分,短期

29、的,不可预期和 不重复出现的因素引 起的随机变动,不规则成分,118,时 间 序 列,不 规 则 成 分,分离出趋势成分,分离出循环成分,分离出季节成分,利用平滑法进行预测,119,讨论三种平滑预测方法:移动平均法、加权移动平均法和指数平滑法。因为每一种方法的都是要“消除”由时间序列的不规则成分所引起的随机波动,所以它们被称为平滑方法。,三 种 平 滑 方 法,移动平均法,加权移动平均法,指数平滑法,利用平滑法进行预测,120,平滑方法对稳定的时间序列即没有明显的趋势、循环和季节影响的时间序列是合适的,这时平滑方法很适应时间序列的水平变化。但当有明显的趋势、循环和季节变差时,平滑方法将不能很好

30、地起作用,平滑方法很容易使用,而且对近距离的预测,如下一个时期的预测,可提供较高的精度水平。,预测方法之一的指数平滑法对资料有最低的要求,平 滑 方 法,缺点,优点,移动平均法,121,移动平均法使用时间序列中最近几个时期数据值的平均数作为下一个时期的预测值。移动平均数的计算公式如下:,加权移动平均法,122,移 动 平 均 法,加权 移动 平均 法,计算移动平均数时每个 观测值权数权数相同,对每期数据值选择不同的权数,然后计算 最近n个时期数值的加权平均数作为预测值,通常,最近时期的观测值应取得最大的 权数,而比较远的时期权数应依次递减,指数平滑法,123,指数平滑法,加权移动平均法,属于,

31、只选择一个权数(最近时期观 测值的权数),其他时期数据值 的权数可以自动推算出来。 当观测值离预测时期越久远时, 权数变得越小,指数平滑法,124,指数平滑法模型:,式中Ft+1t+1期时间序列的预测值; Ytt期时间序列的实际值; Ftt期时间序列的预测值; 平滑常数(01)。,指数平滑法,125,2期的预测值:,3期预测值:,最后,将F3的表达式代入F4的表达式中,有,指数平滑法,126,因此,F4是前三个时间序列数值的加权平均数。Y1,Y2和Y3的系数或权数之和等于1。 由此可以得到一个结论,即任何预测值Ft+1是以前所有时间序列数值的加权平均数。,指数平滑法,127,指数 平滑法 特点

32、,指数平滑法提供的预测值是以前所有预测值的加权平均数,但所有过去资料未必都需要保留,以用来计算下一个时期的预测值。,一旦选定平滑常数,只需要二项的信息就可计算预测值。,对给定的,我们只要知道t期时间序列的实际值和预测值,即Yt和Ft,就可计算t+1期的预测值。,示例,某一观察值序列最后4期的观察值为: 5,5.5,5.8,6.2 (1)使用4期移动平均法预测 。 (2)求在二期预测值 中 前面的系数等于多少?,128,示例,(1) (2) 在二期预测值中 前面的系数等于,129,利用趋势推测法进行预测,130,如何对拥有长期线性趋势的时间序列进行预测。,不稳定,随时间 呈现持续增加 或减少的形

33、态,长期 线性 趋势 数列,趋势推测法可行,平滑法不合适,利用趋势推测法进行预测,131,例 考虑一某超市过去10年的自行车销售量时间序列,资料见表11-1。注意,第1年销售了21600辆,第2年销售了22900辆,第10年(即最近一年)销售了31400辆。尽管图11-1显示在过去10年中销售量有上、下波动,但时间序列总的趋势是增长的或向上的。,利用趋势推测法进行预测,132,利用趋势推测法进行预测,133,图11-1 自行车销售时间序列的图形,利用趋势推测法进行预测,134,图11-2 用线性函数对自行车销售量的趋势描述,利用趋势推测法进行预测,135,被估计的销售量可表示为时间的函数,其表

34、,达式如下:,线性趋势方程,上式中 Ttt期时间序列的趋势值; b0线性趋势的截距; b1线性趋势的斜率; t 时间。,解析,利用趋势推测法进行预测,136,其中:,解析(续),利用趋势推测法进行预测,137,式中 Ttt期时间序列的值; n 时期的个数;,时间序列的平均值,即,t的平均值,即,=t/n。,解析(续),利用趋势推测法进行预测,138,根据计算b0和b1的关系式及表11-1的自行车销售量资料,我们有如下计算结果:,解析(续),利用趋势推测法进行预测,139,因此,自行车销售量时间序列的线性趋势成分的 表达式为:,Tt=20.4+1.1t,解析(续),拟合澳大利亚政府1981199

35、0年每季度的消费支出序列,140,线性拟合,模型 参数估计方法 最小二乘估计 参数估计值,141,拟合效果图,142,非线性拟合,使用场合 长期趋势呈现出非线形特征 参数估计指导思想 能转换成线性模型的都转换成线性模型,用线性最小二乘法进行参数估计 实在不能转换成线性的,就用迭代法进行参数估计,143,常用非线性模型,144,对上海证券交易所每月末上证指数序列进行模型拟合,145,非线性拟合,模型 变换 参数估计方法 线性最小二乘估计 拟合模型口径,146,拟合效果图,147,利用趋势和季节成分进行预测,148,前面我们已经介绍了如何对有趋势成分的时间序列 进行预测。本节我们将把这种讨论扩展到对同时拥有趋 势和季节成分的时间序列进行预测的情形。,利用趋势和季节成分进行预测,149,商业和经济中的许多情形是一期与一期的比较。 例如,我们想研究和了解失业人数是否比上个月上升1%,钢产量是否比上个月上升5%等问题。在使用这些资料时,必须十分小心。因为每当描述季节影响时,这样的比较会使人产生误解。,利

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论