统计数据分析技术_第1页
统计数据分析技术_第2页
统计数据分析技术_第3页
统计数据分析技术_第4页
统计数据分析技术_第5页
已阅读5页,还剩166页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于统计的传统数据分析技术1目录统计学的含义收集数据整理与分析描述统计推断统计常用统计分析软件数学家的幽默统计学家调侃数学家:你们不是说若X=Y且Y=Z,则X=Z吗!那么想必你若喜欢一个女孩,那么这个女孩喜欢的男生你也喜欢吧?数学家反问道:那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均不过是五十度而已!”3统计学统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识(不列颠百科全书)统计研究的基本环节5统计设计收集数据整理与分析资料积累开发应用统计学理论与相关实质性学科理论描述统计推断统计统计调查、实验案例1.正常条件下新生婴儿的性别比为107::102.投掷一枚均匀的硬币,出现正面和反面的频率各位1/2;投掷一枚骰子出现1~6点的频率各位1/63.施肥量对农作物的产量的影响统计设计根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。搞好统计设计不仅要有统计学的一般理论和方法为指导,而且还要求设计者对所要研究的问题本身具有深刻的认识和相关的学科知识。7收集数据统计数据的收集有两种基本方法。对于大多数自然科学和工程技术研究来说,有可能通过有控制的科学实验去取得数据,这时可以采用实验法。对于社会经济现象来说,一般无法进行重复实验,要取得有关数据就必须进行调查观察。海量数据的积累!!!8整理与分析描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。推断统计是现代统计学的主要内容。9统计资料的积累、开发与应用对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。如何更好地将统计数据和统计方法应用于各自的研究领域是应用统计学研究的一个重要方面。10数学与统计学的联系数学与统计学都是研究数量规律的,都要利用各种公式进行运算。数学中的概率论,为统计学提供了数量分析的理论基础。统计学中的理论统计学以抽象的数量为研究对象,其大部分内容也可以看作是数学的分支。11统计学与数学的区别从研究对象看,数学以最一般的形式研究数量的联系和空间形式。统计学特别是应用统计学则总是与客观的对象联系在一起的。从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计本质上是归纳的方法。统计学家特别是应用统计学家需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识。12收集数据数据来源直接来源:第一手资料统计调查(普查、抽样调查)统计实验(实验设计)间接来源:第二手资料企业业务数据与客户数据政府部门统计数据(例如统计局)商务数据服务公司万维网上的相关数据(WWW)14总体和样本总体:又称母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用N表示。样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数(容量)用n表示。总体是唯一的、确定的,而样本是不确定的、可变的、随机的。15总体参数和样本统计量总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。样本统计量:根据样本分布计算的指标,是随机变量。16平均数标准差、方差参数

、2统计量S、S2

总体

样本数据的类型横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。例如,2008年全国各省市自治区的国内生产总值就属于横截面数据。而“十一五”期间我国历年的国内生产总值就属于时间序列数据。面板数据:横截面数据与时间序列数据交织在一起。非结构化数据17面板数据所谓“面板数据”也称为“平行数据”,是指对不同时刻的截面个体作连续观测所得到的多维时间序列数据。例如,在研究生产成本与企业规模和技术进步的关系时,选择不同规模企业在不同时间上的数据作为样本观测值,这些观测值数据就是面板数据。18非结构化数据相对于结构化数据(即存储在数据库中,可以用二维表结构来逻辑表达的数据)而言,不方便用数据库二维表来表现的数据即称为非结构化数据。包括所有格式的办公文档、文本、图片、各类报表、图像和音频/视频信息等等。据调查,现在人们所使用的数据有80%是非结构化的,而非结构化的数据又往往同结构化的数据结合在一起。19整理与分析20统计数据分析方法描述统计推断统计常用统计分析软件21统计数据分析方法统计学探索客观现象数量规律性的过程22反映客观现象的统计数据描述统计学(统计数据的收集、整理、显示和分析)推断统计学(利用样本信息和概率论对总体数量特征进行估计并检验)概率论(分布理论、大数定律、中心极限定理)总体内在的数量规律描述统计的作用对事物的全局认识和大局把握描述粗略分布形状描述现象基本特征和基本框架23描述统计数据整理集中趋势和离中趋势相关分析24数据整理数据分组统计指标统计表和统计图

按照研究的目的,将搜集到的原始数据进行加工,从中提取有用的信息,并搜索其中的数量规律性。数据分组统计数据的分组26分组是将总体所有单位按一定的标准区分为若干部分分组的目的:概括数据,清晰条理如何分组?27将具有共性的个体归入同一组将总体内部个体间的差异通过组别区分开来统计数据的分组空间数列是按不同地区标志进行的分组。例如人口按省、市、自治区分组;品质数列是按现象的性质、类别标志进行的分组。例如人口按性别和民族分组;时间数列按时间发生的先后顺序分组。例如我国解放后各年的人口数字;GDP变量数列是按某一数量标志大小顺序进行的分组。例如某企业按工资收入的多少分组;28次数分配29数据观察值在各组中的个数称为次数,各组间的次数称为次数分配。次数分配描述了总体的结构和特征。例如:某企业非熟练工人的月工资额(百元)数据如下表所示,应如何分组?某企业非熟练工人的月工资额(百元)人员编号月收入人员编号月收入人员编号月收入110611992185284129422106311131192310149114872410551091511825966911697261057111171032710781071810328128912119952911110105201063010130变量次数分配的编制1、将原始资料顺序排序2、确定组数与组距3、将各个数据按其数值大小归入相应的组内4、确定组限31确定组数与组距如果数据分布比较均匀、对称,即中间数值次数多,大小极端值次数少,考虑用以下公式来确定组数:Sturges提出的经验公式组数=1+3.322×logn。式中,n表示总次数,log表示以10为底的对数。在不等距分组情况下,要比较各组次数或分析总体结构,要消除由组距不等造成的影响。为此需计算单位组距的次数,即频数密度。组距=(观察值中的最大数值-观察值中的最小数值)/组数32分组计算组数=1+3.322×logn=5.9(n=30)分6组组距:每组区间的宽度=(观察值中的最大数值-观察值中的最小数值)/组数

=(128-84)/6=7.333分6组,组距784,85,87,91,91,94,95,96,97,99,101,101,103,103……计算不方便34结合实际数据比较计算组距值(7.3),组距为10比较好计算且方便,分组的组数相应从6减少为5。最小值为83,下限从80开始,35按5组,10元作为组距,

计算次数。组限:区间界限80-89

求次数分配表和直方图36次数分配表工资收入次数分配表工资收入分组次数80-90(80-89)390-100(90-99)7100-11013110-1205120-1302合计3037作图38用excel作直方图39分组数据的图示

(直方图的绘制)40140150210直方图下的面积之和等于1某电脑公司销售量分布的直方图我一眼就看出来了,销售量在170~180之间的天数最多!190200180160170频数(天)25201510530220230240销售量(台)次数曲线用直线线段连接直方图各组条形顶端中值,形成一条平滑的曲线,即次数曲线。常见的四种次数曲线:正态分布曲线,偏态曲线,J形曲线和U形曲线。41正态分布曲线偏态曲线J形曲线U形曲线正偏(右偏)负偏(左偏)累计次数分布周工资上组限组次数小于上组限的累计次数小于上组限的累计百分比%80-9090-100100-110110-120120-130901001101201303713523102328301033779310042统计表和统计图一个完整的统计表要求有:表号、表名、分组标志或说明、指标名称及数值;统计图有条形图、线形图、圆饼图、立体图、枝叶图等;43示例数据44线形图(Linegraph)45(亿元)条形图(Barchart)46(亿元)圆饼图(Piechart)47环形图

(doughnutchart)环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于结构比较研究用于展示分类和顺序数据48环形图498%36%31%15%7%33%26%21%13%10%

非常不满意

不满意

一般

满意

非常满意

甲乙两城市家庭对住房状况的评价多变量数据—雷达图

(radarchart)也称为蜘蛛图(spiderchart)显示多个变量的图示方法在显示或对比各变量的数值总和时十分有用假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比可用于研究多个样本之间的相似程度50多变量数据—雷达图

(雷达图的制作)

设有n组样本S1,S2,…,Sn,每个样本测得P个变量X1,X2

,…,XP,要绘制这P个变量的雷达图,其具体做法是51

先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图多变量数据—雷达图

(例题分析)52【例】2003年我国城乡居民家庭平均每人各项生活消费支出构成数据如表。试绘制雷达图2003年城乡居民家庭平均每人生活消费支出构成(%)项目城镇居民农村居民

食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务37.129.796.307.3111.0814.3510.743.3045.595.674.205.968.3612.1315.872.21多变量数据—雷达图

(例题分析)5354散点图(ScatterDiagram)55集中趋势和离中趋势集中趋势的计量离中趋势的计量偏斜度和峰度的计量56次数分配后有两个特征集中趋势的计量。集中趋势反映一组数据中各数据所具有的共同趋势,即资料中各数据聚集的位置离中(离散)趋势的计量

57算术平均值

简单算术平均数计算公式:

它反映数据集中的主要测度。58加权算数平均数59算数平均值的好性质一

数据观察值与均值的离差值之和为零此性质表明均值是个数值的重心60算数平均值的好性质二观察值与均值的离差平方和最小,为任意数。61均值的缺点均值易受极端值的影响,某个极端大值或极端小值都会影响均值的代表性。同时还影响其对集中趋势测度的准确性62中位数63将数据观察值按其变量值由小到大的顺序排序为如果个数为奇数,中位数所在位置位置上的数值为成为中位数;用表示中位数,6,7,8,9,12,15,18举例1987年美国家庭收入中位数大约是30800美元。收入直方图有一个长的右尾部,且平均数较高一些,为37000美元。在处理长尾的分布时,统计学家常常使用中位数而不用平均数,理由在于在某些情况下,平均数过多地注意了分布的极端尾部的小百分比的事例。64众数众数是一组资料中出现此书最多的那个数值,也反映数据集中的程度。20,15,18,20,20,22,20,2320,20,15,19,19,

20,19,2510,11,13,16,15,25,8,126566对称分布平均数与中位数相同众数平均数中位数67均值是数据分布的平衡点或重心中位数把这个分布划分为两半众数正好是分布的顶端68长左尾部—负偏态—左偏态平均数小于中位数几何均值凡是变量值乘积等于总比率或总速度的现象都可以用几何平均数来计算平均率或平均速度。主要用于指数和平均发展速度的计算,用表示,公式为:69表示变异(离散)程度的特征数70数据的变异程度产品质量检查的结果说明生产是否稳定测量的结果说明测量方法或仪器是精密还是粗糙学生的成绩成绩是否整齐(而不是高低)离散程度的测度离散程度的测度的主要方法是:极差和方差极差极差也称为全距,是一组数据的最大值和最小值的差:

71例如:天气预报方差方差是观察值与其均值离差平方和的均值,又有总体方差和样本方差之分;72标准差标准差是方差的正平方根73总体标准差样本标准差数据分布特征和描述统计量数据分布特征集中趋势离散程度分布形状中位数平均数异众比率四分位差极差偏态系数平均差方差或标准差峰态系数众数离散系数74因变量(Y)与自变量(X)之间的关系

75根据因变量与自变量之间的关系不同,可以分为两种类型:函数关系统计关系变量之间的关系76函数关系:变量之间依一定的函数形成的一一对应关系,若两个变量分别记做Y与X,则当Y与X之间存在函数关系时,X值一旦被指定,Y值就是唯一确定的。函数关系77

函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为y=px(p为单价)圆的面积(S)与半径之间的关系可表示为S=r2

企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1x2x3

变量之间的关系78统计关系:两个变量之间存在某种关系,但变量Y并不是由变量X唯一确定的,它们之间没有严格的一一对应关系。两个变量间的这种关系就是统计关系,亦称相关关系。两个变量之间若存在线性关系称为线性相关,存在非线性关系称为曲线相关,通常通过适当的变量变换,曲线相关可转换为线性相关。相关关系79

相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品的消费量(y)与物价(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系总体相关系数80样本相关系数81样本相关系数82样本相关系数83相关关系的测度

(相关系数取值及其意义)84-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加相关性的可视化85Scatterplotsshowingthesimilarityfrom–1to1.86示例为研究股票收益与风险之间的关系,抽选了美国15种股票,计算它们在1956~1980年间的平均收益率和标准差如表(美国15种股票平均收益率与标准差),试计算收益率与风险之间的相关系数。计算结果为:r=0.6376,说明了平均收益越大风险也越大。推断统计87参数估计假设检验方差分析回归分析时间序列分析推断性统计学相关分析与回归分析88相关分析就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。回归分析是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。回归模型的类型89一个自变量两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归一元线性回归模型统计关系的特征90统计关系特征观测点散布在统计关系直线的周围,此种情况说明Y的变化除了受自变量X影响以外,还受其他因素的影响。因此试图建立这样一个回归模型,通过对此模型所作的一些假设,可以体现出上述统计关系所刻划的特征。因变量Y随自变量X有规律的变化,而统计关系直线描述了这一变化的趋势。一元线性回归模型假设根据统计关系特征,可以进行下述假设:91假设(2)这些Y的概率分布的均值,有规律的随X变化而变化(1)对于自变量的每一水平X,存在着Y的一个概率分布;一元线性回归模型92Y与X具有统计关系而且是线性建立回归模型Yi=β0+β1Xi+εi

(i=1,2,···,n)

其中,(Xi,Yj)表示(X,Y)的第i个观测值,β0,β1为参数,β0+β1Xi为反映统计关系直线的分量,εi为反映在统计关系直线周围散布的随机分量ε

i~N(0,σ2)。一元线性回归模型对于任意Xi值有:93⑴Yi服从正态分布⑵E(Yi)=β0+β1Xi;⑶⑷各Yi间相互独立

Yi~N(β0+β1Xi,σ2)一元线性回归方程94最小二乘法Y与X之间为线性关系选出一条最能反映Y与X之间关系规律的直线一元线性回归方程95Yi=β0+β1Xi+εi

β0和β1均未知根据样本数据对β0和β1进行估计β0和β1的估计值为b0和b1

建立一元线性回归方程

一元线性回归方程96一般而言,所求的b0和b1应能使每个样本观测点(Xi,Yi)与回归直线之间的偏差尽可能小,即使观察值与拟合值的误差平方和Q达到最小。回归方程原理图一元线性回归方程97令

Q达到最小值b0和b1称为最小二乘估计量微积分中极值的必要条件

令偏导数为0解方程一元线性回归方程98多元线性回归分析多元线性回归的基本思想是什么?多元线性回归的模型与一元线性回归有什么异同?与一元线性回归相比,多元线性回归的检验有何特殊之处?多元线性回归分析的定义100多元线性回归分析:研究因变量(被解释变量)与两个或两个以上自变量(解释变量)之间的回归问题,称为多元回归分析。线性回归自变量个数大于等于2多元线性回归多元线性回归模型101若因变量Y与解释变量X1,X2,XK……具有线性关系,它们之间的线性回归模型可表示为(其中b0,b1,…,bk为回归系数,u为随机扰动项):多元线性回归的基本理论多元线性回归模型102将n个观察数据代入上述模型,则问题转化为:多元线性回归的基本理论多元线性回归模型103多元线性回归的基本理论写为矩阵形式:多元线性回归模型104多元线性回归的基本理论即:其中,Y,u是n维向量,b是k维向量,x是m×k矩阵多元线性回归模型105多元线性回归的基本理论基本假定:①②多元线性回归模型106多元线性回归的基本理论③④参数的最小二乘估计107采用最小二乘估计回归系数b令:取最小值参数的最小二乘估计108Q在最小值处偏导数为0,得:采用最小二乘估计回归系数b参数的最小二乘估计109采用最小二乘估计回归系数b整理得:求解该联立方程组即可得时间序列分析对时间序列的分析方法有哪几种?它们分别有什么优点和缺点?如何进行时间序列的预测?简单外推模型平滑技术季节调整时间序列的成分

111一个时间序列中往往由几种成分组成,通常假定是四种独立的成分——趋势、循环、季节和不规则。下面我们仔细研究其中的每一种成分。时间序列的四种独立成分趋势循环季节不规则趋势成分

112在一段较长的时间内,时间序列往往呈现逐渐增加或减少的总体趋势。时间序列逐渐转变的性态称为时间序列的趋势。趋势通常是长期因素影响的结果,如人口总量的变化、方法的变化等等趋势成分时间序列的长期动向长期影响因素循环成分

113时间序列常常呈现环绕趋势线上、下的波动。任何时间间隔超过一年的,环绕趋势线的上、下波动,都可归结为时间序列的循环成分。循环成分围绕长期趋势线的上下波动季节成分114许多时间序列往往显示出在一年内有规则的运动,这通常由季节因素引起,因此称为季节成分。季节成分季节因素引起的一年内有规则的运动季节成分115例如,一个游泳池制造商在秋季和冬季各月有较低的销售活动,而在春季和夏季各月有较高的销售量。铲雪设备和防寒衣物的制造商的销售却正好相反。季节成分116季节成分也可用来描述任何持续时间小于一年的、有规则的、重复的运动。例如,每天的交通流量资料显示在一天内的“季节”情况,在上、下班拥挤时刻出现高峰,在一天的休息时刻和傍晚出现中等流量,在午夜到清晨出现小流量。季节成分的扩展不规则成分

117时间序列的不规则成分是剩余的因素,它用来说明在分离了趋势、循环和季节成分后,时间序列值的偏差。不规则成分是由那些影响时间序列的短期的、不可预期的和不重复出现的因素引起的。它是随机的、无法预测的。不规则成分短期的,不可预期和不重复出现的因素引起的随机变动不规则成分

118时间序列不规则成分分离出趋势成分分离出循环成分分离出季节成分利用平滑法进行预测

119讨论三种平滑预测方法:移动平均法、加权移动平均法和指数平滑法。因为每一种方法的都是要“消除”由时间序列的不规则成分所引起的随机波动,所以它们被称为平滑方法。三种平滑方法移动平均法加权移动平均法指数平滑法利用平滑法进行预测

120平滑方法对稳定的时间序列——即没有明显的趋势、循环和季节影响的时间序列——是合适的,这时平滑方法很适应时间序列的水平变化。但当有明显的趋势、循环和季节变差时,平滑方法将不能很好地起作用平滑方法很容易使用,而且对近距离的预测,如下一个时期的预测,可提供较高的精度水平。预测方法之一的指数平滑法对资料有最低的要求平滑方法缺点优点移动平均法121移动平均法使用时间序列中最近几个时期数据值的平均数作为下一个时期的预测值。移动平均数的计算公式如下:加权移动平均法122移动平均法加权移动平均法计算移动平均数时每个观测值权数权数相同对每期数据值选择不同的权数,然后计算最近n个时期数值的加权平均数作为预测值通常,最近时期的观测值应取得最大的权数,而比较远的时期权数应依次递减指数平滑法

123指数平滑法加权移动平均法属于只选择一个权数(最近时期观测值的权数),其他时期数据值的权数可以自动推算出来。当观测值离预测时期越久远时,权数变得越小指数平滑法

124指数平滑法模型:式中Ft+1——t+1期时间序列的预测值;

Yt——t期时间序列的实际值;

Ft——t期时间序列的预测值;

α——平滑常数(0≤α≤1)。指数平滑法

1252期的预测值:3期预测值:最后,将F3的表达式代入F4的表达式中,有指数平滑法

126

因此,F4是前三个时间序列数值的加权平均数。Y1,Y2和Y3的系数或权数之和等于1。由此可以得到一个结论,即任何预测值Ft+1是以前所有时间序列数值的加权平均数。指数平滑法

127指数平滑法特点指数平滑法提供的预测值是以前所有预测值的加权平均数,但所有过去资料未必都需要保留,以用来计算下一个时期的预测值。一旦选定平滑常数α,只需要二项的信息就可计算预测值。对给定的α,我们只要知道t期时间序列的实际值和预测值,即Yt和Ft,就可计算t+1期的预测值。示例某一观察值序列最后4期的观察值为:5,5.5,5.8,6.2(1)使用4期移动平均法预测。(2)求在二期预测值中前面的系数等于多少?128示例(1)(2)

在二期预测值中前面的系数等于

129利用趋势推测法进行预测

130如何对拥有长期线性趋势的时间序列进行预测。不稳定,随时间呈现持续增加或减少的形态长期线性趋势数列趋势推测法可行平滑法不合适利用趋势推测法进行预测

131[例]

考虑一某超市过去10年的自行车销售量时间序列,资料见表11-1。注意,第1年销售了21600辆,第2年销售了22900辆,…,第10年(即最近一年)销售了31400辆。尽管图11-1显示在过去10年中销售量有上、下波动,但时间序列总的趋势是增长的或向上的。利用趋势推测法进行预测

132利用趋势推测法进行预测

133图11-1自行车销售时间序列的图形利用趋势推测法进行预测

134图11-2用线性函数对自行车销售量的趋势描述

利用趋势推测法进行预测

135

被估计的销售量可表示为时间的函数,其表达式如下:线性趋势方程上式中Tt——t期时间序列的趋势值;

b0——线性趋势的截距;

b1——线性趋势的斜率;

t

——时间。[解析]利用趋势推测法进行预测

136其中:[解析(续)]利用趋势推测法进行预测

137式中Tt——t期时间序列的值;

n——时期的个数;——时间序列的平均值,即

—t的平均值,即=∑t/n。[解析(续)]利用趋势推测法进行预测

138

根据计算b0和b1的关系式及表11-1的自行车销售量资料,我们有如下计算结果:[解析(续)]利用趋势推测法进行预测

139

因此,自行车销售量时间序列的线性趋势成分的表达式为:Tt=20.4+1.1t[解析(续)]拟合澳大利亚政府1981—1990年

每季度的消费支出序列

140线性拟合模型参数估计方法最小二乘估计参数估计值141拟合效果图142非线性拟合使用场合长期趋势呈现出非线形特征参数估计指导思想能转换成线性模型的都转换成线性模型,用线性最小二乘法进行参数估计实在不能转换成线性的,就用迭代法进行参数估计143常用非线性模型模型变换变换后模型参数估计方法线性最小二乘估计线性最小二乘估计--迭代法--迭代法--迭代法144对上海证券交易所每月末上证指数

序列进行模型拟合

145非线性拟合模型变换参数估计方法线性最小二乘估计拟合模型口径146拟合效果图147利用趋势和季节成分进行预测148

前面我们已经介绍了如何对有趋势成分的时间序列进行预测。本节我们将把这种讨论扩展到对同时拥有趋势和季节成分的时间序列进行预测的情形。利用趋势和季节成分进行预测149商业和经济中的许多情形是一期与一期的比较。例如,我们想研究和了解失业人数是否比上个月上升1%,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论