




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
金融数据统计分析项目七相关与回归分析01学习目标目录CONTENT一知识目标(1)了解金融数据分析中相关关系和回归分析的基本概念、目的以及流程。(2)掌握相关分析中相关系数的计算与意义。(3)明确相关分析与回归分析的区别与联系(4)掌握回归分析的基本理论与方法(5)掌握一元线性回归方程的求解与应用。(6)了解多元线性回归方程的构建原理和分析方法。二能力目标(1)能够表述金融数据分析中相关关系的一般流程,能够区分相关系数来辨别变量间的相关关系程度。(2)能够区分相关关系和回归关系的原理与意义。(3)能够建立一元线性回归模型,通过模型结果进行数据分析。(4)能够明确构建多元线性回归模型的条件和适用范围。三思政素养目标(1)培养学生团结协作、集思广益的团队精神。(2)引导学生从数据之间的关系,发现其中隐含的意义,培养学生自我探索、思考的创新精神。02案例导读目录CONTENT如何采集2020年的宏观经济指标?案例导入
2020年全球经济遭遇了严重冲击,尤其是二季度多国GDP跌幅创下历史记录。在全球经济形势严峻的背景下,想要了解我国的经济发展形势,需要知道以下指标数据:(1)国内生产总值(GDP)及第一、第二、第三产业的生产总值;(2)全社会固定资产投资额、社会消费品零售总额、进出口总额(包括出口和进口);(3)居民人均消费支出、居民消费价格指数、工业生产者出厂价格指数,工业生产者购进价格指数;(4)财政收入和支出、城镇登记失业率、居民人均可支配收入;(5)广义货币M2供应量、狭义货币M1供应量、流通中的货币M0供应量、社会融资规模、金融机构本外币贷款余额、贷款市场报价利率(LPR)。在教材案例中,宝丽来公司的科学家们描绘出了胶卷保存时间与感光速率变动之间的关系,并建立起回归方程来说明两变量之间的相关关系。那么如何描绘两变量之间的关系,依据什么来建立回归方程进行测度呢?03新课教学目录CONTENT一、相关的意义和种类二、简单线性相关分析三、回归分析任务一相关的意义和种类客观现象之间确实存在的数量上的依存关系称为相关关系。现象之间相关关系密切程度的研究则称为相关分析。一、相关的意义客观现象之间的数量依存关系可以区分为两种不同的类型:函数关系和相关关系。一、相关的意义(一)函数关系二一假设有两个变量x和y,函数关系就是指这两个变量一一对应的关系,即一个变量的数值完全由另外一个变量的数值所决定。函数关系指现象之间在数量上存在着严格的、确定性的依存关系。
商品的销售额与销售量之间的关系圆面积与圆半径的关系相关关系是指变量之间存在一种不确定的数量关系,即一个变量发生变另一个变量也会发生变化,但具体变化的数量不是确定的,只是在一定的范围内而已。日活中,相关关系是非常普遍的:如父母身高与子女身高的关系商品消费量与居民收入的关系一、相关的意义(二)相关关系一、相关的意义二一
一、相关的意义理解相关关系要把握两个要点(1)相关关系是指现象之间确实存在数量上的相互依存关系。(2)现象之间数量依存关系的具体关系值是不固定的。例如,劳动生产率提高,相应地会使成本降低、利润增加等。例如,生育率与人均GDP之间就属于典型的相关关系,人均GDP高的国家生育率往往较低,但二者没有唯一确定的关系,这是因为除了经济因素外,生育率还受教育水平、城市化水平以及不易测量的民族风俗、宗教和其他随机因素的共同影响。区别联系函数关系反映确定性的数量关系,而相关关系表明的是非确定性的数量关系。函数关系是相关关系的特例。相关关系是相关分析的研究对象,而函数关系是相关分析的工具。一、相关的意义按相关的密切程度不同划分两种现象中一种现象的数量变化随另一现象的数量变化而确定,这两种现象之间的依存关系就称为完全相关。两种现象之间的关系介于完全相关和不相关之间,称为不完全相关。两种现象的数量表现各自独立、互不影响,称为不相关。完全相关不完全相关不相关
企业生产成本和工人年龄之间、证券市场上股票的价格和降雨量之间一般是不相关的。二、相关的种类(一)按相关的密切程度不同划分二、相关的种类(二)按相关的表现形态不同划分1.直线相关相关关系是一种数量上不严格的相互依存关系,如果这种关系近似地表现为一条直线,则称为直线相关,也称线性相关。直线正相关直线负相关二、相关的种类2.曲线相关如果相关关系近似地表现为一条曲线,则称为曲线相关,也称非线性相关,如图所示。曲线相关又分为不同的种类,如抛物线、指数曲线和双曲线等。曲线相关(三)按直线相关的方向不同划分按直线相关的方向不同划分正相关负相关例如,施肥量增加,亩产量也随之增加;居民的收入增加,购买力也随之增加。例如,产量越高,生产成本就越低;商品价格越低,销售量就越高。若自变量x的数值增加,因变量y的数值也相应地增加,则称为正相关。若自变量x的数值增加(减少),因变量y的数值相应减少(增加),则称为负相关。二、相关的种类二、相关的种类1.单相关:只涉及两个现象(变量)之间的相关称为单相关,也称简单相关或一元相关,即研究时只涉及一个自变量和一个因变量。2.多元相关:涉及三个或三个以上现象(变量)之间的相关称为多元相关,即一个现象的数量变化是由其他两个或两个以上现象的数量变化的协同作用引起的。在多元相关中,若研究某一变量与其余全部变量之间的总相关程度,称为复相关;若研究其中两个变量的相关程度并假定其余变量是固定的,则称为偏相关。(四)按相关的影响因素多少划分三、相关分析的主要内容(一)(二)(三)(四)确定现象间有无关系及其表现形式。确定相关关系的密切程度。选择合适的数学模型。测定因变量估计值的准确程度。(五)进行显著性检验。任务二简单线性相关分析①利用相关表、相关图判断相关关系的有无。②计算相关系数确定关系的密切程度。进行简单线性相关分析需要分为两个步骤:一、相关表和相关图相关表就是根据所掌握的有关变量一定数量的原始对应资料编制的统计表,该表可以直观地表明因变量和自变量的关系。根据给定资料是否分组,相关表分为简单相关表和分组相关表两种。(一)相关表1.简单相关表确定自变量和因变量;其次,将两个变量的变量值一一对应按自变量的变量值从小到大顺序排列。简单相关表是指利用未分组的原始资料,将两个变量的值一一对应地填列在同一张表格上而形成的相关表。其编制程序是:一、相关表和相关图例如,为了研究固定资产和工业产值的关系,通过调查资料可编制相关表(为方便只列举10个企业有关的原始对应资料),见表7-1。表7-1 10个企业固定资产和工业产值资料(单位:十万元)企业编号固定资产工业产值1204023055340704509057010068011071001258110140912014010130160从表7-1中可看出,随着固定资产的提高,工业产值有相应增加的趋势,尽管存在不同固定资产对应的工业产值表现相同的情况,但是两者之间仍然存在一定的依存关系。简单相关表简单相关表仅在总体单位数比较少的情况下适用。如果总体单位数比较多,则编制的简单相关表会很长,使用起来不方便,在这种情况下应编制分组相关表。一、相关表和相关图一、相关表和相关图2.分组相关表分组相关表就是将原始资料进行分组而编制的相关表。根据分组的情况不同,分组相关表又分为以下两种:(1)单变量分组表。它是将自变量分组并计算频数,而对应的因变量不分组,只计算其平均值。其编制程序是:将自变量分为若干组(资料情况可以是单项式,也可以是组距式)计算各组频数计算各组对应的因变量的平均值一、相关表和相关图例如,200个女大学生身高和体重相关表见表7-2。表7-2 200个女大学生身高和体重相关表体重(千克)学生数(人)平均身高(厘米)45以下115145~47.51215447.5~504615550~52.56515852.5~554316055~57.51916257.5~601116360~62.5216762.5及以上1170合计200—这种单变量分组表是实际工作中使用最多的一种,它能使资料简化,更直接、更清晰地反映出两变量之间的相关关系。一、相关表和相关图(2)双变量分组表。它是将自变量和因变量都进行分组而制成的相关表。这种表的形状如同盘,故又称棋盘式表。其编制程序是:分别对自变量和因变量进行分组按两个变量的组数设计表格计算各组频数,并将其填入表格相应的位置一、相关表和相关图例如,根据表7-2资料编制的双变量分组表见表7-3。表7-3 200个女大学生身高和体重相关表体重(千克)身高(厘米)学生数(人)150~154154~158158~162162~166166~170合计
1160~62.5
2257.5~60
13341155~57.5
8741952.5~55
1410141224350~52.5121221236
6547.5~50
21514105
4645~47.51
6
5
12
1
1合计263746633313200相关图又称散点图,是将相关表中的原始对应数值在平面直角坐标系用坐标点描绘出来。以横轴代表自变量,纵轴代表因变量,在坐标系中将相关表中两个变量的对应数值画出坐标点,每个坐标点在这里称为相关点,所有相关点组成的图形就叫相关图或散点图。一、相关表和相关图(二)相关图一、相关表和相关图通过相关图中所有点的分布情况,可以直观地、大致地看出两个现象间相关的形态和方向。例如,根据表7-1中的资料绘制的相关图如图7-5所示。从图7-5中可以看出,工业产值随着固定资产的增加而增加,并且散点图的分布近似地表现为一条直线由此可判决固定资产与工业产值两个变量之间存在着直线正相关关系。二、相关系数(一)相关系数的意义根据相关表和相关图可以直观判断两个现象是否相关及相关的形态,但不能准确判断相关的密切程度,因此还需运用数学解析方法,构建一个恰当的数学模型来显示现象之间相关关系及其密切程度。相关分析首先需要判断变量之间是否存在相关关系,如果存在,还需要分析相关关系的形态、方向和程度。解决这些问题,最常使用的就是散点图和相关系数这两种工具。二、相关系数(二)相关系数的计算积差法
二、相关系数(三)相关系数的性质实际上,并不是只能通过散点图才能发现变量之间的相关关系,通过相关系数的取值,更能准确说明相关关系的具体情况。(1)计算相关系数时,不需要区分自变量和因变量,两变量是对等关系。(2)相关系数的数值范围在-1和+1之间,即-1≤r≤1。(3)相关系数有正负号,分别表示正相关和负相关。二、相关系数(4)相关系数的值越接近于-1或+1(即绝对值越接近于1),表示相关关系越强;越接近于0,表示相关关系越弱。若相关系数等于±1,则表示两个变量完全相关;若相关系数等0,则表示两个变量之间不存在线性相关关系(但并不意味着不存在非线性关系)。
二、相关系数需要指出的是,有时两变量之间并不存在相关关系,但却可能出现较高的相关系数,这就是虚假相关,导致这种现象发生的原因往往是存在另一个共同影响两变量的因素,如果利用该结果就会得出错误的结论。图7-6相关系数的取值范围任务三回归分析一、回归分析的概念和特点(一)回归分析的概念回归分析就是对具有相关关系的两个或两个以上的变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便进行估计或预测的统计方法。其所建立的数学表达式称为回归方程,而代表现象之间一般数量关系的直线或曲线称为回归直线或回归曲线。一、回归分析的概念和特点(二)回归分析的特点(1)在相关分析中,各变量之间是对等关系;而回归分析是通过建立回归方程来反映变量之间数值的变化关系,必须区分哪个是自变量,哪个是因变量。(2)在两个变量互为根据的情况下,回归分析需要建立两个不同的回归方程,一个是以x为自变量,y为因变量的“y依x的回归方程”;另一个是以y为自变量,x为因变量的“x依y的回归方程”。当然,如果两个变量是单向因果关系,则回归分析就只能建立一个回归方程。一、回归分析的概念和特点(二)回归分析的特点(3)在相关分析中,各变量都是随机变量;而回归分析中,因变量是随机变量,自变量不是随机变量,而是一系列给定的值。(4)利用回归方程,可以根据自变量的数值估计和预测因变量的可能值,一个回归方程对同一自变量数值只能做一次推算。一、回归分析的概念和特点按不同的标准分类从变量间回归关系的表现形式看线性回归分析非线性回归分析按回归分析所涉及的自变量的多少一元回归分析多元回归分析把两者结合起来一元线性回归分析多元线性回归分析二、一元线性回归分析(一)构建回归方程应具备的条件现象间确实存在着相互依存关系010203具备条件现象间存在着直线相关关系具备一定数量的变量观测值二、一元线性回归分析(二)一元线性回归模型
二、一元线性回归分析
二、一元线性回归分析
二、一元线性回归分析(三)最小二乘估计最小二乘估计是指采用最小二乘法使因变量x的观察值与估计值之间的离差平方和达到最小,以此来求得参数a和b的方法。
二、一元线性回归分析下图所示即为最小二乘法的计算示意,即散点图中的点与该直线之间的距离的平方和,小于散点图中的点与任何其他拟合直线之间距离的平方和。
建立回归方程后,只能通过给定的自变量的值来计算因变量的估计值,而不能反过来计算。对由样本数据求出的回归方程,应进行一系列的统计检验,以检查方程对资料的拟合是否有效,是否显著。(1)(4)(2)(3)
回归系数b的值有正负号,正回归系数表示两个变量为正相关关系,在图形上表现为一条上升直线;负回归系数表示负相关,在图形上表现为一条下降直线。二、一元线性回归分析(四)建立回归方程的相关注意事项二、一元线性回归分析(五)一元线性回归检验1.拟合优度检验如果观测点越靠近直线,则说明回归直线对数据的拟合度越好;如果观测点越远离直线,则说明回归直线对数据的拟合度越差。回归直线与各观测点的接近程度称为回归直线对数据的拟合优度。
二、一元线性回归分析(1)判定系数估计标准误差
二、一元线性回归分析(2)估计标准误差二、一元线性回归分析2.显著性检验一元线性回归方程的显著性检验包括回归方程的F检验和回归系数的t检验。(1)F检验(2)t检验F检验是通过构建F统计量,检验自变量x和因变量y之间的线性关系是否显著,通过了F检验则表明变量之间的线性关系显著。t检验是通过构建t统计量,检验自变量x和因变量y的影响是否显著,通过了t检验则表明自变量x对因变量y的影响显著,就可以用自变量x来解释因变量y的变化。这里可以利用Excel的数据分析功能,直接对比显著性水平α来判断因变量与自变量的关系。三、多元线性回归分析与检验(一)多元线性回归模型多元线性回归模型可表示如下:
三、多元线性回归分析与检验(二)多元线性回归方程一元线性回归方程只反映一个因变量受一个自变量影响的情况,现实中往往一个因变量会受多个自变量的影响。粮食亩产量会受播种量、降雨量以及施肥量等因素的影响。产品的利润会受产品销售额、产品成本等因素的影响。因此应将影响因变量的多个因素综合起来进行分析,建立一个更符合实际的模型,来揭示现象内在的规律。多元线性回归分析三、多元线性回归分析与检验
三、多元线性回归分析与检验二元线性回归方程是最典型的多元线性回归方程。
三、多元线性回归分析与检验(三)拟合优度检验
三、多元线性回归分析与检验2.估计标准误差
三、多元线性回归分析与检验3.显著性检验多元回归系数的显著性检验需要对每个回归系数分别进行检验,如果某个自变量没有通过检验,就意味着该自变量对因变量的影响不显著,就不能进入回归模型中。与此相反,在进行多元线性回归方程的线性关系检验时,如果多个自变量中有一个自变量与因变量的线性关系显著,就能通过检验。
四、估计标准误差(一)估计标准误差的概念估计标准误差值越小,说明因变量的实际值与其估计值间的差异越小,组合的回归直线方程越精确,代表性越大估计标准误差值越大,说明因变量的实际值与其估计值间的差异越大,即拟合的回归直线方程越不精确,代表性越小。估计标准误差是用来说明回归方程推算结果准确程度的统计分析指标,或者说是反映回归直线代表性大小的统计分析指标。四、估计标准误差(二)简单直线回归估计标准误差的计算
课堂实训课堂实训——分析研发与销售的关系一、实训目标及思路某上市公司从其下属的研发中心中随机抽样获得20次产品的研发投入金额数据以及估计的销售额数据,并将产品对应的实际销售额数据进行收集和汇总,希望找出研发投入金额数据和实际销售额数据之间存在的关系。下面将利用相关分析和回归分析找出研发投入金额数据与实际销售额数据之间可能存在的关系,并通过回归方程预测在研发投入金额为20万元时产品销售额的估计结果,具体操作思路如图7-8所示。课堂实训二、操作方法本实训的具体操作如教材所示。图7-8相关与回归分析思路04项目实训目录CONTENT实训内容采集某一城市近15年社会商品零售总额和居民收入数据,希望找出社会商品零售总额和居民收入数据之间存在的关系,接下来利用相关分析和回归分析找出社会商品零售总额与民收入数据之间可能存在的关系,并通过回归方程预测在居民收入数据为10亿元时社会商品零售总额的估计结果。谢谢观看金融数据统计分析项目八时间序列分析01学习目标目录CONTENT一知识目标(1)了解金融数据分析中时间序列的含义与分类。(2)熟悉金融数据分析中时间序列分析的影响因素与预测误差。(3)掌握金融数据分析中时间序列分析的指标计算与模型构建。(4)掌握金融数据分析中时间序列分析的预测算法与分析方法。二能力目标(1)能够表述金融数据分析中相关关系的一般流程,能够区分相关系数来辨别变量间的相关关系程度。(2)能够区分相关关系和回归关系的原理与意义。(3)能够建立一元线性回归模型,通过模型结果进行数据分析。(4)能够明确构建多元线性回归模型的条件和适用范围。三思政素养目标(1)通过时间数列分析,培养学生爱岗敬业、艰苦奋斗的意志品质(2)引导学生探索时间和数据之间的关系,发现其中隐含的联系与实际意义,培养学生自主学习能力,提高学生的逻辑思维能力。02案例导读目录CONTENT预测食品和饮料的销售额案例导入Vintage饭店位于美国佛罗里达州迈尔斯堡以西的卡普蒂瓦岛上,是一个公众常去的场所。它由KarenPayne拥有和经营已超过30年。在这期间,Karen一直在寻求建立以新鲜海味设置的高质量正餐的饭店信誉。Karen及其员工的努力被证实是成功的,她的饭店成为岛上最好的、营业额增长最快的饭店之一。Karen为确定饭店未来的增长计划需要建立一个系统,这个系统可使她提前一年预测今后每个月食品和饮料的销售量。Karen拥有的资料见表8-1,这些资料是在三年的经营中有关食品和饮料的销售总额。案例导入表8-1 Vintage饭店三年的经营活动中有关食品和饮料的销售总额月份123456789101112第一年242235232178184140145152110130152206第二年263238247193193149157161122130167230第三年282255265205210160166174126148173235上表中的单位为千美元,试着分析Vintage饭店的销售资料,为Karen准备一份囊括你的发现、预测和建议的分析报告。其内容包括:(1)时间数列的图形。(2)对数据进行季节性分析。指出每个月的季节指数,并讨论各月销售量的高低。季节指数有直观上的意义吗?对此应加以讨论。(3)预测第四年各月的销售量。(4)当用来说明新的销售资料时,提出对你所建立的系统的建议。(5)在你报告的附录中,给出分析评论的结果。假设第四年1月份的销售额为295000美元,你的预测误差为多少?如果这个误差太大,Karen可能会对你的预测值和实际销售额的差异产生疑虑,你将如何消除她对预测方法的疑虑?03新课教学目录CONTENT一、时间数列的意义和种类二、时间数列的水平指标三、时间数列的速度指标四、时间数列变动的趋势分析任务一时间数列的意义和种类一、时间数列的概念及意义(一)时间数列的概念时间数列在形式上包括两个构成要素:0102被研究现象所属的时间,用“t”表示,可以是年份、季度、月份及其他任何时间形式;与现象所属时间相对应的指标数值。时间数列是指将同类指标在不同时间上的数值按时间的先后顺序排列起来形成的统计数列,也称为动态数列,是一种常见的经济数据表现形式。一、时间数列的概念及意义例如表8-2显示的是我国2006~2021年若干统计指标的时间数列,从中可以看出时间数列由两个基本要素构成:统计指标所属的时间01统计指标在特定时间的具体指标值02一、时间数列的概念及意义表8-2 我国2006~2021年的国内生产总值、人口及第三产业产值年份国内生产总值(亿元)年末人口数(万人)年平均人口数(万人)人均国内生产总值(元/人)第三产业增加值(亿元)第三产业所占比重(%)(1)(2)(3)(4)(5)(6)(7)2006219438.5131448131102.01673891759.741.82007270232.3132129131788.520505115810.742.92008319515.5132802132465.524121136805.842.82009349081.4133450133126.026222154747.944.32010413030.3134091133770.530876182038.044.12011489300.6134735134413.036403216098.644.22012540367.4135404135069.540007244821.945.32013595244.4136072135738.043852277959.346.72014643974.0136782136427.047203308058.647.82015689052.1137462137122.050251346149.750.22016743585.5138271137866.553935383365.051.62017832035.9140011139141.059592438355.961.12018919281.1140541140276.065534489700.861.52019986515.2141008140774.570078535371.063.520201013567.0141212141110.071828551973.746.320211143669.7141260141236.080976609679.754.9一、时间数列的概念及意义(二)时间数列的意义描述社会经济现象的发展状况和结果。意义123研究社会经济现象的发展速度、发展趋势,探索现象发展变化的规律,并据以进行统计预测。分析长期趋势、季节变动和循环变动等影响因素,了解和分析社会现象发展变化的规律性。一、时间数列的概念及意义时间序列时间序列是由同一现象在不同时间上的相继观察值排列而成的数列,形式上主要由现象所属的时间和现象在不同时间上的观察值两部分组成。时间序列的时间是变化的,常用的时间间隔包括年、季度、月、周、日等,时间序列的观察值可以是总量指标、平均指标,也可以是相对指标。为了保证观察值具有可比性,采集的同一个时间序列中不同时间单位上的指标口径必须一致:计量单位一致计算方法一致指标口径时期长短一致总体范围一致经济内容一致二、时间数列的分类时间数列绝对数时间数列对数时间数列平均数时间数列即总量指标时间数列,是基本数列。是在绝对数时间数列的基础上派生出来的,属于派生数列。二、时间数列的分类时间序列绝对数序列时期序列时点序列相对数序列平均数序列也称总量指标序列,是最基本的时间序列。如果指标所反映的是现象在不同时段内的活动总量,则为时期序列。如果指标所反映的是现象在不同瞬间时点上的活动总量,则为时点序列。由绝对数序列派生而来,反映现象相对水平的发展变化过程,不同时间上的指标数值不能相加。反映现象平均水平的发展变化过程,不同时间上的指标数值不能相加。二、时间数列的分类(一)总量指标时间数列总量指标时间数列是指把一系列同类的总量指标按时间先后顺序排列起来形成的时间数列,用以反映社会经济现象在各个时期达到的绝对水平及其变化发展的状态。例如表8-2中的国内生产总值、年末人口数和第三产业增加值都属于总量指标时间数列。二、时间数列的分类按照总量指标所反映的内容不同总体单位总量数列总体标志总量数列表8-2中的年末人口数是总体单位总量数列,而国内生产总值和第三产业增加值是总体标志总量数列。根据总量指标反映的社会经济现象所属的时间不同时期数列时点数列时期数列的特点如下:0102可加性。不同时期的总量指标可以相加,所得数值表明现象在更长一个时期的数值。数列中每个指标数值的大小与其所属的时期长短有直接的联系。一般指标所属时期越长,指标值越大。各项指标都是反映某种现象在一段时期内发展过程的总量,该时间数列称为时期数列。例如,表8-2中的国内生产总值和第三产业增加值,其指标都反映总体在一年内的发展总量。03每个指标的数值是通过连续不断的登记而取得的。二、时间数列的分类时点数列的特点如下:0102不可加性。指标数值的大小与时点间隔的长短没有直接关系。时点数列是反映现象在某一时点(瞬间)所处的数量水平的时间数列。表8-2中的年末人口数就是时点数列。03指标值采取间断统计的方法获得。二、时间数列的分类二、时间数列的分类(二)相对指标和平均指标时间数列相对指标和平均指标都是由总量指标派生出来的,它们分别反映社会经济现象达到的相对水平和平均水平。将一系列同类的相对指标或平均指标按时间先后顺序排列起来而形成的时间数列,即为相对指标时间数列和平均指标时间数列。例如表8-2中的第三产业所占比重属于相对指标时间数列,人均国内生产总值属于平均指标时间数列。循环变动季节变动长期趋势不规则变动二、时间数列的分类(三)时间序列的影响因素二、时间数列的分类1.长期趋势长期趋势(SecularTrend,代表符号为T)是现象在较长时期内持续发展变化的一种趋向或状态,它是时间序列中最基本的影响因素或构成要素,可分为上升趋势、下降趋势、水平趋势,也可分为线性趋势和非线性趋势。8-3长期趋势的示意图图中,折线图形表示某现象在时间的变化过程中呈不同的增减变化情况,而虚线则是该现象的长期趋势,通过长期趋势可以明显发现该现象总体呈不断增加的状态。二、时间数列的分类2.季节变动季节变动(SeasonalFluctuation,代表符号为S)是一种使现象以一定时期为周期呈现较有规律的上升、下降交替运动的影响因素,通常表现为现象在一年内随着自然季节的更替而发生的较有规律的增减变化,有旺季和淡季之分。8-4季节变动的示意图该现象的时间序列可以分解为长期趋势和季节变动两个图形,从中可以发现该现象受季节变动的影响也非常大。二、时间数列的分类3.循环变动循环变动(CyclicalVariation,代表符号为C)是一种使现象呈现出以较长时间为一周期,涨落相间、扩张与紧缩、波峰与波谷相交替的波动,如图所示。与长期趋势相比,循环变动表现为波浪式的涨落交替的变动,长期趋势表现为单一方向的持续变动;与季节变动相比,循环变动的周期不是一年,而是一年以上且无固定的周期季节变动的周期通常为参考标准。8-5循环变动的示意图二、时间数列的分类4.不规则变动不规则变动(IrregularVariation,代表符号为I)是指现象受到各种偶然因素影响而呈现出方向不定、时起时伏、时大时小的变动,各种偶然因素的作用无法相互抵消,且影响幅度很大。如果不考虑季节变动的因素,则图8-3所示现象的时间序列可以分解为长期趋势和不规则变动两个图形,从中可以发现不规则变动也影响着现象的发展变化。8-6循环变动的示意图(一)时间长短一致在时期数列中,由于时间长短直接影响指标值的大小,所以必须保持各指标值所属时期长短一致。(四)计算方法、计算价格和计量单位应该一致采用什么方法计算、按照何种价格或单位进行计量,各个指标值都要保持前后一致。(1)(4)(2)(3)(二)总体范围一致不同时期的研究对象范围要一致。(三)指标的经济内容一致时间数列指标值的经济内容必须一致,才具有可比性。二、一元线性回归分析三、时间数列的编制原则任务二时间数列的水平指标时间序列的计算指标水平指标速度指标发展速度发展水平一、发展水平和平均发展水平平均发展水平增长量平均增长量平均发展速度增长速度平均增长速度一、发展水平和平均发展水平表8-2 我国2006~2021年的国内生产总值、人口及第三产业产值年份国内生产总值(亿元)年末人口数(万人)年平均人口数(万人)人均国内生产总值(元/人)第三产业增加值(亿元)第三产业所占比重(%)(1)(2)(3)(4)(5)(6)(7)2006219438.5131448131102.01673891759.741.82007270232.3132129131788.520505115810.742.92008319515.5132802132465.524121136805.842.82009349081.4133450133126.026222154747.944.32010413030.3134091133770.530876182038.044.12011489300.6134735134413.036403216098.644.22012540367.4135404135069.540007244821.945.32013595244.4136072135738.043852277959.346.72014643974.0136782136427.047203308058.647.82015689052.1137462137122.050251346149.750.22016743585.5138271137866.553935383365.051.62017832035.9140011139141.059592438355.961.12018919281.1140541140276.065534489700.861.52019986515.2141008140774.570078535371.063.520201013567.0141212141110.071828551973.746.320211143669.7141260141236.080976609679.754.92021年的GDP发展水平2021年的人口发展水平一、发展水平和平均发展水平(一)发展水平
在对各个时间的发展水平进行比较时,把作为比较基础的那个时间称为基期,相对应的发展水平称为基期水平。01把所研究考察的那个时间称为报告期,相对应的发展水平称为报告期水平。02基期和报告期是根据研究需要而定的。03一、发展水平和平均发展水平发展水平按指标表现形式不同按指标在序列中的位置不同按照在数据分析中的作用不同总量水平相对水平平均水平最初水平中间水平最末水平报告期水平基期水平一、发展水平和平均发展水平
一、发展水平和平均发展水平为了综合说明社会经济现象在一段时期内的发展水平,需要计算平均发展水平。平均发展水平又称序时平均数,它与平均指标的概念既有相同点也有不同点。相同点是两种指标都是所有变量值的代表数值,表现的都是现象的一般水平。01不同点是平均发展水平平均的是现象在不同时间上指标数值的差别02是从动态上说明现象的一般水平,是根据时间数列计算的;而平均指标平均的是现象各单位在同一个时间上的数量差别;是从静态上说明现象的一般水平,是根据变量数列计算的。(二)平均发展水平一、发展水平和平均发展水平
1.时期序列的平均发展水平计算方法一、发展水平和平均发展水平二一按日记录且间隔不等如果是按日记录,但各时间点间隔不相等时,平均发展水平需要以间隔时间为权数,进行加权平均,其计算公式如下所示:按日记录且间隔相等按日连续记录且各时间点间隔相等时,平均发展水平的计算方法与时期序列的计算方法相同,其计算公式如下所示:
2.时点序列的平均发展水平计算方法概念公式增长量反映的是现象在观察期内增减的绝对数量,即两个时期发展水平相减的差额。增长量=报告期水平-基期水平根据选择的基期不同,增长量可以分为逐期增长量、累计增长量和同比增长量。(一)增长量二、增长量和平均增长量
二、增长量和平均增长量
增长量也称增长水平,是报告期发展水平与基期发展水平之差。增长量逐期增长量累计增长量二、增长量和平均增长量是报告期水平与前一期水平之差,即以前一期为基期。是报告期水平与某一固定时间发展水平之差,即将基期固定在某一时间。
逐期增长量与累计增长量的关系是:逐期增长量之和等于累计增长量。(二)平均增长量二、增长量和平均增长量
任务三时间数列的速度指标(一)发展速度一、发展速度和增长速度
概念公式发展速度是反映社会经济现象发展快慢的相对指标,用两个不同时期的发展水平相对比而求得,一般用百分比来表示。根据发展速度的基期不同环比发展速度定基发展速度是将基期定为报告期的前一期,反映现象的逐期发展程度。是将基期固定为某一期,反映现象在较长一段时间内的发展程度,也称为总发展速度。
一、发展速度和增长速度环比发展速度和定基发展速度之间存在一定的数量关系,即:一、发展速度和增长速度(1)环比发展速度的连乘积等于相应的定基发展速度。(2)相邻两个时期的定基发展速度之商等于相应时期的环比发展速度。
(二)增长速度一、发展速度和增长速度?概念:增长速度是表明社会经济现象增长程度的相对指标。
一、发展速度和增长速度基期不同环比增长速度定基增长速度环比增长速度=环比发展速度-1定基增长速度=定基发展速度-1是将基期定为报告期的前一期,用报告期的增长量与前一期的发展水平对比而得,反映现象的逐期增长程度。是将基期固定为某一期,用报告期的增长量与固定基期的发展水平对比而得,反映现象在较长一段时间内的增长程度。二、平均发展速度和平均增长速度累计法又称代数平均法或方程法,是以时间数列内各期发展水平的总和同基期水平对比来计算平均每年增长(或下降)速度,使按平均发展速度计算的各期发展水平的累计总和等于全期的实际总水平。水平法又称几何平均法,是以时间数列最后一期的发展水平同基期水平对比来计算平均每年增长(或下降)速度。平均发展速度是各个时期环比发展速度的平均数,说明社会经济现象在较长时期内发展速度变化的平均程度。二一累计法侧重考察全期发展水平的总和,按这种方法确定的平均发展速度,推算的各期发展水平的总和与实际资料的累计发展总数是一致的。水平法侧重于考察最末一期的发展水平,按这种方法确定的平均发展速度,推算的最后一期发展水平,等于最末一期的实际发展水平。推算的最末一期的定基发展速度和根据实际资料计算的最末一期定基发展速度是一致的。推算的各期定基发展速度的总和与根据实际资料计算的定基发展速度的总和是一致的。二、平均发展速度和平均增长速度二、平均发展速度和平均增长速度在一般正常情况下,两种方法计算的平均发展速度比较接近;但在经济发展不平衡甚至出现大起大落时,两种方法计算的结果差别较大。在我国的实际统计工作中,除固定资产投资用“累计法”计算外,其余均用“水平法”计算。
平均增长速度和平均发展速度的关系是:平均增长速度=平均发展速度-1上式是水平法公式的推导过程,其中蕴含的数学依据是:现象发展的总速度不等于各期发展速度之和,而等于各期环比发展速度的连乘积,表明现象从最初的水平通过期的增长(或下降)最终发展到了最末期的水平。二、平均发展速度和平均增长速度5注意时间数列的速度指标是由水平指标对比计算而来的,以百分数表示的抽象化指标。运用速度指标时,最好结合基期水平进行分析。按水平法计算需要结合各个时期的环比发展速度来补充说明平均发展速度。三、发展速度分析应注意的问题任务四时间数列变动的趋势分析一、时间数列变动的构成因素
一个国家的经济发展可能受到劳动力、资源和生产力水平的长期稳定的影响,同时也可能受到自然灾害、国际环境、政治因素等非长期因素的影响。这些因素哪些是长期因素?哪些是短期因素?或者哪些是偶然性因素呢?一、时间数列变动的构成因素长期趋势不规则变动循环变动季节变动5构成因素长期趋势是指现象在一段相当长的时期内所表现出来的持续上升或下降或不变的趋势。长期趋势是总体受某种根本性的支配因素影响的表现结果。图8-7 2006~2021年我国人口数量的长期趋势一、时间数列变动的构成因素(一)长期趋势需要注意的是,这里的长期并非时间意义上的绝对长短,而是针对时间数列的各期间隔而言的。季节变动是指时间数列在一年内随季节更替出现的周期性波动。季节变动最基本的意义是受自然界季节更替影响而发生的年复一年的规律性变化。图8-8 某农场禽蛋产值的季节变动一、时间数列变动的构成因素(二)季节变动农产品的生产、水电消费的季节变动等(三)循环变动一、时间数列变动的构成因素循环变动是指变动周期大于一年的有一定规律的重复变动。不规则变动也称随机变动,是指现象受偶然因素的影响而出现的不规则变动。季节变动是一年内的按月或按季的周期性变动;循环变动的周期一般超过一年,而且循环变动的周期长短不一致,规律性较不明显。例如,2004年年底发生在东南亚的海啸对东南亚地区旅游业造成的影响表现在旅游人数上就是一种不规则变动。(四)不规则变动
乘法模型假定四个构成要素对现象发展的影响是相互的,长期趋势成分与时间数列原始指标值都是以绝对数的形式存在的,其余成分则均以比例(相对数)形式表示。加法模型假定四个要素的影响是相对独立的,时间数列总变动体现为各种因素的总和。二、时间数列的组合模型以Y表示时间数列的指标数值,T表示长期趋势成分,S表示季节变动成分,C表示循环变动成分,I表示不规则变动成分,用下标t表示时间(t=1,2,⋯,n),n为时间数列的项数。三、长期趋势的测定与预测时间数列的长期趋势是针对一个较长时期而言的,一般来讲,分析长期趋势所选的时期越长越好。对长期趋势的测定和分析,是时间数列的重要工作,其主要目的有三个:②对现象未来的发展趋势做出预测。①认识现象随时间发展变化的趋势和规律性。③从时间数列中剔除长期趋势成分,以便于分解出其他类型的影响因素。时间数列趋势的测定方法有许多种,最常用的是移动平均法和趋势模型法。目的时间序列的预测误差该预测误差是指预测值与实际值之间的离差,它是判断预测准确性的一个重要指标。由于利用时间序列进行外推预测可以选用多种方法,因此需要借助预测误差来选择最优的方法,这就是预测误差在外推预测时起到的根本作用。(一)时间序列的预测误差三、长期趋势的测定与预测平均绝对误差均方误差均方根误差三、长期趋势的测定与预测一平均绝对误差(MAD)代表各期实际值与预测值的离差绝对数的算术平均数。
二均方误差(MSE)代表各期预测误差的平方的算术平均数。
三均方根误差(RMSE)代表各期预测误差平方的算术平均数的平方根,即均方误差的平方根,也叫标准误差。
简便、直观扩大时距后形成的新时间数列包含的数据数量减少,信息大量流失,不便于做进一步分析。(1)时距扩大法它是测定长期趋势最原始、最简单的方法。时距扩大法是将原来时间数列中较小时距单位的若干个数据加以合并,得到较大时距单位的数据。当原始时间数列中各指标数值上下波动,使得现象变化规律表现不明显时,可通过扩大数列时间间隔的方法,使得较小时距数据所受到的偶然因素的影响相互抵消,以反映现象发展的长期趋势。(二)时间序列的测定方法三、长期趋势的测定与预测优点缺点三、长期趋势的测定与预测(2)移动平均法它是采取逐期递推移动的方法对原数列按一定时距扩大,得到一系列扩大时距的平均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 无线电频率管理汇报
- 采购合同模板大全
- 酒店预订服务合同范本
- 企业合同风险防范:实战技巧
- 2024潍坊市新航科技职业中等专业学校工作人员招聘考试及答案
- 2024江西赣州三江高级技工学校工作人员招聘考试及答案
- 2024河池市职业教育中心学校工作人员招聘考试及答案
- 建筑设备租赁合同协议
- 原地舒展运动课件
- 蔬菜种子购销合同书
- 吉林省吉林市2024-2025学年高三下学期3月三模试题 生物 含答案
- GB/T 16895.36-2024低压电气装置第 7-722 部分:特殊装置或场所的要求电动车供电
- 人音版初中音乐 九年级上册 中考一轮复习课件
- 二手车营销策划方案
- 钢格构柱组合式塔吊方案(专家认证)
- 工程结算单(样本)
- 校园小品剧本多人10人 校园多人小品剧本
- 完整欠条范本
- 巴厘岛码头工程量清单
- 数学杂志投稿地址
- 工程制图d唐福官第三章点直线平面的投影
评论
0/150
提交评论