版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章时间序列分析第1页,共29页,2023年,2月20日,星期一第八章1随机过程随机时间序列与随机过程由一串不同时刻的随机变量x1,x2,…,所构成的序列称为随机时间序列,用xt(t=1,2,…)来表示。当随机时间序列中的时间t是连续变化时,就称为随机过程,记为X(t),是时间t的函数。自然界的变化过程可分为两大类:确定过程和随机过程。如果每次试验所得到观测过程都相同,且都是时间t的一个确定的函数,具有确定的变化规律,这种过程就称为“确定过程”。如果每次实验所得到的观测的过程都不同,是时间t的不同的函数,实验前无法预知这次实验会随时间呈现怎样的过程,这种过程就称为:“随机过程”。即:“随机时间序列”是“随机过程”的离散形式。第2页,共29页,2023年,2月20日,星期一
月年一二三四五六七八九十十一十二1951-2.2-0.54.39.716.020.723.625.421.917.78.44.519520.4-1.43.710.416.220.524.224.121.415.68.8-0.41953-2.30.04.710.716.120.624.725.822.418.58.42.519540.30.53.69.714.619.022.024.621.315.111.1-1…………………………………例表8.1:青岛市逐年年各月平均气温表格中的任一行表示气温在一年中的变化,可认为是在相同条件下所做的一次独立实验。气温随时间的演变过程是连续的,虽存在春夏秋冬的周期性规律,但是每年的过程都不完全相同。
每次实验结果都是t的不同的函数,具有随机性,所以气温的变化过程就是一种“随机过程”。固定表中的某一列(同一个月份),可以视为是在一定条件下的随机变量序列,称为“静态时间序列”(具有相同的期望,冬天低,夏天高)。第3页,共29页,2023年,2月20日,星期一截口而对于某一时刻tj来说,随机过程就表现为一个随机变量,记为X(tj),称为随机过程的一个“截口”。名词:现实:针对随机过程X(t)的某一次观测过程,称为随机过程X(t)中的一个观测“现实”(realization),或称“样本函数”,用小写字母表示,记为x(t)。
月年一二三四五六七八九十十一十二1951-2.2-0.54.39.716.020.723.625.421.917.78.44.519520.4-1.43.710.416.220.524.224.121.415.68.8-0.41953-2.30.04.710.716.120.624.725.822.418.58.42.519540.30.53.69.714.619.022.024.621.315.111.1-1…………………………………第4页,共29页,2023年,2月20日,星期一随机时间序列的统计特征1均值函数随机时间序列X在任一指定时刻t表现为一个随机变量,它的期望记为:E(X(t)),该随机变量可以随机地取任意值,设它的各种取值的概率密度函数为:f(x,t),则有:各个观测现实(样本函数)都围绕着均值函数摆动;均值函数反映了各个时刻X(t)的摆动中心,它是X(t)的所有现实在t时刻的总平均。因此,
μ(t)是个确定性的t函数。对表8.1来说,对每列求平均就得到了μ(t)的估计。μ(t)称为随机过程X(t)的数学期望。由于μ(t)是t的函数,因此被称为“期望函数”或“均值函数”。第5页,共29页,2023年,2月20日,星期一2方差函数随机过程的某一个截口处,为一个随机变量X(t),该随机变量取值的变化程度,可用方差来衡量,这就是随机过程的方差函数。方差函数也是时间t的确定性的函数,反映了每个截口处取值的变动情况,即相对于均值函数的离散程度。注意:即使两个随机过程的均值函数和方差函数都完全一样,那么他们仍可能具有完全不同的特点,如下图A与B中两个随机过程(每条曲线为一个现实)。(A)(B)A与B具有几乎相同的均值和方差函数,但内部结构却是完全不同的。A中每个现实的变化较为缓慢,在t1和t2时刻具有相关性;B则是无规则的大幅波动。这种内部结构的描述可通过协方差(或相关)函数来实现。第6页,共29页,2023年,2月20日,星期一3.协方差函数和相关函数随机过程在任两个时刻(截口)t1和t2表现为两个随机变量,这两个随机变量可以存在相关性,即存在协方差和相关系数。K(t1,t2)称为自协方差函数,简称为协方差函数。当t1=t2=t时,自协方差函数就是随机过程在第t时刻的方差。t1和t2时刻的相关系数为:ρ(t1,t2)称为自相关函数,简称为相关函数,表示随机过程X(t)在不同时刻t1和t2之间线性相关的程度。它们的协方差为:第7页,共29页,2023年,2月20日,星期一第八章2平稳时间序列及其遍历性平稳随机过程如果随机过程的统计特性不随时间的推移而变化,即其均函数是与t无关的常数:并且,协方差函数仅仅与时间间隔τ有关,而与t的起始点位置无关,即:这种随机过程称为:“广义平稳随机过程”或“宽平稳随机过程”。相应的时间序列资料称为:“宽平稳时间序列”。有“广义平稳”或“宽平稳”序列,相应地也就有“狭义平稳”或“严平稳”序列。严平稳序列的“严格之处”是指:它要求随机过程的全部概率特性(包括概率密度f(x,t))在任意t时刻都要相同。对气象要素的变化过程而言,严平稳过程的条件难以满足。从实际意义的角度来说,我们并不需要考虑全部概率特性的平稳,只要求宽平稳就足够了。以后谈到“平稳时间序列”时,主要是指“宽平稳时间序列”而言。第8页,共29页,2023年,2月20日,星期一平稳随机过程中有一个较广的应用——白噪声过程对于一个零均值的随机过程a,若其方差满足:则称此随机过程为:白噪声过程。白噪声表示不含有任何规律性波动的纯随机过程,可认为白噪声没有“记忆”。常用白噪声过程来表示“随机误差”。当资料为离散的时间序列资料时,称为“白噪声序列”。“白噪声”名字的来源:类似物理上的白色光,白色光是由强度相同的各种波长的颜色谐波共同组成;白噪声就是由强度相同的各种频率的振动共同组成的随机序列。第9页,共29页,2023年,2月20日,星期一平稳随机过程的基本统计特征不随时间改变,如何来估计这些统计特征?根据定义,若对随机过程进行观测,获得了n个观测现实,以xj(ti)表示第j个观测现实在ti截口的取值,则可对随机过程的统计特征作出如下估计:以上统计量的计算要依赖于n个现实,但在很多实际问题中,我们能观测到的只有一个现实,于是产生一个想法:能否用一个现实来代替多个现实,以估计随机过程的统计特征?注意此处的n代表现实的个数;第10页,共29页,2023年,2月20日,星期一要想用一个现实来估计随机过程的统计特征,该现实需要满足条件:——该现实要能经历(遍历)随机过程各种可能的状态。图A图B比较图A与图B所示的两种平稳随机过程。图中每条曲线代表一个现实。平稳随机过程A:每个现实都围绕着随机过程的均值波动,且他们的平均振幅都差不多,该随机过程的一个现实就可以近似代表整个随机过程的属性。平稳随机过程B:每个现实都围绕不同的数学期望波动,且振幅也不一致,仅仅靠一个现实无法代表整个随机过程的特性。类似平稳随机过程A这样,对于任意一个现实,只要观测时间足够长,就可把该现实的时间平均作为整个随机过程总体均值的近似值,具有这种性质的平稳随机过程就称其具有“各态历经性”(或“各态遍历性”)。第11页,共29页,2023年,2月20日,星期一对于具有各态遍历性的平稳过程,用“一个现实”来确定其统计特征时,求平均的时间区间取得越长,其估计误差就越小。因此,对气象问题来说,凡是具备各态历经性的平稳过程,就可以用一个充分长的现实来代替多个现实。由这一个现实的时间平均来代替多个现实的总平均来估算期望函数或协方差函数等统计特征。设某具有各态遍历性的平稳时间序列,若有一个充分长的观测现实,x1,x2,…,xn,则其均值函数的估计值为:对“各态历经性(遍历性)”的理解各态历经性是建立在平稳随机过程的每一个现实几乎可以代表所有可能现实的基础上的,或者说,一个充分长的现实能近似代替短时间内各现实的总体。各态遍历性的应用第12页,共29页,2023年,2月20日,星期一时滞为τ的自协方差函数的估计值为:自相关函数的估计值为:特别地,当τ=0时,协方差变为方差s2:自相关函数还可写为标准化数据的自协方差函数:要验证某随机过程是否为“各态历经性”,比较困难;通常假设所研究的平稳过程具有各态历经性,然后从这个假设出发,计算时间序列的各种统计特征。注意此处的n代表一个现实(时间序列)的长度,而非现实的个数;第13页,共29页,2023年,2月20日,星期一第8章3平稳时间序列预报如何对平稳时间序列做预报?时间序列某个时刻的取值,可能与前一时刻的取值有关,于是可建立回归模型,寻找变量在不同时刻的联系,因此这种回归模型称为自回归模型(Autoregressive(AR)Model)。一阶自回归模型表示要素在某一时刻与前一时刻之间的线性回归模型,称为一阶自回归模型,记为AR(1)。对随机时间序列xt(设已中心化),有:用前一时刻的xt-1乘以上式两边,然后取数学期望,得:Xt-1只与前一时刻的白噪音有关,而与后面(t)时刻的白噪音无关。第14页,共29页,2023年,2月20日,星期一于是,一阶自回归模型可写为:由以上递推公式知,第t-1时刻可写为:将xt-1的表达式代入xt的表达式:依此类推,第t时刻的xt与第t-τ时刻的xt-τ的关系可表示为:这表征了落后τ时刻与落后1时刻的自相关函数的关系。这表明:某时刻的气象要素还可看成是前期无穷多白噪声共同影响的结果。第15页,共29页,2023年,2月20日,星期一符合一阶自回归模型的随机过程,被称为:红噪声过程(又称为“马尔可夫过程”),第t时刻的xt仅与前一时刻的xt-1有关。红噪声就是指:过程在t>t0时刻所处的状态与过程在t0之前(t<t0)所处的状态无关,只与第t0时刻的状态有关。通俗地说,在已经知道“现在”的条件下,要想推测“未来”无需依赖“过去”。红噪声没有任何周期性。反映了信号的时间延续性。红噪声过程第16页,共29页,2023年,2月20日,星期一设具有各态历经性的标准化平稳时间序列为:x1,x2,x3,…,xn
要预报第t时刻的值,利用前期第t-1,t-2,…,t-p,共p个时刻的值作为因子变量,建立多元回归方程,即:以上多元自回归模型称为:p阶自回归模型,记为AR(p)。p阶自回归模型第17页,共29页,2023年,2月20日,星期一p阶自回归系数的估计为求解回归系数,类似AR(1)模型,用xt-1,xt-2,…,
xt-p依次乘以上式的两端,并取数学期望,可以得到p个方程。首先考察第1个方程,即用xt-1乘以上式两端,并取期望,得:通过以上分析可知,第一个方程可以写为:第18页,共29页,2023年,2月20日,星期一可得方程组:写成矩阵形式,并利用ρ0=1:以上求解自回归系数的多元回归方程正规方程组称为:尤拉-沃尔克(Yule-Walker)方程。同理,对第二个方程两边同乘以xt-2,然后取期望,可写为:同理,第p个方程两边同乘以xt-p,然后取期望,可写为:与多元回归的正规方程组本质上相同。第19页,共29页,2023年,2月20日,星期一在实际中,我们要利用平稳时间序列的一个样本现实,求解自回归系数。自回归方程的经验形式,可写成:实际计算时,利用标准化序列计算自相关函数,得到自相关函数的估计值,记为:于是,把ρ换成r,求解自回归系数的尤拉-沃尔克方程写为:第20页,共29页,2023年,2月20日,星期一不同形式的自回归方程前面推导的自回归预报方程是标准化变量的,若将上式两端乘以序列的标准差s,即得到自回归的距平形式:将上式加上时间序列的均值,即为自回归的原值形式(为方便记符,等号右侧采用与距平变量相同的符号):可见,自回归预报方程,无论是原值形式、距平形式、还是标准化形式,自回归系数都是相同的。多元回归的标准化变量与距平变量形式的回归方程具有不同的回归系数,而自回归具有相同的回归系数,本质上是因为:xt、xt-1…等具有相同的标准差。回忆:不同形式的多元回归的回归系数是怎样的?第21页,共29页,2023年,2月20日,星期一例:某台站有15年(1978-1992)的年降水资料,并假设是具有各态遍历性的平稳时间序列,试建立AR(3)模型,并外推下一年的值。因为要建立AR(3)模型,所以需要用到的自相关系数是r1,r2,r3,算得r1=-0.041,r2=-0.438,r3=-0.286;代入AR(3)模型:得:解以上方程组得:因此,距平(或标准化)形式的3阶自回归预报方程为:第22页,共29页,2023年,2月20日,星期一显著性检验因此,该自回归方程不能通过显著性水平为0.05的检验。本例为AR(3),m=3,x序列的总长度为15,但用于实际回归方程计算的样本长度n=15-3=12第23页,共29页,2023年,2月20日,星期一利用AR(3)模型,根据前三年的降水距平值可以预测下一年的距平值。例如,要估计1993年的降水距平值,就将1992、1991、1990年的降水距平值代入AR(3)模型:若要对原始值而非距平值进行预测,需在距平值的预报结果的基础上加上原始变量的均值588.57:对于该问题,1978-1992年15年的年降水资料的均值为588.57;1990、1991、1992年的降水原始数据为:928.2,573.2,407.0;1990、1991、1992年的降水距平数据为:339.63,-15.37,-181.57;自回归递推预报第24页,共29页,2023年,2月20日,星期一递推多步的预报例如,根据AR(3)模型,如果已经有了第t-1,t-2,t-3这三个时刻的观测值xt-1,xt-2,xt-3,现要预测第t+2时刻的值,应如何计算?采用自回归递推预报!通过递推3步,最终获得了第t+2时刻的估计值。注意:递推预报xt+2时,由于xt和xt+1的值也是通过递推预报估计出来的,带有误差,因此,最终预报的xt+2累积了误差,递推步数越多,累积的误差越大,影响预报效果。为了避免误差过度积累,递推的步数不宜太多,应该小于自回归模型的阶数。第25页,共29页,2023年,2月20日,星期一自回归递推预
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河北省张家口市(2024年-2025年小学六年级语文)部编版期中考试((上下)学期)试卷及答案
- 河北省唐山市(2024年-2025年小学六年级语文)部编版期中考试((上下)学期)试卷及答案
- 内蒙古通辽市(2024年-2025年小学六年级语文)统编版期末考试(上学期)试卷及答案
- “三维度”序列化作业设计赋能初中语文名著阅读教学
- 2025年宁夏货运从业资格证考试试题带答案的
- 2025年榆林货运从业资格证继续再教育考试答案
- 兰州工业学院《护理统计与研究》2023-2024学年第一学期期末试卷
- 兰州大学《Matlab编程与应用》2023-2024学年第一学期期末试卷
- 兰州财经大学《车辆机械设计基础》2023-2024学年第一学期期末试卷
- 秘书职业中常见问题及解决策略计划
- 皮肤美容与整形技术的新进展
- 《柔性生产方式》课件
- 单位员工餐厅整体保障服务方案
- 中国旗袍课件
- 销售线索培训课件
- 北京市西城区2023-2024学年七年级上学期期末数学试题
- 提高肿瘤治疗前TNM分期评估率PDCA
- 2024年江苏省环保集团招聘笔试参考题库含答案解析
- 2023年山东工业技师学院教师招聘笔试参考题库(共500题)答案详解版
- 月嫂职业道德与礼仪培训服务
- 【数字媒体艺术的应用国内外文献综述2500字】
评论
0/150
提交评论