气象统计期末复习解读_第1页
气象统计期末复习解读_第2页
气象统计期末复习解读_第3页
气象统计期末复习解读_第4页
气象统计期末复习解读_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章xJJxt气象资料及其表示方法1、平均值n t=i含义:2、距平含义:反映数据偏离平均值的状况,也是通常所说的异常。Xdt = Xt - x是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。距平序列:单要素样本中每个样本资料点的距平值组成的序列称为距平序列,也可以 记为距平向量。3、中心化的概念:把资料处理为距平的方法叫中心化。气象上常用距平值代替原样本中的资料值作为研究对象。4、中心化的必要性:因为气象要素的年变化周期影响很大,各月的平均值不一样,为了使之能在同一水平下比较,常使用距平值(比如之前的举例)。5、中心化的特性:距平值的平均值为0,使用方便;直接作为预报值,比较

2、直观(偏高 /偏低)。1 n6、方差和均方差(标准差)Sx(Xt - X)2对气象要素x,资料长度n,其表达式:Vn t-含义:Sx是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),Sx2是方差。7、方差和均方差(标准差)气象上的应用:1)如果12月份气温标准差比1月份大,反映了 12月份气温随时间变化幅度比1月大。2)对于同一个月,如果南京气温的标准差比北京小,说明北京气温变化幅度大。(内陆日变化较沿海大,这个日变化大小的比较就使用标准差比较的)3)均方差小的要素预报比大的容易。均方差越大,变量不确定性越大,预报越困难。4)变量减去某常数后均方差相

3、同。8、累积频率:变量小于某上限的次数与总次数之比。(样本特征一直方图)9、总体(母体):统计分析对象的全体。样本:总体中的一部分。10、为何要进行标准化?各要素单位不同、平均值和标准差也不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量-标准化变量。Xzt =(Xt -X)/Sx目的:为了消去单位量纲不同所造成的影响。正态化的必要性:各类统计预报模型和统计检验方法(F,t,u,X2检3会)要求资料是符合正态分布正态化的处理方法:立方根或四次方根;双曲正切转换;化为有序数后的正态化转换(标准化和正态化) 11、标准化变量的平均值为 0。标准化变量的方差为 1。 1

4、2、峰度系数与偏度系数峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候 变量的分布特征。偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。峰度系数:表征分布形态图形顶峰的凸平度(即渐进于横轴的陡度)。13、标准偏度系数和峰度系数的计算公式为:nng1=1/6nr (xt-X)/s)3g2 =、n/241/n” (xt - x)/s)4 - 3偏:一峰:一s为标准差14、状态资料(离散型随机变量):表征气象要素的各种状态,观测结果无法用数据表示。15、对样本而言是频率表,总体而言就是分布列。16、两个方面来研究问题:R型分析”:研究不同变量(要素)或同一要素不同格点之

5、间的关系(行)。Q型分析”:研究样本之间的关系(列)。17、协方差:衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系)18、协方差气象意义的进一步理解:1 n_1)反映了两个气象要素异常关系的平均状况,sij(xit - xi)(xjt - xj)或者两个变量的正、负相关关系。n t=i如理解(气温为例):前冬气温负距平(冷)、后冬正距平(暖) 一协方差负值-反相关; 前冬气温正距平(暖)、后冬正距平(暖)-协方差正值-正相关2)变量自身的协方差就是方差。19、协方差矩阵 S =1/nX 'X 'T ,对角线元素是第i个变量的方差,撇号代表距平。20、区域资料的整理

6、的三种方法:(1)代表站方法一平均相关系数最大的站(2)区域平均法:区域平均值要与周围格点 (站点)值区别大(3)综合指数法(各站点要素方差差异较大)K越大,异常越明显。21、资料的订正:插补、纠正、延长22、资料的误差:1)抽样误差2)观测误差:系统误差(仪器不良);偶然误差(操作不慎);随 机误差(四舍五入)23、资料的质量要求:准确性和精确性;均一性;代表性;比较性24、资料的审查分为两类:技术性检查;合理性25、气象资料的订正方法:回归订正法(关系密切的站);差值订正法(地理环境近似一致的站点);比值订正法(两站降水比值为准常数)第二章选择最大信息的预报因子1、天气预报指标必须满足两个

7、经验性的条件(1) P(A/B)>>P(A)或者 P(A/B)<<P(A),A/B 之间有一定联系(2) P(A/B)->1或P(A/B)->0,预报指标有一定准确率2、二分类预报:只预报事件A出现或者不出现(非 A),又称为正反预报。设P(A)=p,P(非A)=q, p+q=1符合二项分布的条件:每次试验只有两个结果;试验条件不变,每次实验结果一样;试验的独立性。用于计算天气现象出现的概率特别是小概率事件,天气预报指标的检验。3、状态要素:可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。定量数据要素:主要用相关系数选择预报因子或因子集,并用

8、t检验方法检验其可靠性。4、样本相关是否意味着总体相关?正态总体的相关检验实质上是两个变量间或不同时刻间观测数据的独立性检验。所谓相关检验,就是检验p =0的假设是否显著 。在假设总体相关系数 p =0成立条件下,样本相关系数r的概率密度函数正好是t分布的密度函数。于是,就可以用t检验法来检验。5、t 检验t = , J n - 2在原假设p =0的条件下,统计量 <1 - r2 符合自由度为n-2的t分布。给定信度a和样本相关系数r,根据自由度查出ta,若|t|大于等于ta,即否定P =0,总体相关;反之接受 P =0,总体非相关。6、由ta计算出ra:样本容量固定时,通过检验的t值应

9、该至少等于 ta, 2故有t =r巨-2 r二 k式中,ra就是通过检验的相关系数临界值。Q=飞1 _ %2豆一 n-2 + tj实际应用中,若已知自由度(n-2)和显著性水平,查相关系数春口可。”7、自相关系数:衡量气象要素不同时刻之间的关系密切程度的量是自协方差和自相关系数。 8、落后交叉协方差和相关系数:衡量两个变量不同时刻之间的相关密切程度的量,常用落 后交叉协方差和落后交叉相关系数表示。9、高自相关变量间的相关系数及其统计检验:(1)两个变量无持续性(非高自相关)t检验(2)两变量本身有强持续性或高自相关,t检验的自由度不能用,需要计算有效自由度 n/T,其中一 二T = '

10、 Rxx(j)Ryy(j)j 二10、偏相关系数:当存在三个以上变量互相影响时(如考虑 y和x1、x2之间的关系),需 要考虑消除了 x1(x2)影响后,x2(x1)与y的相关关系,这时候的相关系数称为偏相关系数, 记为 ry1.2 (ry2.1 )11、简单相关系数:描述两个变量线性相关的统计量,一般简称为相关系数或者点相关系数,用r表示。它也做为两总体相关系数p的估计。12、相关系数是标准化变量的协方差。(2)有-1<=r<=1(3)绝对值越大,表示变量之间关系越密切。当r>0,表明两变量呈正相关, 越接近1,正相关越显著;当r<0,表明两变量呈负相关, 越接近-1

11、,负相关越显著;当r=0,则表示两变量相互独立。计算出的相关系数是否显著,需要经过显著性检验。第三章气候稳定性检验1、假设检验的一般步骤为:1)写出零假设和备选假设;2)确定检验统计量;3)确定显著性水平;4)根据数据计算检验统计量的实现值;5)根据这个实现值计算p-值;6)进行判断:如果p-值小于或等于alpha,就拒绝零假设,这时犯(第一类)错误的概率最多为alpha;如果p-值大于alpha,就不拒绝零假设,因为证据不足。2、气候稳定性检验涉及两种情形:(1)某一地区气候是否具有稳定性,比较不同时段气候变量的均值或者方差是否发生显著变化。(2)两个地区的气候变化运否查在显著差异也可以通过

12、检验均值和方差来判断。t x - y3、t统计量2-检验两地气候是否有显著差异:(n1 -1)S12+”2 -1)S2 1工S1、S2表示样本均方差,n1, n2为样本量。nn1 + n2 - 2 Y n1 n2服从自由度n1+n2-2的t分布。若|t|>=ta ,表明两区域的均值存在显著差异。若样本量足够大,t =(x y)/ S1 /n1 S2 /nn24、F检验检验两个总体方差是否存在显著差异上述统计量遵从自由度v1=n1-1,v2=n2-1的F分布。若F>=F(a/2)则认为两地样本方差有显著差异,或者说气候有显著差异。第四章气候变化趋势分析1、气候时间序列:随时间变化的一

13、列气候数据。2、气候序列的基本特点: 1)数据取值随时间变化;2)每一时刻取值的随机性; 3)前后 时刻数据之间存在相关性、持续性; 4)序列整体有上升或下降趋势,呈周期振荡;5)某一时刻数据取值出现转折或突变。3、回归系数b (气候倾向率):回归系数b表示了变量x的趋势倾向。b符号为正,说明变量随时间t的增加呈上升趋势,反之则为下降趋势,b值的大小反应了上升和下降的速率, 即倾向程度。4、相关系数r (气候趋势系数):变量与时间的相关系数表示变量x随时间变化程度。要判断变化趋势的程度是否显著,就要对相关系数进行显著性检验。5、滑动平均是趋势拟合技术最基础的方法,它相当于低通滤波器。用确定时间

14、序列的平滑 值来显示变化趋势。主要从滑动平均序列曲线图来诊断其变化趋势。6、累积距平也是一种常用的、由曲线直观判断变化趋势的方法。对于序列x,其某一时刻t的累积距平表示为:。 t /兄八便- X)7、累积距平计算结果分析:t y1)累积距平曲线呈上升趋势,表示距平值施加;2)呈下降趋势,表示距平值减小;3)从曲线明显的上下起伏,可以判断其长期显著的的演变趋势及持续性变化,甚至还可以判断出发生突变的大致时间。从曲线小的波动可以考察其短期的距平值变化。图1b 1976年是个明显的转折点,在这之前累积曲线基本上呈上升趋势,海温以正距平主,这之后累积曲线呈下降趋势,海温以负距平为主。1951- 197

15、5年平均海温距平 为12 C,而1977- 1993年平均海温距平为 -128 C。这就是说西风漂流区年平均海温从 1951- 1975 年 至 1977- 1993 年 下降了 0148 Co图1c 1981年是个明显的转折点, 在这之前累积曲线呈下降趋势,海温以负距平为主,这之后累积曲线呈上升趋势,海温以正距平为主。1951- 1980年平均海温距 平为 0.08 C, 1982- 1993 年为 0.21 C,赤道 太平洋年平均海温1981年后比1981年前增加了 0.29 。8、五、七和九点二次平滑方法概述:对时间序列做五点二次、七点二次和九点二次平滑, 与滑动平均一样,也起到低通滤波

16、的作用,以展示出变化趋势。优点:可以克服滑动平均削弱过多波幅的缺点。第五章 一元线性回归1、一元回归处理的是两个变量之间的关系,即一个预报量和一个预报因子之间的关系。2、距平形式的回归方程:夕- y = b(x-x)3、回归问题的方差分析222意义:评价回归方程的优劣。sy = s?se预报量的方差可以表示成回归估计值的方*(回匕方差)和误差方差(残差方差)之和。4、方差分析表明,预报量 y的变化可以看成由前期因子x的变化所引起的,同时加上随机因素e变化的影响,这种前期因子 x的变化影响可以归为一种简单的线性关系,这部分关系的变化可以用回归方差的大小来衡量。如果回归方差大,表明用线性关系解释y

17、与x的关系比较符合实际情况,回归模型比较好。1 J _ 2 _ 1 J _ 2 1 /5、u和q分别称为回归平方和及残差平方和n±(yi一y)工£(? y)(yi .?)Syy称为总离差平方和。U反映了回归值的分散程度。Q反映了观测值偏离回归直线的程度。6、三个平方和的意义概括如下:总平方和(Syy):反映因变量的 n个观察值与其均值的总离差。回归平方和(U):反映自变量 x的变化对因变量 y取值变化的影响,或者说,是由于x 与y之间的线性关系引起的y的取值变化,也称为可解释的平方和。残差平方和(Q):反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和

18、。7、相关系数与线性回归:因为回归方差不可能大于预报量的方差,可以用它们的比值来衡量方程的拟合效果。表明了预报因子x对预报量y的方差的线性关系程度,这一比值又称为解释方差。也可以说明相关系数的含义:它是衡量两个变量线性关系离切程度的量,又被称为回归方程的判决系数。S y?_U _r22r xy8、判决系数R2:回归平方和占总离差平方和的比例。S y S yy1)反映回归直线的拟合程度;2)取值范围在0,1 之间;3)R2t1,说明回归方程拟合的越好;R2T0,说明回归方程拟合的越差;4)判决曾等于相点系数的平方,即R2=r29、回归系数b与相关系数之间的关系b = 一>= - rxy ,

19、 r与b同号。10、回归方程的显著性检验:F=(U/1)/(Q/(n-2) Sx S原假设回归系数 b为0的条件下,上述统计量遵从分子自由度为1,分母自由度为(n-2)的F分布,若线性相关显著,则回归方差较大,因此统计量F也较大;反之,F较小。对给定的显著性水平 a,查表得到F临界值Fa,如果F>Fa则拒绝原假设,认为线性相关显著。对于一元线性回D3来说,因为F的相关系数表达式开方就是相关系数t检验的表达式,故回归方程的检验与相关系数的检验一致。11、回归分析与相关分析的区别: 1.相关分析中,变量 x变量y处于平等的地位;回归 分析中,变量y称为因变量,处在被解释的地位,x称为自变量,

20、用于预测因变量的变化。2.相关分析中所涉及的变量 x和y都是随机变量;回归分析中,因变量 y是随机变量, 自变量x可以是随机变量,也可以是非随机的确定变量。3.相关分析主要是描述两个变量 之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。第六章 多元线性回归1、多元回归就是研究一个预报量和多个预报因子之间的关系。主要讨论较为简单的多元线性回归。其分析原理与一元线性回归分析完全相同。2、线性回归模型的距平形式:X Xb = X yy 二bo bi Xi b2x2 L bpx p(3)3、预报量的方差可以表示成回归估计值的方差(回 归方差)和误差

21、方差(残差方差)之 和。 Sj = S2 + Se24、复相关系数:衡量一个变量(预报量)和多个变量(因子)之间的线性关系程度的量, 因为变量之间的关系可归结为一个多元线性回归方程,所以复相关系数是衡量预报量和估 计量之间线性相关程度的量。上式反映了回归平方和、总离差平方和与复相关系数的关系。可见,复相关系数实际是衡量p个因子对预报量的线性解释方差的百分率,其变化在012之间。R =1-Q/Syy0。 p一 Qn-p-15、假设预报因子与预报量之间无线性关系,则回归系数应该为检验假设:Ho:固=&二=' =0计算统计量遵从分子自由度为 p,分母自由度为n-p-1的F6、若在预报

22、因子中减去第 残差平方和记为b*、U'、cii是因子离差矩阵的逆矩阵分布,在显著性水平 a下,若F>Fa,认为回归方程是显著的。i个因子,再建立对 y的预报方程,则回归系数、回归平方和、?Q',定义第i个 因子的方差贡献为 Qi =q - q=u -U' = bC的第i行第i列元素。cii7、计算统计量符合自由度为(1, n-p-1)的F分布。给定信度以后,当 Fi>=Fa第i个因子的方差贡献是显著的。b2Qi_ciiFi =八Q n p dQ8、利用回归方程进行预报的步骤:1)确定预报量并选择恰当的因子。2)根据数据计算回归系数标准方程组所包含的有关统计量

23、(因子的交叉积、矩阵协方差阵或相关矩阵,以及因子与预报量交叉积向量等);3)求解线性方程组,定出回归系数;4)建立回归方程并进行统计显著性检验;5)利用已经给出的因子带入回归方程做出预报量的估计,求出预报值的置信区间。第七章逐步回归方法1、既要选择对预报量影响显著的因子,又要使回归方程的残差方差估计很小,这样才有利于气象预报。2、逐步回归的三种方案:1)逐步剔除方案2)逐步引进方案3)双重检验的逐步回归方案第八章气象场的自然正交展开1、EOF分析方法原理:将某气候变量场的观测资料以矩阵(m行n歹U)形式给出。m是空间点,n是时间序列长度。Z和空间函数 V两部分,即X=VZi=1,2,mt=1,

24、2, ,n, k=1,2, ,pp个空间函数 vik和时间函数zki的2、气象场的自然正交展开,是将X分解为时间函数pXit =VikZkt = VilZit . Vi2Z2t . VipZptk =1含义:场中第i个格点上的第t次观测值,可以看作是 线性组合上式表明,第t个场可以表示为 m个空间典型场,按照不同的权重线性叠加而成。V的每一列表示一个空间典型场,由于这个场由实际资料确定,故又叫经验正交函数。nZ ZT - ZtZtJ i J jJt J jt113、上述分解要求满足下列两个条件:pVTVj =" VkiVkjk 14、重要参数第i个特征向量对X场的贡献率 Pi = %前p个特征向量对 X场的贡献率 5、计算步骤:1)根据分析目的,确定 X的具体形态(距平或者标准化距平);2)由X求协方差矩阵A=xXt; 3)求A的全部特征值、特征向量 ,h=1H (通常使用Jacobi法);4)将特征值作非升序排列(通常使用沉浮法) ,并对特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论