版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章气象资料及其表示方法数据资料的统计特征要素样本中资料分布的特点—用一些统计量表征。1、平均值1 n含义:平均值是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。2、距平心二兀一片『—1,2,…小含义:反映数据偏离平均值的状况,也是通常所说的异常。**中心化**概念:把资料处理为距平的方法叫中心化特性:距平值的平均值为0,使用方便;直接作为预报值,比较直观(偏高/偏低)3、方差和均方差(标准差)需区FF-1,匕…含义:’是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度是方差。标准差大-----变化幅度大;均方差小的要素预报比大容易,变化幅度小;变量减去某常数后均方差相同。累积频率:变量小于某上限的次数与总次数之比。二、 总体和样本1、总体(母体):统计分析对象的全体。2、样本:总体中的一部分。
三、数据的标准化各要素单位不同、平均值和标准差也不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量(消除单位量纲的影响)J= /=IZ…5证明:(1)标准化变量的平均值为0。(2)标准化变量的方差为1。峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候变量的分布特征。偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。峰度系数:表征分布形态图形顶峰的凸平度(即渐进于横轴的陡度)三、 状态资料和统计特征状态资料(离散型随机变量)表征气象要素的各种状态,观测结果无法用数据表示。频率表、分布列 列出各个状态出现的频率。对样本而言是频率表,总体而言就是分布列。四、 多要素的气象资料两个方面来研究问题:
四、 多要素的气象资料两个方面来研究问题:"R型分析":研究不同变量(要素)或同一要素不同格点之间的关系。(行)“Q型分析”:研究样本之间的关系(列)五、 统计量---协方差和协方差矩阵1•协方差衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系)(另外一个统计量叫相关系数)量叫相关系数)反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。变量自身的协方差就是方差协方差带单位,不同要素之间不好比较,相关系数可解决这个问题。2•协方差矩阵s=(升)=*用灯=匕2,…冈m阶对称矩阵,对角线元素是第i个变量的方差,撇号代表距平。六、区域资料的整理和利用六、区域资料的整理和利用(1)代表站方法---平均相关系数最大的站(2)区域平均法---区域平均值要与周围格点(站点)值区别大(3)综合指数法(各站点要素方差差异较大)U「八12…心二】丄…化越大,异常越明显>i表示区域内台站,j表示观测资料的年代第二章选择最大信息的预报因子条件概率在事件B已经发生的条件下计算事件A的概率,称为事件A在事件B已出现条件下的条件概率,记为P(A/B)。天气预报指标必须满足两个经验性的条件P(A/B)>>P(A)或者P(A/B)<<P(A) A/B之间有一定联系(2)P(A/B)-----1或P(A/B)——0 预报指标有一定准确率天气预报指标的统计检验二分类预报:只预报事件A出现或者不出现!,又称为正反预报°P(A)二p,V: ,p+q=1求n次独立试验中,事件A出现m次的概率厂 原始资料:肿"挣宀傭二替,爲)$£JT■ $ 原始资料:肿"挣宀傭二替,爲)$£JT■ $ 距平(均值为0) 八标准化距平(标准化后资料均值为0,均方差为1) 相关系数二协方差相关系数的检验正态总体的相关检验实质上是两个变量间或不同时刻间观测数据的独立性检验。所谓相关检验,就是检验p=0的假设是否显著。在假设总体相关系数p=0成立条件下,样本相关系数r的概率密度函数正好是t分布的密度函数。于是,就可以用t检验法来检验。定量数据时的指标状态要素:可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。定量数据要素:主要用相关系数选择预报因子或因子集,并用t检验方法检验其可靠性。5.(1)t检验>■在原假设p=o的条件下,统计量 」 ' 「符合自由度为n-2的t分布.给定信度a和样本相关系数r,根据自由度查出£若『色几,即否定p=0,总体相关。反之,接受p=0,总体非相关。相关系数表可以计算统一的判别标准相关系数 ,若.■-,则通过显著性的t检验。实际应用中若已知自由度(n-2)和显著性水平,查相关系数表即可。7•自相关系数衡量气象要素不同时刻之间的关系密切程度的量是自协方差和自相关系数。落后交叉协方差和相关系数衡量两个变量不同时刻之间的相关密切程度的量常用落后交叉协方差和落后交叉相关系数表示。高自相关变量间的相关系数及其统计检验(1)两个变量无持续性(非高自相关) 1检验(2)两变量本身有强持续性或高自相关,t检验的自由度不能用,需要计算有效自由度•,其中偏相关系数当存在三个以上变量互相影响时(如考虑y和x1、x2之间的关系),需要考虑消除了x1(x2)影响后,x2(x1)与y的相关关系,这时候的相关系数称为偏相关系数,记为■"- 1■":第三章气候稳定性检验1涉骤(1).写出零假设H0和备选假设H1;
.确定检验统计量;.确定显著性水平;.根据数据计算检验统计量的实现值;.根据这个实现值计算p-值;.进行判断:如果p-值小于或等于alpha,就拒绝零假设,这时犯(第一类)错误的概率最多为alpha;如果p-值大于alpha,就不拒绝零假设,因为证据不足。2.气候稳定性检验涉及两种情形(1)某一地区气候是否具有稳定性比较不同时段气候变量的均值或者方差是否发生显著变化。(2)两个地区的气候变化是否存在显著差异也可以通过检验均值和方差来判断。3•平均值的显著性检验(1)u检验—检验一个/二个总体均值(2)t检验----检验一个/二个总体均值(服从自由度-1>^r一\念t统计量检验两地气候是否有显著差异■.(服从自由度n1+n2-2的t分布)若n1+n2-2的t分布)若AI'",表明两区域的均值存在显著差异。如果样本量足够大,可以近似按下式计算:4•对方差的检验(方差反映了某一变量观测数据的偏离程度,它是变量稳定与否的重要测度)(1)一检验——检验一个总体方差(2)F检验 检验两个总体方差是否存在显著差异上述统计量遵从自由度"■ _1的F分布。若则认为两地样本方差有显著差异,或者说气候有显著差异。回归统计MuitipleR0.728906869回归统计MuitipleR0.728906869RSquare0.53130522^AdjustedRSquare0.505266625标准误差3.B2727235S观测值20!!!!!!!!!!!!!!!!!!!!!!!!!!分析输出结果:Coeflldents标准误萍1.?la'.Coeflldents标准误萍1.?la'.Lov-r 9戮「限3j.Ol艰汨.〔久Intercept'i.509545S1SL.35S529□.注"'■■iJ44.6553S210.3637110.3S371X^ariotlc1-0.234290285D.051867-4.DC.000267-0.34326-0.L25E2-i).34326-D.12532Y二-D.2343JC+7.5035R3=0.5313检验可通过p(F)值(小于a,拒绝)或者t检验(大于ta,拒绝)回归井析df1SS30.87946JUS30.87946F20.^nificancf0.000267?FIE27.240541.5133631958.12第四章气候变化趋势分析一、 线性倾向估计1•回归系数b(气候倾向率)回归系数b表示了变量x的趋势倾向。b符号为正,说明变量随时间t的增加呈上升趋势,反之则为下降趋势,b值的大小反应了上升和下降的速率,即倾向程度。相关系数r(气候趋势系数)变量与时间的相关系数表示变量x随时间变化程度。要判断变化趋势的程度是否显著,就要对相关系数进行显著性检验。二、 滑动平均滑动平均是趋势拟合技术最基础的方法,它相当于低通滤波器。用确定时间序列的平滑
值来显示变化趋势。三、 累积距平累积距平也是一种常用的、由曲线直观判断变化趋势的方法。对于序列X,其某一时刻t的累积距平表示为:的累积距平表示为:计算结果分析1) 累积距平曲线呈上升趋势,表示距平值增加;2) 呈下降趋势,表示距平值减小;3) 从曲线明显的上下起伏,可以判断其长期显著的的演变趋势及持续性变化,甚至还可以判断出发生突变的大致时间。从曲线小的波动可以考察其短期的距平值变化。四、 五、七和九点二次平滑对时间序列做五点二次、七点二次和九点二次平滑,与滑动平均一样,也起到低通滤波的作用,以展示出变化趋势。优点:可以克服滑动平均削弱过多波幅的缺点。根据最小二乘法原理确定系数,可以得到五点二次、七点二次和九点二次平滑公式。第五章一元线性回归一元回归处理的是两个变量之间的关系,即一个预报量和一个预报因子之间的关系。求回归系数的方法称为最小二乘法。|J1 科 it|J1 科 it■v,--【口吃片)-廊柠I 「 _jz"―営丄鮎 号:-看(-1 " ?-|| I-]距平形式的回归方程:当变量为距平时,回归方程可以不用求a,因为a=0,回归直线通过原点。
TOC\o"1-5"\h\zyy=方(xx)a=y—hx =^xdf f标准化距平形式的回归方程:,S*Sj. H +利用…回归问题的方差分析(1) 意义评价回归方程的优劣。(2) 预报量的方差可以表示成回归估计值的方差(回归方差)和误差方差(残差方差)之和。和。方差分析表明,预报量y的变化可以看成由前期因子x的变化所引起的,同时加上随机因素e变化的影响,这种前期因子x的变化影响可以归为一种简单的线性关系,这部分关系的变化可以用回归方差的大小来衡量。如果回归方差大,表明用线性关系解释y与x的关系比较符合实际情况,回归模型比较好。两边同时乘以n变成各变量离差平方和的关系。11-J,U和Q分别称为回归平方和及残差平方和,'称为总离差平方和。U反映了回归值的分散程度。Q反映了观测值偏离回归直线的程度。1•总平方和()反映因变量的n个观察值与其均值的总离差。2•回归平方和(U)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和。
3•残差平方和(Q)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和。相关系数与线性回归(1)因为回归方差不可能大于预报量的方差,可以用它们的比值来衡量方程的拟合效果。JV :上式含义表明了预报因子X对预报量y的方差的线性关系程度这一比值又称为解释方差。也可以说明相关系数的含义:它是衡量两个变量线性关系密切程度的量,又被称为回归方程的判决系数。判决系数R2(coefficientofdetermination)回归平方和占总离差平方和的比例2•反映回归直线的拟合程度;3•取值范围在[0,1]之间;R2〜1,说明回归方程拟合的越好;R2〜0,说明回归方程拟合的越差;判决系数等于相关系数的平方,即R2二r2(2)回归系数b与相关系数之间的关系 、、,r与b同号。回归方程的显著性检验u卜=吉〔打-卫)原假设回归系数b=0的条件下,上述统计量遵从分子自由度为1,分母自由度为(n-2)的F分布,若线性相关显著,则回归方差较大,因此统计量F也较大;反之,F较小。对给定的显著性水平w,查表得到F临界值厂,如果八丿•,则拒绝原假设,认为线性相关显著。对于一元线性回归来说因为F的相关系数表达式开方就是相关系数t检验的表达式,故回归方程的检验与相关系数的检验一致。回归分析与相关分析的区别:相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化。相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。第六章多元线性回归多元回归就是研究一个预报量和多个预报因子之间的关系。主要讨论较为简单的多元线性回归。其分析原理与一元线性回归分析完全相同。一、 线性回归模型的其他两种形式距平形式:■-_ 一 :-71二、 回归问题的方差分析和一元回归问题方差分析类似预报量的方差可以表示成回归估计值的方荃回归“=S'2+V2方差)和误差方差(残差方差)之和。 —三、 复相关系数复相关系数是衡量一个变量(预报量)和多个变量(因子之间的线性关系程度的
量,因为变量之间的关系可归结为一个多元线性回归方程,所以复相关系数是衡量预报亠 =I-量和估计量之间线性相关程度的量,通常记为意义:上式反映了回归平方和、总离差平方和与复相关系数的关系。可见,复相关系数实际是衡量p个因子对预报量的线性解释方差的百分率,其变化在0〜1之间。四、回归方程的显著性检验假设预报因子与预报量之间无线性关系,则回归系数应该为0。检验假设:" 一—■ ■1计算统计量:遵从分子自由度为P,分母自由度为n-p-1的F分布,在显著性水平下,若'■',认为回归方程是显著的。五、预报值的95%置信区间y±1.96 疔六、预报因子的显著性检验若在预报因子中减去第i个因子,再建立对y的预报方程,则回归系数、回归平方和、是因子离差矩阵的逆矩阵的第i行第i列元素。■I .1n-p-lP计算统计量 符合自由度为(1,n-p-1)的F分布。给定信度以后,当FCJ第i个因子的方差贡献是显著的。七、 禾I」用回归方程进行预报的步骤1•确定预报量并选择恰当的因子。
2•根据数据计算回归系数标准方程组所包含的有关统计量(因子的交叉积、矩阵协方差阵或相关矩阵,以及因子与预报量交叉积向量等);3•求解线性方程组,定出回归系数;4•建立回归方程并进行统计显著性检验;5•利用已经给出的因子带入回归方程做出预报量的估计,求出预报值的置信区间。!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!根据输出结果,写出相应的方程回归统计MultipleR0.9&1U8S37RSquare0.98Z375&2Adjust巴dRSquare标准误差2.4=4:&00795&观测值13调整复相关系数复相关系数残差方差的无偏计13次观测数据方差井析rdfSSMSFDignificanceF回归分析42667.099666.9749111.47924.75618E-07B47.S63645.9B2955122715.763自由度离差积和方差的无偏估计CorffLCLEni5标准误差tStatP-VnlLLELoivcr99%Upper99%'■甲9-.Entere已pt62.405369370.070960.B906020.399134-999892909-99.178552223.9393{Z1-r-l2.032660.:,.)822-0,16633974:13,:!'85)39-:.ir.':::::.:「ICVariabl0-510167580-7237380.7048580.500901-1-15889054=42.179225704-L.15389052.179226Varit^J、.」」川沁、,LJ.754T090.L3503LU.:比卩比6334527T4S42271581-L.6334:5201.B42272GL"1-0rH4D610291-?0R0?-o.0.B410711.r?9138DIB1.491015961."791381.才rY=62.4054+1.5511x1+0.5102x2+0.1019x3-0.1441x495%置信区间:JTy±1.96CT疔=Qn丫立第七章逐步回归方法
既要选择对预报量影响显著的因子,又要使回归方程的残差方差估计很小,这样才有利于气象预报。逐步回归的三种方案1、逐步剔除方案2、逐步引进方案3、双重检验的逐步回归方案第八章气象场的自然正交展开g%…m是空间点,n是时间序列长度。气象场的自然正交展开,是将X分解为时间函数Z和空间函数V两部分,即A-IZX"=£V居云打=匕1了“十片2云*十・…十, 宀或者1•含义场中第i个格点上的第t次观测值可以看作是p个空间函数厂和时间函数二-的线性组合。上式表明,第t个场可以表示为m个空间典型场
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025合法的小型工程合同
- 2025京亚葡萄批发合同
- 2025房屋抵押合同书
- 2025年度个人商铺买卖合同规范范本
- 2025企业管理资料范本电梯(自动扶梯)维修保养合同书
- 2025【合同范本】施工建筑合同范本
- 2025年度专业心理咨询师个人劳务合同范本
- 二零二五年度电商知识产权保护与维权合同8篇
- 二零二五年度餐饮企业食品安全风险评估与风险防范合同3篇
- 2024版公司整体转让合同范本
- 退休人员出国探亲申请书
- 伤残抚恤管理办法实施细则
- 高中物理竞赛真题分类汇编 4 光学 (学生版+解析版50题)
- 西方经济学-高鸿业-笔记
- 幼儿园美术教育研究策略国内外
- 高中英语选择性必修一单词表
- 物业公司介绍
- 2024届河南省五市高三第一次联考英语试题及答案
- 【永辉超市公司员工招聘问题及优化(12000字论文)】
- 孕妇学校品管圈课件
- 《愿望的实现》交流ppt课件2
评论
0/150
提交评论