已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
帅l l i i , r l lplp l lr l l l l , r ! r l ipifl,rrrif,!lll y 1 5 2 8 1 4 7 分类号:t p 3 1 1 1 3 1 0 7 1 0 2 0 0 4 0 5 9 6 壤步太海 硕士学位论文 基于数据挖掘技术的黄土高原降雨侵蚀 预测模型的研究 导师姓名职称 申请学位级别 乌文柏 揣锦华教授 硕士学科专业名称计算机应用技术 论文提交日期2 0 0 7 年5 月2 5 日论文答辩日期2 0 0 7 年6 月7 日 学位授予单位长安大学 答辩委员会主席 学位论文评阅人 赵祥模教授 刘彦明副教授 孙朝云教授 摘要 降雨是引起土壤侵蚀的主要原因之一,为了减少降雨侵蚀造成的危害,构建降雨侵 蚀预测模型已经成为我国水土保持工作的一个研究重点。降雨侵蚀预测模型是土壤侵蚀 研究的重要部分,可以作为预测降雨引起的土壤侵蚀量的主要工具,为定量研究土壤侵 蚀提供依据。为了能够使模型具有实际应用价值,采用黄土高原( 黄河流域) 实际测量 得到的数据作为分析基础,使用数学建模方法得到降雨侵蚀预测模型的方程表达式。 降雨侵蚀预测模型属于土壤侵蚀模型的组成部分,在土壤侵蚀的建模理论中,因子 分析模型提供的方法为本文的研究提供了分析依据。因此,本文利用降雨侵蚀因子和土 壤侵蚀量的测量数据来构建降雨侵蚀预测模型。 在理解降雨侵蚀机理和土壤侵蚀相关理论的基础上,本文主要是以数据分析为手 段,以实际应用价值为目的构建降雨侵蚀预测模型。具体的,本文使用回归分析作为数 学建模的主要方法,并结合数据挖掘中的数据预处理技术对数据进行处理,从而达到优 化模型的效果。本文主要使用s p s s l 3 0 作为数据分析软件,应用环境是w i n d o w sx p 。 主要研究成果为: ( 1 ) 通过对降雨侵蚀数据的分析,结合数据预处理技术和数据的实际含义,提出 降雨侵蚀预测模型的数据预处理算法,结果表明,使用该预处理算法处理后的数据所建 立的模型要比原始数据建立的模型更好。 ( 2 ) 通过对降雨侵蚀数据的曲线拟合分析,结合对通用水土流失方程( u s l e ) 的 理解,提出降雨侵蚀预测模型的乘法模型。 ( 3 ) 通过乘法模型的线性化变换方法,将乘法模型转化为可以使用线性回归分析 进行求解的表达形式。将结果求解、变换,得到降雨侵蚀预测的乘法模型。 ( 4 ) 所使用的模型评价指标都是数值型,在模型的比较和评价中,这些都可以定 量地对结果进行评价。另外,还使用图形对模型的结果作了分析和比较,在模型求解中, 这种方法可以更直观地反映问题。 本文在最后总结了在研究过程中遇到的一些问题和解决方法,并对降雨侵蚀预测模 型的建立和应用作了展望。 关键词:土壤侵蚀,回归分析,数据挖掘,曲线拟合,数学模型 a b s t r a c t r a i n f a l li st h em a i nc a u s a t i o nf o rs o i le r o s i o n t om i t i g a t et h ej e o p a r d yf r o mr a i n f a l l e r o s i o n ,o u rg o v e r n m e n th a sl a i dt h ec r u c i a lp i v o to ft h en a t i o n sw a t e ra n ds o i lp r e s e r v a t i o n r e s e a r c ho nc o n s t r u c t i n gr a i n f a l le r o s i o np r e d i c t i o nm o d e l ,w h i c hi sai m p o r t a n tp a r to f r e s e a r c ho ns o i le r o s i o n ,a n di tc a l le s t a b l i s ht h ef o u n d a t i o nf o rr e s e a r c h i n gs o i le r o s i o ni n f i x e dq u a n t i t y , a st h em a i ni n s t r u m e n tt of o r e c a s tt h es o i le r o s i o nq u a n t u mc a u s e db yr a i n f a l l t h ef a c t u a lm e a s u r i n gd a t aa b o u tt h el o e s sp l a t e a u ( t h ey e l l o wr i v e rd r a i n a g ea r e a ) i s i n t r o d u c e da sa n a l y z i n ge l e m e n tt oe n d o wt h em o d e lw i t hp r a c t i c a la p p l i c a t i o nv a l u e ,a n d m a t h e m a t i c a lm o d e l i n gm e t h o di su s e dt of i g u r eo u tt h ee q u a t i o n e x p r e s s i o no fr a i n f a l l e r o s i o np r e d i c t i o nm o d e l t h er a i n f a l le r o s i o np r e d i c t i o nm o d e li sac o n t r i b u t i n gp a r to fs o i le r o s i o nm o d e l a c c o r d i n gt ot h et h e o r yo fm o d e l i n gt h es o i le r o s i o n ,t h er e s e a r c ho ft h i sd i s s e r t a t i o na c h i e v e s a n a l y z i n gb a s i su s i n gt h em e t h o dp r o v i d e db yg e n ea n a l y z i n gm o d e l t h u si nt h i sd i s s e r t a t i o n , t h er a i n f a l le r o s i o np r e d i c t i o nm o d e li sc o n s t r u c t e di nt h el i g h to fr a i n f a l le r o s i o ng e n ea n dt h e m e a s u r i n gd a t ag a i n e df r o ms o i le r o s i o nq u a n t u m o nt h eb a s i so fu n d e r s t a n d i n gt h em e c h a n i s mo fr a i n f a l le r o s i o na n dr e l a t i v et h e o r y a b o u ts o i le r o s i o n ,t h i sd i s s e r t a t i o nc o n s t r u c t st h er a i n f a l le r o s i o np r e d i c t i o nm o d e lw i t hd a t a a n a l y z i n ga st h ei n s t r u m e n tt oa c h i e v et h e a i mo fp r a c t i c a la p p l i c a t i o n c o n c r e t e l y , t h e r e g r e s s i o na n a l y s i si si n t r o d u c e da st h em a i nm a t h e m a t i c a lm o d e l i n gm e t h o d ,c o m b i n e dw i t h t h ed a t ap r e t r e a t m e n tt e c h n i q u eo fd a t am i n i n g t h u st h ed a t ai sp r o c e e d e dt oa c c o m p l i s h e f f e c to fo p t i m i z i n gt h em o d e l s p s s1 3 0i ss e r v e da st h em a i nd a t aa n a l y z i n gs o f t w a r ei nt h e w i n d o w sx pa p p l i c a t i o ne n v i r o n m e n t t h em a i na c h i e v e m e n t so ft h i sd i s s e r t a t i o ni sa s f o l l o w s : ( 1 ) b ya n a l y z i n gt h er a i n f a l le r o s i o nd a t a ,c o m b i n e dw i t hd a t ap r e t r e a t m e n tt e c h n i q u e a n da c t u a lm e a n i n g so ft h ed a t a ,t h ed a t ap r e t r e a t m e n ta l g o r i t h mi sp r o p o s e df o rr a i n f a l l e r o s i o np r e d i c t i o nm o d e l t h ea n a l y z i n gr e s u l t si n d i c a t et h a tt h em o d e lc o n s t r u c t e dw i t hd a t a p r o c e e d e db yt h i sa l g o r i t h mb e h a v e sb e t t e rt h a nt h eo n ec o n s t r u c t e dw i t ho r i g i n a ld a t a ( 2 ) t h em u l t i p l i c a t i v em o d e lf o rr a i n f a l le r o s i o np r e d i c t i o nm o d e li sp u tf o r w a r db y l u a n a l y z i n gt h er a i n f a l le r o s i o nd a t aw i t hc u r v ef i t t i n gt e c h n i q u ea n dc o m b i n i n gc o m p r e h e n s i o n o fu n i v e r s a ls o i ll o s se q u a t i o n ( u s l e ) ( 3 ) t h em u l t i p l i c a t i v em o d e l ,w i t ht h em e t h o do fl i n e a rt r a n s f o r m a t i o nf o ri t , i s t r a n s l a t e di n t oe x p r e s s i o nf o r mw h i c hc a nb ef i g u r e do u tb yl i n e a rr e g r e s s i o na n a l y s i s t h e r e s o l v e dr e s u l ti st r a n s f o r m e dt oa c h i e v er a i n f a l le r o s i o np r e d i c t i o nm u l t i p l i c a t i v em o d e l ( 4 ) t h em o d e le v a l u a t i o nc r i t e r i o n su s e di nt h i sd i s s e r t a t i o na r ea l li nt h ef o r mo f n u m e r i c a lv a l u e s ot h e s ec r i t e r i o n sc a nb ea p p l i e df o rq u a n t i f i c a t i o n a le v a l u a t i o no ft h e r e s u l t si nc o m p a r i n ga n de v a l u a t i n gt h em o d e l i na d d i t i o n ,g r a p h i c sa r ee m p l o y e dt oa n a l y z e a n dc o m p a r er e s u l t so ft h em o d e l t h i sm e t h o dh e l p st of i n do u tp r o b l e m si nm o d e ls o l u t i o n a tl a s tt h i sd i s s e r t a t i o ns u m m a r i z e ds o m eq u e s t i o n sa n dm e t h o d si nt h ep r o c e s so f r e s e a r c ha n di n d i c a t e st h ef o r e g r o u n do fc o n s t r u c t i n ga n da p p l y i n gt h er a i n f a l le r o s i o n p r e d i c t i o nm o d e l k e y w o r d s :s o i le r o s i o n ,r e g r e s s i o na n a l y s i s ,d a t am i n i n g , c u r v ef i t t i n g ,m a t h e m a t i c a l m o d e l 论文独创性声明 本人声明:本人所呈交的学位论文是在导师的指导下,独立进行研究工 作所取得的成果。除论文中已经注明引用的内容外,对论文的研究做出重 要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何 未加明确注明的其他个人或集体已经公开发表的成果。 本声明的法律责任由本人承担。 论文作者签名:乌交木自 功口- 7 年莎月占日 论文知识产权权属声明 本人在导师指导下所完成的论文及相关的职务作品,知识产权归属学 校。学校享有以任何方式发表、复制、公开阅览、借阅以及申请专利等权 利。本人离校后发表或使用学位论文或与该论文直接相关的学术论文或成 果时,署名单位仍然为长安大学。 ( 保密的论文在解密后应遵守此规定) 论文作者签名: 导师签名: 乌天桶 散嘲 2 口一年6 只ge l 匕7 年月寥e l 长安大学硕士学位论文 第一章绪论 水土流失治理关乎国计民生,造成水土流失主要原因是土壤侵蚀,土壤侵蚀的定 义是土壤及其母质在水力、风力、冻融、重力等外营力作用下,被破坏、剥蚀、搬运和 沉积的过程。在自然界,当携带和推移松散物质的力超过抵抗松散物质移动的力时,便 引起了土壤侵蚀。一般地,水力作用造成的土壤侵蚀称为水蚀,也就是水土流失。 由降雨产生的土壤侵蚀称为降雨侵蚀,在土壤侵蚀研究中,降雨侵蚀相对于其他 侵蚀而言,可以由测量得到较为可靠的数据,因此可以通过数学建模方法构建数学预测 模型。 降雨侵蚀预测模型在水土资源管理中有着重要作用,它是预报水土流失、指导水 土保持措施配置、优化水土资源利用的有效工具。同时,降雨侵蚀预测模型是土壤侵蚀 数学模型的重要组成部分,随着科学技术的不断进步和发展,建立模型的方法也层出不 穷,不断更新。 1 1 课题研究意义 1 1 1 背景介绍 水土流失是影响社会进步、经济发展和资源开发的重点问题之一,属于环境问题研 究范畴。防止水土流失从古至今都是人类社会发展一大研究领域,由于人类社会发展速 度不断提高,造成的土地资源破坏也日趋严重,水土流失问题对农业、交通、人类生存 环境等都构成了威胁,特别是在发展中国家,由于在早期对水土流失的危害缺乏认识, 已经构成了水土流失的恶性循环,在我国一些地区,如黄土高原黄河流域,水土流失尤 其严重。要建立可持续发展的社会,水土流失成为首要解决的问题之一。 在科学研究中,为了解决水土流失造成的问题,必须从土壤侵蚀的研究入手。研究 土壤侵蚀的成因、分析土壤侵蚀规律是防止水土流失的根本手段。在土壤侵蚀规律的研 究中,建立土壤侵蚀预报模型是现今研究的热点。构建土壤侵蚀预报模型主要是研究土 壤侵蚀过程中各种侵蚀因子在侵蚀过程中的作用。土壤侵蚀预报模型是解决水土流失危 害的有效工具,建立实用性强、应用范围广、结构简单的土壤侵蚀预报模型一直是研究 者们致力追求的目标。 降雨侵蚀是土壤侵蚀的主要侵蚀过程之一,在土壤侵蚀的众多因素中,降雨是引起 水土流失的直接原因之一。在多种土壤侵蚀因素综合作用下,土壤结构遭到破坏,而造 1 第一章绪论 成土壤侵蚀过程的一个环节,搬运过程是必不可少的,大多数情况下,降雨引起的土壤 搬运比其他的因素要大得多,所以对土壤侵蚀的研究大多是围绕降雨侵蚀进行展开的。 另外,在测量方面,相关的降雨数据的收集比较方便,也更可靠,使得构造出的降雨侵 蚀预测模型可信度和实用价值更高。 1 1 2 土壤侵蚀的危害 土壤侵蚀及其导致的土地退化和泥沙等是全球性的环境灾害问题,并且已经对人类 的生存和发展构成了威胁。土壤侵蚀的危害直接反映在对土壤的破坏上。土壤侵蚀引起 的水土流失带走大量土壤、养分和水分,破坏土地资源,危害生态环境,后果严重,影 响巨大。其危害表现在对当地粮食生产的威胁和对下游生态环境的破坏具体为: ( 1 ) 破坏土地资源、蚕食农田; ( 2 ) 削弱土地肥力、威胁粮食生产; ( 3 ) 水土流失与地区贫困恶性循环; ( 4 ) 泥沙淤积,影响水库湖泊及航运综合利用; ( 5 ) 影响现代城镇的发展; ( 6 ) 水土流失会加快温室气体的排放。 中国是世界上的人口大国、农业大国,也是世界上土壤侵蚀最严重的国家之一,各 种类型的侵蚀遍及全国,而且强度高,成因复杂,危害极大,特别是黄河流域的土壤侵 蚀及其造成的水土流失尤为严重。据水利部遥感中心1 9 9 0 年全国范围的土壤侵蚀调查, 全国轻度以上侵蚀的水蚀面积达1 7 9 万k m 2 、风蚀面积达到1 8 8 万k m 2 、融冻侵蚀面积 达到1 2 5 万k m 2 ,总计轻度以上侵蚀面积达到了4 9 2 万k m 2 、合5 1 的国土面积需要治 理。大部分水蚀区和农牧过渡带的风蚀区急需治理。 由于水土流失的危害和治理的需要,水土流失预报日益成为许多国家政府环境建设 和治理规划与决策的重要依据,也是水土保持学科领域国际发展的热点问题,因此开展 中国水土流失宏观动态预报研究具有重要的生产实践意义和科学研究意义【。 在黄土高原地区,由于植被破坏严重,加上气候、地质、地形和人类活动等多种因 素的影响,水土流失问题一直是国家重点治理的对象。黄土高原地表支离破碎,千沟万 壑,有7 0 是坡地,植被覆盖极差,每遇暴雨,泥沙与雨水齐下,水土流失量之大为世 界所罕见。现黄土高原的水土流失面积占高原总面积的9 0 ,其中水土流失严重的地区 占一半以上。据山西省大宁县县志记载,太德塬在清光绪年间,塬面面积约8 7 0 公顷, 2 长安大学硕士学位论文 现在只剩下了6 0 0 公顷,其余的都变成了沟壑。黄土高原的水土保持是一项十分艰巨的 工作,需要较长的时间才能完成。当前,水土流失仍然是我国国民经济和社会发展的严 重障碍。据遥感最新普查结果,现黄土高原每年流失掉的土壤就相当3 6 万公顷土地的 3 0 厘米耕作层,伴随失去的氮、磷、钾养分4 2 0 0 万吨,相当于1 9 8 9 年我国化肥使用量 的1 7 7 1 2 1 。 1 1 3 建立降雨侵蚀预测模型的意义 土壤侵蚀定量研究中主要是对土壤侵蚀量进行分析,土壤侵蚀量是流域内被侵蚀土 壤的数量表示。我们可以通过野外调查获得土壤侵蚀量,也可通过数学模型计算求得。 但是通过野外调查来测量土壤侵蚀过程和评价土壤侵蚀的影响是一项困难且需耗费大 量人力物力的工作,这是因为: ( 1 ) 在整个流域内土壤侵蚀的来源是巨大的,且流域范围小至小块农田,大至大 型流域集水区,因而要定量评价土壤侵蚀程度和数量是困难的; ( 2 ) 土壤侵蚀是多因素综合作用的结果,包括各种自然因素和社会经济人为因素, 难以全面考察土壤侵蚀的影响因素; ( 3 ) 从一个地方得出的土壤侵蚀量关系难以外推到其他无测站的流域,开发和评 价所有潜在侵蚀控制的方法是不可行的。 自从2 0 世纪6 0 7 0 年代,数学模型已在水文学和流域管理中广泛应用。同样在土 壤侵蚀研究中运用数学模型模拟流域内的土壤侵蚀过程是一项有意义的工作。同时计算 机技术也不断提高,更使数学模型模拟变得可行。它有助于克服野外调查方法的困难。 数学模型模拟的优点主要可概括为如下: ( 1 ) 模型是自然系统的抽象。许多不容易测量的过程可用具有一定假设的数学算 法进行描述。因此,它们有助于提高对真实系统的理解; ( 2 ) 模型可用于把个别过程放大到大比例,因此,它们是进行数据综合和研究整 个系统( 如流域等) 在多重时间尺度上对多重压力( 如土地利用变化、气候变化等) 响 应的有效工具; ( 3 ) 模型有益于绝对预测,有助于对自然和人文影响分析;模型也可重复运行以 模拟不同情况下的相对响应: ( 4 ) 模型可能是高成本,甚至是对培训模型构造者是耗费财力的,但数学模型被 认为是规划任何水土保持措施的影响、规划水资源、设计水质和水文系统的最有效工 3 第一章绪论 具。 综上所述,构造数学模型模拟土壤侵蚀过程,计算土壤侵蚀量具有比野外调查更多 的优点,而且它恰好也便于与计算机技术相结合,发挥计算机运算速度快的特长,以解 决数学模型的计算问题。另外,它便于和其它计算机软件,如地理信息系统相连,完成 更复杂的工作,因此其意义是重大的【3 1 。 构建黄土高原的降雨侵蚀预测模型可以改善黄土高原水土流失现状。由于降雨侵蚀 是引起黄土高原水土流失的一大因素,也是造成黄土高原土壤侵蚀的主要侵蚀过程,建 立降雨侵蚀预测模型对黄土高原土壤侵蚀定量分析有促进作用,并可以将建模过程的经 验总结推广,为降雨侵蚀严重地区提供有效的水土流失治理方案。 1 2 国内外土壤侵蚀研究进展 国外在土壤侵蚀研究方面起步较早,特别是在通用水土流失方程( u s l e :u n i v e r s a l s o i ll o s se q u a t i o n ) 提出后,对土壤侵蚀的研究从概念定性研究提升到可以利用模型定 量研究,使通过测试数据构建数学模型成为可能。 我国土壤侵蚀定量评价的研究始于上世纪4 0 年代,上世纪8 0 年代初开始统计模型 的研究和开发,8 0 年代末开展了土壤侵蚀预报物理模型的探索,同时还在较大区域乃至 全国范围内进行了土壤侵蚀和水土保持的评价研究,特别在地貌复杂的黄土高原地区研 究较多。中国土壤侵蚀与水土保持定量评价研究可概括为三个层次和两种类型,即地块 小流域区域( 或国家) 三个层次,统计模型、物理模型两种类型。 土壤侵蚀预报模型研究是国际土壤学研究的前沿领域。由于我国土壤侵蚀环境的复 杂、侵蚀类型和过程的特殊及人类活动影响较大,使国际上比较成熟的侵蚀预报模型在 我国的应用受到极大的限制。研究开发中国土壤侵蚀预报模型,是水土保持实践的需求, 也是水土保持学科发展的需要。 中国土壤侵蚀预报模型的开发以已有的长期实验观测数据为基础,分析坡面、小流 域和区域等多种尺度土壤侵蚀发生发展的过程与机制;认识影响土壤侵蚀的主要因子, 并提取量化指标;从时间和空间上揭示径流形成、汇集及各种侵蚀方式中的土壤分散及 泥沙搬运与沉积的动态过程;并进行模拟与集成;吸收和借鉴国际土壤侵蚀预报的最新 研究成果,建立能预报复杂地形条件下的具有明确物理学意义的土壤侵蚀预报模型,为 我国水土保持与生态环境建设等决策工作提供科学依据,并带动我国土壤侵蚀及其相关 现代地表过程研究进入世界先进行列【4 1 。 4 长安大学硕士学位论文 对于水土流失严重的区域如长江中游,黄土高原地区等地,我国一直投入大量人力 物力,希望解决水土流失造成的危害。 作为我国土壤侵蚀预报模型开发的预研究,从2 0 0 1 年1 2 月立项以来,由水利部水 保监测中心和中科院水土保持与生态环境研究中心共同主持的“水土流失预报模型应用 研究及推广项目已完成了预定的研究任务,为国内开展土壤侵蚀预报模型研究和开发 提供了有益的借鉴和指导。该项目对国内外土壤侵蚀预报模型的研究成果进行了系统地 调研和总结,在土壤侵蚀预报模型评述、中国侵蚀模型开发战略、中国土壤侵蚀模型的 基本框架设计等方面取得了显著的进展。专家们认为,该项目针对国家水土保持和生态 环境建设的需求,就我国土壤侵蚀预报模型开发有关问题进行先期研究,对系统地开展 我国土壤侵蚀预报模型的开发研究工作具有重要意义;项目对国内外各种模型的开发背 景、基本结构、计算参数、使用范围、经验教训和推广应用的可能性等进行了系统分析 和评价,为国内开展土壤侵蚀预报模型研究提供了有益的借鉴;根据我国侵蚀环境的特 殊性,该研究提出了中国土壤侵蚀预报模型研究的初步框架,符合我国土壤侵蚀研究的 实际情况,为我国土壤侵蚀模型开发提供指导【5 1 。 在黄土高原土壤侵蚀数学模型的研究方面,我国政府给予了很高的重视,2 0 0 6 年9 月1 6 1 7 日,黄委组织在郑州召开会议,对黄土高原水土流失数学模型研发任务书 进行了审查,并通过了审查。 会议围绕着土壤侵蚀数学模型研发的目的、目标、主要类型与框架以及关键技术路 线等主要内容进行了讨论,并提出了审查意见,主要内容:为满足黄土高原水土保持 规划设计、效益评价和黄河水沙调控体系科学运行等工作的迫切需要,开展黄土高原土 壤侵蚀数学模型研究是非常必要的。模型研发要充分吸纳国内外现有模型研究成果的 精华。总体目标是以实测资料较为丰富的小流域为模拟对象,构建不同类型区的土壤 侵蚀模型,逐步建立中大尺度模型。近期目标是用4 年时间( 2 0 0 7 2 0 1 0 年) ,建立岔 巴沟小流域的机理模型、经验模型和中尺度典型支流土壤侵蚀经验模型。研究内容主 要包括:模型调研和实地查勘;论证确定模型类型与构架,编制概要设计报告;构建产 流产沙模型;构建信息支撑体系;可视化构件设计;模型率定与验证掣副。 1 3 本文研究内容 本文是利用观测到的黄土高原降雨相关数据和土壤侵蚀数据,研究黄土高原地区降 雨侵蚀预测模型,通过参考通用水土流失方程的框架,使用回归分析和数据挖掘相关的 5 第一章绪论 数据预处理方法,得出降雨侵蚀预测模型的数学方程式,并给出评价结论。 本文难点是降雨侵蚀数学方程式的框架无法预知,需要通过曲线拟合得出几个变量 之间的关系,通过试验比较得出最佳的模型。另外,由于土壤侵蚀并不是由降雨一个因 素决定,而是由很多其他侵蚀因素与之共同作用,所以在用降雨数据研究的时候,其他 因素产生的误差必然存在,如何分析数据的结构特征,并通过数据清洗技术除去噪声从 而减少误差,是构造精确数学方程的关键。 1 4 技术路线 本文以水土流失和降雨侵蚀主要理论为指导,结合实际数据,通过使用s p s s 统计 分析软件进行试验,主要的研究方法是使用回归分析建立数学模型,再通过使用数据挖 掘分析技术对模型进行优化。 本文构造降雨侵蚀的主要方法是线性回归分析,对数据的处理主要使用的是数据挖 掘的数据分析技术,辅助的分析方法还有曲线拟合、数据统计分析、方程线性变换方法 等。 主要分析过程和使用技术如下: ( 1 ) 利用线性回归技术和未通过处理的原始数据建立线性模型,求出模型的评价 指标,这个过程求出的结果是作为以后分析的基础,用于比较其后使用方法的好坏。 ( 2 ) 通过数据挖掘的数据预处理技术分析原始数据,并根据实际需要建立数据预 处理算法,将数据优化后再用线性回归进行分析。 ( 3 ) 通过曲线拟合方法建立乘法模型,通过线性变换和线性回归分析求出模型的 数学方程的表达式和评价指标,并与前边的分析结果比较。 ( 4 ) 在各个分析过程中,根据需要利用不同的图形分析,可以直观看出分析的好 坏。 1 5 论文结构 本论文的内容围绕降雨侵蚀预测模型的构建过程,共分为六章: 第一章绪论:阐述土壤侵蚀的相关概念,以及课题研究的意义,并对土壤侵蚀数 学模型,特别是降雨侵蚀预测模型的研究作了介绍。本章分析了研究的重点,给出了全 文研究的技术路线。 第二章土壤侵蚀理论与降雨侵蚀研究:本章从土壤侵蚀的分类和成因描述开始, 6 长安大学硕上学位论文 进而介绍了土壤侵蚀研究的主要方法,在此基础上对通用水土流失方程和相关概念作了 阐述。 第三章降雨侵蚀预测模型的建立方法和原理:首先从大的方面介绍了土壤侵蚀数 学模型的建立方法,进而介绍了降雨侵蚀中的几个因子,重点描述了本论文进行分析的 主要方法回归分析。 第四章数据预处理技术和模型的评价方法:简单介绍了数据挖掘中数据预处理的 相关技术,并对使用的模型分析方法做了阐述,最后利用s p s s 和降雨侵蚀原始数据进 行线性回归建模,用作分析比较的基础。 第五章结合数据预处理技术的线性模型研究:详细介绍了本论文使用的数据预处 理技术,建立降雨侵蚀数据预处理算法,并使用经过数据预处理的数据进行回归分析, 建立数学模型,并与第四章得出的模型比较得出结论,提出仍需解决的问题。 第六章降雨侵蚀预测模型的乘法模型研究:首先介绍了曲线拟合的概念,并介绍 使用曲线拟合的目的。通过分析给出降雨侵蚀预测模型的乘法模型,通过线性化变换和 回归分析得出乘法模型的方程表达式,并将其分析结果和以前的模型分析结果作比较, 得出结论。 总结与展望对降雨侵蚀预测模型的建模过程中遇到的问题作了总结,归纳了在研 究中尚未解决的问题,分析了模型的不足之处,最后展望了前景和相关的后续研究内容。 7 第二章降雨侵蚀理论与研究 第二章降雨侵蚀理论与研究 土壤侵蚀分类的内容包括侵蚀的类型、侵蚀强度、抗侵蚀程度等。根据外营力的不 同,土壤侵蚀可以分成水力侵蚀、重力侵蚀、风力侵蚀、冻融侵蚀、冰川侵蚀、混合侵 蚀、生物侵蚀等几类。按侵蚀成因上有无人类扰动,土壤侵蚀可分为地质侵蚀( g e o l o g i c e r o s i o n ) 和加速侵蚀( a c c e l e r a t e de r o s i o n ) 等。按土壤侵蚀发生的时代可分为古代侵蚀 ( a n c i e n te r o s i o n ) 和现代侵蚀( h u m a ne r o s i o n ) 。一般地,侵蚀强度和抗侵蚀程度以分 级评价的方法来研究。 2 1 土壤侵蚀的成因 土壤侵蚀是自然现象,其产生的原因既有自然因素,也有人为因素,黄河中游黄土 高原地区植被稀少土壤疏松、暴雨较多、地形破碎,易产生了强烈的土壤侵蚀。在研究 中,能够造成水土流失的土壤侵蚀研究因素是需要注意的。由于土壤侵蚀过程是持续的 自然过程,随时随地都会发生,土壤侵蚀到一定程度,加上外在一些条件如降雨等,从 而形成水土流失。在土壤侵蚀研究的实际意义中,形成水土流失的土壤侵蚀因素需要重 点研究,因此我们介绍的土壤侵蚀因素都是形成水土流失的主要成因,包括自然和人为 两方面。 2 1 1 自然因素 从自然方面考虑,主要有地形、降雨、土壤( 地面物质组成) 、植被四个方面。 ( 1 ) 地形。地面坡度越陡,地表径流的流速越快,对土壤的冲刷侵蚀力就越强。 坡面越长,汇集地表径流量越多,冲刷力也越强。黄土丘陵区、地面坡度大部在1 5 0 以 上,有的达3 0 0 ;坡长一般1 0 0 2 0 0 m ,甚至更长。每年每亩流失5 1 0 吨,甚至1 5 吨以 上。 - ; ( 2 ) 降雨。产生水土流失的降雨,一般是强度较大的暴雨,降雨强度超过土壤入 渗强度才会产生地表( 超渗) 径流,造成对地表的冲刷侵蚀。 ( 3 ) 地面物质组成。质地松软,遇水易蚀,抗蚀力很低的土壤,如黄土、粉沙壤 土等是产生水土流失的对象。 ( 4 ) 植被。达到一定郁闭度的林草植被有保护土壤不被侵蚀的作用。郁闭度越高, 保持水土越强。 长安大学硕士学位论文 2 1 2 人为因素 人类对土地不合理的利用、破坏了地面植被和稳定的地形,以致造成严重的土壤侵 蚀,引起大面积水土流失,最主要的有两个方面。 ( 1 ) 毁林毁草、陡坡开荒,破坏了地面植被。 ( 2 ) 开矿、修路等基本建设不注意水土保持,破坏了地面植被和稳定的地形,同 时,将废土弃石随意向河沟倾倒,造成大量新的水土流失。 2 2 土壤侵蚀研究方法 土壤侵蚀研究方法在本节特指降雨侵蚀研究方法,主要研究土壤侵蚀量和降雨、地 形等因素的关系。土壤侵蚀量是土壤侵蚀定量分析的指标之一,它是流域内被侵蚀土壤 的数量表示。 土壤侵蚀量是指土壤侵蚀作用的数量结果,通常把土壤、母质及地表松散物质在外 营力的破坏、剥蚀作用下产生分离和位移的物质量,称为土壤侵蚀量。单位时间:、单位 面积内产生的土壤侵蚀量( 单位通常为t k i n 2 a ) ,称为土壤侵蚀速率( 或速度) 。在特 定时间段内通过小流域出口断面的泥沙总量( 或径流总量) ,称为流域输沙量 l i n e r ,系统弹出线性回归对话框如下 自m 目* i m 【r 6 自d 岖& 【删 口。;豢。一。 日c 1 “1 h 州 厂 $ ;嚣器一 一m & m 【r “7 1 e r s 士“m v b h 田 田“一 口。 ( 4 1 1 ) ( 4 1 2 ) 图4 4s p s s 线形回归主对话框 如图4 4 所示,选择径流模数、降雨量、平均雨强、短时最大雨强进入对话框用 e n t e r ( 强行进入) 方式进行线形回归。其它选项都采用默认方式。 4 32 结果分析 由于s p s s 输出多为图形格式,因此将结果以图形格式给出并解释。 图45 王图4 8 为式( 4 1 1 ) 使用s p s s 进行线形回归得到的输出结果。 v a l m b l e $ 卧e t e d r e m o v e d b l 。l 1 1 短盯殴最 大融 肇臻岔 aa l lr e q u e s t e dv ar l a b 】e se n t e r e d b d e p e n d e n t v a r ia b l e :径z _ 模数 图4 5 变量进入退出记录 图45 是拟合过程中变量进入腿出模型的情况记录,只出现了一个模型1 ,该模 i = j | 第四章数据预处理技术和模型的评价方法 型中短时最大雨强、降雨量、平均雨强为进入的变量,没有移出的变量,具体的进入 退出方法为e n t e r 。 m o d e ls l l l | l l l a l y a d j u s t e d 8 t d e r r o ro f m o d e ir r s q u a r e rs q u a r et h ee s t i m a t e 14 13 a17 116 84 d 7 82 0 8 a p r e d i c t o r s :( c o n s t a n t ) 短时断最大雨强降雨量平 均雨强 图4 6 模型拟合结果总结 图4 6 为所拟合模型的情况简报,显示在模型1 中多元相关系数r 为0 4 1 3 ,而确 定系数r 2 为o 1 7 1 ,调整的确定系数j r 锄为o 1 7 1 。 a n o v p s u mo f m o d e i s q u a r e s d fm e a ns q u a r ef s i g 1 r e g r e s s i o n 3 e + 0 0 9 3 9 5 8 6 8 9 17 3 35 7 b 4 20 0 0 a r e s i d u a l1 e + 0 1 08 4 116 6 3 17 7 6 9 5 t o t a l 2 e + 0 1 0 8 4 4 a p r e d i c t o r s :( c on s t an t ) 。短时断最大雨强降雨量平均雨强 b d e p e nd e n tv a r ia b l e :径流模数 图4 7 模型检验结果 图4 7 是所用模型的检验结果,可以看到这就是一个标准的方差分析表。从上表 可见,所用的回归模型f 值为5 7 6 4 2 ,尸值为0 0 0 0 ,因此我们用的这个回归模型是有 统计学意义的。 c o e 仟i c i e t l t s a u n s l a n d a r d i z e ds t a n d a r d i z e d c o e 俪c i e n t sc o e 俩c i e n t s m o d e i 日s t d er r o r b e t a t s i g 1 ( c o n s t a n o 10 4 6 6 9 83 14 9 0 13 3 2 40 0 1 降雨量4 9 1 6 66 1 6 02 5 47 9 8 10 0 0 平均雨强3 8 014 5 1 40 0 10 2 69 7 9 短时段最大雨强2 6 5 6 5 172 5 0 4 2 83 5 510 6 0 80 0 0 a d e p e nd e n tv a r ia b l e :径;氚模数 图4 8 系数回归结果 图4 8 给出了包括常数项在内的所有系数的估计值和检验结果,用的是t 检验,同时 长安大学硕士学位论文 还会给出标化未标化系数。可见常数项和各自变量都是有统计学意义的,内容翻译成中 文如表4 1 所示: 表4 1 系数回归结果表 标准化 未标准化系数 系数 模型系数b系数标准误差 系数卢值 p 值 1 常数 1 0 4 6 6 9 8 3 1 4 9 0 1- 3 3 2 4o 0 0 1 降雨量 4 9 1 6 66 1 6 0o 2 5 47 9 8 10 0 0 0 平均雨强0 3 8 01 4 5 1 4o 0 0 10 0 2 60 9 7 9 短时最大雨强 2 6 5 6 5 1 7 2 5 0 4 2 80 3 5 51 0 6 0 8o 0 0 0 另外我们从输出的两个统计图可以进行直观分析。 hi s t o g r a m d e p e n d e n tv a r i a b l e :径流模数 r e g r e s s i o ns l z n d a r d i z e dr e s i d u a l 图4 9 对标准化径流模数( 原始数据) 预测值的正态分布图 直方图( h i s t o g r a m ) 是以一组无间隔的直条图表现频数分布特征的统计图,直方 图的每一条形高度分别代表相应组别的频率。如图4 9 所示,径流模数的观测值基本服 从正态分布。 4 1 ,u亡:口2 第四章数据预处理技术和模型的评价方法 n o r m a lp - pp l o to fr e g r e s s i o ns t a n d a r d i z e dr e s i d u a l d e p e n d e n tv a r i a b l e :径流模数 图4 1 0 径流模数正态概率分布图( 径流模数脚概率图) p p 概率图( p pp r o b a b i l i t yp l o t s ) 是根据变量的累积比例对所指定的理论分布累积 比例绘制的图形,它是一种直观的探查样本数据是否与某个概率分布的统计图形相一 致,如果被检验的数据符合所指定的分布,代表样本数据的点簇在一条直线上。如图4 1 0 所示,使用原始数据进行线性回归后的结果并不是很好,因为径流模数p p 图中散点分 布偏离直线较大。 同样的,使用原始数据建立侵蚀模数的线性回归模型,使用模型为公式( 4 。1 2 ) , 我们将侵蚀模数与径流模数建模结果的主要部分列入表4 2 : 表4 2 原始数据建模主要结果 模型因变 方程的解释 数据量 系数回归结果 量 r尺2 r 6 0 1 0 4 6 。6 9 8 6 1 4 9 1 6 6 径流模数 1 0 1 8 0 4 1 30 1 7 10 1 7 1 6 2 0 3 8 0 6 3 2 6 5 6 5 1 7 4 2 口etc=u弓考o-山 长安大学硕士学位论文 表4 2 原始数据建模主要结果( 续) 模型因变 方程的解释 数据量系数回归结果 量尺砰 r 2 , , , t j c 01 2 0 3 2 6 c l 2 6 4 5 侵蚀模数 1 0 1 80 2 4 30 0 5 9o 0 5 6 c 21 9 3 7 c 3 2 8 9 5 7 3 注:两个模型都具有统计学意义。 4 3 3 结论 由以上的分析结果我们得到使用原始数据得到的降雨侵蚀预测模型的线性方程为: 径流模数:夕l i r a - 1 0 4 6 6 9 8 + 4 9 1 6 6 7 x 1 + o 3 8 0 x 2 + 2 6 5 6 5 1 7 7 x 3 侵蚀模数:2t - 1 2 0 3 2 6 + 2 6 4 5 x 1 - 1 9 3 7 x 2 + 2 8 9 5 7 3 x , 虽然回归的结果具有统计学意义,但是从方程的几个解释
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 癫痫病人的急救护理
- 浅谈制作课件教学课件
- 测量运动课件教学课件
- 部编版八年级地理上册第四章第二节《农业》课件
- 河南省2024九年级语文上册第一单元3我爱这土地课件新人教版
- 2.3.1共价键的极性 课件 高二上学期化学人教版(2019)选择性必修2
- 特殊药品管理应急演练
- 董氏奇穴治疗颈椎病
- 初中语文教案教学反思
- 护理专业说课稿
- THL520电话交换机说明书
- 职工食堂承包投标书范本
- 色谱柱Agilent安捷伦化色谱柱介绍
- 不动产登记表.doc
- 医疗器械生产场地的相关要求
- 《产品合格证》(通用格式模板)
- 电梯控制器DP30使用手册应用篇
- (完整版)塔吊基础专项施工方案(专家论证)
- 测绘专业职称考试中级复习资料
- 外汇与汇率教学课件PPT
- 施工现场区域特点和规定
评论
0/150
提交评论