(海洋地质专业论文)数字河口平台建设关键技术研究.pdf_第1页
(海洋地质专业论文)数字河口平台建设关键技术研究.pdf_第2页
(海洋地质专业论文)数字河口平台建设关键技术研究.pdf_第3页
(海洋地质专业论文)数字河口平台建设关键技术研究.pdf_第4页
(海洋地质专业论文)数字河口平台建设关键技术研究.pdf_第5页
已阅读5页,还剩130页未读 继续免费阅读

(海洋地质专业论文)数字河口平台建设关键技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数。7 4 , q l i 、r 台建搜关键技术研究 数字河口平台建设关键技术研究 摘要 信息技术的飞速发展改变了和改变着我们的生活方式,我们的生活理念,冲 击着社会的各个领域,许多领域和行业已经发生和正在发生巨大的变革,这是一 个信息的时代。在当今信息社会,人们对信息的需求基越来越大,特别是在科学 研究中,多学科的交叉和融合对数据集成、处理和共察提出了更高麴要求,仅靠 传统的方法越来越难以满足人们的需要。 纸质地图和海洋调查数据都是重要的数据来源,其数据类型纷繁复杂,数量 也非常大,数据集成和处理工作菲常繁重,仅靠传统的手工操作难以完成该任务, 本文通过对地图自动识别与矢量化方法和海洋调查数据处理方法的改进,大大节 约了处理时间,加快了数据集成和处理的进程,对于数据共享具有重要意义。 海洋数据的处理方法与一般数据处理方法不同,具有其独特性,本文对数据 的处理并不局限于已有文献采用的方法,而是根据海洋数据本身的特点,通过分 析其内在特征,充分利用信息技术最新的研究成果,在已有研究的基础上加以综 合和竣进,提高了囊己的观点帮方法,本文的研究成采主要包括: 。 1 在等值线自动识别方面,首次采用了神经网络方法对图文进行分离,取得 了较好的分离效果;并提出了基于非线性埃尔米特插值和能量函数相结合的等值 线识剐方法,跟踪步长增大,克服了采用直线段跟踪等值线步长小的缺点,判识 等值线所依掘的信息量更大,符合等值线整体识别的发展趋势。 2 在c t d 数据处理方丽,针对c t d 数据的特点,设计了独特的粗大误差处 理流程和处理方法,解决了常规方法效率低,操作繁琐的特点。 3 结合海洋沉积学领域端元分析模型,_ 开发了端元分解算法,并首次利用泼 模型对东海陆架沉积物粒度数掘进行了研究和分析,揭示了其中蕴含的大量信 息。 关键词:数据共享;。c t d 粗大误差;等值线自动矢量化;端元分辑模型 数。,河u f 台建设关键技术研究 k e yt e c h n o l o g yr e s e a r c ho fd i g i t a le s t u a r yp l a t f o r m c o n s t r u c t i o n a b s t r a c t t h i si sab i ge r aw i t hb i gc h a n g ea n db i gc h a l l e n g e ,i n f o r m a t i o n t e c h n o o g yh a sr e m o d e l e do u rl i f e ,o u rt h o u g h t ,a n dh a sg r e a t l yi n f l u e n c e d e a c hd o m a i no fw h o l es o c i e t y ,t h i si sa ne r ao fi n f o r m a t i o n m o r ea n dm o r e i n f o r m a t i o ni sd e m a n d e di nt h ep r o g r e s s ,e s p e c i a l l yi ns c i e n t i f jc r e s e a r c ha c t i v i t y ,m u l t i d i s c i p l i n ei n t e g r a t i o nr e s e a r c hc a l lf o rd e e p i n t e g r a t i o n ,p r o c e s sa n ds h a r eo fm u l t i s o u r c ed a t a ,t h et r a d i t i o n a l i n f o r m a t i o np r o c e s sm e t h o d sc a r l ts a t i s f i e su sn o w p a p e rm a pa n do c e a ns u r v e yd a t aa r ei m p o r t a n td a t as o u r c e sn o w a d a y s , i t sd a t a t y p ei sv a r i o u sa n dc o m p l e x ,i t sq u a n t i t yi sa l s ol a r g e ,t h ed a t a i n t e g r a t i o na n dp r o c e s sj o bi st e d i o u sa n dd i f f i c u l to n l yd e p e n do nm a n u a l p r o c e s s 。i nt h i sp a p e r ;t h r o u g ht h ei m p r o v e m e n to fp a p e rm a pa u t o m a t i c v e c t 。o r i z a t i o na l g o r i t h ma n do c e a ns u r v e yd a t ap r o c e s sm e t h o d ,t h ed a t a i n t e g r a t i o na n dp r o c e s si sq u i c k e n e d ,l a r g ea m o u n t so ft i m ei ss a v e d ,t h i s i sv e r yh e l p f u lt ot h es h a r eo fd a t a t h ep r o c e s sm e t h o do fo c e a nd a t ah a v eit so w nf e a t u r e ,a n disv e r y d i f f e r e n tf r o mo r d i n a r yd a t ap r o c e s sm e t h o d ,i nt h i sp a p e r ,w ea r en o t r e s t r i c t e do ft h e o r y ,m e t h o da n da l g o r i t h m st h a tp r o v e de f f e c t i v e l y ,w e p u to u rf o c u so nt h eo c e a nd a t a sf e a t u r e ,t h r o u g ha n a ly s iso fo c e a n d a t a se s s e n t i a lc h a r a c t e r i s t i c sa n da p p l i c a t i o no fu pt ot i m ec o m p u t e r t e c h n o l o g ya c h i e v e m e n t ,n e wm e t h o d sa r er e c o m m e n d e d m a i ne o n t r i b u t i o n s o ft h ed i s s e r t a t i o ni n c l u d e : 1i nt h ei s o li n ea u t o m a t i cv e c t o r i z a t i o nd o m a i n ,an o v e lp i c t u r e t e x t s e p a r a t i o na l g o r i t h mw h i c hu s en e u r a ln e t w o r kt os e p a r a t et e x tf r o m i s o li n ei sp r e s e n t ,t h ep r o c e s sr e s u l ti sf i n e :a n dw ep r e s e n tan e w l l 数,河u 、f 台建设关键技术研究 i s o l i n en o n l i n e a r h e r m i t ei n t e r p 0 1 a t i o nt r a c i n gm e t h o d ,t h em e t h o du s e n o n l i n e a rh e r m i t ei n t e r p o l a t i o na n de n e r g yf u n c t i o nt o o p t i m i z et h e p o s i t i o no fk e yp o i n t s ,i ta c q u i r eab i gt r a c i n gs t e p ,o v e r c o m et h e1i n e a r i n t e r p o l a t i o n ss h o r t c o m e ,t h ei n f o r m a t i o nu s e dt op i nt h ek e yp o i n t s i sm o r et h a nl i n e a ri n t e r p o l a t i o nm e t h o d ,t h i si sa c c o r dw i t ht h eh o l i s t i c a u t o m a t i c ¥e c 专o r i z a t i o nt e n d e n c yo f i s o li n e s 。 2i nt h e c t dd a t ap r o c e s sd o m a i n ,a f t e ra n a l y s eo fc t dd a t a s c h a r a c t e r i s t i c s ,w ep r e s e n tau n i q u ec t dw i l dd a t ae l i m i n a t a t i o nm e t h o d , t h ep r o c e s se f f i c i e n c yo fc t dd a t ai sg r e a t l yi m p r o v e d 3 + f i n a ll y ,i nt h em a r i n es e d i m e n t o l o g yd a t ap r o c e s sd o m a i n ,w eg i v e ae n dm e m b e ru n m i x i n gp r o g r a m ,i nt h es t u d yo ft h es e d i m e n tf r o me a s tc h i n a s e as h e l f ,w eg e tm a n yi n f o r m a t i o nh i d d e ni nt h eg r a i ns i z ed a t au s i n g t h isp r o g r a m k e y w o r d s :d a t as h a r e :c t do u ti io r :is oi ir ea u t o m a ticv e c t o rjz a tio n :e n d m e m b e rm o d el 数。,河1 - 1 、f ,行建设关键技术研究 插图目次 图2 1 东中国海一月份2 0 m 水深的水温平面分布图1 6 图2 2 图像预处理结果2 4 图2 3b p 人l :神经网络结构图2 7 图2 4 人i :神经网络训练川图2 8 幽2 5 图文分离效果3 2 图2 - 6 图文分离测试结果3 3 幽2 7 跟踪步k 的限制3 6 图2 8 插值方式测试图像3 9 图2 - 9 二次样条插值结果4 0 图2 1 0 埃尔米特插值结果4 1 图2 1 11 卜线性埃尔米特插值方法跟踪结果4 5 图2 12 变长直线段跟踪结果4 6 图2 1 31 f 线性埃尔米特插值方法跟踪结果局部。4 7 图2 1 4 断点连接结果4 9 图2 1 5 断点迎接结果局部5 0 图2 1 6 笛值线交互修改界面5 2 幽2 17 交互修改结果5 3 图2 18 、i - 白动等值线标注原理5 4 图2 19 系统总体框架。5 5 图2 2 0 系统的土界面。5 6 图2 2 1 l1 月底层盐度分布图5 7 幽2 2 2 介形虫数苗分布图5 8 幽2 2 3 春季表层溶解氧分布图一5 9 幽3 1 海洋c t d 数据的变化特征6 3 图3 - 2 淘汰点的计算范同利数据处理范同6 7 图3 3c t d 数据幅值异常处理流群图6 8 v l l 数,河u 、f 台建设关键技术研究 图3 4c t d 数据幅值变化率异常处理流科图6 8 图3 5c t d 粗人误筹检测的结果6 9 图3 - 6g i s 可视化站位交且选取界面。7 2 图3 7c t d 数据显示界面7 3 图3 8 某断面温度分布图7 4 图4 1 研究区站位7 6 图4 2 表层沉积物粒度频率分布曲线7 9 图4 3 表层沉积物粒度数据多元统计分析绵果8 1 图4 4 拄状样中值粒径直方图8 2 图4 5 研究区纵断面沉积物粒度参数8 2 图4 - 6 研究i 叉:站位承l 底质类型分布图8 9 图4 7 表层沉积物粒度数据反演结果9 1 图4 8 研究区表层沉积物端元相对含鼙等值线图和水深等值线幽9 4 幽4 9 研究区表层沉积物粒度频率分布曲线和概率分布累积曲线9 5 图4 1 0 研究区海流示意图9 8 图4 1 1 研究区站位和i 底质类玳分布图10 1 图4 1 23 0 站柱样粒度数据端元分析结果:1 0 2 图4 133 0 站柱状样含水率10 4 图4 1 4 东弧冬季风强度与3 0 站梓样的气候指标的对比1 0 5 图4 1 53 0 站柱样气候指标与其他温度波动曲线的对比1 0 7 图5 1 数据共享平台的主页1 1 0 图5 2k 江口温度显示系统11 4 v l l i 数y - :q h 、| ,台建设关键技术研究 表格目次 表2 1 几种插值方式所需关键点数3 8 表2 2 几种插值方式所需关键点数的比较3 表2 3 等值线识别效果比较4 4 表4 1 f 艮江口近海表层沉积物各粒级卣分含量7 7 表4 2 门一化后的 5 粒级2 8 、3 0 、3 1 、3 4 、3 5 、3 6 站粒度数据8 5 表4 3 艮江口邻近海域各站何表层沉积物粒度参数9 3 表4 - 4 研究| 文:表层沉积物端元含量与悬移、跃移、推移组分含量( ) 9 6 表5 1 用户类型和数据访问权限1 11 i x 独创声 明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含未获得 l 逵! 垫遗直墓丝盂蔓鳖型芭塑丝:奎拦互窒2 或其他教育机构的学位或证书使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 学位论文作者签名:懈签字同期刁p 。夕年 臼钐 同 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并 向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人 授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用 影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学技术信息 研究所将本学位论文收录到中国学位论文全文数据库,并通过网络向社会公 众提供信息服务。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:膨 导师签 签字隅矽垆6 月答字嗍矗中嘲 数,河i - i 1 ,行建设关键技术研究 1 引言 1 1 课题来源与项目背景 本文研究构建的数字河口平台是9 7 3 计划“中国典型河口一近海陆海相互作 用及其环境效应 项目的公共信息平台,隶属于其中的子课题9 :河口一近海环 境污染调控对策及生态系统变异的趋势预测。 海岸带是地球四大圈层交汇的地带,物理过程、化学过程、生物过程及地质 过程交织耦合,陆海相互作用强烈。全世界河流入海泥沙、生源要素及污染物的 7 5 9 0 归宿于海岸带,全世界6 0 的人i z l 和三分之二的大中城市集中在沿海 地区,海岸带环境演化直接关系到人类的生存空问、生存质量和社会的可持续发 展。河口一近海系统位处沿海经济带,是海陆相互作用最为活跃、对流域自然变 化和人类活动响应最为敏感、与近岸环境变化关系最为密切的区域。我国沿海经 济带的快速发展对海岸带资源与环境有着极大的依赖性,同时也赋予海岸带沉重 的环境压力。长江、黄河流域占全国国土面积的1 4 以上,居住着5 亿以上人口, 人类生存和社会发展对流域资源的需求之切和赋予环境的压力之大无可比拟。特 h 别是近年来由于流域环境的巨大变化和重大水利工程的实施,使我国最为典型的 两大江河一长江与黄河的入海物质通量及所携物质的组成发生了巨大的变化,直 接导致了三角洲海岸的蚀退、河口及其邻近海域严重污染等重大环境问题,已经 对我国社会与经济的发展、人民的健康生活以及沿海资源的丌发构成了巨大的压 力( h t t p :w w w o u c e d u c n d i q i u 9 7 3 ) 。 为了深刻认识海岸带系统对全球变化的响应及其在全球物质循环中的作用, 探讨海岸带系统演化的机理并预测未来海岸带环境的变化趋势,确保人类有效、 持续地利用海岸带资源,一个集中研究陆地、海洋、大气相互作用的国际性大型 研究计划海岸带陆海相互作用( l a n d o c e a ni n t e r a c t i o n si nt h ec 0 2 u s t n lz o n e 简 称l o i c z ) 于1 9 9 3 年应运而生,并已得到了世界众多科学家和各国政府的积极 响应、参与和支持,成为目自订国际海洋科学跨学科研究的前沿热点和国际地圈一 生物圈计划( i g b p ) 的核心内容。 l o i c z 是i g b p 七个核心计划之一,目前提出的主要研究问题是:海岸带 数一 l 叮t - i 、f 台建设关键投术研究 子系统在整个地球系统中的作用和地位,以及将来可能的变化。作为i g b p 的核 心计划,它的研究对象是地球表层系统陆地、褥洋、大气交、汇和相互律磁的区域 海岸带,海岸带作为地球表层固、液、气三相圈层相交和共同作用的地带, 是地球表层物质、能量和信息流通交换最活跃的区域。l o i c z 研究的长期目标 是:( 1 ) 在全球和地区尺度上测定:,陆地一海洋一大气间通过海岸带的物质通 量;海岸系统改变和贮藏颗粒物质及溶解物质的能力;外力作用、条件变化 对沿岸生态系统结构与功能的效应;( 2 ) 测定土地利用、气候与海平面变化及人 类活动如何改变海岸带颗粒物质的通量和保持度;( 3 ) 测定海岸系统的变化( 包 括有机物和营养盐鱼各种陡域与海洋排入量的响应) 如何影响全球c 循环及大 气中痕量气体的组成;( 4 ) 评估沿岸系统对全球变化的响应对人类、对沿岸环境 的居住和使用,对海岸带环境综合管理的科学和社会经济基础的意义( 刘瑞玉, 1 9 9 7 ) 。 海岸带在全球物质循环和气候变化中扮演着重要角色,其流域水文和河口的 水动力、生念系统对海洋水体和沉积物、大气、陆地间的物质交换起重要作用, 河流搬运泥沙至河鼹沉积和沿岸输运,影嚷海岸带的地貌演变。海岸带还影酸着 大气中c 0 2 等与气候相关的痕量气体和c , n ,s 之类重要元素的通量( 沈焕 庭,1 9 9 9 ) 。 溺流入海物质通量及其组成的变异已使河墨海岸带的生态安全和人类生存 环境面临严峻的挑战。正在实施的三峡工程举世瞩目,由此引起的入海物质通量 变异以及将对河口一近海环境的影响已经引起国际上诸多国家和地区的高度关 注。此外,小浪底水库和南水= 艺调工程、谣部大开发和流域城市化进程等还将遴 一步改变长江、黄河中下游水沙过程及入海物质通量。因此,深入系统地研究我 国世界级的两大典型江河流域入海物质通量及其组成对人类活动和全球变化的 响应,剖析入海物顼在河口及冀邻近海域的输运、转化及归宿的机制,探讨沉积 动力和水环境变化过程,模拟和定量评估河口及邻近海域的地貌演化及环境效应 并实现其趋势预测,对于海岸带资源利用和环境保护、防治和减少由于海岸蚀退 及岸坡失稳所造成的灾害、逐步遏制近海区域富营养化和赤潮的发生、维护河翻 及其邻近海区的生物多样性及尘念环境的健康至关重要 ( h t t p :w w w o u c e d u c n d i q i u 9 7 3 ) 。 2 数,洲u 、f ,白建设关键投术研究 基于上述原因,9 7 3 计划启动了“中国典型河口一近海陆海相互作用及其环 境效应”项露。该项露共分为l o 个子课题,主要研究以下5 个方面翡内容:( 1 ) 河流入海物质( 组成) 的通量变异机制及输运过程;( 2 ) 河口沉积动力过程、 三角洲海岸侵蚀堆积机制和趋势预测;( 3 ) 河口一近海环境的控制因素及变异 枫理;( 4 ) 河口一近海生物地球化学过程;( 5 ) 三焦洲海岸侵蚀防护和河口一 近海环境恶化的治理对策等。这5 个方面紧密联系,环环相扣,每个方蟊的研究 都需要其他几个方面的支持。该项目的实施需要多个学科( 包括海洋地质、物理 海洋、海洋化学、海洋环境、海洋工程、海洋生物等) 众多科学家的协闻工作, 因此各单位之间的数据集中和共享就变得尤为重要。另外参加该项冒的主要有中 国海洋大学、华东师范大学、中国环境科学研究院、南京大学、国家海洋局第一 海洋研究所、中山大学、中国石化胜利油田有限公司等多家单位,分布在青岛、 上海、北京、广她| 、东营等多个地区,数据的集中和共享问题变得j 常困难。 因此我们的研究目的就是构建一个多学科分布式科学数据共享平台,为参与 该项目研究的科学家以及相关研究人员提供专业数掘服务,并为公众提供一个了 解浮翟海岸带环境、接触科学研究项蠢、科学研究人员的平台。 1 2 国内外研究现状和发展动态 当前,经济发展的全球化和全球性科技活动不断增强,导致全球范围内对科 学数据信息资源的交流、互通和深度使罔的强烈需求和高度依赖。面对科技创新 国际竞争的严峻挑战,实施科学数据共享,整合离散的海量科学数据资源,建立 健全数据资源的共享机制,发挥科学数据的最大价值,是增强国家科技竞争能力 昀有效途径,是信息黠代全球科技发展的必然选择( 徐冠华,2 0 0 3 ) 。数据共享 的必要性是地球科学研究本身的特点所决定的,地球科学研究的对象和问题通常 以长时间、大尺度、大规模为特征,研究工作不仅需要在实验室中进行,而且更 需要大范围、长时间系列的实地观测。焉任何一个科研项隧自身只能取得一定空 | 珏j 范圈和定时间段落的某个特定对象的观测资料。为了全面了然某种自然规 律,就有获得其他科研项目( 正在进行的和已经完成的) 科学数据的必然要求。 这种要求是互裙的、多商的,这种要求也是地球科学发展所必需的( 孙枢,2 0 0 3 ) 。 在地球科学研究中,- i 3 学科的研究常常需要依赖其他学科的数据,l o i c z 数, i l j u 甲台建设关键技术研究 研究就是一个典型的例子。海岸带是人们生存空间的拓展地,随着城乡发展以及 旅游和交通的需要,给海岸带生态系统带来了巨大的危机。另外,过去建设的和 新建的水利工程( 例如:水坝、改移河道) 影响着河水、营养物、沉积物以及污 染物向海的输入。针对上述问题已经开展了许多研究,并取得了大量的数据,但 大多数是在单一学科下进行的,很少多学科联合研究。l o i c z 计划把海岸带包 括水体、流域以及他们对人类活动和自然变化的响应看作是一个完整的整体,从 多学科的角度对海岸带进行研究( h t t p :w 3 k g k s s d e l o i c z b a s i n s ) 。 长期以来我国投人了大量的资金获得了很多科学数据,然而只是形成了一系 列的数据“孤岛”,社会上的“数据鸿沟始终存在。随着计算机技术和g i s 技 术的发展以及众多全球化问题的出现,迫切需要一种合理的方法来协调不同地学 数据部门之间的资源共享,以解决这一信息社会中的信息饥渴问题,只有建设高 速畅通的科学数据共享网络,用网络将“孤岛 连接起来,填平“鸿沟”,在网 络上形成“数据洪流9 99 才能使广大科技工作者十分方便地获得他们所需的科学 数据( 孙九林,2 0 0 3 ) 。 网络技术的飞速发展为科学数据共享提供了良好的条件,各种形式的网站十 分活跃,对学术交流和科技进步起到了重要的推动作用。世界数据中心( w o r l d d a t ac e n t e r 简称w d c ) 的建设是数据共享的一个重要里程碑,w d c 由国际科 学联合会( i n t e r n a t i o n a lc o u n c i lo fs c i e n t i f i cu n i o n s 简称i c s u ) 创建于1 9 5 0 s 后期,目前w d c 已经发展到美国、俄罗斯、欧洲、澳大利亚、印度、r 本和中 国等多个国家和地区。在中国拥有地质、地震地质、气象、海洋、地球物理、天 文、空间、冰川冻土、资源与环境等9 个学科中一l , ( h t t p :w w w n g d c n o a a g o v w d c ) 。 其中中国海洋w d c 分中心在线共享服务数据总量1 3 3 g b ,提供海洋坏境监测 站资料、海洋温盐资料、南深站数据资料、b t 数据资料、c t d 数据资料、表层 海流数据资料、a r g o 浮标数据库、g t s p p 数据资料、海面气象观测数据资料、 海洋化学数据资料、m o d i s 数据资料、海洋生物数据资料等大量的原始数据, 以及中国近海海域坏境图集、中国南海海洋环境图集、海洋环境统计分析产品、 海洋要素数据同化产品、海洋环境遥感产品、海面气象资料、a r g o 资料产品、 太平洋温盐等值线分粕图、西太平洋水深网格图等众多图集。截止到2 0 0 6 年1 0 月海洋科学数据共享服务网累计访问量达5 8 3 2 3 人次( 含分中心网站) ,用户群 4 数。河h 咀t 台建设关键技术研究 主要分布在海洋局、中科院、气象局、国土资源部、农业部、高等院校及各省市 社会公众。网站注册人数为3 1 0 人,其中实名注册人数为1 8 0 人 ( h t t p :m d s c o i g o v o n ) 。目前,有关数据集成与共享的研究主要集中在数据集成 与共享政策、数据集成与共享标准、数据集成和共享框架、数据处理和分析工具 等几个方面。 。 1 2 1 数据集成与共享政策 合理的数据共享政策是实现数据共享持续发展的保证。数据共享可以最大程 度地发挥数据的使用价值,使丌发数据资源的投资得到最有效的利用。数据不像 物质产品,没有排它性。能否实现数据共享并使之持续发展,国家政策引导是很 重要的。对于国家投资产生的一般数据,应当及时向全社会无偿共享;对于国家 投资、单位或个人具有较大智力投入的数据,可以设立一定的保护期,保护期内, 由生产单位或个人独占,过了保护期以后,则应当向全社会公开。必须尊重和保 护数据提供者的知识产权。被提供服务者是数据的最终用户,对数据不具备散发 权,同时,被提供服务者在其研究成果中要注明所使用数据的来源( 廖顺宝, 2 0 0 5 ) 。 建立信息共享的政策机制和制定共享的管理办法是开展可持续发展信息共 享的前提和依据,是保障包括共享行为、经济和社会效益以及法规因素在内的可 持续发展信息共享的基础。用市场机制激活可持续发展信息共享,用管理机制调 节和保障可持续发展信息共享。行为因素即数据的拥有者是否愿意将数据与他人 共享,这是进行数据共享的先决条件。信息参与共享后,随着用户增多效益就会 增大,价格问题必然出现。不同的系统、环境中的共享将带来额外的丌销,因此 必须规范数据的价格,制定政策和法规,鼓励和吸引数掘提供者参与信息共享; 对数据共享的范围和数据的使用权限等进行约束( 孙成永,2 0 0 1 ) 。 1 2 2 数据集成与共享标准 标准规范是实现共享的技术保证。同一数据产品可以通过不同的软件来丌发 和管理,在应用中,不同的用户也可能使用各自熟悉的软件来分析使用数据。这 就涉及到数据格式是否兼容的问题。一种数据产品,即使再有价值、数据质量再 数,河l j 、i i - 台建设关键技术研究 高,如果它不能被大多数用户方便地使用,其共享价值也就不存在了。因此,数 据产品的标准化、规范化对于数据共享至关重要。与数据共享有关的标准规范很 多,主要包括:数据分类标准、元数据标准、数据产品质量标准、数据产品的格 式标准等( 廖顺宝,2 0 0 5 ) 。 具体到项目本身,不同的数据格式、不同的研究状况以及不同的研究需要导 致不同的项目往往采用自己独特的标准。太平洋地区2 0 0 1 空气质量研究计划根 据项目的需要制定了自己的数据交换标准,该标准分为三部分:文件头部分包含 一般信息,例如调查人员姓名、联系方式、数据版本、文件内容、质量等级、采 样间隔和数据使用方式等;元数据表部分包含数据认证标志、监测地点以及实验 室备注等;数据表部分不仅包含数据本身,还包含零值和负值的描述以及检出限、 不确定度、数据格式及其说明等。并采用广泛使用的m se x c e l s 表格对数掘进行 记录( w i l l i 锄bs ,2 0 0 6 ) 。 世界数据中心中国中心( w b r l dd a t ac e n t e r - d ) 地质科学数据网的数据集的 核心元数据内容2 0 项:数据集名称、数据集标识符、数据集内容摘要、数据集 关键词、数据集时问范围( 起始时问、结束时间) 、数掘集空间范围( 最低、最 高经度;最低、最高纬度;最低、最高高度) 、数据质量说明、数据存储介质、 数据格式、数据量、数据来源、数据集语种、数据集作者信息、元数据作者信息、 数据集存放地点、数据集共享方式、数据尺度、数据更新周期、数据空间参考系 及坐标、附录等( 戴爱德,2 0 0 4 ) 。 1 2 3 数据集成和共享框架 廖顺宝认为地学数据共享发布平台应当具备用户管理、数据目录查询、元数 据管理、数据查询与浏览、数据下载等基本功能( 廖顺宝,2 0 0 5 ) 。 孙成永等在中国可持续发展信息共享网络建设中认为中国可持续发展领域 的数据是分散在各个部门和研究机构中,数据种类多样,结构千差万别。数据的 完全集中在技术和管理上是不可行的,而数据完全按分布式的方式管理也存在协 调、数据质量控制、高层次集成等问题,因此必须建立集中和分布相结合的共享 体系。以统一的元数据标准和基础地理信息平台建立分布式数据库系统,并将可 无偿使用的、带有一定共性的、可集成的数据集中在网络中心,形成以分布式为 6 数+ ,洲u ,r 台建设关键技术研究 主、集中和分布相结合、集中带动分布的完整的共享体系( 孙成永,2 0 0 1 ) 。 吴洪桥等提出了一种面向网络信息共享的需求,同时也满足元数据和数据集 一体化的管理模式即:网络一体化管理模式。该模式下i n t e r n e t 上的任一用户可 以通过一定的机制把自己掌握的数据,按照定的格式提交到指定的服务器来共 享,同时他也可以获得对已有部分数据的管理权限。这种元数据管理模式有以下 的特点:( 1 ) 动态和开放的管理:通过服务器端与用户交互的管理层,不仅能使 普通i n t e m e t 用户按照一定的格式和要求提交自己的数据,同时还能建立自己的 元数据库并提交到元数据服务器,这样元数据的管理不再是针对特定人群,普通 用户在通过服务器的认证以后,可以获得对部分元数据和原始数据集的管理权 限。( 2 ) 网络分布式管理:管理系统采用分稚式管理模式管理分布在网络上不同 节点的海量资源与环境数掘集;在对元数据的管理上,由予当前资源环境元数据 的实现方式有单个文件、多个文件或者数据库等多种形式,数据库技术和分南式 存储技术在海量数据的管理方面已经比较成熟,采用关系数据库( 如o r a c l e , s q ls e r v e r 等) 可以统一管理资源与环境的不同类型元数据,同时还可以实现元 数据的分布式存储。( 3 ) 一体化管理:在该模式中,采鬟了薅层管理模式,元数 据和数据集一体化的管理实现了元数据和数据集管理上的同步和一致性;用户与- 元数据交互管理解决了元数据管理动念和开放的要求,使i n t e m e t 上的任何用户 可以依据一定豹步骤提供共享数据,在用户、元数据和数据集三者之间的关系上, 真正实现三位一体的管理目标( 吴洪桥,2 0 0 3 ) 。 国际地圈生物圈计划组织( i g b p ) 为满足各地用户对数掘的需求建立了 i g b p 元数据信息系统,它盘3 个主模块组成,郎关系数据库、魄理信意系统和 用户界面核心软件。元数据在数据中心形成后提供给i g b p ,然后经过加工处理 进入数据库,并根据元数据性质分类,分别存放。对关系数据的操作是通过建立 在g i s 基础上的中心软件来实现的,该软件提供了用户利用元数据信息系统的 交互式赛面。通过i n t e r n e t 网络,世界各地的数据用户可与分布在i g b p 核心工 程中心及各个合作实验室的i g b p 元数据信息系统联系,以获得自己感兴趣数据 的详细信息,并通过元数据中给出的方式获得这些数据( 周成虎,2 0 0 0 ) 。 欧共体地中海区域国际海洋研究计划m a t e r 采用分禽式的管理方式,按照 地理位置的不同分为三个分中心,维护4 个详细数据目录:航次、站位、设备、 7 数, - u 、台建设关键技术研究 数据集,通过万维网提供浏览服务( c m a i l l a r d ,2 0 0 2 ) 。 美国加州大学伯克利分校s e o n g e u nj e o n g 等设计了水文数据管理、获取和分 析系统( h d m r a s ) ,该系统主要包含4 个部分:( 1 ) x m l 元数据管理框架;( 2 ) j a v a 应用程序引擎;( 3 ) 用于数据分析和可视化的i d l 软件;( 4 ) 数据存储。j a v a 应用程序引擎是系统的核心,使用j a v a 引擎处理系统中的x m l 格式的元数据, 通过元数据实现对数据集的访问、分析和可视化。系统数据的可视化借助i d l 软件实现,i d l 软件通过表格方式访问和显示数据,能够实现数据的二维和三维 的可视化,并提供基本的统计分析功能。另外i d l 软件可以访问n e t c d f 、h d f 等通用的数据格式( s e o n g e u nj e o n g ,2 0 0 6 ) 。 1 2 4 数据处理和分析工具 l o i c z 计划在执行的过程中,逐渐开发和形成了一些数掘处理和分析工具, 其中比较有名的是w e b l o i c z v i e w( w l v ) 和d e l u x ei n t e g r a t e ds y s t e m 。f o r c l u s t e r i n go p e r a t i o n s ( d i s c o ) 。d i s c o 是对w l v 的改进,是一个基于网络的 数据分析工具,该工具适合于对空间数据集进行趋势和聚类分析,是为分析美国 堪萨斯大学h e x c o r a l 数据库中多变量空f b j 数据库而开发的,也可用于对其他数 据集的分析。其基本数据分析工具是一系列的聚类程序,另外还提供给用户以下 功能:多种对数据以及聚类结果可视化的方法;计算特征向量、主成分分析功能; 高维数据可视化功能等( h t t p :w w w 1 0 i c z o r g ) 。 孙效功等采用组件式g i s 软件m a p o b j e c t s 和面向对象编程工具v i s u a lb a s i c 对海岸带钻孔数据的可视化技术进行了分析和研究。参考国家标准和规范,通过 动态链接库调用w i n d o w s 应用程序接口函数来实现任意自定义点状符号的绘制, 并根据多个点状符号设计模板,实现钻孔数据的柱状剖面图的绘制。对钻孔数据, 根据需要将其分为钻孔图层库、钻孔基本情况数据库、岩性资料数据库等3 个库, 实现了单个钻孔柱状剖面图和多个钻孔对比柱状剖面图的绘制,并对其对比分析 的算法作了讨论,结果表明该技术可以有效地实现海岸带钻孔数据的分析及可视 化工作( 孙效功,2 0 0 4 ) 。 无独有偶,加拿大温莎大学j a m e sd m c c a r t h y 等也利用g i s 丌发了钻孔信 息系统( b o r e l s ) ,使用a r c g i s 软件包中的a r c s c e n e3 d 软件实现了钻孔数据的 8 数,洲u 、i z 台建设关键披术研究 管理、可视化、查询和分析等。b o r e i s 使用e x c e l 表格存储钻孔数据,并且提供 了数据发现向导功能,减少了数据格式的转换和重组,方便了科学家的使用。 b o r e l s 建立在通用的g i s 软件基础上,既继承了a r c g i s 软件的丰富功麓又减少 了软件培训时间,使得科学家可以集中精力用在专业研究上面。选用v i s u a l b a s i c 6 ( v b 6 ) 开发工具,它与e x c e l 表格软件和a r c g i s 软件可以很好的集成在 一起,v b 6 使焉a d o 数据弓l 擎按照关系型数据库的方式访阆e x c e l 表格。使禳 b o r e l s 处理数据分为三个阶段:( 1 ) 数据交互发现阶段;( 2 ) 生成s h p 文件;( 3 ) 可视化和分析阶段。b o r e l s 提供项目管理工具应用于前两个阶段,可视化和蒙板 工具应用于最后一个阶段。管理工具提供曩常数据管理的功能,包括:项誉文件 创建、数据发现和s h p 文件生成等;可视化工具集成了a r c s c e n e 软件的绘图功 能,另外还开发了两个查询工具:一个是枚举值查询,一个是阂值查询,查询结 果可视显示。为方便生成查诲命令,系统还提供了查询生成器。使用蒙板工具可 以剔除未查到对象的显示。另外系统还提供垂向缩放、插入栅格图像等功能 ( j a m e sd ,2 0 0 6 ) 。 s o m ( s e l f o r g a n i z i n gm a p ) 是宙k o h o n e n 在1 9 8 2 年提出来的一种基于竞争 学习的单层神经网络模型,它在对数据矢量化的同时还能实现数据的降维映射, 该映射具有拓扑关系保持的优怠特性,这也使得s o m 成为一种常用的聚类和可 视化工具。然而,由于神经元在低维空间中的位置是固定有序的,这样就不能很 好地保持数据闽的距离信息,将距离信息间接地展现在神经元网格上,数据的结 构被扭曲了,为了能更自然地展现数据的结构,除拓扑关系外,在映射的过程中 还应尽可能保持数掘问的距离( 或相似度) 信息,邵超等提出了一种新的位置可 调s o m 算法d p s o m ( d i s t a n c ep r e s e r v i n gs o m ) ,它能够按照神经元在原数 据空i 、日j 中相互间的距离对其位置进行调节,从而能更自然地展现数据的结构。既 可以实现数据的聚类和压缩,又可以很自然地对数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论