版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、FitHAS: FITS头分析入库系统于建军中科院网络中心主要内容背景FitHAS体系结构下一步工作总结背景虚拟天文台环境海量天文数据的存储和访问e-Science/网格技术虚拟天文台(Virtual Observatory)定义:利用先进的信息技术将各种天文研究资源以统一的服务模式无缝透明地汇集到一起,形成一个统一的数据密集型的网络化天文研究与科普教育平台虚拟天文台吸收了网格等先进技术,将集成海量天文资源,提供丰富的服务核心问题是数据处理海量天文数据是向天文学家和社会各界提供天文数据服务的重要基础需要在VO环境下有效地组织数据资源,挖掘海量数据的潜力,从而使这宝贵的资源能为国内外的天文学家乃
2、至社会各界所更好地使用,真正发挥其巨大的作用 海量天文数据目前:国际上公开的天文数据已经达到上百TB量级一些观测项目的数据日产出数量甚至以十亿甚至十万亿的量级来计算未来:将达到PB量级传统的数据存储和管理的方式已很难满足海量天文数据的存储和访问要求天文数据处理在虚拟天文台环境下如何对海量数据进行有效存储成为一个亟待解决的问题如何对海量数据进行快速有效的访问,也是关系到虚拟天文台服务能力的重要课题e-Science技术定义e-Science is about global collaboration in key areas of science, and the next generation
3、 of infrastructure that will enable it.” By 英国e-Science倡导者 John Taylor, 2001为什么要引入e-Science技术解决现代科学研究的巨大挑战科学研究问题空前复杂化科学研究对象不是简单孤立系统,而是涵盖更大的范围,跨学科科研信息、数据的实时获取与处理,仿真与大规模计算成为分析、发现和预测的主要手段科学家之间密切的合作与交流e-Science的意义使得全球性的、跨学科的、大规模科研合作,跨越时间、空间、物理障碍的资源共享与协同工作成为可能将改变科学家们从事科研活动的方法和模式,极大地促进交流合作,推动科学研究的发展科研信息化是
4、整个社会信息化的前卫,是下一代互联网络技术及信息基础设施在科研领域的率先应用网格技术网格技术的最终目标:把整个互联网整合成一台巨大的超级计算机实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享为用户提供一步到位的服务e-Science的核心就是网格技术e-Science发展为VO提供技术支持 VO的最终目的:实现全球天文数据的高级共享提供一整套的智能化工具TB量级甚至PB量级大型天文数据产出项目的不断涌现VO的技术需求:对数据存储、管理、传输、检索等技术提出了更高的要求在海量分布式数据的基础上进行科学研究,就必须有全新的数据共享、互操作、作业调度、可视化、统计分析、数据挖
5、掘、安全管理等模型。 VO的这些需求正是e-Science要实现的目标!VO是e-Science的试验床 天文数据有着其他学科数据所无法比拟的特点: 天文数据绝大部分是开放数据天文数据很少有商业价值不存在保密问题,数据和结果可自由共享,非常适合国际性的联合研究与试验天文数据是海量的数据例如美国正计划建造的“暗物质望远镜”,每天观测数据高达18TB天文数据是真实而归档完好的数据,并提供在线访问服务天文数据是高度复杂的数据对数据处理、数据挖掘、可视化等研究提出了挑战。 VO要实现对海量天文数据的融合从e-Science网格基础设施的构建,到中间件的开发,最后到e-Science天文应用工具的实现,
6、VO为e-Science提供了一整套的应用需求天文数据现状 天文数据包括星表、图像、光谱天文方面的文献和观测日志这些数据一般以文件或数据库形式保存天文数据文件格式有普通文本文件、FITS、VOTable目前很多观测数据以FITS文件保存很多数据查询服务将结果包装成VOTable形式这些大多是直接处理文件而且是少量文件的应用 FitHAS介绍天文学灵活图像传输系统FITSFlexible Image Transport System美国D.C.Wells等人于1979年提出的1982年国际天文协会(IAU)接受并推荐将其作为天文台之间进行图像数据交换的标准格式。在FITS的一般结构中,含有若干使
7、用ASCII码编写的描述信息,用于描述数据数组的结构、坐标系统以及附加参数等FITS描述了数据定义和数据编码的一般方法,对一维、二维、多维的数据类型都提供了合适的转换,不仅适用于天文数据,还可用于其他学科的图像处理。 目前FITS对综合孔径、甚大阵、CCD观测记录,以及CDS发表的天文星表和CD-ROM星表,都提供了较好的支持Fits文件格式基本结构包含一系列逻辑记录(logical record),逻辑记录的长度总是2880字节,因此一个FITS文件的大小是2880的整数倍。 一个逻辑记录中,一般会包含一个或多个头部数据单元(Header and Data Unit,HDU)每个HDU是由一
8、个头部以及其所描述的数据数组所组成。在一个FITS文件含有多个HDU时,第一个头部数据单元也就是主头部数据单元基本FITS 文件包含主头部和一个主数据数组。 Fits文件中图像数据以FORTRAN-77规则存储,低字节在前Fits头部FITS的头部是通过一组卡片映象(Card image)来描述数据数组每一个卡片映象都是一个80字节长的使用ASCII编码的字符串这些卡片映象的最后需要以“END”关键词作为结束标志,其后直到头部结束都用空格填满Fit头-元数据Fit文件中包含的元数据FITS和VOTable具有一定的结构化 特征比如FITS文件中会出现以ASCII编码的用于描述图像位置信息等的部
9、分在天文学领域,元数据是用于描述档案、档案提供的服务、其中的数据集合、每个数据集合的结构和语义以及数据集合中每个数据集的结构和语义。元数据包含了一些重要描述信息典型的元数据可以是用来描述星表、图像或光谱等数据对象的信息包括天文学家在检索和筛选数据文件时所需要的判断依据,如坐标信息等;同时还有一些可以作为简单数据处理所使用的输入信息Fits头元数据示例FitHAS需求已初步积累数据China-VO通过多年的天文观测以及与其他国家的交流,已获得大量的天文数据,并且数据的总量还将随着各巡天项目不断的数据产出而增长需要整理和归档为China-VO的海量天文数据管理的规划和决策提供理论依据,并为进一步发
10、布天文数据和开发数据访问服务打下良好的基础自动化工具支持开发通用天文数据的归档和管理工具,以解决目前China-VO面临的海量数据归档和管理中遇到的问题,并为未来大天区多目标光纤光谱望远镜(LAMOST)等项目的数据管理提供有效易用的工具,提高我国天文研究工作的效率和技术水平。 FitHAS意义必要性改变靠遍历访问大量的数据文件的做法可行性FITS有标准的格式约定,并且其头部记录部分采用ASCII格式编写,因此可以方便地提取,也十分适于在数据库中进行灵活的查询经济性:FITS头元数据占用空间较小。以天文台已归档的部分SDSS的光谱数据为例,1T的FITS文件,存入数据库的元数据所占用的空间仅几
11、百M易用性数据库SQL语句和结构查询方法,满足用户在海量数据的检索结果和检索时间上的要求。 关联性在入库的元数据中,还可以扩充其他重要信息,例如文件的位置,这样就构成了元数据和对应文件之间的一一映射e-Science虚拟实验室的重要工具LAMOST数据归档数据中心天文数据归档e-Science天文协同环境的第一步FitHASLAMOST数据处理系统LAMOST数据分析系统China-VO天文e-Science虚拟实验室FitHAS体系结构FitHAS主要功能FITS头部浏览 数据库元数据表的浏览 单一FITS文件的归档处理向导 FITS文件的批量归档管理向导 FitHAS FeatureFIT
12、S头部解析和浏览 FITS元数据和数据库中表模式的自动映射 存储FITS元数据的数据库表模式自动生成 单一FITS文件的入库归档 FITS文件批量入库归档 数据库中元数据表的浏览 数据管理的可视化界面和完整归档管理流程的用户向导 归档文件的过滤器筛选FitHAS Feature (续)元数据记录的冲突检测与处理跳过冲突记录,其他照常导入更新原有记录,其他照常导入 全部清空再导入记录国际化支持 文件归档参数设置 数据库统一配置FitHAS目标屏蔽不同FITS文件的差异向用户提供统一的接口对大量的FITS文件进行快速有效的访问和方便的管理有效满足China-VO对于海量数据存储和访问的需求,同时具有很强的可扩展性FitHAS示例-主界面FitHAS示例-数据库配置FitHAS示例-数据浏览FitHAS示例-数据导入Fit
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【KS5U发布】河南省中原名校2021届高三高考仿真统一考试卷(5月)-数学(文)-扫描版含答案
- 2025年度杭州汽车租赁合同中的租赁押金条款3篇
- 区域内绿色交通解决方案
- 2025年度工程索赔合同属性明确2篇
- 2024年桑日县人民医院高层次卫技人才招聘笔试历年参考题库频考点附带答案
- 实施方案汇编10篇
- 2025年度服务合同:大数据分析与咨询服务协议
- 大学生假期社会实践心得体会【5篇】
- 实体企业金融化对企业创新的影响
- 2021承德市高考英语信息匹配类、阅读类五月选练及答案10
- 【《现金流视角下的绿地集团财务风险防范探究(定量论文)》11000字】
- 小学二年级口算及竖式计算练习题
- DL∕T 681.1-2019 燃煤电厂磨煤机耐磨件技术条件 第1部分:球磨机磨球和衬板(代替DLT 681-2012)
- DB23T 1727-2016 地理标志产品 克东天然苏打水
- 水电站施工合同水电站施工合同(2024版)
- 渭南市白水县2021-2022学年七年级上学期期末考试数学试卷【带答案】
- 2024时事政治必考试题库附答案(满分必刷)
- DZ∕T 0289-2015 区域生态地球化学评价规范(正式版)
- 公司年会小品《老同学显摆大会》台词剧本手稿
- 护士条例课件
- 工程造价毕业设计总结报告
评论
0/150
提交评论