下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、华南理工大学本科毕业设计开题报告一、 选题的背景及意义近四十年来,传统的确定性数据 ( deterministic data)管理技术得到了极大的发展,造就了一个数百亿的数据库产业。数据库技术和系统已经成为信息化社会基础设施建设的重要支撑。在传统数据库的应用中,数据的存在性和精确性均确定无疑。近年来,随着技术的进步和人们对数据采集和处理技术理解的不断深入,不确定性数据 ( uncertain data)得到了广泛的重视。在许多现实的应用中,例如 经济、军事、物流、金融、电信等领域,数据的不确定性普遍存在,不确定性数 据扮演着关键角色。传统的数据管理技术却无法有效管理不确定性数据,这就引 发了学
2、术界和工业界对研发新型的不确定性数据管理技术的兴趣。由于不确定性数据的产生原因比较复杂 (可能是原始数据本身不准确或是采用了粗粒度的数据集合, 也可能是为了满足特殊应用目的或是在处理缺失值、 数据集成过程中而产生的) ,因此,不确定性数据的种类较多,例如关系型数据、半 结构化数据、流数据、移动对象数据等,相应地也出现了许多与数据类型紧密相 关的数据模型。定义与应用场景相匹配的数据模型是不确定性数据管理的首要任务 . 在不确 定性数据管理领域 ,最常用的模型是可能世界模型 (possibleworld model)。该模型 从一个不确定性数据库演化出很多确定的数据库实例 (称为可能世界实例 ),
3、而且 所有实例的概率之和为 1. 不确定性数据的种类较多 ,例如关系型数据、半结构化 数据、流数据、移动对象数据等 ,尽管存在许多与数据类型紧密相关的数据模型 , 但是这些模型最终都可以转化为可能世界模型. 其中,基于xml的不确定性数据建模的研究对象主要是半结构化数据模型。半结构化数据模型 ( semistructured data model)能有效描述缺乏严格模式结构的数据。半结构化数据通常可以用文档树来描述。Dekhtyar等 人 提 出 了 一 种 管 理概 率 半 结 构 化 数 据 (probabilisticsemistructured data)的方法,该方法以关系数据库技术
4、为基础,支持丰富的代数查询。更多的工作则是直接以文档树形式描述不确定性半结构化数据,例如文档模型 ( p2document model)p2、概率树模型,以及 PXML 模型 、Keulen 等人的概率树模型、 PrXML 模型等。二、 工作任务分析 我在小组中的研究部分是不确定性数据的模型。 项目开启后,我的工作与任 务可分解分以下几个部分 1、学习与整理前辈们在不确定性数据方面的研究成果。这项目工作任务主要分三个阶段进行。第一阶段是广泛地收集与了解不确定性数据的相关知识,了解 不确定性数据的轮廓,知道相关的术语、概念,方便以后与别人作相关的交流。第二阶段是有针对性学习与理整理现有的不确定性
5、数据模型方面的理论知识。这 一阶段,要知道各种模型的概念、所针对不同种类的数据、以及它们优势与不足 之处。第三阶段是把精力放在不确定性数据研究的某种数据的模型上。此阶段要 做到对相关的模型在较深入的理解,不单要知道他们的定义、优劣、具体应用情况,还要理解它们在数学上表述、证明。2、对现有的不确定性数据模型提出自己的见解。主要包括以下一系列的活动:1)仔细研究现在模型的优点与不足之处;2)与其它组员(还有指导老师以及相 关的研究人员)交流看法,尤其是向其它组员了解在不确定性数据的存储与查询方面算法知识, 为优化工作提供依据与灵感。3)整理所收集到的不确定性数据模型的资料。三、 调研报告1 不确定
6、性数据与xml 的发展史实际上,针对不确定性数据的研究工作已经有几十年历史了。从二十世纪八 十年代末开始,针对概率数据库( probabilistic database)的研究工作就从未间断, 这类研究工作将不确定性引入到关系数据模型中去,取得较大研究进展。近年来, 针对不确定性数据的研究工作则在更广的范围之内取得更大的进展,即:在更丰 富的数据类型上处理更多种类的查询任务。不确定性数据管理技术的典型框架包 含四大部分:模型定义、预处理与集成、存储与索引、查询分析处理。可扩展标记语言 XML(eXtensible Markup Language)1是一种简单灵活的文本格式的可扩 展标 记语 言
7、, 起源于 SGML(Standard Generalized MarkupLanguage),是 SGML 的一个子集合,也就是SGML 的一个简化版本,非常适合于在 Web 上或者其它多种数据源间进行数据的交换。随着Web 上数据的增多, HTML 的缺点越来越突出。 W3C 的成员认识到,必须有一种方法能够把数据本身 和数据的显示分离开来, 这样 W3C 在 1996 年提出了 XML 的概念。XML不仅保 留了 SGML 的很多优点,而且更加容易操作以及在World Wide Web 环境下实现。1998 年, XML 成了 W3C 的推荐标准。2 不确定性数据的发展方向在传统数据库的
8、应用中,数据的存在性和精确性均确凿无疑。近年来,随着技术的进步和人们对数据采集和处理技术理解的不断深入,不确定性数据( uncertain data)得到广泛的重视。在许多现实的应用中,例如:经济、军事、物流、金融、电信等领域,数据的不确定性普遍存在,不确定性数据扮演关键角色。传统的数据管理技术却无法有效管理不确定性数据,这就引发了学术界和工业界对研发新型的不确定性数据管理技术的兴趣。针对不确定性数据的研究工作则在更广的范围之内取得更大的进展,即:在更丰富的数据类型上处理更多种类的查询任务。四、 方案拟定与分析1、采用由大到小,由浅入深的顺序进行研究。不确定性数据对于我来说,是比较新的东西。要
9、想快速把握一样新的东西,并不断深入, 从整体上了解它的整个框架, 是很重要的。 这样可以防止在研究的过程中迷失方向, 同时,从整体上把握了不确定性数据后, 也可以更方便更有效率地与别人进行交流,更有效地从网络上检索到有用的信息。万丈高楼平地起, 把握不确定性数据的整体, 就是为不确定性数据的模型研究打基础。基础扎实,深入研究阶段才能底气。五、 毕业论文撰写提纲摘要 Abstract 第一章绪论 1.1 不确定性数据的背景 1.2 不确定性数据的管理框架模型定义预处理与集成存储与索引查询分析处理 1.3 不确定性数据的模型 1.4 建模的要求与挑战庞大的可能世界实例集合新出现的维度概率维不确定性
10、数据管理的理论问题 第二章 可能世界模型 2.1 可能世界模型的简介2.2 可能世界模型的举例与说明第三章针对关系型数据的模型3.1Probabilistic ?-table 模型 3.2 Probabilistic or-set table 模型 3.3 Probabilistic or-set-?Table 模型 3.4Probabilisticc-table 模型3.4.1 三个简单的表达系统 3.4.2Probabilistic c-table第四章 针对半结构化数据的模型4.1 p-document 模型4.1.1模型简介 4.1.2 xml 4.1.3 模型定义的相关问题与解决方法
11、4.2 概率树模型模型( probabilistic tree model 4.2.1 模型快照4.2.2 模型的定义4.2.3 模型的不足之处 4.3 PXDB 模型 4.3.1 PXDB 模型引入4.3.2 模型定义 4.3.3 c-formulae4.3.4模型评价 第五章 其它模型5.1针对数据流的模型 5.1.1针对数据流的模型5.1.2 一个常用模型的定义5.1.3相关窗口的分类5.2 针对多维数据的模型5.2.1 关于 OLAP 5.2.2 针对多维数据的模型5.2.3相关模型 第六章 总结6.1内容总结 6.2 展望 参考文献 致谢 六、 实施计划设计总共用时 3 个半月左右。具体安排如下:论文选题,收集资料,并完成开题报告初稿。学习与整理不确定性数据的相关资料。进入不确定性数据模型深入研究阶段,并完成论文初 稿。修改毕业论文整理好材料,装订好论文,进行答辩准备。指导教师意见:签 名:年月日备注:1、要有 10 篇以上相关文章的阅读量。2、理、工科开题报告撰写不少于 2500 字,人文社科开题报
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 城市管理智能化方案
- 商场物业客户服务培训方案
- 测量仪器销售代理合同
- 2024至2030年中国温室无土栽培蔬菜行业投资前景及策略咨询研究报告
- 2024至2030年中国智能卡考勤机数据监测研究报告
- 卫生院麻风病防治工作总结
- 2024至2030年中国公寓电梯数据监测研究报告
- 2024至2030年阴离子交换膜项目投资价值分析报告
- 2024至2030年樟子松元木项目投资价值分析报告
- 2024至2030年养殖机械设备项目投资价值分析报告
- 第三单元名著导读《骆驼祥子》整本书阅读教学设计+2023-2024学年统编版语文七年级下册
- 《第二单元测试卷》(单元练习)-2024-2025学年六年级上册数学北师大版
- 2024年员工向公司借款合同标准版本(六篇)
- DB11T 527-2021 配电室安全管理规范
- 2024-2030年中国铁路电力电气化行业运营动态及市场规模发展预测研究报告
- 《数字身份辩设备》课件+2024-2025学年人教版(2024)初中信息科技七年级全一册
- 文物建筑和博物馆火灾风险指南及检查指引
- 河南省部分学校2024-2025学年高三上学期10月大联考物理试卷(无答案)
- 申请失业保险金承诺书
- 2024年黑龙江龙江森工集团招聘笔试参考题库含答案解析
- 课程思政示范课程—课程思政矩阵图(示例)
评论
0/150
提交评论