




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于数据挖掘的红楼梦 作者考证,指导老师: 学生姓名: 答辩时间:2009年6月9日,答辩内容,课题背景及意义 研究动态 数据挖掘流程 经典聚类算法 实验过程 结果分析 总结与展望,课题背景与意义,红学研究国际化、现代化 红楼梦用词的偶然性与客观规律 数据挖掘提取客观规律 意义 现代方法探索古代文学 加深对红楼梦的认识、理解,研究动态,国际上: 现代化“国际红学资料中心” 深圳大学:红楼梦多功能计算机自动 检索系统 复旦大学李贤平教授 :红楼梦成书新说,数据挖掘系统图,数据挖掘流程,数据挖掘(data mining,简称dm ):数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 主要内容 数据选择 数据预处理,经典聚类算法,聚类:把一组个体按照相似性划分成若干个 类别 聚类算法 k-means算法 分层聚类法 采用估算最大值法 ,k-means算法,思想:相邻两次的聚类中心没有任何变化,数据对象调整结束 。 特点 相对易实现 时空效率高 应用广泛,k-means算法(续),流程步骤 从 n个数据对象任选 k 个作为初始聚类中心 循环3到5直到每个聚类不再发生变化为止 计算每个对象与中心对象的距离 根据最小距离重新划分 重新计算中心对象 实现代码,实验过程,数据选择 原则:与文章内容关系小 所选字词:虚词(之,其, 或,亦 ), 转折词(而,虽,然,但 ) 实现:字频统计程序,实验过程(续1),数据预处理 数据归一化:范围01 归一化公式:,实验过程(续2),数据分析 k的取值从1到10 对所取k值运行k-means程序 分别得出运行结果,结果分析,对所取k得到的结果进行分析 确定最终的聚类结果 图示该结果(还没弄出来),总结与展望,完成用数据挖掘方法考证红楼梦作者 在前人研究
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024新教材高中政治 第一单元 生产资料所有制与经济体制 第一课 我国的生产资料所有制 1.2坚持两个毫不动摇教学设计 部编版必修2
- 企业报告与展示方案
- 2024年秋八年级物理上册 第五章 第5节 显微镜和望远镜教学设计 (新版)新人教版
- 3古诗三首《迢迢牵牛星》(教学设计)2023-2024学年统编版语文六年级下册
- 人才中介协议书6篇
- 1 古诗三首 村晚教学设计-2023-2024学年五年级下册语文统编版
- 七年级生物下册 第四单元 生物圈中的人 第一章 人的由来 4.1.2 人的生殖教学设计 新人教版
- 2023三年级数学上册 四 走进新农村-位置与变换 信息窗2 平移和旋转第1课时教学设计 青岛版六三制
- 2024秋八年级英语上册 Unit 5 Do you want to watch a game show Section B (2a-2e)教学设计(新版)人教新目标版
- 原物料管理与生产管理第二章
- 西师版数学四年级下册全册教案
- 应急柜检查表
- (完整版)湘教版地理必修一知识点总结
- 顾洁Storytime
- (完整版)叉车孔设计标准
- 四方公司机组扭振监测、控制和保护新技术-
- 冷冻机的制冷效率与运行电费
- 装配式公路钢桥使用手册(word)
- 新标准大学英语(第二版)视听说教程2答案
- 玻璃瓶罐的缺陷产生原因及解决方法
- 206前列腺穿刺活检临床路径
评论
0/150
提交评论