版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、浅谈数据挖掘在图书管理方面应用【摘要】本文以数据挖掘的定义出发,对数据挖掘的功 能及分类进行简要的概述,最终探讨了数据挖掘技术在图书 馆管理以及读者服务这两方面的应用,希望给我们图书员的 工作起到一定的指导效果。【关键词】数据挖掘;图书管理0.引言随着社会的发展,图书管理工作相对于以往面临着更大 的难题,比如海量的数据、个性化需求等。在这种背景下, 数据挖掘技术在解决这些问题的过程中具有非常大的优势, 因此,本文关于数据挖掘在图书管理方面运用有着很强的实 践意义。1数据挖掘定义数据挖掘的英文全称为data mining,被我们简称为dm, 主要是指从数据库中抽取具备潜在应用价值、以前未知、隐
2、含信息的过程,主要用途是为决策者提供数据之间的关联, 找寻被忽视的因素,因此,能够对我们的预测及决策行为起 到很强的促进效果。在数据挖掘技术中,一个相关性非常强的概念为知识发 现,这是指在信息背景下从很多数据中找出有效的、新颖的、 可信的模式的处理过程,其主要的应用对象为vld13,目标是 发现数据库中规律性的知识。可以说,数据挖掘属于一种特 定的知识发现,也是知识发现过程中最为重要的一部分。2数据挖掘的分类数据具有多种多样的表现形式,因此,我们可以以研究 对象数据结构的形式对数据挖掘进行划分,具体来说,数据 挖掘可以分为数据挖掘、文本数据挖掘以及web数据挖掘这 三类。首先,数据挖掘。这一类
3、的数据挖掘对象主要是结构化 数据,比如在包括sql server qracle informix在内的一 些数据库中可以应用这一类数据挖掘。其次,web数据挖掘。在广义上说,这一类数据挖掘可 以看做是从互联网中发现及分析有用的信息,具体来说,其 定义具有两种意义:web内容挖掘,这是从数量极大的在线 数据库及web站点中对信息、资料进行搜索及获取;web使 用挖掘,在这个过程中将建立并分析读者所访问站点及服务 的模型。一般情况下,在web挖掘过程中所使用的工具主要 有:speed tracer 以及 web log miner 等。第三,用户挖掘。在数字图书馆中,用户挖掘主要是通 过对用户访问
4、图书馆留下的记录进行分析,进而对用户访问 模式及挖掘,最终为网站的经营及管理提供决策服务。这类 数据挖掘主要又可以分为访问模式的追踪以及个性化使用 记录的追踪这两类。3. 数据挖掘的功能数据挖掘技术不但能够帮助我们查询及遍历过去的数 据,还可以预测将来趋势及行为,并对以前没有发现的模式 进行自动探索,进而提升我们决策的可靠性。总结起来其功 能可以分为以下几个方面:首先,关联分析,在数据库中,如果一些能够被发现的、 重要的两个或者多个变量之间存在着一种规律性的取值则 可以认为它们之间存在着关联。我们进行关联分析的主要作 用是探寻出数据库里的隐藏关联网。其次,聚类。所谓聚类主要是指数据库中的记录能
5、够被 划为一系列具有意义的子集。这一技术包含了传统模式识别 方法数学分类学。它能够提升我们认识客观事实的效率,属 于偏差分析以及概念描述的基础和前提。第三,概念描述。这主要是描述某对象的内涵,并对其 中的有关特征进行概括,它包括区别性描述以及特征性描 述,在生成区别性描述的过程中主要的方法有遗传算法、决 策树算法等,而生成特征性描述的过程中则只会对所有对象 的共性进行涉及。最后,偏差检测。在数据库中,数据往往会存在异常记 录,对于这些偏差进行检测具有很强的意义。偏差中存在很 多潜在知识,举例来说,分类过程中的反常实例、不符合规 则特例、模型预测及观测结果的偏差等。4. 图书管理中数据挖掘技术的
6、应用4.1应用于图书馆的管理图书馆的管理是图书管理的前提和基础,在图书管理 中,数据挖掘技术主要起到以下作用:首先,数据挖掘技术能够为图书馆更好的发展提供定 位。在图书馆经营的过程中,服务现实需求以及客观条件制 约都是不可避免的,做好自身发展定位极为重要。因此我们 要对面向服务群及自身的潜在资源产生足够的了解,而通过 数据挖掘技术则可以帮助我们提升规划结果的科学性。其次,图书馆的经营过程中,人才是至关重要的,而所 谓人才无外乎专业水平、思想道德、现代化信息技术水平等。 因此,我们可以在收集相关文献的基础上,从中建立一个可 执行、可调整以及可预测的模型,为人才的规划提供科学依 据。第三,文献管理
7、归根结底属于知识管理,而知识管理又 是从数据中对有效知识进行管理的过程,数据挖掘技术作为 从数据库中抽取未知、隐含、具有潜在价值信息的过程,二 者两虽有区别,但具有更大的一致性。因此,文献信息管理 是可以利用数据挖掘技术来发现及解决问题的。尤其在当前 的环境下,资金比较受限制,如何做好各学科的分配更是非 常重要。4. 2应用于读者服务(1) 为读者起到导读的作用。在图书馆中,读者导读 一直属于一项工作重点。当前属于数字化时代,信息资源无 论在数量上,还是在速度和来源上,相对以往都有很大的不 同,这就导致我们读者容易产生信息过剩反而无从下手的感 觉。因此,导读工作的重要性不言而喻。具体来说,分类
8、技 术能够对数量庞大的信息资源进行分类;聚类技术则可以对 杂乱无序的信息进行归类,进而给其标引或者建立一个相应 数据库,这能够帮助信息用户群的不同信息需求。举例来说, 我们可以以用户角度出发,对用户在何种情况下需要何种信 息解决何种问题进行了解,也就是对用户信息需求进行全面 的了解,进而确定信息使用模式,然后设计更为有效地信息 服务系统。此外,在读者检索的过程中,传统的信息数据库定题情 报服务当前存在着很大的难题,对于一些排列不规范或者无 序的电子信息要要在不同平台上操作,效率很多。而通过数 据挖掘技术能够对各种数据进行整合,把不同平台电子版信 息及纸质图书利用四种规则建立一恶搞统一平台,这能
9、够极 大地提升检索效率。(2) 服务竞争情报。当前随着市场化的加剧,图书馆 服务更为重视经济及社会效益,使得不论是高校科研教育服 务,还是企业服务,竞争性都成为了一个重要的课题。在这 种背景下,数据挖掘技术可以对竞争情报起到服务的作用, 这方面的研究成果主要有专题情报价值数据挖掘、面向集成 竞争情报系统数据挖掘等,可以说已经获得了较为广泛的应 用。(3) 提供个性化web服务。所谓web个性化,主要是 通过web数据对网站的信息及服务进行调节,进而满足不同 客户的不同需求。在这一过程中,我们主要的过程是对服务 器中保存的访问日志数据、代理日志数据以及引用日志数据 进行收集,然后利用模型化算法或者一些其他信息处理技术 对这些数据进行加工,获取我们所需要的决策信息,最终以 此为基础建设特殊数字资源以及网络虚拟资源,实现web个 性化服务。5. 结语在图书管理中,数据挖掘技术将来必然会有有着更为广 泛的应用,这些应用将体现在资源建设、读者服务以及决策 管理等各个方面。因此,对于我们图书馆员来说,要加强自 身在这方面的水平,不仅要对一些基本技能进行掌握,平时 工作中还要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年环保服务合同标的与环境改善要求
- 2024版吊车拆装服务合同2篇
- 劳务发放协议书(2篇)
- 动漫形象内容授权合同(2篇)
- 2024版大数据中心建设运营合同
- 2024年设备租赁及安装协议
- 2024年高低压配电线路维修及施工承包合同
- 2024年矿产开采用地股权转让与资源开发合同3篇
- 2025年春季泉州市市属卫生事业单位公拟聘用人员历年高频重点提升(共500题)附带答案详解
- 2025年新疆艺术学院高层次人才招考聘用高频重点提升(共500题)附带答案详解
- 重点关爱学生帮扶活动记录表
- 2021年10月自考00850广告设计基础试题及答案含解析
- 结构化面试表格
- 地热能资源的潜力及在能源领域中的应用前景
- 2023版:美国眼科学会青光眼治疗指南(全文)
- 家长会课件:小学寒假家长会课件
- 变刚度单孔手术机器人系统设计方法及主从控制策略
- 儿童室外游戏机创业计划书
- 2024年浙江宁波永耀供电服务有限公司招聘笔试参考题库含答案解析
- 温州食堂承包策划方案
- 40篇英语短文搞定高考3500个单词(全部)
评论
0/150
提交评论