下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 移动环境下特色数据资源个性化推送系统的构建方法 张安磊摘 要:绍了在移动环境下数据资源个性化推送系统的构建方法。该系统通过对用户的反馈意见、用户的浏览记录、每篇文章的评分和下载量统计以及用户对每篇文章打上的标签等综合考虑并给定一个评分值,然后通过加权二部图算法,最终实现对特色数据资源的个性化推送。关键词:个性化推送技术;特色数据资源;移动环境;加权二部图中图分类号:tp311.52特色数据库是图书馆在充分利用自己的馆藏特色基础上建立起来的一种具有本馆特色的可供共享的文献信息数据库1。它重点关注某一领域,并尽可能地将该领域内的有价值的信息收录进来,体现了数据库的专题性和独特性2。2009年,学
2、校针对贵州省经济社会发展需要开展综合性学科科学研究等方面有所突破,重点开展山地经济、生态经济、反贫困问题研究等领域的研究,提升学校在省内外和国家层面上的科技竞争力。虽然特色数据库的信息量相对有限,但是其中有价值的数据仍然相当多,因此,我们迫切希望找到一种能够在信息海洋中自动获取实用、准确、精炼和优质的方法。而利用个性化信息推送技术在移动网络环境下开展信息推送服务无疑是一种最好的选择。1 系统概述本系统首先进行数据拉取,即用户注册时收集用户的身份,专业,研究方向,感兴趣的内容等个人信息,然后通过在学者查找资源过程中根据查看记录适时地进行数据推送,并且以后再定期的将新的符合条件的资源信息进行数据推
3、送(数据推送即主动将学校特色数据库中学者可能感兴趣的论文,书籍,视频等信息通过该系统传送到用户的手机中)根据用户的反馈意见、用户的浏览记录、每篇文章的评分和下载量统计以及用户对每篇文章打上的标签等信息来建立用户的兴趣模型,而在这个推送过程中,该系统还能根据学者对手机情景模式的设置来决定是立即还是延迟提示学者对这些推送信息进行查看。2 技术要点2.1 分众分类法它是互联网时代的一个创造词,表示一种由非专业信息人员创造的分类法,分众分类法与传统结构严谨的金字塔式的文献分类法和信息分类法不同,它强调的是一种自下而上的、社会性的、用户共同创造的、自由的分类法。分众分类法就是由用户将自己感兴趣的信息加以
4、组织整理,自由选择关键词为信息贴加标签,具有强烈的个人背景特色。2.2 手机的个性化推送(1)web数据挖掘web数据挖掘从表征web的超链接结构、网页内容和使用日志中探寻有用的信息。虽然web挖掘使用了许多数据挖掘技术,但是它不仅仅是传统数据挖掘的一个简单应用。在过去20年中,许多新的挖掘人物和算法相继发明。依据在挖掘过程中使用的数据类别,web挖掘人物可以被划分为三种主要类型:web结构挖掘、web内容挖掘和web使用挖掘。web结构挖掘:web结构挖掘从表征web结构的超链接中寻找有用的知识。web内容挖掘:web内容挖掘从网页内容中抽取有用的信息和知识。web使用挖掘:web使用挖掘从
5、记录每位用户点击情况的使用日志中挖掘用户的访问模式。这项任务也使用了许多数据挖掘算法。其中一项重要的议题是点击流数据的预处理,以便生成可以用来挖掘的合适数据。web数据挖掘过程和数据挖掘过程十分相似,区别通常只是数据收集。在传统数据挖掘中,这些数据经常是收集并存储在数据仓库中的。而对于web挖掘而言,数据收集是一项艰巨的任务,尤其是进行web结构挖掘和内容挖掘的时候,需要爬取大量的网页。(2)移动环境下的个性化推送它是指服务器根据用户需求定向将信息实时送达手机的服务。当有信息需要发送到手机时,它通过手机与服务器的网络连接将信息发送给用户,而这些信息,则是使用web数据挖掘中的相应算法整理出来的
6、。在本系统中,为了进一步发挥特色数据库的科研作用,让系统中的数据挖掘算法能够针对不同的用户及时推送他们需要的文献、书籍、视频,我们可以充分发挥出移动环境特有的便捷性,及时性等优势,使用户通过手机能够及时收到这些推送信息。(3)基于加权二部图的推荐算法二部图是一种特殊的网络,它包含两类结点,一类是用户结点;另一类是项目结点,例如论文、特色数据资源等信息资源3。而加权二部图是在二部图的基础上衍伸而来的,它考虑用户-项目之间的权重,首先,项目将资源按照项目用户之间的边权与该项目边权之和的比分配给用户,然后按照同样的方式按照用户项目边权与该用户边权之和的比例将资源返回给项目。3 本系统的特点以及解决的
7、关键问题3.1 本系统的特点(1)将推送技术和传统的拉取技术结合。采用数据挖掘的方法和技术,从拉取到的信息中提取有用的知识,发现隐藏在大量数据中的内在规律,从而可以根据数据挖掘的结果向对学者有针对性地、及时地主动的推送信息。(2)使用分众分类法和其他与数据信息资源相关的属性(如:时效性,研究方向等)对其进行分类,该方法是向用户提供一种协同构建与共享各自网络资源标签的开放式平台,通过用户自己制定分类标准和提交资源标签来实现,最后,由用户群体定义的频率来确定资源的类别。(3)现有的基于“山地经济、生态经济、反贫困问题研究”领域特色数据库只将资源分类为下列四种:山地经济,经济史,反贫困问题,生态经济
8、。故首先对资源根据学者评分,专业方向等进行进一步细粒度的划分。然后研究该特色数据库的注册用户,并将他们的身份,喜好,研究内容,上网习惯,用户评分等重要指标一一调查并列举,然后进行评分,这样能将用户进行进一步细分,选择一个合适的开发平台并构造适合该数据库的个性化推送的算法。3.2 系统所解决的关键的问题(1)确定用户的关键需求信息,这些需求信息能为学者的个性化信息推送提供参考依据。我们主要采用调研的方式,对本系统的潜在用户进行实地问卷调查,最后根据对用户的调研结果来设计本系统的用户注册信息。(2)需要最大程度的为用户推送他们想要的,感兴趣的资源,并且在保证个性化推送准确性的前提下,合理推送一定数
9、量的资源。本系统通过对用户信息以及用户对资源的操作信息的拉取,采用加权二部图的个性化推送算法,构建“用户特色数据资源”二部图。其中,用户信息主要是用户的注册信息,用户对资源的操作信息主要是用户的反馈意见、用户的浏览记录、每篇文章的评分和下载量统计以及用户对每篇文章打的标签。(3)建立学者兴趣的动态模型。在学者定制好一个自己的描述文件之后,系统必须根据学习的信息源分析当前学者的行为,从而调整学者兴趣的权重或者调整学者兴趣层次结构。根据学习的信息源,学者跟踪的方法分为两种:显式跟踪和隐式跟踪。显式跟踪是指系统要求学者对推荐的资源进行反馈和评价, 从而达到学习的目的。隐式跟踪不要求学者提供什么信息, 所有的跟踪都由系统自动完成。4 结束语本文利用数据挖掘中分类的思想和加权二部图的推荐算法提出了一种移动环境下特色数据资源个性化推送系统的构建方法。目前,贵州省大部分高校都建设了符合自己图书馆馆藏的特色数据库,但是,这些学校的图书馆都没有针对移动环境建立个性化的资源信息推送系统。手机使用方便灵活快捷的特性和信息推送的主动性和个性化的特点4,决定了在移动环境下建立资源的信息推送系统是非常有必要的5。参考文献1李育嫦.国内学科信息门户发展现状分析j.情报科学,2008(6).2刘竟.面向概念检索的农史信息门户的设
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《标准理解与实施》课件
- 《盾构施工测量培训》课件
- 《员工安全教育讲义》课件
- 《测序技术介绍》课件
- 单位管理制度集合大全职工管理篇
- 单位管理制度集粹选集员工管理篇十篇
- 单位管理制度汇编大全职工管理篇
- 单位管理制度合并汇编【职员管理篇】
- 《客服分析报告会》课件
- 单位管理制度分享合集【人力资源管理】十篇
- DZ/T 0462.1-2023 矿产资源“三率”指标要求 第1部分:煤(正式版)
- DLT 265-2012 变压器有载分接开关现场试验导则
- 手术室护理年终总结
- 职业生涯规划班会课教案设计
- 微观经济学(对外经济贸易大学)智慧树知到期末考试答案2024年
- (正式版)HGT 6277-2024 甲醇制烯烃(MTO)级甲醇
- 注射用更昔洛韦的临床疗效研究
- 2023年1月广东省自考00634广告策划试题及答案含解析
- 中国绿色建筑现状与未来展望
- 河南省洛阳市2023-2024学年高二上学期期末考试英语试题(解析版)
- 超声检查医疗纠纷的防范培训课件
评论
0/150
提交评论