日志挖掘论文网络日志挖掘和协同过滤算法的研究_第1页
日志挖掘论文网络日志挖掘和协同过滤算法的研究_第2页
日志挖掘论文网络日志挖掘和协同过滤算法的研究_第3页
日志挖掘论文网络日志挖掘和协同过滤算法的研究_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、日志挖掘论文:网络日志挖掘和协同过滤算法的研究【中文摘要】随着互联网技术出现至今不过短短几十年的时间,但是正是在这并不算太长的时间里经历的不断发展,使得互联网技术对每个人的生活都产生了极其深远的影响。相对于传统意义上的网站而言,在二十世纪末二十一世纪初所兴起的Web 2.0技术不仅带来了最新的技术,也致力于将提升用户使用体验作为目标。在这样的动力之下,也带动了各种提升用户的网站使用体验和优化网站结构以及个性化用户访问等等方面的研究。作为实现对北京语言大学Web服务器日志的挖掘来优化该网站的设计,构建以用户为中心的网站,为用户提供个性化的信息服务目标的第一步,本文在充分考虑了北京语言大学Web服

2、务器日志实际情况下,对日志挖掘的工具做了相对应优化和改进工作。本文还详细介绍了日志挖掘预处理中的各个步骤,分析了其中牵涉到的各种预处理算法,并且实现了一个完整的日志挖掘工具。为将来更细致更详尽的日志挖掘工作打下了一个良好的基础。此外,本文还详尽分析了两种传统的协同过滤算法,对比了基于用户相似度的协同过滤算法和基于项目相似度的协同过滤算法在不同相似度公式之下的表现,并且根据这两种算法各自的优缺点,提出了一种新的基于混合相似度的协同过滤算法。分析了这种新的算法在理论上对两种传统算法的优势所在。本文也实现了以上各种算法,并使用MovieLens的数据集对各种算法进行了测试。结果证明,本文所提出来的新

3、的基于混合相似度的协同过滤算法不仅吸收了两种传统算法的优点,同时也在一定程度上对两种传统算法的缺点有改进,在MAE以及召回率等度量指标上都一定程度的提升。【英文摘要】It was only couple of decades since the emergence of Internet, but as the quickly growing of Internet and developing of techniques, Internet has impacted everyones everyday life enormously. Comparing the traditional w

4、ebsite which only offer the users text and multimedia, Web 2.0 developing during late 20th century and 21st century not only brings new technology but only on the purpose of increasing users experience on the website. Under such an endeavor, researches among increasing users experiences, optimizing

5、the structure of website and personalizing users visiting become more and more important.In order to optimize Beijing Language and Culture Universitys web structure, to construct a website suitable for users and to personalize users information services by mining the logs of web servers, this articl

6、e serves as the first step. After thoroughly considering the current situation of Beijing Language and Culture Universitys web log, this article does corresponding optimization and improvement in doing web mining. Also this article depicts the details of every single step of pre-processing of web lo

7、g mining, analysis different pre-processing algorithm involving it. This article also implements a completed web mining tools, as a solid foundation for future web log mining procedures.Besides that, this article also analyses two traditional collaborative filtering algorithms, which are user-based

8、collaborative filtering algorithm and item-based collaborative filtering algorithm. By comparing the advantages and disadvantages of these two algorithms with different way to calculate similarity, this article introduces a new method called mixed-based collaborative filtering algorithm, and depicts

9、 the advantages of the new method to the traditional two. After implementation and tested with the data of MovieLens, the result proves that this new mixed-based collaborative filtering algorithm not only has the advantages of the traditional two methods but also overtake some disadvantages of them. The results also show that on different measurements like MAE and ratio of recal

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论