第五讲: Web点击流分析模型_第1页
第五讲: Web点击流分析模型_第2页
第五讲: Web点击流分析模型_第3页
第五讲: Web点击流分析模型_第4页
第五讲: Web点击流分析模型_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四讲: Web点击流分析模型主讲:梁满发Web点击流分析Web点击流分析就是通过分析那些访问过的网页的有序数据,预测访问者对WWW站点的访问行为。分析的目的是揭示如何通过Web点击流认识到用户对一个站点最可能的浏览路径,也能求得客户浏览某个特定网页的概率,预测某时间进入网站或离开网站的概率,分析客户浏览某类网页的行为。这些知识可以用来网站在线预测,网页组织设计,电子商务营销宣传等工作。工作目标()了解客户访问网页模式,即各类页网访问频率,链接频率;()分析网页关联和链接关联,分析各类页相近性;()访客访问网页链接秩序,即行为模式;()寻找某网页之间的链接路径。认识数据我们以某个网站服务器记录

2、下某段时间客户访问网站的日志数据为分析对象,文件名为SAMPSIO.WEBPATH ,它含有四个变量信息:REFERRER 访问网页信息。SESSION_ID 客户标识。REQUESTED_FILE 访问过程中要提交的信息。SESSION_SEQUENCE 访问的次序。REFERRER变量频数表这个变量是服务记录下访客访问网页的记录。从表中看出,有232个缺损值(标记),这个缺损值可能是服务器记录错误,因此,数据要过滤掉它。SESSION_ID变量频数表此变量记录了访客访问的时间。没有缺损值。REQUESTED_FILE变量频数表REQUESTED_FILE 表示在访问网页过程被要求提交信息。

3、SESSION_SEQUENCE变量频数表设置变量角色首先,我们进行日志文件分析。从REQUESTED_FILE变量中提取访问网页的信息。因此,我们把 SESSION_ID 变量设置为ID角色,REQUESTED_FILE 变量为 Target角色,其它的为Rejected角色。增加 Input Data Source 节点 到工作窗to the diagram workspace.设 SAMPSIO.WEBPATH 为源数据.分配 SESSION_ID 为ID角色.分配 REQUESTED_FILE 为Target 角色.分配 REFFERER 和 SESSION_SEQUENCE 为Rej

4、ected 角色.采集点击流信息增加 Link Analysis 节点.打开 Link Analysis 节点, 选择 Tools Settings. 点击 Post Processing.关闭Detailed Settings 窗 和 Link Analysis 节点. 保存修改.右击 Link Analysis 节点, 选择 Run.选择 results.MDS分析注意:没有链接方向在圈中的页面可认为是同类的,即目标访问相近链接次序分析为了分析访客访问网页秩序行为,则要增加网页链接秩序的变量,因此,u分配 SESSION_ID 为ID角色,.u分配 REQUESTED_FILE 为Targ

5、et 角色u分配 SESSION_SEQUENCE 为Sequence 角色.u分配 REFFERER 为Rejected 角色l增加Link Analysis节点.l打开 Link Analysis, 选择 Tools Settings. l点击 Transactions ,并将 Minimum Count 值设置为1l点击Post Processing ,在Nodes: separate prefix from value下下, 将 Number of delimiters 从 0 改为10。l保存修改l选择运行l观察结果节点数从30个增加到67个客户点击导航模式显示网页之间的移动模式显示

6、访问路径u点击Transactions ,并 将Sequences 栏中的 Minimum Count 值设为 1.u设置 Keep very long sequences 为“ No”.u设置 Retain path positions 为“ Yes”. u点击Post Processing,在 Nodes: separate prefix from value内内, 将 Number of delimiters 从0 改为 10. u运行u浏览结果选择Detailed Results. 移去All.增加All在 Layout窗中, Technique 选择Tree ,点击 在在 方向选择 polar ,点击 OK. u右击工作窗,从弹出的菜单中选择Display,再点击,再点击 Links 栏. 在 Direction 域中, direction 设为_null_.u在 Mode 栏中, 选择 Enhanceu设 Batch Size 为 1024 。 u点击OK ,关闭.寻找详细的导航路径右击选择Path 菜单. 在 Find Paths窗中, 点击 Source Nodes , 选择增加Text 在Sourc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论