网站访问与先决因素关系的研究_第1页
网站访问与先决因素关系的研究_第2页
网站访问与先决因素关系的研究_第3页
网站访问与先决因素关系的研究_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网站访问与先决因素关系的研究

1web规范化研究模型随着网络暴货的发展,网络泡沫在人们的生活中变得越来越重要。用户在网上是为了获得更有价值的信息、更便宜的产品、以及更好而且廉价的服务,因此一个网站的成功越来越决定于网站的质量。根据许多研究者的理论和实验,DeLoneandMcLean(2003)总结出了一个成功的信息系统(IS)模型。一个网站的许多特性与机制与其他复杂系统是一样的,所以IS研究模型也可以应用到网站研究中。我们着重注意图1红色矩形框中部分。由图1我们提出如下的问题:●系统质量、信息质量与网站访问量之间的关系?●一个容易的、有效的,用于评价系统质量、信息质量与网站访问的客观方法?我们将使用web日志作来网站访问研究的实验数据,它记录了网站的大部分访问情况。在本文我们定义了三个影响网站质量的因素:系统响应时间,链接结构以及内容设计,并设计了一个模型来评测这些要素以及验证我们的假设。2方法论模型2.1网页下的链接比在本文中,我们利用web日志来进行客观评测,其基于以下两个因素:●只那些真正访问这个网站的人才能给出网站最为精确的评估,特别是一些专业网站。●为什么利用日志来评测网站的访问情况是最有效的呢。Web日志是免费的、灵活的,也最便于分析的。一个网站包含成千上万的网页,我们把它们分为两大类型:索引页与内容页。索引页的内容主要是链接,内容页则主要是文学。这儿,我们提出一个新的概念:链接百分比,当一个风页中的链接百分比小于一个阀值时,就被认为是内容页。否则,就是索引页。链接百分比阀值是从行业专家或者专门的研究中获得的。对一个网页p,我们定义它的链接百分比rp如下:rp=mp/Mp,mp:,网页P中的链接的总字数,Mp:网页P的总字数P基本上,用户访问网站就是为了它的内容,其他的都是为了这个服务的。网站的访问情况主要决定于站点内容页的访问。因此,在本文中,我们将通过分析站点的所有内容网页的访问情况来评估网站的访问情况。用户从入口网页到内容网页的的平均点击数常被用来作为判定网站链接结构是否合理的标准。通常,一个网站如果设计的非常高效的话,网页的访问点击数就将近于最短路径。考虑到,在日常访问中,一个用户利用回退按钮再次浏览是很常见的。因此,为了精确的得到平均点击数,在一个会话中,我们只计算那些从入口网页到内容网页第一次访问点击数。2.2根据内容分析,提出两种模型Neilson(2000)建议网站的文本应该尽量短小。一个原因就是从计算机上阅读要比从纸质慢得多,另一个原因是用户不会喜欢滚屏。因此,我们提出第一个假定:假定经1.Tp与Up具有逆向关系。网页中的链接需要清楚的描绘。同时,网站设计者应该把最重要的链接放在入口网页上,以便于用户能更快地找到他所要的信息。假定2.Sp与Up具有逆向关系我们下面一步要考虑的是网页访问的时间。如果一个用户认为一个网页提供了比其他网页更重要的信息,他将会花更多时间仔细越多它。因为不同的内容网页文字量是不同的,而参加每个文字的访问时间将更为恰当。因此,第三个假设是:假定3.RT,p与Up具有正向关系下面跟第二个假定是有相同的原因。Web用户不会愿意进行太多的点击去访问一个内容网页。不同的内容网页在网站可能处在不同的层次,因此提出我们的第四个假定:假定4.Rs,p与Up具有逆向关系根据以上4个假定,我们建立一个如下模型:针对内容网页PUp=C+αTp+βSp+γRT,p+λRs,p+up∀p∈[1,2,...N]Up:网页P的访问量;C:中断;TP:网页P所包含的字数;Sp:从入口网页到内容网页P,所花费的点击次数;UP:出错期;αβγλ:模型中的相关指数;Rt,p:访问内容网页P花费时间/TP;Rs,p:从首页到内容网页P花费时间/Sp.3访问时间和访问频率设定下一步先进行整理.首先,我们从web日志中排除图像网页,如jpg,gif,jpeg以及css。再则,还要排除那些自动网页采集程序“网络蜘蛛”产生的数据。这些蜘蛛程序发送的查询并不代表真实用户的真实请求。在本文中,我们简化处理,对一个会话来说,如果一个网页的平均访问时间低于1秒,我们就认为这个用户是蜘蛛程序,就把它从数据集中排除。再一步要做的是,确定查询记录中有哪些会话。因此,我们设定一个的时间上限,假设任何会话都是在这个时间段内完成。如果在两次访问之间,时间跨度很长,则后一次访问就可能是一次新的访问。这里,我们先设定上限30分钟为一个访问周期。这样会话时间就不可能超过30分钟的阀值。如果在一个会话中,第一个URL请求的时间戳为t1,则仅当t2-t1<30时,带有时间戳t2URL请求才会被分配给这个会话;如果时间戳大于t1+30,则这个请求将会被认为是个新会话中的第一个请求。这里,如果一个用户通过从搜索引擎获得的链接直接访问,这就不能精确地反映网站的结构,将对Tp的值产生影响。所以这里我们只考虑从入口网页开始的会话。4数据分析4.1重量总结数据总共包含了98,267,084条记录。涉及了447,005个用户。具体情况如表2所述:4.2内容网页的单变量通过统计分析,我们得出表3、表4:从以上的回归分析结果,我们可以说Tp,RT.P以及Rs.p在统计上是比较关键的因素。这意味着这三个变量不能为0.它们跟内容网页的访问频率密切相关。但对于独立变量Sp来说,它的重要程度比较低的,它有时间可以为0.进一步,我们可以得出表5的结论。下面我们将对四个变量进行单独分析:●内容网页的文字量与内容网页的访问频率成正向关系。我们的假定被统计分析的结果推翻。这与我们的理解是不一致的。通常都建议简化网页的内容,以方便用户最短的时间内把握网页的要点,但这也影响到这个网页的访问频率。更多文字不仅仅意味着阅读、理解需要花费更多的时间,但也提供了更多的信息。●假定2也被结果所否定。这意味着大量的点击并能影响内容网页的访问,也就说链接结构是无所谓的。一个解释就是用户在访问这个网站之前,他就有他的目的,他不介意到达目标网页需要多少次的点击。对他来说,最重要的事情就是录找到信息。如求职者来网站查找职位信息。●否定了假定1之后,假定3的验证表明了每个文字的访问时间是有影响的,而并不是整个风页的访问时间。这与假定1的否定是一致的。●如果在到达内容网页之前,每个同间网页所花费的时间比较低,则内容网页的访问量将是很高的。反之亦然。它表明用户浏览网站时,对时间是很敏感的。5信息质量的影响在文中,我们研究了网站访问的先决因素,并通过分析信息质量、系统质量与网站访问量的关系,提出了研究结果。测试数据都来自于公达公司网站。总而言之,我们发现信息质量,例如:访问时间、页面的文字量都是与网站的访问量密切相关的。根据我们的研究结果,网站设计人员不能就是简单的考虑如何使web页面短小、简洁。有时候,使用更多文字以把问题描述的更清楚也是非常重要的。对于系统质量来说,我们发现系统响应时间、链接的设计与网站的访问量成逆关系。Web用户通常都关心他们是不是能尽快的找到有用信息。因此,对于网站设计者来说,他们应该尽最大的努力去降低系统下载时间,并且使链接更有效,以降低web用户到达内容网页所花费时间。6内容网页的到这个研究也具有一定的局限性。第一个限制来自于这些客观的、计算机数据记录本身。我们首先必须做一些假设来支持我们的分析,如,假定一个内容网页是每个用户的目标网页。另一限制来自于网站选择。我们所用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论