版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE2WebStats专业网站日志分析系统技术说明书(版本:6.95)北京海市经纬网络技术开发有限公司2010年3月名目TOC\o"1—3”\h\z\uHYPERLINK\l”_Toc258854490”第1章ﻩ系统简介及特点 PAGEREF_Toc258854490\h3HYPERLINK\l"_Toc258854491”1.1ﻩ系统特点ﻩPAGEREF_Toc258854491\h3HYPERLINK\l"_Toc258854492”1.2 与第三方统计对比ﻩPAGEREF_Toc258854492\h4HYPERLINK\l”_Toc258854493"第2章 功能说明 PAGEREF_Toc258854493\h5HYPERLINK\l"_Toc258854494"第3章 系统运行环境ﻩPAGEREF_Toc258854494\h23系统简介及特点WebStats系统是对网站服务器日志文件进行专业统计分析的软件系统,其输出的统计报告清楚美观、图文并茂,详尽地展现了用户访问数据各项统计报表,可以为网站管理人员供应牢靠的决策依据,是大型政府门户网站、新闻类网站、商业网站抱负的流量分析工具。系统特点功能全面:针对网站服务器标准日志或扩展日志记录,本系统给出了最全面的统计分析,分析内容涵盖了目前可统计的全部分析项目,是同类软件中分析统计结果最全面的日志分析系统软件。适用范围广:WebStats网站访问统计分析系统可以分析Apache、IIS、Roxen、WebSphere、Dominonotes、WebLogic、IPlanetApplication、OracleIAS、Tomcat、Jboss、Resin等30多种常见的Web服务器的日志文件,也可以分析邮件服务器和FTP服务器产生的日志文件。适合大访问量网站:本系统计算速度快、占用硬件资源小,可以胜任大访问量网站的日志信息统计。针对服务器集群型网站,本系统专门供应了日志文件合并工具,可以对Cluster进行整体统计或分别统计。跨平台运行:本系统采纳C语言开发底层模块,使用CGI展现统计结果。可以在Windows、Linux、Unix等流行的操作系统上运行.运行环境不需要任何第三方数据库支持。报告展现图文并茂:统计分析结果使用报表和饼图、棒图、地图等形象的方式呈现,并配有对各个指标的简略解释,易于管理人员理解分析.共性化统计:通过各种过滤配置,本系统可以实现共性化统计.如统计来自特定地址(IP)、特定频道、特定文件、特定用户等的访问量。为政府、商业等网站供应特定统计信息。平平稳定:经过5年的进展完善,本系统运行稳定、平安、牢靠.使用简洁、便利:WebStats系统使用便利,经过简洁安装即可使用其供应的标准配置功能。如果要使用共性化统计,系统供应了在线配置工具,可以便利地配置。全自动化运行:本系统含有自动定时运行功能,可以依据设置每天定时运行一次或多次。可以随时在线查看运行结果。数据准时更新:我们将准时更新IP数据库,保证统计结果精准牢靠。与第三方统计对比现在流行的第三方网站流量统计方法是在被统计网站的首页加入一段统计代码,网站访问数据通过代码发送到统计服务网站上,统计服务网站依据收集的信息进行统计。这种第三方统计有明显的缺陷:首先,会把自己网站的最重要的访问信息泄露给具有商业行为的第三方,不利于商业机密的维护;其次,加入第三方代码可能带来注入攻击的风险;最后,这种第三方统计一般只能统计站外信息和首页的访问信息,而不能对站内各频道、文章、文件、用户等进行统计分析。而站内统计往往是改进网站内容和服务最必不行少的信息依据。下表是本系统与第三方统计之间的功能对比:统计项目WebStats网站访问统计分析第三方流量统计按访问时间:按月统计√√按日统计√√按星期分布√√流量按小时分布√√按访问者:接入商√√国家或地区√√中国省区√√城市√√访客IP√√最近访问日期√√鉴别出的用户√无最近访问日期√√搜寻引擎网站的机器人√√蠕虫/病毒攻击√√扫瞄器统计:每次访问所花时间√只对首页(或其它插入代码页)文件类别√无URL网址√无入站处√无出站处√无操作系统√√版本√√扫瞄器√√版本√√屏幕分辨率√√来路链接:来源网址√√由哪些搜寻引擎转介√只对首页(或其它插入代码页)由哪些其他网站转介√只对首页(或其它插入代码页)搜寻√只对首页(或其它插入代码页)用以搜寻的短语√只对首页(或其它插入代码页)用以搜寻的关键词√只对首页(或其它插入代码页)其他:HTTP错误码√无找不到的网页√无格外定制统计:频道访问统计√无特定IP统计√无特定文件统计√无产品统计√无广告统计√无功能说明本统计报告的数据由Web服务器自动产生的log文件统计得来,可以统计扫瞄者的各种真实的访问行为信息,向网站拥有单位供应丰富的网站基础用户访问数据,为网站优化和改进供应决策支持依据.系统每日定时收取Web服务的log文件,并将此累积为月度统计数据文件,用于生成网站统计报告。可选择"报告日期"列出的年和月,以查看当月的统计报告.选择统计日期选择统计日期报告摘要本表是所选择月的网站访问摘要数据。表内栏目的数据项含义如下:访问者(不计重复):本栏目下记录以不同来访者独立IP计算的来访人数.请注意,由于在局域网中可能有众多用户使用一个IP共享上网,这些人只记录了一个独立IP.因此,实际到访人数可能大于此栏目下的数据.访问人次:本栏目下记录访问网站的总人次。如果从相同IP地址来扫瞄本网站,每隔60分钟会增加一个访问人次数。网页数:访问者在统计时间间隔内点击网页的总数量。这里的“网页"定义为以html或(htm,asp,jsp等)结束的文件。文件数:访问者的扫瞄器在统计时间间隔内向网站服务器恳求(下传)的文件数量。文件类型包括:图片、脚本、网页、视频、css等。由于一个网页内可能包含很多图片或其它文件,这个数量比“网页数"要大很多.所以评估网站的访问量时,“网页数”比较精准,“文件数”是一个参考。字节数:访问者在点击网页时,扫瞄器向网站服务器恳求(下传)的文件内容的数据流量,包含网页文件,图片文件,影像文件等。如果此流量特别增加,你必须增加服务器带宽,以保证网站打开速度。扫瞄器流量、非扫瞄器流量:“扫瞄器流量”为访问者点击网页产生的流量,是正常流量;“非扫瞄器流量”为索引擎机器人,蠕虫病毒产生的流量和非正常的HTTP回应产生的流量,这些流量不代表网站的访问量,所以本报告在统计时将去除非扫瞄器流量(专门统计索引擎机器人和蠕虫的表除外)。
按月统计此表为所选择时间的年统计表,是对每月“摘要”表的汇总。没有统计数据的月份将显示为0,本月的数据以黑体字开头显示。报告中把两个重要的指标:访问者和访问人次按月显示在上部的棒图中,可以一目了然地比较出每月网站访问量的变化。
按日统计此表为所选择统计月的每日访问统计表,没有统计数据的日期将显示为0,周末(六、日)以灰底显示,以便观察工作日和周末的区分.本日的数据以黑体字开头显示。报告中把两个重要的指标:访问人次和网页数(点击次数)按日显示在上部的曲线图中,可以一目了然地比较出当月每日的网站访问量的变化。按星期分布此表显示统计月内各星期内每日的平均访问量(计算方式:如本月统计了四个星期一,将四个星期一的数据之和除以四就是周一的平均数),其目的是揭示网站访问量按星期内每天的分布情况,以便观察一周七天的到访量区分.
流量按小时分布此表显示统计月每日24小时中,累积到每个小时的访问量。显示的时间为服务器所在地(中国为GMT+8)的时间,以24小时方式显示(0-23)。本统计表的目的是对比一日中访问量的分布情况。上图显示的网站在工作时间(8-18时)的访问量明显提高。ﻬ国家或地区本表显示来自不同国家的访问者所产生的流量,揭示出网站访问量按国家分布情况,可以清楚地得知网站用户的全球地理分布.系统使用IP-Country数据库进行IP转换。上部的饼图只显示前10国或地区(及其它)所占份额的比重。由于IP地址变化较频繁,为了保证转换的精准性,请定期更新数据库版本。ﻬ中国省区本表显示来自中国各省、自治区、直辖市的访问者所产生的访问量.地图以颜色区分各地区所占访问量份额的比重,清楚地标识出网站在中国各地区的访问分布,让网站管理人员清楚访问者的地理来源。地图的数据是标注的“网页数(点击数)”。由于IP地址变化比较频繁,请准时更新IP—China数据库,以便得到精准的统计数据.ﻬ来访者城市此表显示来自不同国家不同城市的访问者所产生的访问量。使用IP-City数据库进行IP转换(城市的名称为英文)由于IP地址变化较频繁,为了保证转换的精准性,请定期更新数据库.
接入商此表显示中国访问者使用不同互联网接入商(ISP)访问本网站所产生的访问量.右部饼图显示主要接入商所占访问量份额的比重.如果访问量集中在某个ISP(如图中的联通),网站应考虑加大连接此接入商的带宽,以获得更好的用户体验。访客IP本表显示访问者IP地址及其来源明细。对于当月超过1000位不同IP访问者的网站,考虑网页的显示长度,在“全部列出”页中只显示1000条数据,但统计中不会漏掉1000以后的数据。从列表中可以得知每位访问者的最近访问时间、点击的网页数、来自什么地方等简略信息。
鉴别出的用户此表显示使用“用户名"和“密码"登录网站的户名。对于当月超过1000位不同登录用户的网站,考虑网页的显示长度,在“全部列出”页中只显示1000条数据,但1000以后的数据已经进入各项统计.要取得此表的数据,必须建立一个用户名(登录名列表).搜寻引擎网站的机器人此表显示搜寻引擎抓取机器人为了索引网站,到本网站抓取数据所产生的网站流量.由于抓取机器人产生的流量不是正常访问流量,本表列出的搜寻引擎机器人产生的“非扫瞄器”流量并未包含在其他图表中。蠕虫此表显示蠕虫病毒攻击本网站产生的网站流量,0代表没有蠕虫病毒访问。由于蠕虫病毒产生的流量不是正常访问流量,本表列出的蠕虫病毒产生的“非扫瞄器"流量并未包含在其他图表中。所例网站没有受到蠕虫攻击。ﻬ每次访问所花时间此表显示访问者到访本网站所停留的不同时间段。s-秒、mn—分、h-小时,h+为一个小时以上。此表可以反映网站内容对读者的吸引力,访问者在本网站停留的时间愈长,说明本网站的内容愈有吸引力。文件类别此表显示访问者点击网页时产生的不同类型文件的恳求。由于网站包含很多图像文件(gif、jpg等),其它文件数据量较小,所以下载量最大的文件往往是图像文件.
URL网址此表为访问者点击全部网页的地址(URL)明细,每个URL代表一个Html文件。由于URL是网站制作时使用的网页指向地址,表意性较差,不宜阅读,如要了解每个栏目(频道)的访问统计,请参考“频道访问统计表”。当URL大于1000条时,考虑网页的显示长度,在“全部列出”页中只显示1000条数据,但1000以后的数据已经进入各项统计。操作系统此表显示访问者的计算机所使用的操作系统。
扫瞄器此表显示访问者计算机所使用的扫瞄器。网站设计人员可以依据访问者使用扫瞄器的类型和版原来调整网站的兼容性。屏幕分辨率本表显示访问者使用计算机的屏幕分辨率.网站设计人员可以依据本统计数据来确定网页的最佳尺寸和比例.要得到此表数据,必须在首页插入特定的js代码,详见配置说明。
进入网站的方法此表显示访问者进入本网站的方式。本统计可以告知网站管理人员访问者是如何找到并进入本网站的:网址由访问者自行输入或从书签取出:访问者在扫瞄器中自己键入本网地址,或从保藏夹(书签)中点击本网地址进入;来自搜寻引擎:从搜寻引擎通过关键词搜寻找到本网站并点击进入;来自此网站外的其他网页(非搜寻引擎):从其它网站的链接(如友情链接、网址导航等)点击进入本网站.点击“全部列出",可以查看全部链接到本网站的URL明细。
用以搜寻的短语和用以搜寻的关键词
当访问者从搜寻引擎进入本网站时,访问者在搜寻引擎输入的关键词或短语统计.用以搜寻的短语:是访问者在搜寻引擎输入的包括至少一个空格的短句。用以搜寻的关键词:为访问者在搜寻引擎输入的没有空格的短句(词)。保藏及插件安装此表给出访问者在其扫瞄器上安装插件的信息。HTTP错误码此表列出了当访问者点击本网站时,网页不能正常显示而产生的错误。最常见的错误代码为404(网页未找到)。此项错误可能是网站加入了错误链接.403错误代码为有些用户试图访问禁止访问的内容(如黑客进行的攻击性访问)。
频道访问统计本统计给出网站内除首页之外的各频道的不同访问量,可以清楚地反映出哪个频道(栏目)更受读者欢迎.这些数据对改进网站内容供应格外有用的决策信息。
系统运行环境软件环境:Linux环境举例:RedhatLinux9.0Apache2.2Perl5.8Jre1.6Windows环境举例:Windowsserver2003或以上IIS6.0Perl5.8Jre1。6硬件环境:CPU:2G或以上RAM:2G或以上HD:30G(系统运行),数据存储视数据量定。ﻬ北京海市经纬网络技术开发有限公司简介:北京海市经纬网络技术开发有限公司(简称:海市公司)是国内技术领先的网站内容管理系统供应商,为政府、媒体、企业全方位供应最专业的门户网站建设方案。海市公司创立于2003年,注册资本1000万人民币,是北京市双软认证企业、北京中关村高新技术企业、海淀区创新企业,已获得ISO9001:2000质量管理体系认证.创业之初,海市人将目光锁定在国际先进的第三代网站建设技术--网站内容管理系统(WCM系统)的研发上,抱定一个信念:“做中国最好的网站内容管理系统"。数载磨砺,历经八次重大改版,现已定型的WCM8。0版拥有:大型网站群的支撑平台、超大流量的负载均衡、完善的平安
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 借款低压房屋合同
- 房屋租赁合同无瑕疵
- 2023年云南省楚雄天立学校教师招聘考试真题
- jsp课程设计农产品
- java课程设计源代码24点
- c课程设计特殊数据输出
- 文员实习总结(11篇)
- PLC艺术灯的课课程设计
- 房产转让合同(设立店铺)(34篇)
- javaweb数据库课程设计个人
- 国开作业《公共关系学》实训项目1:公关三要素分析(六选一)参考552
- 肺功能进修总结汇报
- 中国航天发展历史
- 《燃烧性能测试》课件-第二节 氧指数测试
- DB32/T 4446-2023 公共机构能源托管规程
- 初中英语名词单复数专项训练题目
- 面神经微血管减压术护理
- 2.贵州省地方标准项目申报书
- “读思达”教学法在整本书阅读教学中的实践
- 盐酸右美托咪定鼻喷雾剂-临床用药解读
- HSK 2标准教程(完整版)
评论
0/150
提交评论