上海交通大学IPv6视频网站日志分析报告.doc_第1页
上海交通大学IPv6视频网站日志分析报告.doc_第2页
上海交通大学IPv6视频网站日志分析报告.doc_第3页
上海交通大学IPv6视频网站日志分析报告.doc_第4页
上海交通大学IPv6视频网站日志分析报告.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上海交通大学IPv6视频网站日志分析报告姜开达 沈霆 韩定一2008.5.11.概述(以下简称video6网站)是上海交通大学网络信息中心在下一代互联网CERNET2上建立的视频服务网站,通过IPv6网络向全球提供服务。目前主要提供几十个电视台、电台的网上直播,以及测试性提供少量视频点播内容。该网站广受用户好评,是目前国内IPv6网络上流量最大的网站。考虑到当前IPv6网络资源较少,而该站点电视直播资源丰富,用户群体很大,能够在一定程度上反映出IPv6用户的分布和使用状况。因此我们决定对该站点的Web访问日志进行分析。我们希望通过初步分析达到以下目的:1. 了解网站目前的访问情况。这样有助于我们更全面掌握服务器的使用状况,合理配置视频服务的软硬件系统,更好的为用户提供服务。2. 分析目前IPv6用户的分布状况和接入方式。在当前国内IPv6普及率不高的情况下希望得到用户比较集中的地区分布并进行初步统计分析。2. 原始日志数据 我们在video6网站的Web服务器端启动了日志记录功能,日志记录的格式为: date time s-sitename cs-method cs-uri-stem cs-username c-ip cs-version cs(User-Agent) cs(Referer) sc-status sc-bytes,收集了从 2008年2月26日到2008年3月27日共一个月的日志。这份日志一共涉及到 129,236个不同的IPv6地址,包含2,930,961条原始记录。我们依次采用下列手段过滤了一些对于此次统计分析没有意义的访问记录,包括:1.由于服务器是双栈的,日志中存在来自Baiduspider等搜索引擎和网络扫描产生的少量IPv4地址的访问。因为这些数据不能反映IPv6用户的真实访问情况,我们首先将这些数据剔除在分析数据集之外。这些记录一共 364条,占所有原始记录的0.012%。2.考虑到不是所有用户都会访问video6网站的论坛和网速带宽测试栏目,而这种访问可能会使一个用户产生较多的日志记录,对后来的分析产生干扰。我们也过滤了用户访问这些内容的日志记录。这些记录一共 281,189条,占所有原始记录的9.59%。3.同样是为了避免干扰分析,我们过滤了扩展名是 .zip,.exe 等文件的下载记录。这些记录有20,092条,占所有原始记录的0.686%。4.我们发现日志里对部分目录的GET请求,显示的IPv6地址会以%0结尾,这可能和Web服务器的处理有关。由于这部分IPv6地址在请求其他文件时已经有所反映,并不会影响我们此次的分析,所以可以忽略。这些记录有1,818,846条,占所有原始记录的62.1%。经过这些过滤,最终剩余810,470条访问记录作为此次分析样本,占所有原始记录的27.7%,涉及到 129,236个不同IPv6地址。3. 用户IPv6地址来源和地区分布根据我们目前所掌握的信息,用户的IPv6地址主要来源于4种途径。1. ISATAP隧道方式 ISATAP隧道方式获取的IPv6地址格式为:Prefix(64bit):0:5efe:IPv4ADDR(IPv4ADDR即隧道端点的IPv4源地址,常见形式为a.b.c.d),所以在日志记录中我们很容易发现哪些用户使用ISATAP方式接入。一般说来,如果用户的IPv4地址不发生变化,那么他通过ISATAP隧道方式获取的IPv6地址也不会发生变化。我们经过统计发现存在有34个ISATAP服务器地址,共出现了10,056个不同的IPv6地址,占分析样本所有地址的7.78%。表1. ISATAP服务器活跃程度排名Top20排序.Prefix(64bit):0:5efe提供者 IPv6地址数12001:da8:1005:1111:0:5efe南京农业大学222322001:da8:21c:6ff:0:5efe中国人民大学166932001:da8:207:1:0:5efe北京师范大学145942001:250:2009:400c:0:5efe四川西华大学100452001:da8:c803:85:0:5efe西南大学98462001:da8:200:900e:0:5efe清华大学47272001:da8:c800:b:0:5efe重庆大学40382001:da8:c003:3:0:5efe西北师范大学38592001:da8:8000:3:0:5efe上海交通大学334102001:250:5008:2000:0:5efe江苏工业学院324112001:da8:205:ffff:0:5efe北京交通大学204122001:da8:224:a0d2:0:5efe中国政法大学180132001:da8:224:a0ce:0:5efe中国政法大学94142001:da8:211:2:0:5efe北京林业大学89152001:da8:7007:ffff:0:5efe石油大学44162001:da8:224:a021:0:5efe中国政法大学34172001:da8:224:a037:0:5efe中国政法大学26182001:da8:b8:66:0:5efe同济大学26192001:da8:7007:fffe:0:5efe石油大学25202001:da8:e800:2:0:5efe厦门大学15 从表1中我们可以看出几乎所有ISATAP隧道接入方式都由国内大学或学院提供。分析对应的IPv4地址可以看出这些主要面向校内用户(出现的IPv4地址是内部地址或校内地址),但是也有部分允许校外接入使用。由于在部分学校存在DHCP自动获取IPv4地址的现象,这样同一个用户在不同时间访问video6网站,日志记录到的可能是不同的IPv6地址。这会给我们的分析带来一定程度的偏差,所以并不能说出现地址多的学校用户数一定比地址少的用户多,这仅仅是一个趋势上的大致排名。Top20的ISATAP服务器出现过的IPv6地址总计9994,占全部 ISATAP隧道接入的 99.4%。2. 6to4隧道方式 6to4隧道方式获取的IPv6地址格式为:2002:IPv4ADDR:/48 (IPv4ADDR即隧道端点的IPv4源地址,常见形式为xxxx:xxxx,是由32位IPv4源地址a.b.c.d转化而来的32位16进制表示)。我们统计下来出现过2,815个6to4隧道IPv6地址,占分析样本所有地址的2.2%。我们编写程序对这些地址进行了转换,得到了对应的2773个IPv4地址,再使用网上流行的纯真(CZ88)IP地址库对这些IPv4地址全部做了地域反查然后归类分析,得到结果如下表:表2. 6to4服务活跃程度排名 Top10排序来源IPv4地址数1山东大学12442重庆大学3663中科院3454兰州大学3405网通1206电信1017上海交通大学548教育网直通车299江苏工业学院1110东北大学9 从表2中我们可以看出大学和科研院所还是使用6to4隧道的主力。需要特别说明的是,6to4并非是IPv6的主流接入方式,很多用户可能只是在安装了IPv6协议以后,从微软的隧道服务器自动获取到的IPv6地址。在这张表里排名靠前的学校,安装IPv6协议的用户数相对较多。Top10的6to4活跃用户总计2619,占全部使用6to4隧道接入方式的94.4%。 3. 支持IPv6的Proxy 通过对同一个IPv6地址的出现次数以及用户浏览器代理的关联分析,我们发现了唯一的一个IPv6地址(2001:638:902:1:11),这个地址在所有的日志中出现了30,420次,占3.75%。通过分析来自这个IP的日志,得到了541个不同的User-Agent。如果操作系统和使用的浏览器程序不变,一般用户访问时日志记录的User-Agent是不变的。在我们这次分析的包含129,236个IPv6地址的日志样本中,不重复的User-Agent也只有3292个。那么说明最少有541个用户使用了这个代理服务器(由于不同用户的访问User-Agent信息可能相同,所以实际数目可能远远超过这个数字)来访问video6网站。对这个IPv6地址反解出来的域名为 proxy.ipv6.uni-leipzig.de,是由德国莱比锡大学提供的IPv6 http 和 ftp proxy,这也是在IPv6网络上广泛使用的一个知名代理服务器。4. Native IPv6方式 剩下来的IPv6地址我们认为是Native IPv6接入。这些IPv6地址有116,364个,占分析样本所有地址的90%。我们将这些IPv6地址和对应学校或单位做了区域映射并分类统计,最终得到下表:表3. Native IP 活跃地区排行Top25排序Prefix(48bit):使用者 活跃IP12001:CC0:2020中科院研究生院2431822001:DA8:7000山东大学2347932001:DA8:224中国政法大学2167942001:DA8:216北京工业大学1562252001:DA8:7001山东大学齐鲁软件学院636862001:DA8:215北京邮电大学407872001:DA8:C000兰州大学241682001:DA8:200清华大学226292001:250:217中国传媒大学2007102001:DA8:D800中国科技大学1644112001:DA8:211北京林业大学1385122001:250:1804华南理工大学1378132001:DA8:E000浙江大学1210142001:DA8:207北京师范大学1039152001:DA8:7005济南大学 911162001:250:1401兰州理工大学685172001:256:1003Tnet网591182001:DA8:201北京大学389192001:DA8:C803西南大学380202001:250:2009四川西华大学332212001:250:1999华南理工大学311232001:DA8:1002东南大学281242001:DA8:21C中国人民大学277252001:CC0:201C中科院206可以看出,高校和科研单位是Native IPv6的主要使用者。各学校使用普及情况非常不平衡,Top25的学校或单位使用的IPv6地址数为113,248,占全部Native IPv6接入的97.3%,其他高校IPv6的普及推广情况可想而知,不容乐观。我们通常公认的校园网基础建设比较好的学校,IPv6的使用情况也并没有想象的那么好。但是在部分地区,IPv6还是有相当程度的使用量,这些都值得我们关注和思考。有一点需要特别指出,出于安全性考虑, Windows操作系统里使用自动配置获得的Native IPv6地址会随着时间的增加而自动改变,因此同一用户在不同时间段内访问video6网站,日志里记录的用户IPv6地址可能是不同的。由于我们暂时无法分离出这些重复用户,这给我们的分析带来一定程度的误差。在表3排名靠前的学校里,实际使用的用户并没有列出的IP地址那么多,而只是从一个侧面表明其使用人数和使用频率相对较高。4. 用户浏览器和操作系统分析由于使用IPv6代理的用户无法精确统计其信息,我们过滤了来自Proxy的所有日志记录。因为用户可能会多次访问video6网站,在日志里就会留下不同时段来自同一个用户的访问纪录。为了避免重复统计,因此在下面的分析中,我们认为一个IPv6地址仅代表一个用户,以下内容分析样本中一个IPv6地址只会出现一次。虽然IPv6网络里不存在NAT等因素引起一个IP对应多个用户的现象,但是实际情况存在有一个用户对应多个IPv6地址的情况,所以下面的分析不可避免的存在有一些误差。.4.1 客户端浏览器的统计我们首先对客户端浏览器做了统计,其分布如表4。表 4. 浏览器使用比例图浏览器独立 IP 数 百分比IE 6.07798659.1%IE 7.04590334.8%Firefox 2.062274.7%Opera 9800.74%Firefox 3.04710.36%Firefox 1.0/1.52710.21%IE 8.0890.07%Safari580.04%可以看出绝大部分用户(94.6%)都是使用IE或其内核浏览器来访问video6网站,这也意味着大部分人都选择使用Windows平台。 4.2 客户端操作系统的统计 从日志的User-Agent信息里可以获取用户的操作系统信息,其分布见下表:表5. 操作系统分布比例图操作系统 独立 IP 数 百分比 Windows XP 11989792.7%Windows Vista 90136.97%Linux 1860.14%Windows 2003 1540.12%Windows 2000 610.05%Macintosh 120.009%可以看出,由于Windows XP对IPv6的良好支持,大部分用户都选择了使用这种操作系统来访问video6网站,Vista由于内置了IPv6协议,也有相当部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论