版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、论网站点击次数的正态分析方法奚回 (单位略 陕西 西安 710068)李兴波 (保定金融高等专科学校 河北 保定 071000) (特不讲明:本文是作者为了学习实证分析方法而刻意研究的一个问题,有用意义可能不大,练笔而已,敬请各位专家批判指正。)摘要:现行的网站点击次数分析方法有明显的缺陷,其根源在于没有对点击次数作随机变量考察。本文作了这种考察,并验证了它服从正态分布。正态分布的参数能够关心网站分析其进展状况、与同业比较、制定科学的治理目标、考核职员等多种分析目的。这种以正态分布为基础的分析方法,本文暂称为网站点击次数的正态分析方法。关键词:点击次数;分析方法;正态分布;参数一、网站点击次数
2、现行分析指标的缺陷和本文问题的提出随着我国经济社会的进展,计算机网络的应用已越来越普及,并发挥着越来越重要的媒介作用,因此,如何治理网络也变得越来越重要。对一个网站来讲,点击次数(本文的分析方法,也适用于其他类似于点击次数的现象,如“某论坛某天发表的文章数”)的高低直接阻碍着其经营目标的实现程度,因此各网站总是极尽所能地提高其点击次数,并引入了一些与点击次数有关的分析指标,如最高点击次数、点击次数的不同期比较、点击次数的时刻序列变化、一定期间点击次数的平均值等1。同时,关于点击次数及其他网络流量信息重要性的关注也催生了商业性分析软件的应用,如ITSUN网站流量统计分析系统2。尽管这些指标(含分
3、析软件所用指标)能够在一定程度上反映网站的治理状况,然而就关于点击次数的分析程度来讲,仍存在着明显的缺陷。要紧表现在:1、网站的访问者要紧是网站无法操纵的客户,因此点击次数是随机变量,上下变动频繁,这使现行分析指标的直接依照点击次数绘制的时刻序列图波动剧烈、趋势弱。尽管我们能够作回归分析来反映总体趋势,但回归直线和曲线的代表性都专门差,如图1所示回归直线的R2仅为0.0713,回归曲线的R2仅为0.1。而且回归线也不能提供更为详细的变动信息。图1是依照“晋城在线”网站2005年7月1日至12月31日的点击次数绘制的时刻序列图和回归线图,它讲明了此缺陷的存在:2、最高点击次数是极端值,价值有限。
4、3、各网站客观上需要能够在同业间相互比较的标准指标。4、考察点击次数出现在某个区间的概率(或频率)有助于网站制定科学的治理目标和考核标准。但现行的分析方法没有涉及此分析角度。5、点击次数存在“周周期性”,即点击次数以一周为一个周期上下波动。图2是晋城在线两周的点击次数时刻序列图,它直观地讲明了其点击次数存在周周期性:点击次数存在周周期性的缘故,可能是因为大部分用户访问网站的时刻受其工作时刻的周周期性的阻碍。这种周周期性会阻碍现行考核分析指标结果的正确性或正确程度。下面以晋城在线2005年11月和10月的点击次数对比分析为例,来讲明这种阻碍的显著及剔除这种阻碍的方法:该网站11、10月的点击次数
5、分不为95581509和98024557次,则: 1、不考虑周周期性的阻碍。则11月的日均点击次数为3186050次,10月为3162082次。比较可知,11月的业绩高于10月,因为11月的日均点击次数上升了23968次。但这只是假象。2、考虑周周期性的阻碍。注意到,除4个整周外,10月余周一、六、日3天,11月余周二、三2天。我们已知晋城在线的点击次数明显地存在周周期性,周六、日在低点,周二、三在高点,因此10月的点击次数合计明显受低点阻碍,而11月则受高点阻碍。要剔除这种阻碍,方法是:忽略非整周数据中的周周期性数据,而保留其中的非周周期性数据(幸免将非整周数据中的非周周期性数据也一同忽略掉
6、了),然后将保留的数据并入4周数据中按4周计算日均点击次数。其中,某天(例如周六)的点击次数周周期性数据,确实是各周该天点击次数的期望值(平均值)。这时,11月的日均点击次数为3168104次,10月为3162529次。比较可知,11月的业绩比10月仅微弱上升,因为11月的日均点击次数比10月仅上升了5575次。比较而言,本文认为第二种方法是科学的方法。 上述方法的对比,讲明了点击次数周周期性关于分析结果正确性或正确程度阻碍的显著,而要理解并剔除这种阻碍,则需要对点击次数作随机变量考察。鉴于以上对网站点击次数现行分析指标缺陷的分析,注意到:网站“某一天的点击次数”是随机变量,它服从正态分布(后
7、有实证检验),这使得利用正态分布的参数(,2)对它进行科学考察成为可能。因此,本文就拟从正态分布的角度,对网站点击次数分析方法进行研究,以期能改善现行指标的分析效果,或提出更有效的指标。本文研究所用网站点击次数数据是“晋城在线”网站提供的公开的“晋城在线网站全频道点击次数月报表”(2005.7-12)3。在此,对该网站支持科学研究的实际行动表示感谢。另外,在本文写作过程中,笔者曾查阅了相当数量的文献资料,但未发觉一个与本文研究思路和内容类似或有关的文章,这使笔者的参考与借鉴无从进行,因此文内的不足可能在所难免,谨期能抛砖引玉。二、对“晋城在线”点击次数服从正态分布的实证检验表面上看,点击次数是
8、离散型数据,但因为它取值范围广泛(0至几百万),因此应该把它看作连续型变量进行考察。经笔者检验分析,证明晋城在线的点击次数服从正态分布。表一是依照晋城在线2005年7-12月每天的点击次数样本数据计算的正态分布的分布函数(注意不是密度函数)频率概率对比表(其中为实际点击次数除以10万后的四舍五入): 表1:晋城在线点击次数分布函数频率概率对比表k频率pk%概率pk%k频率pk%概率pk%200.5434782610.0126134813359.782608756.90034414211.0869565220.0446793153470.1086956567.46446235241.630434
9、7830.8184675383577.1739130477.02111367252.1739130431.2738300543687.584.74415642263.8043478263.0878957353790.7608695790.11332948276.521739136.197391933896.1956521793.82972678289.78260869610.378291283997.282608796.070256272911.9565217415.154691624097.8260869697.123889423020.6521739124.414474184198.913
10、0434898.825500833130.4347826134.242960994299.4565217499.393041093247.8260869645.592957924310099.79485127依照该表可绘制分布函数(注意不是密度函数)的频率概率对比图(图3)如下:从图3直观可知,晋城在线点击次数的分布与参数为(32.9,3.522)的正态分布有较好的拟合。另外,还能够用2检验对这一问题(H0:晋城在线点击次数服从参数为(32.9,3.522)的正态分布)进行更准确的检验。检验结果为:依照样本数据计算,得2=40.0343。查2表,得显著性水平为0.005、自由度为21的临界值为
11、41.401。因为2=40.034341.401,因此H0通过了检验,即晋城在线的点击次数服从参数为(32.9,3.522)的正态分布。4三、利用正态分布参数对晋城在线进展状况和内部考核的分析(一)、对网站进展趋势的分析网站治理者首先应正确理解其网站的整体进展趋势,但如前所述,图1的分析不能专门好地提供这方面的信息。因此,客观上需要一种更好的指标来反映点击次数的进展趋势。正态分布的参数是其随机变量的期望值,其含义为均值,能够作为点击次数的代表。在本例中,=32.9;而标准差为3.52,远小于,因此,的变化能够专门好地反映点击次数的进展趋势。下图(图4)是晋城在线点击次数的变化曲线图:从该图能够
12、得到以下信息:1、整体上,晋城在线点击次数呈稳定下降趋势,但最近有回升的迹象。2、在约第25至65日间,点击次数快速上升,并维持在较高的水平。此后,点击次数却一再稳定下降。在约85日附近情况有所改善,但没能逆转。最后10日左右,点击次数有回升的迹象,但幅度不大。上述趋势至少给网站提出了两个研究命题:1、推断点击次数下降的性质,分析缘故。从性质上,能够初步推断下降是系统性的。这讲明晋城在线整体服务质量与市场需求有一定的距离。2、对系统性下降之外的变动进行分析,即对点击次数的3个上涨期作细致的调查分析,为采取逆转措施提供思路。需要讲明的是:查看图5时应忽略起初的几个值或部分值,因为现在数据量太少;
13、图五反映的变化有迟滞现象,实际情况的发生要比图5反映的早几日;依照多个需要,制作多个数据量的图五更有利于分析。(二)对同业间相互比较的分析由于能够作为点击次数的代表,能够反映这种代表性的强弱,因此它们能够用作同业间相互比较的标准指标(数据时期要相同)。同样,能够计算多个进行比较,也能够使用连续的变化曲线图(图5)进行更详细的比较。由于没有其他网站的数据,因此本文不作同业比较的实例分析。(三)对网站制定科学治理目标的分析治理目标分长远目标和近期目标。1、对晋城在线长远目标的分析从图5能够推断其点击次数的下降是系统性的,在外部环境和内部治理没有发生显著改善往常这种趋势可不能改变。外部环境是客观存在
14、,因此应从内部治理着手来延缓或逆转这种趋势。这确实是该网站在可预见的以后的长远目标。为了达此目标,晋城在线应对其网站服务质量进行细致的考察,因为其点击次数的稳步下降与网络进展的总趋势(按几何级数增长5)相反。2、对晋城在线近期目标的分析。从近期(如一个月)来讲,则应以近几期(如近3个月)的数据计算的为依据。具体目标应确定为比略大的某个区域,如+/10,+/5,表述为(+1)。具体略大指大多少,视治理力度的大小决定。(四)对网站内部考核指标的改善科学剔除点击次数周周期性阻碍,能够使剩余的点击次数数据与职员的工作努力程度的相关性进一步提高,使日均点击次数能更好地反映职员的业绩。那个举例前面有,不再
15、重复。另外,一个经营期结束后,实际的点击次数往往与目标不一致,这时就要分析其差异性质(有利差异依旧不利差异)、大小、缘故。服从正态分布的随机变量,其某个具体值落在区间的概率为68.27%,落在2区间的概率为95.45%,落在3区间的概率为99.73%。也确实是讲,假如点击次数落在上述区间则属正常,未落在上述区间则不正常。这为进一步考核职员的工作努力程度提供了分析的依据。四、结语:网站点击次数的正态分析方法要义纵上所述,可总结网站点击次数正态分析方法的要义如下:网站点击次数服从正态分布;那个分布的参数能够关心网站分析其进展状况、与同业比较、制定科学的治理目标、考核职员等多种目的。=要紧参考文献:15 杨坚争、许勤、杨维新.电子商务基础与实务M.西安市:西安电子科技大学出版社,2001.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 纹样课程设计与收获
- 科技创新绘画-20220325075041
- 电气防火检测技术规范-20220519153900
- 网页课程设计之海贼王
- 2024物业保安合同当事人
- 绘画的差异化课程设计
- 2025版工程劳务分包合同税率调整与合同条款修订协议3篇
- 英语双师课程设计
- 二零二五年度公墓墓园绿化资源管理与利用合同3篇
- 会议活动组织策划合同
- 最新MARSI-医用黏胶相关皮肤损伤课件
- 工程开工报审表范本
- 航空小镇主题乐园项目规划设计方案
- 保洁冬季防滑防冻工作措施
- 少儿美术课件-《我的情绪小怪兽》
- 永续债计入权益的必备条件分析
- 预应力钢绞线张拉伸长量计算程序单端(自动版)
- 基坑监测课件ppt版(共155页)
- 蠕变、应力松弛、滞后和内耗讲解
- 开发区开发管理模式及发展要素PPT课件
- 急诊科科主任述职报告范文
评论
0/150
提交评论