网络信息生命力评价的信息价值视角_第1页
网络信息生命力评价的信息价值视角_第2页
网络信息生命力评价的信息价值视角_第3页
网络信息生命力评价的信息价值视角_第4页
网络信息生命力评价的信息价值视角_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络信息生命力评价的信息价值视角

0网络信息生命周期研究网络信息通常是指以数字形式记录、以多媒体形式表达的信息单元。它可以通过计算机网络通信模式进行传输、识别和使用,并在一定时期内稳定接收并访问。根据层次,可分为三种类型:第一类:网络信息本身,包括各种文本、图像、视频、广播等;第二类:网络文献和相关信息,包括各种数据库和数字图书馆。第三类:网络结构单元,如网站、网络、域名等。近年来,它已发展成为一个知识单元,并存在着连接结构。网络信息同传统的文献信息一样存在生命周期,要经历萌芽、增长、成熟、老化直至消亡几个生命阶段,反映了网络信息生命力的衍变过程。武汉大学马费城教授从价值视角研究了网络信息生命周期,以价值视角为基础的网络信息生命周期描述了网络信息的价值在产生之后随着时间推移而不断衰减的情况。张青敏基于系统动力学的网络环境对网络信息生命周期的演变规律进行了研究,该文利用系统动力学建立网络信息生命周期演化模型,利用效用价值的变化轨迹表示网络信息生命周期的演化过程。基于网络信息增长和老化模型来评价网络信息的生命力即是从价值视角来阐述,由于网络信息的特殊性和复杂性,网络信息的增长和老化模型呈现着跟传统文献不同的特点,研究对象是动态的网络信息,研究方法主要是采用链接分析法、数据挖掘法、网络日志分析法等。目前国内外对于网络信息增长和老化的研究方法主要包括两方面,第一,基于网络信息本身和大型网络数据库比如国内的万方、CNKI、维普等的文献进行链接分析;第二,利用搜索引擎比如Google、Alltheweb、Altavista和百度等对网络结构单元和信息单元进行统计和分析。1网络信息存量持续增长量,网络信息利用率降低网络信息增长是指网络信息随着时间推移而不断增长,网络信息总量的快速增加导致单位量的网络信息利用率降低,效用价值减少,从侧面反映了网络信息老化。1.1使用指数增长模型的研究传统的文献增长模型主要有洛特卡模型、LeoEgghe对洛特卡模型的扩展模型,其它的还有线性增长模型、分级滑动指数模型、超越函数模型、舍一布增长模型等。网络信息的增长模型客观地描述了网络信息生命力在一段时间内是如何上升的,主要分为两类,一类是基于传统的文献增长模型发展起来的,对网络信息随时间推延在数量上的变化进行定量描述和统计分析,主要用于描述网络信息本身、网络文献及相关信息和网络结构单元及其之间的链接的增长,研究较为成熟的有指数增长模型等。指数增长模型描述了科学文献与时间之间的函数关系,通过将不同年代的文献量作为因变量,将历史年代作为自变量,描出数据点再练成一条平滑的曲线,得到了一条指数函数曲线,此外还有逻辑增长模型、Gompertz函数模型、Ware模型、跟Ware模型类似的对数模型、乘数扩张模型、二次曲线规律增长模型。另一类是基于网络信息分布模型发展起来的,主要研究网络结构单元和链接结构的增长规律,一般用于描述网络结构单元及其之间的链接数和Web结构的增长,研究较为成熟的有幂定律模型等。幂定律模型是基于优先链接理论发展起来的,描述的是规模和概率的关系。幂定律应用于网络,可以描述网络信息增长机制和节点与链接的增长与分布情况,阐述了结构化的网络中所出现的小世界现象并不是随机路径产生的结果,而是因为网络中存在着高度连通性的节点,正是因为这些节点的存在使得网络的连通性加强,此外还有基于Yule的优先链接理论产生的Yule模型、Web领结模型、由著名的小世界理论演化而来的Web小世界模型、网络拓扑模型等,MikeThelwall的增长模型等。1.2网络结构单元与链接分析增长现象一直是网络计量学的研究热点,国内外学者一直致力于将传统的文献增长模型应用于网络信息的增长研究中。国外学者除了研究网络信息本身和网络文献的增长规律外,研究较为深入的还有利用链接分析等方法探索网络结构单元及其之间的链接关系的增长规律。国内学者则主要是研究网络信息本身和网络文献的增长规律,对于网络信息的结构单元及其之间的链接关系的研究较少。2网络信息老化网络信息老化是指网络信息随着时间的推移逐渐失去效用价值或者效用价值减退的一种现象,导致网络信息老化的因素主要有网络信息的增长、更新、消失、语用衰减等。2.1传统文献老化模型传统文献老化的测度模型有负指数模型、巴尔顿-开普勒模型(B-K模型)、布鲁克斯老化模型、阿弗拉米斯库模型等,传统文献老化模型是否适用于网络文献的老化研究目前还没有统一的定论,基于这些模型对网络文献老化进行实证的论文数量较少,主要是基于负指数模型的研究。2.2网络信息老化测度关于网络信息老化,国外的研究近年来侧重于对网络信息的可访问性研究,主要是对网络节点的链接有效性以及网络文献的引文半衰期和链接衰减率进行统计和分析,上世纪90年代,国外有学者提出“信息存续状态”一词,就是专门用来记录网络链接的持续状态。国内对于网络信息老化的研究目前仍处于起步阶段,最早的文献见于2004年王宏鑫和邱均平的《关于网络信息老化研究的若干问题》,该文探讨了网络信息研究的内容、思路和方法,并提出传统文献老化的测度指标可以应用到网络信息的老化测度中。传统文献的老化测度指标主要包括半衰期、普赖斯指数。段宇锋认为,网络信息的存续状态有别于传统文献信息,其内涵主要包括网络信息更新、网络信息的可取性、网络信息的生存期,其中生存期基于网络信息的载体和URL(统一资源定位符)两方面来考虑,他根据网络信息自身的生命周期和被利用情况两个方面建立衡量网络信息老化的测度指标。网络信息的生命周期可以用半衰期(包括静态半衰期和动态半衰期)和生存期(网络信息的URL持续时间)来衡量,网络信息的被利用情况即价值周期用宏观网络信息半衰期(某主题领域网络信息所含链接的链宿所指资源中较新的一半是在多长时间内产生的)、微观网络信息半衰期(指向该网络信息的全部其他网络信息的二分之一是在其发布后的多长时间内出现的)、普赖斯指数和链接衰减率来衡量。3基于增长和老化模型的网络信息创造力网络信息的增长和老化模型以时间为自变量,探索一段时间内网络信息量的变化情况,用数学方法模拟得到网络信息随时间增长和衰减的函数和曲线,以揭示网络信息价值增加、衰减直至消失整个动态衍变过程的一般规律,很好地从信息价值角度度量了网络信息的生命力,因而利用增长和老化模型来探索网络信息生命力的变化规律也是学界广泛采用的研究方法。3.1在线监测与研究分析网络信息增长从侧面反映了网络信息老化,J.L.Ortega等人的研究也说明了这点,他们从NetCarta.com收录的网站中选取738个网站,于1997年和2004年分别进行纵向研究,指出网络内容的快速增长掩盖了其老化现象,网络信息的增长是以原有内容的消失为代价的。增长至成熟是网络信息生命周期重要的阶段,此时,网络信息的生命力比较旺盛,研究较为普遍,效用价值被充分利用。网络信息呈现出的增长规律直接反映了此阶段网络信息生命力的变化历程。国内应用比较成熟的主要集中在利用网络信息本身和网络文献的增长规律来评价网络信息的生命力。邱均平和殷之明在2005年开展的一项研究中,以PC显卡为主题内容,利用Google检索并统计分析网络主题内容的数量分布和变化情况,得出网络信息内容呈指数增长的规律。兰州大学阎劲松在其硕士论文中做了一项实证研究,探索单一网站网页数量的增长规律,他选取搜狐新闻频道作为数据来源,做了离线检索和在线检索两项工作,离线检索时利用离线浏览软件下载特定时间特定目录的网页,统计网页数量,获得原始数据;在线检索时,使用搜索引擎检索特定时间发布的、符合某种特征的网页,统计网页数量,获取原始数据。经过分析两种数据,发现单一网站的网络信息增长符合逻辑增长模型。夏蓓丽基于Gompertz函数模型研究了Web2.0热点信息的增长与老化特征,以“超女”博文数量为例,其2007年内每月数值受客观时间(超女赛程)的影响,在总决赛时达到峰值,总体符合Gompertz函数模型。2009年,武汉大学苏金燕、周春雷和罗力以知识管理主题领域为例研究网络学术信息的增长规律,利用Altavista为搜索工具获取信息,分别以年份和月份尺度进行增长曲线拟合发现,知识管理主题领域网络学术信息的增长模型为指数增长模型。利用链接分析等方法研究网络结构单元的增长规律来深入探索网络结构的生命力的研究则主要集中在国外。1992年,Egghe和Rao基于20个在线数据库数据集在1968-1987年间的数据累积发现:社会科学与人文类数据的增长符合Gompertz函数模型。Rao另于1999和Seetharam年采用和Egghe相同的方法研究了全球性食品科学文献额增长规律,发现这类文献的增长符合Gompertz函数模型。Bar-Ilan在1997年以疯牛病为例研究了网络新闻组中热点主题的增长情况,他发现新闻组中热点主题的增长机制在一定程度上类似于经典文献计量学中的逻辑增长函数。1999年,Barabási和Albert将优先链接理论应用到网络结构单元的增长研究中,R.Albert发现网页的入链和出链概率随网页中连接数的增长符合幂定律模型,B.Huberman和L.Adamic通过Alexa和Inforseek爬取网站的规模分布数据,发现网站的规模的分布和网站中网页的分布符合幂定律模型,即大多数网站具有很少的网页,而少数网站具有很多网页。2000年,Border等人借助Altavista收集超过2亿个页面和15亿链接发现页面的入链分布服从幂定律。2002年,P.L.Krapivskky和S.Render运用统计物理学方法从网络节点的层面研究网络增长规律,得到网络节点链入数和链出数的变化均呈现明显的指数增长规律。2003年,S.Zhou和R.Mondragón发现网络节点与链接服从度的分布,这种分布符合幂定律模型。同年,H.Jeong、Z.Néda和A.Barabási通过用实证方法研究4种网络结构单元对链接入度的依赖程度验证了优先链接理论的存在。按照该理论,拥有越多链接的网站生命力越旺盛,即越容易被用户点击或者被其它网站链接,比如国内的四大门户网站,新浪、雅虎、搜狐和网易的点击率和出链数就很高,拥有链接少的网站很可能形成信息孤岛。3.2网络信息的总体使用能力和转发能力通过对老化的研究,可以评价网络信息的生命力,老化的越快,生命力越羸弱,老化的越慢,生命力越旺盛,因此常常作为价值视角的网络信息生命周期的代名词。目前国内的应用还不成熟,一般是利用生命周期测度指标如半衰期、生存期和被利用情况测度指标如宏观网络信息半衰期、微观网络信息半衰期、普赖斯指数和链接衰减率来衡量网络信息的老化速度,从而评价网络信息的生命力。华东师范大学张瑞在其硕士论文中利用自行开发的研究程序对全国的信息资源随机抽样以研究共时半衰期,并研究了2005-2007年我国图书情报类期刊的网络引用的可访问情况以测度某个年份网络信息的历时半衰期,实验结果表明我国互联网尚在利用的全部信息中较新的一半是最近的12.42天发表的,2005-2007年的期刊平均历时半衰期为2.27年。2009年,华东师范大学鞠菲做了一项研究,从新浪国内新闻板块本年度的专题报道中随机抽取50条新闻,统计在新闻发布后的每一天的评论数量,连续统计13天,13天后的评论数量归为一类,以评论量代表新闻信息的价值,通过评论量的变化分析网络信息老化的规律。结果显示,网络信息生命半衰期小于一天,评论量随时间呈现负指数变化。国外侧重于通过对网络信息的可访问性动态分析来评价研究对象的生命力,一般是对网络节点的链接有效性以及网络文献的引文半衰期和链接衰减率进行分析。J.Bar-Ilan和B.C.Peritz于1999年最早运用文献计量学分析方法研究了特定主题的网络文档在一段时间内的动态性,他们选取与“信息计量学”主题相关的网页集合为对象,进行一项为期5年的历时研究,分别于1998年、1999年、2002年和2003年对这些网页进行观测并寻找该主题相关的新网页。通过分析变化和消失的比例,就可以发现这个主题网页的变化规律。同年,Koehler以网络上获得额随机普通的URL为研究对象,将网页的访问状态分为三类:一直可访问的网页;间断可访问的网页;不再可访问的网页。Koeheler针对网页不可再访问的情况进行统计,结果显示,1996年12月开始,6个月后有12.2%的网站和20.5%的网页不能被访问到,随着时间推移,可访问性越来越低。2004年,Bar-Yossef等提出了一套行之有效的网络信息生命周期测度措施和算法,并将其应用到搜索引擎、网页维护者和个人用户。关于网络文献的引文衰减研究主要集中在老化测量指标如半衰期、链接衰减率等上,比较不同学科主题的网络文献以及不同形式如域名层次、网页深度等的网络文献的引文半衰期,探讨链接衰减的原因。Dionhoe—LianGoh在2007年对网络信息老化中的链接有效性衰减进行了研究,提取三种权威期刊1997年到2003年的文献的引文,测度链接衰减率和半衰期,结果发现,这些文献的半衰期为5年,31%的引文由于URL发生改变不能再访问,而且域名不同的引文衰减程度不同,比如域名为edu的URL可访问性最低。4网络信息的增长和老化研究是未来的一个研究热点网络信息增长和老化直接反映了网络信息生命力的动态衍变规律,在未来依旧是网络计量学的研究热点。由于网络信息的瞬息万变,要想真正的了解其内在的变化规律,实证研究与规范研究相结合是必要的,而且需要借助图书情报学、传播学、数学统计学、计算机科学等多学科的理论方法进行交叉研究,并且要注意定量研究方法与定性研究方法的结合。根据目前网络信息增长的研究状态,可以判断未来依旧是基于传统的文献增长模型来对网络信息的增长规律进行探讨,并不断地做出论证、修正,以使其更适合网络信息的增长现象。随着中国互联网的发展,网络结构单元、结构单元之间的链接关系以及基于网络结构单元和之间的链接关系形成的Web结构的增长也成为研究热点。基于Web结构,研究对象也会从表层Web信息延伸到深层Web信息,网络节点和链接的增长会日渐受到研究人员

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论