



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、信息管理学整理-邱振东、事物存在的方式和运动状态1 的表现形式,这指的是主体所感知或表述的事物存在的方式和运动状态,这指的是信息链( Information Chain)中最高级别的环节是信息分布的“富集”和“贫集”现象实际上是人类社会特有的信息分布中的“核心趋势”和“集中取向”有什么不同?布拉德福定律有两个基本要点:一是、 2、 3、 45、核心趋势如高产作者群体的形成、期刊信息密度增大、高频词汇的确立等都是信息生产主体的主动期望与采取实际步骤的结果。集中取向则不同,是社会选择和影响的结果,信息生产者基本处于被动状态。核心趋势和集中取向的效果是一致的,仅仅是累积的程度不一样。前者是相乘的累积
2、,后者是相加的累积;前者是主动的选择,后者是被动的接受;前者称为自增生的过程,后者倾向大变量分布过程。、6录;二是确定相关论文在主体来源中的分布规律。7、分析影响文献增长的因素1、不同的学科发展态势2、学科发展的不同阶段本体层次的信息认识 层次的信息智选 机制支配的结果频次等级排,形成主体来源 (期刊) 的有序3、学科研究人员的增加 4、受到物质、经济、智力、时间等因素的影响和限制普赖斯指数,即某一学科领域内,对发表年限不超过文献的半衰期,是指某学科领域现时尚在利用的全部文献中的、8用次数之比值。、9内发表的。结合信息服务实践,谈谈信息服务设计应注意哪些方面的设计? 、10信息产品设计、信息服
3、务体验设计、信息服务传递设计三个方面很重要。同时从用户的角度来说,体验好,易获得,低成本,高效益。请结合自身经历,分析、 11retrievalbrowsing试分析查全率与查准率二者的关系 、12查全率(检索出的相关信息量查准率(检索出的相关信息量年的文献的引用次数与总的一是在多长一段时retrievalbrowsing两种行为之间的关系是检索,是用户带有目的性的主动行. 是浏览,是用户通过搜索引擎的反馈信息而进行.系统中的相关信息总量 *100%检索出的信息总量*100%二者之间具互逆关系,定程度以后,两者就会呈现出非线性的反变关系。也就是说,在查准率不断提高的同时,查准率也会持续下降。信
4、息栈的增值功能是对信息进行加工和处理。分析信息化在当代社会经济发展中的地位和作用是社会经济发展的基础也是社会经济快速发展的必要保证和强有力的推动力、13、 14地位:成互逆相关曲线在一个信息检索系统中当查全率和查准率达到查全率会持续下降反之在查全率不断提高的同时1 是社会经济快速发展的必要保证作用:2 是社会经济快速发展的强有力的推动力3 为社会经济发展提供了方向,与时俱进字以上)中每个词按其出现频次递减排列起齐夫定律:如果将一篇较长文章(约 5000 、151 来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为表示词的r 表示词在文章中出现的频次,用 这样一直到D
5、 级,如果用f 级,其次为2 级为常数。等级序号,则有: fr=c ,式中, c 我们发现信息及相关因素常常表现出明显的传递和利用过程中,在社会信息流的产生、 、16。核心趋势和 集中取向 如果将科学期刊按其刊载某个学科主“布拉德福定律( Bradfords Law of Scattering):、 17核心题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的这时核心区和后继各区中所含的期刊部分和包含着与核心部分同等数量论文的随后几区,2”)数成1:a:a 。的关系(a1分布。经典的洛特卡表达式又称平方反比、18 的对如果横坐标取期刊按载文量递减排列时的顺序号 n 布拉德
6、福定律还可用图形表示。、19,我们将绘制出的曲线称为布拉德福分散累积数量 n数,纵坐标取 1至号期刊所载论文的曲线。 定律受洛特卡定律的启示,普赖斯提出了核心生产者分布的 平方根 、20 信息的 离散 分布是信息的重要属性,它表现为信息的内容单元以不同方式从不同角度 、21分布于各种载体中。齐夫定律具有广泛的应用,在词表管理和控制、信息系统建设、信息储存与检索、自、22 动标引方面都取得了许多应用成果。文献信息的老化一般指这样几种情形:文献中的信息仍旧有用,但为后来的著作所超越、23 信息不再有用、文献中所含的信息仍然有用,但现在已被包含在更新的其他论著中、文献中信息仍旧有用,但现在正处于一个
7、人们对其兴趣下降的学科。排序,形成主体来源(期刊)的有频次等级 布拉德福定律有两个基本要点:一是 、24序目录; 二是确定相关论文在主体来源中的分布规律。当前信息服务的载体形式主要表现为(网络载体)。 、25个最基本的构成要素,而信息机构不是。326 、在信息服务过程中,信息源、信息活动和信息用户是)易用性原则、及时性原则信息服务的服务原则包括(、27)信息需求的特征有哪些?(知识性、多样性、模糊性、28是个性化信息服务的一种表现形式 RS 2 人机交互是网络信息交互行为的表现形式之一、30 用户对提供信息服务及信息资料的时间要求有一个总趋势 (更快更新)。 、31 感知到的需要或差距, 或非
8、常态知识。 信息搜寻开始于 ()。 、32 归纳起来,我们认为:信息资源由信息生产者 、信息、信息技术 三大要素组成,信息 、33是最关键的因素。 生产者信息科学源于香农的信息论,形成于“三论”的统合,这里所说的“三论”是指(信息 、34论、系统论和控制论 )。信息论的创始人是(香农 ) 35、90年代,我国文献情报领域的学者们更多地吸收了欧洲学者的信息管理思想,形成了(信 、36 息管理学派)信息系统学派主要代表人物包括( 霍顿 )、马钱德 (D. A. Marchand) 等,是三大流派最系统、 37最成熟的理论学派。( 信息管理学派 )是三大派流派中内部分歧最大的理论流派,代表人物有马丁
9、、克罗、38宁 。1986 年,信息管理学者马钱德和(霍顿)出版了信息趋势: 如何从你的信息资源中 、39 获利,在这本书中将信息管理发展过程划分为五个阶段,信息战略规划成为信息管理发展过程的最新阶段。40、按信息活动的应用层次,可以将信息分为( 宏观信息与微观信息 )。41 、按主体的认识层次由低到高划分,信息可分为(语法信息语义信息语用信息)“对涉及信息活动的各种要素、42进行合理地计划、 集成和控制” 指的是 (中观信息管理) 、43 按预测的性质可分为定性预测和(定量预测 ) 44、( BPR )是企业再造工程的核心领域。、45 信息论产生于 20 世纪40 年代末,它的主要创立者是美
10、国的数学家( 香农 (Shannon) 和维 、46 纳 (Norbert w 、 Wiener)。一般认为,香农的 ( 通讯的数学理论)(1948) 的发表,标志着信息论的诞生。47 、 作为科学术语,控制的概念首先是由( 维纳)于 1948 年在他的著作控制论关于、48 在动物和机器中控制和通讯的科学一书中正式提出来的。早在二十世纪七十年代,美国学者( 诺兰 (R Nolan) )曾把一个单位计算机的应用过程、49划分为初装、蔓延、控制、集成、数据管理和成熟六个阶段。MRP 是 ( 物料需求计划)、 ERP是 ( 企业资源计划)、 MRPII 是 ( 制造资源计划)、 ERP的 、50 核
11、心管理思想是 ( 供需链 (Supply Chain) 管理 )。信息对物质载体具有依附性 51、“三金”工程是指“金桥”“金卡”“金关” 三大基础工程的简称 52、核心信息源 是马太效应优势积累的结果53、我们可以通过对信息源、信息准确度、信息费用三方面的评价来判断信息是否有价值54、 信息组织的特性是 渗透性、依附性、增效性、55从便于对信息管理的角度将信息源划分为记录型、智力型、实物型、零次型、5 信息检索的特性相关性、不确定性、逻辑5 控制论的创始人维 5按照空间状态分可以把信息分宏观信息、中观信息、微观信 5 物能信 一起是构成现实世界的三大要6 归纳起来,我们认为:信息资源信息生产
12、信信息技 三大要素组6记录管理学派的代表人物瑞克高和库 6 信息管理的系统原则的内容包整体性原历时性原满意化原三个原 63 信息管理的原则有:系统原则 、激活原则 、共享原则 、搜索原则 和整序原则、64 根据载体的不同,我们可将信息分成文字信息 、声像信息 和实物信息65、信息科学的方法论体系包括信息论 、系统论 和控制论 。 66、控制系统主要包括以下几个方面:控制的目标、控制的主体、控制的客体、控制的方法 、67和手段信息资源 :狭义的信息资源是指信息本身或信息内容,即经过加工处理, 对决策有用的 、68数据。广义的信息资源是指信息活动中各种要素的总称。主要由信息生产者、信息、信息技术三
13、大要素组成。69、信息管理学:以信息资源和信息活动管理为研究对象,研究各种信息管理活动的基本规、70 律、普遍原理和通用方法的学科。(1)管理特征:一般性特征,如:基本职能是计划、组织、领导、控制;对象是组织、71 活动;独有特征:第一,信息管理的对象主要是信息资源和信息活动;第二, 信息管理贯穿于整个管理过程之中。(2)时代特征:信息量迅速增长、信息处理和传播速度更快、信息处理的方法日趋复杂、信息管理所涉及的领域不断扩大原则( 1)系统原则( 2)整序原则( 3)激活原则( 4)搜索原则( 5)共享原则信息交流的障碍有哪些?造成信息交流障碍的原因。、72( 1)信息失真(物理失真、语义改变、
14、语用衰减)原因:技术或通道障碍;信息栈过多;社会因素;自然因素。( 2)信息附加原因:自然、社会、技术因素。简述信息分布的规律。(从信息生产者、离散、和时间三方面论述)(共 25 分)、731、信息生产者分布规律洛特卡定律;普莱斯定律;2、信息离散分布规律布拉德福定律;齐夫定律;3、信息对时间的分布规律指数增长率;逐渐过时率。Mooers 定律是 齐夫定律 的具体应用74、B2C:指的是企业与消费者之间的商务模式,英文为Business to Customer, 简称 B2C. 75 、信息管理的传统管理阶段是以信息源管理 为核心。76、多向主动传递 是专业信息服务开展的各种信息传递中最基本、
15、最重要的信息传递。77、普赖斯曲线:文献数量随着时间呈指数增长的曲线78 、社会信息 :为了特定的目的产生、传递、交流并应用于人类社会实践活动,包括一切由、79 人类创造的语言、符号和其他物质载体表达记录的数据、消息、经验、知识。信息交流:不同时间或不同空间上的认知主体之间相互交换信息的过程。洛特卡定律是指某一学科领域内所有写了X 篇论文的作者数是所有写了1 篇论文作者数、80 量的1/X2。数据处理系统就DP系 8、课件:第一章重点:信息及信息管理的涵义;信息管理学研究对象难点:信息管理学研究对象、信息度量(2)不同学科的研究者对“信息”的理解经济管理学家认为“信息是提供决策的有效数据”物理
16、学家认为信息是熵电子学家、计算机科学家认为信息是电子线路中传输的信号社会科学: “信息”大多是指消息、情报(4)我国著名信息学专家钟义信教授的信息定义本体论层次的信息定义:是指事物存在方式和运动状态的表现形式。事物:泛指存在于人类社会、思维活动和自然界中一切可能的对象。存在方式:指事物的内部结构和外部联系。运动状态:指事物在时间和空间上变化所展示的特征、态势和规律。认识论层次的信息定义 :是指主体所感知或所表述的事物运动状态及其变化方式,是反 映出来的客观事物的属性。data )( 1)数据(。它可以是数字、文字、图像,数据是载荷或记录信息的按照一定规则排列组合的 物理符号 信息 + 背景 (
17、Context) = 也可以是声音或计算机代码。(提取和评价的吸收、是人的大脑通过思维重新组合的、系统化的信息集合;数据:2)知识 (knowledge)是对信息加工、=知识+ 经验。信息产物,包括显性知识和隐性知识。“系统化、组织化的信息”三者关系:数据是信息的原材料,信息是数据所载荷的内容;的抽象产物 (intelligence)信息是知识的原材料,知识是由信息提炼出来)情报(3 难获得性的特它产生于特定的领域。它具有其他类信息所不具备的保密性、是特定的信息,。点。情报一般定义为“有用的信息”news) (message4 ()消息,消息往往用于指那些最新的动态。消息是信息的外壳,信息是消
18、息的内核。零次信息: 以自然物为载体的口头信息或实物信息,是一切信息产生的源信息,即客观存在于社会生活中,通过人的视觉、听觉、触觉等形成的言语、神情、动作、气氛等表象形式。一次信息: 指未经加工或略微加工的原始信息,是人类社会实践活动中直接产生或得到的各种数据、概念、知识、经验及其总结。如新闻、阅读性图书、会议记录、论文、专著、统计报表等。二次信息:对一次信息的加工整理,目的是为了检索一次信息。如:文摘、索引、目录等。三次信息:利用二次信息对一次信息加工整理的结果。字典、词典、百科全书、年鉴、综述、述评、参考型图书等。信息的特征:1、普遍性本体论层次的信息是事物的运动状态和状态变化的方式,这决
19、定了信息具有普遍性。2、无限性和有限性物质的无限性决定了本体论层次信息的无限性;人类认知的有限性,决定了认识论层次信息的有限性。3、客观性与主观性(绝对性和相对性)本体论层次信息决定了信息的客观性和绝对性;认识论层次信息决定了信息的主观性和相对性4、依附性和独立性任何信息都必须有一定的载体,没有物质载体,信息便无法存在;载体的转换不会改变信息的性质和含义。5、传递性信息可以从空间或时间的一点传到另一点。6、动态性与时效性信息是事物的运动状态,决定了信息是不断变化的,同时,信息只有在特定的时刻或时期,才有利用价值。7、信息的可共享性(苹果交换)信息在利用中不被消耗,可以在同一时间或不同时间提供给
20、众多的用户利用。信息不会因为与别人分享而减少;信息的度量(1)基于经验的信息度量基本原理: 不论如何进行评价, 信息的价值认可都有一定的主观性, 都是建立在定性分析之上或定性与定量相结合分析之上的,基于研究者、管理者、使用者的经验而进行的。基于经验的信息度量的基础是对信息价值的基本认识布鲁克斯信息度量经验方程式:K(S)为原有的知识结构, I 为吸收的情报量,即能够理解、整合到自己知识结构中的信息; KS+ S为吸收了新的信息后形成的信息知识结构。基于经验的信息度量主要有以下几种方法:信息计量方法、社会调查方法、评估研究方法、层次分析方法(2)基于数据量的信息度量在计算机信息处理中,常用的信息
21、度量方法,是按表达信息内容的数据所占用的计算机存储空间的大小来衡量。常用度量单位:B ( byte ,字节 )。 KB( KiloByte ,千字节) MB ( MegaByte ,兆字节)GB( GigaByte,千兆字节或吉咖字节)TB( TeraByte,兆兆字节或太拉字节)PB( PetaByte,拍它字节)EB( ExaByte,艾可萨字节)在传统的信息处理领域,也就是对报刊、 书籍等非计算机信息的处理,通常直接采用发行种类、发行量或者文本的字数来进行度量。)基于概率的信息度量( 3 消除的不确定程度们认识的不确定程度;则发出的信息量就小;基本理念:信息量的大小取决于信息内容消除人如
22、果事先就确切地大,则发出的信息量就大;消除的不确定程度小, 知道消息的内容,即消除的不确定程度为零。因此,消息中所包含的信息量就等于零。 信息的功能)信息是人类社会生存的条件和发展的源泉。( 1 (2)信息是人类认识世界的中介( 3)信息是人类改造世界的重要资源和成果信息管理的概念如分类、主题、代码、就是对信息本身的管理,即采用各种技术方法和手段()信息管理 (狭义 )对信息进行组织、控制、存贮、检索和规划等,并将其引向预定目标;计算机处理等等信息、 人、机器、不单单是对信息的管理, 而是对涉及信息活动的各种要素(信息管理 (广义)进行合理的组织和控制,以实现信息及有关资源的合理配置,从而有效
23、地满足社会机构等)的信息要求。 信息管理的目标 信息的开发和利用在有领导、为:保证社会信息流在不同渠道中有序流动,信息管理的 总目标 效能,有条不紊地进行,使各类信息以更高的效率、有组织的统一规划和管理下,协调一致、更低的成本在国家社会进步、经济发展、人民物质文化生活水平提高中充分发挥作用。分目标(1)信息的生产与开发分目标(2) 信息利用分目标。(3)信息管理机制分目标。信息管理的基本原理1.信息增值原理2.信息管理服务原理3.信息管理的增效原理4.市场调节原理5依法管理原理信息管理的发展历程( 1)古代信息管理活动时期( 2)近代信息管理活动时期( 3)现代信息管理活动时期信息管理发展阶段
24、分类国外对信息管理发展阶段的研究马灿德和克雷斯莱茵的“四阶段说”信息的物理控制;自动化技术的管理;信息资源管理; 知识管理马灿德和霍顿的“五阶段说”信息的物理控制;公司自动化技术管理;信息资源管理;竞争者分析和竞争情报;战略信息管理史密斯和梅德利的“五阶段说”数据处理;信息系统;管理信息系统;终端用户及其战略影响;信息资源管理我国对信息管理发展阶段的研究孟广均等信息资源管理的萌芽时期(20 世纪 40 年代中 70 年代中);信息资源管理的形成时期(20 世纪70 年代中 80 年代末);信息资源管理的发展时期(20 世纪 90 年代);马费成等传统管理阶段;信息管理阶段;信息资源管理阶段;
25、知识管理阶段卢泰宏传统管理时期 (1900 1950), 以图书馆为特征 ;技术管理时期 (1950 1980), 以信息系统为特征 ;资源管理时期 (1980 ), 以信息资源管理为特征信息管理学理论体系1.信息管理学基础理论( 1)系统科学理论 系统论、控制论、信息学、运筹学、系统自组织理论、非线性科学、复杂适应系统理论。( 2)管理科学理论 科学管理理论、组织管理理论、行为管理理论、数量管理理论、系统管理理论、权变管理理论、全面质量管理理论、目标管理理论。2.信息管理学应用理论( 1)信息整序理论理论基础新三论耗散结构理论1969 年由比利时布鲁塞尔自由大学教授普里高津(Prigogin
26、g )提出。维持系统的耗散结构必须具备如下条件:第一,系统必须是一个开放系统;第二,系统必须处于远离平衡状态;第三,系统内部各要素之间产生相互协调动作和相干效应,才能使系统从杂乱无章变为井然有序;第四,涨落导致有序。协同理论1977 年由西德理论物理学家赫尔曼哈肯(Haken)教授提出。a.论述系统从无序到有序和从有序到无序相互转变的条件与规律。b.揭示类比事物之间相同的内在固有属性。c.研究远离平衡态的开放系统。d.在一定的条件下,系统原来所处的稳定平衡状态可以变成为非稳定的,然后在非稳定状态的基础上,由于涨落的作用,系统有可能过渡到一个新的稳定的平衡状态,从而形成系统的自组织过程,完成了从
27、无序到有序的转变。)提出。 R.Thom 年由法国数学家雷诺托姆(1972 突变理论突变理论的主要特点:用形象而精确的数学模型来描述和预测事物的连续性中断的质变过程。突变理论在信息管理学中有着广泛的应用。突变理论方法可应用于研究信息对知识结构改变的影响;还可应用于信息系统的设计。旧三论申农的信息论、维纳的控制论、贝塔朗菲的系统论( 2)信息检索理论一般是指检索语言、检索策略、检索效率、检索系统及检索自动化、网络化等方面的理论。( 3)信息交流理论1)信息交流模型理论通信过程的一般模式传播学模型社会学模型以美国社会学家门泽尔 (Menzel) 为代表提出的正式交流与非正式交流 (formal a
28、nd informal communication) 模型,在社会学研究中较有影响。正式交流 :依法组织、具有正规合法渠道、受法律保护,是社会组织机构运行的必要条件。有种说法是借助于文献的间接交流属于正式交流,其余是非正式交流。科学交流模式管理学模型(法约尔跳板模型)信息交流的栈理论23)信息衰减与增值原理信息衰减原理: 在从信息生产者到信息接受者的信息流中会发生3 种形式的衰减:物理衰减、语义衰减、语用衰减。信息增值原理:即在信息交流过程中,附加信息的生成与传递。4)信息传递的保真原理与冗余原理信息保真原理: 信息保真即信息守恒。信息冗余原理:冗余原理是为实现信息准确传递,使用各种冗余方法来
29、加强信息传递的准确性效果,以减少信息衰减和信息增值的一种基本方法。( 4)信息系统理论信息系统理论是将系统科学的理论和方法应用于信息组织和管理的一门分支学科,现代化的信息系统是信息系统的发展方向,而现代化的信息系统主要是指计算机化的信息系统,或称之为基于计算机的信息系统(Computer Based Information System , CBIS)。从其发展历程看,计算机信息系统经历了DPS/EDPS/TPS、 MIS、 DSS/ES、 ERP 4个阶段。( 5)信息资源管理理论一般理论 从总体上研究信息资源管理活动的基本理论和一般规律,其分支学科主要包括信息资源理论、信息资源管理理论、信
30、息资源管理学方法论、信息资源管理学学科史、信息资源管理的比较研究、相关学科理论与方法的应用研究等。应用理论 研究信息资源管理活动某个环节和局部与规律的问题,其分支学科主要有文献信息学、图书馆学、情报学、档案学、大众传播学、编辑学和出版发行学等。国内外信息管理理论流派信息管理理论的形成开始于20 世纪 70 年代后期, 最初萌芽于两个领域:工商管理领域和政府部门。目前主要有三大学派:信息系统学派、信息系统学派是欧美信息资源管理理论研究的主流。主要代表人物包括霍顿、马钱德、史密斯、梅德利、博蒙特、萨瑟兰、D.侯赛因、 K.M.侯赛因等。信息系统学派的理论学说是3 大流派中最为系统最为成熟 的理论学
31、说。信息系统学派的特点:注重信息的资源特性和财产特性注重信息系统理论与管理理论的结合注重信息资源的实用分析注重信息资源管理的战略性质注重案例研究,注重集体研究其面向对象主要是工商管理领域的管理者、管理信息系统专业师生及一般信息管理者记录管理学派、该学派的代表作:里克斯和高的信息资源管理( Information Resource Management)美国学者罗贝克(Mary F.Robek) 等所著的信息与记录管理( Information and RecordsManagement )英国学者库克(Michael Cook) 所著的信息管理与档案数据( InformationManagem
32、ent and Archival Data)等。记录管理学派理论学说的主要特点:将信息资源等同于记录注重记录的生命周期注重多种媒体的集成管理没有上升到战略管理的层次未能真正统一文献信息管理,其实质是一种扩大化的档案和文书管理虽然也应用了信息系统理论和管理理论, 但这些理论在这里只是一种框架, 它所装的仍是记录管理的内容。信息管理学派信息管理学派是3 大流派中内部分歧最大的理论流派,主要有:马丁()的信息管理理论马丁在 1988 年出版的 信息社会 中专门有 “信息管理” 一章, 涉及:信息管理的内涵和意义、要素、原则、认知、制约因素、实施与信息管理的过程克罗宁 (B.Cronin)和达文波特
33、(E.Davenport) 的信息管理理论克罗宁和达文波特的信息管理理论:信息管理归纳为三种模型:隐喻模型 :是根据事物描述目标事物的方法,常见的隐喻包括资源、武器、资产、财产、商品等;转喻模型 :是以部分代表整体的方法,常用的转喻包括肖像、关键词、文摘、概要、屏幕菜单等; 分类模型 :是基于共同的明显的因素来约束分离的实体,常用的分类方法包括等级分类、综合分类、语义网、图形理论、结群分类等。斯特洛特曼的信息管理理论他认为:信息管理是信息服务的内核 ;信息管理的背景分为三个层次: 信息服务是第一重背景,图书馆和情报服务是信息服务的有机组成部分;信息市场是中观背景;信息环境是宏观背景。信息管理学
34、科的发展趋势:( 1)从技术角度看,信息管理正逐步实现科学化和现代化,不断开拓信息管理的新局面和新领域。( 2)从学科发展的角度看,信息研究的多学科、跨学科或交叉学科的特征十分明显。信息管理学是系统科学和管理科学两大学科相互渗透、相互作用而形成的综合性交叉科学。这种学科整合式的发展也反映了现代科学日益走向集成化、整体化的大趋势。课件:第二章重点:数据挖掘技术术语,信息安全威胁和对策难点:知识组织技术网格的概念:网格是可以作为虚拟的整体而使用的在地理上分散的异构资源,这些资源可能属于不同管理域,它们包括网络可达的异构计算机、数据库、科学仪器、文件和超级计算系统等。网格技术的本质网格的本质不是它的
35、规模,而是充分利用互连网络中的现有软硬件资源,支持广域环境上的计算数据、存储、信息和知识资源的共享、互通与互用, 消除资源孤岛。 以较低成本获得较高的性能。共享与协同是网格的 本质 问题。共享 是将网络上海量、自治、分布、异构的资源进行有效组织,以服务的方式为网格用户提供统一透明的访问机制。这些资源包括计算、存储、数据、软件、仪器设备、传感器、信息库、知识库和专家等。协同 是指资源可以相互交互、理解、协作,以期共同完成复杂的网格应用。包括人人、人资源、资源资源的协同。网格技术的特点(1)分布性 ( 2)异构性 ( 3)自治性 ( 4)动态性 ( 5)自相似性网格的分类按网格 主体 分为科学网格
36、、地球系统网格、地震网格、军事网格、物理网格、游戏网格、教育网格等许多种。按网格 客体 分为数据网格、计算网格和服务网格。按网格 客体的不同层次可以分为资源网格、信息网格和知识网格。知识发现( Knowledge discovery of database ) :知识发现是从数据集中识别出有效的 、新颖的 、潜在有用的 ,以及最终可理解的模式的非平凡过程。数据挖掘( data mining ) :数据挖掘在技术上的定义:数据挖掘( Data Mining )就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据
37、挖掘在商业角度定义数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。数据挖掘的主要流程(四个阶段)系统的数据挖掘过程是一个不断循环、优化的过程。数据挖掘的任务:1)描述性挖掘任务:用数据挖掘算法来描述大量数据的特性;2)预测性挖掘任务:用当前的数据进行分析,来预测未知事物或者事件的发生。应用实例:电信:客户流失百货公司 / 超市:购物篮分析保险:交叉销售,流失信用卡:欺诈探测电子商务:网站日志分析,个性化服务税务部门:偷漏税行为探测警察机关:犯罪行为分析医学:医疗保健,病症原因分析数据仓库的概念:
38、数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。数据仓库是知识发现、数据挖掘的基础数据仓库的几个重要概念:ETL( Extract/Transformation/Load):用户从数据源抽取出所需的数据,经过数据清洗、转换,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。元数据 :关于数据的数据,指在数据仓库建设过程中所产生的有关数据源定义、目标定义、 转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息。Data Mart:数据集市- 小型的,面向部门或工作组级数据仓库。Operation Data Store操作数据存储 ODS 是
39、能支持企业日常的全局应用的数据集合,是不同于DB 的一种新的数据环境,是DW扩展后得到的一个混合形式。四个基本特点:面向主题的(Subject-Oriented) 、集成的、可变的、当前或接近当前的。粒度:数据仓库的数据单元中保存数据的细化或综合程度的级别。细化程度越高, 粒度级就越小;相反,细化程度越低,粒度级就越大。分割:结构相同的数据可以被分成多个数据物理单元。任何给定的数据单元属于且仅属于一个分割。数据仓库的特点:面向主题:典型的主题领域:客户;产品;交易;帐目集成的:数据提取、净化、转换、装载非易失的:数据仓库的数据通常是一起载入和访问的,但并不进行一般意义上的数据更新随时间的变化性
40、:数据仓库的键码结构总是包含某时间元素。网络爬虫概述狭义上指遵循标准的http协议,利用超链接和Web 文档检索方法遍历万维网的软件程序;而广义的定义则是能遵循http协议,检索Web 文档的软件都称之为网络爬虫。网络爬虫是 搜索引擎 中最核心 的部分, 整个搜索引擎的素材库来源于网络爬虫的采集,从搜索引擎整个产业链来看,网络爬虫是处于最上游的产业。信息过滤的定义信息过滤是根据用户的信息需求,在动态的信息流中,搜索用户感兴趣的信息,屏蔽其它无用和不良的信息。信息过滤的分类主动 (Active) 的IF 系统主动搜集信息,并将相关信息发送给用户通常采用Push 操作会造成信息过载问题,所以该系统
41、要尽力建立精确的用户需求。被动 (Passive)的IF 系统不负责为用户搜集信息通常用于邮件和新闻组信息过滤信息安全的概念所谓网络信息安全就是指网络系统的硬件、 软件及其系统中的数据受到保护, 不受偶然的或者恶意的原因而遭到破坏、更改、泄露,系统连续可靠正常地运行,网络服务不中断。信息安全的威胁( 1)病毒( 2)网络犯罪和黑客对网络攻击( 3)拒绝服务攻击( 4)信息泄漏指信息被泄漏给非授权的人( 5)非授权访问( 6)窃取( 7)截取( 8)伪造( 9)篡改( 10)假冒( 11) 行为否认信息安全的策略(1)保护物理安全(2)访问控制策略(3)保护信息安全传输(4)为服务器安装安全操作
42、系统(5)防止黑客利用系统漏洞攻击( 6)口令机制是资源访问的第一道屏障( 7)安装防火墙 ( 8)网络安全管理课件:第三章重点:信息源概念、信息源分布规律难点:信息源分布规律;引文分析方法信息源概述信息源是信息的来源; 是蕴含信息的一切事物; 信息源可以不断转化为信息资源, 但不全是信息资源;信息源分为:原始信息源、信息服务机构、信息系统三个层次。原始信息源 是没有经过任何加工处理,产生一些无序的、复杂的、真实可靠的信息。信息服务机构 是专门从事信息的采集、组织、分析、存储的组织。 他们要对将原始信息进行加工处理后,传递给用户,为用户提供信息服务的信息源。信息系统 存储了大量的有序信息,通过
43、 现代信息网络进行传递,为各类信息部门和信息机构提供更专业的服务。信息源定义(标准)信息源是人们在科研活动、 生产经营活动和其他一切活动中所产生的成果和各种原始记录, 以及对这些成果和原始记录加工整理得到的成品都是借以获得信息的源泉。信息源内涵丰富,包括各种信息载体, 也包括各种信息机构;包括传统印刷型文献资料,也包括现代电子图书报刊;包括各种信息储存和信息传递机构,也包括各种信息生产机构。信息源的种类(1)按信息产生的时间顺序先导信息源 :天气(地震)预报、股市展望实时信息源 :实验记录、产品测试报告、股市行情滞后信息源 :报刊文章、科技报告、论文等。( 2)按信息的可保存性正式记录的信息源
44、非正式记录的信息源( 3)按信息的生产过程原始信息源、二次信息源、三次信息源、精粹信息源:利用二次和三次信息源对某一学科、某一专题、某一研究方向中最有研究价值的某些数据、论述、文章、 观点等按一定标准加以编制而成的信息源。(4)按信息存在的形式实物信息源 :年轮、各种展品等。特点:直观性、客观性、隐蔽性文献信息源 :用文字、图形、符号、声频、视频等技术手段将系统化的信息内容存储在纸张、胶片、磁带和光盘等物质载体上而形成的一类信息源。特点:系统性、时滞性、稳定性组织机构信息源:研究机构、信息中心、图书馆、档案馆、标准化组织、学术团体、高校、新闻出版单位等。特点:权威性、垄断性:清华同方、重庆维普,提高了信息检索效率;有利于信息共享。特点:动态数据库信息源管理性、多用性、技术依赖性(5)按信息源的形式文献型信息源、档案型信息源、统计型信息源、图像型信息源3、信息源的分布规律3.1 文献信息的增长规律文献信息增长规律是用于解决文献增长同时间的关系的规律, 以文献为计量单位研究科学知识的增长,是建立在两个假设之上: 1)所有的知识都包含在已发表的文献中 ;2)每篇文献含有等量的知识。(1)指数增长规律普赖斯曲线
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 可行性研究报告合作
- 农业项目可行性研究报告怎样写
- 太阳能光伏并网发电厂家
- 教育行业学生评估与反馈预案
- 汽车行业智能汽车研发与制造流程优化方案
- 跨境电商系统建设
- 物流项目报告
- 交通卡口监控系统维护方案
- 旅游酒店行业的智能化客房服务系统开发方案
- 三农特色种植技术手册
- GB/T 16422.2-2022塑料实验室光源暴露试验方法第2部分:氙弧灯
- 大客户销售培训
- 生物化学与分子生物学实验(终版)
- 细胞内蛋白质的分选和运输细胞生物学-1
- 高血压健康宣教-饮食课件
- 八年级-现在完成时复习(共26张)课件
- 电气基础知识培训要点课件
- 基坑工程施工验收记录表
- GB∕T 37045-2018 信息技术 生物特征识别 指纹处理芯片技术要求
- 沥青项目运营方案参考范文
- 商品混凝土项目园区审批申请报告(范文参考)
评论
0/150
提交评论