




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
育明教育27位粉丝1楼情报检索与分析
一.名詞解释
1.叙詞法:是建立在叙詞語言及其性质的基础上的一种新的处理文献的措施。其基本原理是通過概念组配(分析与综合)来体現主題,以提高標引的专指性和检索的灵活性。
2.加权检索:加权检索是某些检索系统中提供的一种定量检索技术。加权检索同布尔检索、截詞检索等同样,也是文献检索的一种基本检索手段,但与它們不一样的是,加权检索的侧重點不在于鉴定检索詞或字符串是不是在数据库中存在、与别的检索詞或字符串是什么关系,而是在于鉴定检索詞或字符串在满足检索逻辑後對文献命中与否的影响程度。加权检索的基本措施是:在每個提問詞背面給定一种数值表达其重要程度,這個数值称為权,在检索時,先查找這些检索詞在数据库记录中与否存在,然後计算存在的检索詞的权值總和。权值之和到达或超過预先給定的阈值,该记录即為命中记录。
运用加权检索可以命中关键概念文献,因此它是一种缩小检索范围提高检准率的有效措施。但并不是所有系统都能提供加权检索這种检索技术,而能提供加权检索的系统,對权的定义、加权方式、权值计算和检索成果的鉴定等方面,又有不一样的技术规范。
3.联机
4.searchengine:搜索引擎就是互联网上提供的具有信息发現、组织、检索、导航及其他有关服务功能的多种软件系统或工具的總称。
5.metedata:提供有关信息资源或数据的一种构造化的数据,是對信息资源的构造化的描述。其作用為:描述信息资源或数据自身的特性和属性,规定数字化信息的组织,具有定位、发現、证明、评估,选择等功能。
6.指南数据库:是存储有关某些客体(如机构、人物等)的一般指示性描述的一类参照数据库。
7.HTML:超文本置口号言,是為网页创立和其他可在网页浏览器中看到的信息设计的一种置口号言。HTML被用来构造化信息——例如標題、段落和列表等等,也可用来在一定程度上描述文档的外观和語义。
8.on-goingproject:進行中的项目
9.逆波兰体現式:又称福岛措施,這种措施重要的处理思想是先将检索式(一般為中缀体現式形式)转换為等价的逆波兰式(即後缀体現式形式),然後将逆波兰式翻译成一组检索指令。
10.专利:這個概念的基本涵义是指专利权,其派生义是指获得专利权的技术发明,或指发明人申請专利時提交并由专利局出版的有关某发明的技术阐明書(即专利阐明書)
11.检索方略:概括的說,就是指為实現检索目的而制定的全盘计划和方案,是對整個检索過程的筹划和指导。
12.先组式索引語言:指在实行检索前,索引詞已被(標引者)预先组配好了的一种索引語言。检索時,检索人员只能直接运用预先給定的索引詞去检索文献。
13.叙詞:指的是来自文献和顾客并通過严格的多方面控制、用以体現文献主題或信息需求的單义詞或代码。
14.引文索引法:运用手頭已經掌握的一篇重要的较早发飙的有关著作作為检索的起點,运用引文索引查出所有引用過這篇著作的人及其文章的出处,再查来源索引,就可以查得某些与課題有关的文献。
15.报道性文摘:用来概括原文的内容要點(尤其是创新點),向讀者提供原文中的定量信息(如距离、最大值、最小值、平均值、中值、公式、可靠度等)和定性信息(如发現、成果、新措施、新设备、結论等)的一种文摘。
16.源数据库:能直接提供原始资料或详细数据的自足性数据库,顾客不必再查阅其他信息源。包括数值数据库、文本-数值数据库、全文数据库、术語数据库、图像数据库、音频数据库等。
17.回溯检索:對检索系统已存储的所有情报,或其中一定期间范围的情报,按照特定主題范围(顾客課題)進行文献普查。回溯情报检索,不仅要查找最新情报,并且要追溯查找過去年代已存储的所有情报。一般所說的文献检索,即指此类检索。例如,申請专利為查证新奇性而進行的文献普查,科研人员從事新的課題研究之前為了理解国内外已經有成果而進行的文献普查,都是回溯情报检索。回溯情报检索可以采用脱机(成批)处理,也可采用联机处理,但前者只是初期的计算机情报检索采用,目前的回溯情报检索几乎均采用联机处理方式,因此联机检索和回溯检索具有同样的含义。赞0-8-1421:05答复育明教育27位粉丝2楼18.网罗度:又称標引深度,指的是每篇文献所含主題(要素)在標引過程中被确认和转换成索引詞或索引款目的数量。標引深度也是衡量索引质量的重要指標之一。
网罗度是指用作记录分析的文献在整個已出版文献中所占的份量。一般来說,對文献的记录越充足,网罗度也就越高,分析出来的关键出版社也就越精确、越有权威性。网罗度的高下,决定了关键表(关键出版社的列表)信息密度的大小。因此,從某個意义上来讲,网罗度的高下,实际上就是信息量的大小。
19.参照:是索引参照系统的重要部分。從本质上讲,参照是反应標目之间語义关系的一种指示物,也是链接有关款目的一种媒介物。它把讀者從目前查的地方指导到应當去查的地方,以便查出有关的所有標目和款目。
20.功能分类
21.原文检索:“原文”是指数据库中的原始记录,原文检索即以原始记录中的检索詞与检索詞间特定位置关系為對象的运算。原文检索可以說是一种不依赖叙詞表而直接使用自由詞的检索措施。
原文检索的运算方式,不一样的检索系统有不一样的规定,其差异是:规定的运算符不一样;运算符的职能和使用范围不一样。原文检索的运算符可以通称為位置运算符。從RECON、ORBIT和STAIRS三大软件對原文检索的规定,可以看出其运算符重要是如下4個级别:
(1)记录级检索,规定检索詞出目前同一记录中;
(2)字段级检索,规定检索詞出目前同一字段中;
(3)子字段或自然句级检索,规定检索詞出目前同一子字段或同一自然句中;
(4)詞位置检索,规定检索詞之间的互相位置满足某些条件。
原文检索可以弥补布尔逻辑检索、截詞措施检索的某些局限性。运用原文检索措施,可以增强选詞的灵活性,部分地处理布尔检索不能处理的問題,從而提高文献检索的水平和筛选能力。不過,原文检索的能力是有限的。從逻辑形式上看,它仅是更高级的布尔系统,因此存在著布尔逻辑自身的缺陷。
22.准波兰变换法:针對逆波兰变换對系统内存空间规定過高而提出的一种改善措施。它通過對逆波兰体現式的改写,得到一种检索時所需内存工作区個数至少的後缀体現式,這样的後缀体現式被称為准波兰式。
23.囊括值:指与某一提問有关的文献在指定文献集合中的分布密度。一般,分布密度越大越轻易检出。其体現式為G=給定集合中与某一提問有关的文献量/給定集合中的文献總量。
24.引文珠形增長:從已知的有关检索問題的少数几种专指詞開始检索,以便至少检出一篇命中文献或一条有关信息,然後审阅這批文献或信息条目,從中选出某些新的有关检索詞,补充到检索式中去。這些詞加入到检索式之後,就能查出其他新的命中成果。不停反复上述過程,直到找不到其他适合包括于检索式的附加詞為止,或者已經得到了数量合适的命中成果。
25.元搜索引擎:又称集合型搜索引擎,将多种單一搜索引擎集成在一起,提供统一的检索界面,将顾客的检索提問同步提交給多种独立的搜索引擎,同步检索多种数据库;并根据多种独立搜索引擎的检索成果進行二次加工,如對检索成果去重、排序等;输出給顾客。
26.標引深度:同网络度18。
27.互逆有关:英国Cleverdon等人由试验得到的查全率—查准率經验曲线体現,查全率与查准率是互逆的,即對于一种查找规定,假如要设法提高查全率,则查准率會減少,反之亦然。這也可以看作是文献信息检索的一种基本特性。
28.ontology:是共享概念模型的明确的形式化规范阐明。這包括4层含义[4]:概念模(conceptualization)、明确(explicit)、形式化(formal)和共享(share)。“概念模型”指通過抽象出客观世界中某些現象(Phenomenon)的有关概念而得到的模型。概念模型所体現的含义独立于详细的环境状态。“明确”指所使用的概念及使用這些概念的约束均有明确的定义。“形式化”Ontology是计算机可讀的(即能被计算机处理)。“共享”指Ontology中体現的是共同承认的知识,反应的是有关领域中公认的概念集,即Ontology针對的是团体而非個体的共识。Ontology的目的是捕捉有关领域的知识,提供對该领域知识的共同理解,确定该领域内共同承认的詞汇,并從不一样层次的形式化模式上給出這些詞汇(术語)和詞汇间互相关系的明确定义。-8-1421:05答复育明教育27位粉丝3楼29.有关分析:研究随机变量之间的有关关系的一种记录措施。有关关系是一种非确定性的关系,例如,以X和Y分别记一种人的身高和体重,或分别记每公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中的一种去精确地决定另一种的程度,這就是有关关系。
30.聚类文档:指针對系统中的所有文献向量,使用一定的相似性(或相异性)度量指標和聚类措施,计算出文献与文献之间的相似度,并把相似度较高的文献汇集在一起,形成一种個的文献类目,進而形成文献的聚类文档。
31.非程序化决策:指没有一套固定的程序,只能采用“現裁現做”的方式進行处理的决策,或者說是不能精确体現過程的决策。
32.後控詞表:後控詞表是编制很严谨的主題詞表,包括詞的多种关系,甚至詞的語法属性、关系之间能互相参照,對顾客提問詞進行多种控制,包括同义詞扩充、有关詞扩充,上下位按等级扩充,還可带有智能型(即联想功能、自學习功能、自我完善功能)的一种詞表系统。從一定程度上說,其目的是對不规范的標引詞加以规范,以实現较高的查全、查准率。後控詞表也一般被作為一种较為有效的控制手段以提高检索系统的性能,其实质就是将對標引的控制放在標引之後,较之字面匹配、詞频计算等後控手段有著無可比拟的优越性。
33.关系模型:关系模型是建立在数學理论基础之上的,用二维表格的形式表达实体的联络。
34.事务等待图:事务等待图是一种有向图GT,U)。T為結點的集合,每個結點表达正运行的事务;U為边的集合,每条边表达事务等待的状况。若T1等待T2,则T1、T2之间划一条有向边,從T1指向T2。事务等待图動态地反应了所有事务的等待状况。并发控制子系统周期性地(例如每隔1分钟)检测事务等待图,假如发現图中存在回路,则表达系统中出現了死锁。
35.向量空间模型:将文档標识為由n個通過归一化处理的標引詞构成的n维空间中的向量,该向量第k维的值(第k個分量)表达第k個標引詞在文档中的权值。顾客检索提問式也同样表达為一种n维向量。文档和检索提問式的RSV是這两個向量的標量乘积,RSV越大,文档和检索提問式的有关度便越大。
36.非数量决策:重要依托决策者基于管理經验之上的分析判断的决策。
37.专長权:领导因自身专長而具有的权威。
38.纵横法:纵横法是一种經验措施,它是以研究課題中有代表性的作者為线索,通過检索工具,采用往纵向和横向扩大来获取文献的一种措施。
40.质疑式頭脑風暴:又称破壞式頭脑風暴,這种措施也是以小组會的形式進行,重要用来對過去已經制定的方案和设想提出异议。
41.技术复原
42.信息分析
43.序贯决策:也称動态决策,它要做出一系列互相关联的决策,從而具有两個特點:一是它做出的决策不是一种而是一串;二是這一串决策并非彼此無关,而是前一项决策直接影响後一项决策。
44.分层抽样:又称类型抽样。它将總体各個單位先按重要標志分组,然後在各组中,采用纯随机抽样或机械抽样方式,确定所要抽取的單位。
45.集体頭脑風暴:一般是以小组會的方式進行,人数以5到10人為宜。這种讨论會一般事前约法三章:第一,思想自由奔放,想到什么說什么,不规定全面系统;第二,讨论中各說各的,不评论他人的意見,不互相争论;第三,联络他人思绪,結合或改善他人意見,多提方案或者提议。
46.变换角度:又称相异思维,是突出发散思维過程,鼓励從不一样角度、不一样侧面来思索問題的一种研究措施。
二.简答
1.原文信息检索有几种等级,要实現這几种等级對系统有什么规定。
2.专利文献检索和一般文献检索比较的特點
A.专利文献数量巨大,覆盖面广;B。专利文献格式统一,措辞严谨;C。专利文献描述對象详细、單一;D。专利文献技术内容新奇可靠,实用性强;E。转移文献文献类型多,反复量大;F。专利文献技术上具有保守性。-8-1421:05答复育明教育27位粉丝5楼B.相對频率加权法:一种詞的相對频率是它在一批足够多的文献样品中出現频次的平均值。相對频率加权法既考虑某詞在某一特定文献内的使用频次,又考虑它在有关的特定领域中的使用频次。其主导思想是:在一般文献中不常常出現的低频詞取低值,在专业文献中频繁出現而在特定文献内以低频率出現的詞取高值。相對频率加权法有也許減少詞的误选率和漏选率,防止某些有助于提高查全率的高频詞和有助于提高查准率的低频詞被不合适的排除在標引詞外。不過,建立一种数据可靠的相對频率表也绝非易事。
C.反文献频率加权法:基于如下假设:某詞的重要性与它在特定文献中出現的频次成正比,而与具有该詞的文献量成反比。因此将加权公式设计為WEIGHTik=FREQik/DOCFREQk。
16.什么是文本聚类?它和文本分类有何区别于联络?
文本聚类是指运用计算机将文献按其属性相似度汇集成不一样的类,生成聚类文献和提供聚类检索。它不一样于老式的文献分类。由于它不是基于某种预定的类表,而是基于文献,即先有文献後有类。类的内涵和外延以及整個类体系完全由系统内的文献决定,类的性质時刻与本类文献相一致。类的形成過程也不一样。老式的文献分类一般按自上而下的次序一次完毕,而聚类则按照自下而上的次序生成类,且不是一次完毕。文献聚类有助于提高检索效率,使属于某一給定类的所有文献在一次文档访問中就可以检出。它可以节省提問处理時间,使检索時不必逐詞逐篇的一一比较,只在有关类内部進行比较。
17.与一般的科技文献相比,专利文献有何不一样之处?同2
18.叙詞語言有哪些优良性或性质?同13
19.引文索引法与主題法相比有什么長处和缺陷?同14
20.图像基于内容的检索可以分為那几种类型?
a.基于颜色的检索;b.基于纹理的检索;c.基于形状的检索;d.基于感情特性的检索。
21.什么是Web文本挖掘?它与文本检索有什么联络和区别?
Web文本挖掘指從大量非构造化、异构的Web文档的集合中发既有效的、新奇的潜在可用的及最终可理解的知识的過程。
文本挖掘与文本检索是两种不一样的技术,表目前如下方面1)目的不一样。文本检索的目的在于协助顾客发現资源;文本挖掘的目的是為了揭示文档中隐含的知识;(2)评价手段不一样。文本检索一般使用查全率和查准率评价其效果,规定返回尽量多的有关文档,同步不有关的文档尽量的少;而文本挖掘采用收益、置信度、简洁性等来衡量所发現知识的有效性、可用性和可理解性;(3)措施论不一样。信息检索是目的驱動的,顾客需要明确提出查询规定;而文本挖掘的成果独立于顾客的信息需求,也是顾客所無法预知的;(4)使用場所不一样。有時信息检索系统返回太多的成果以致顾客無法一一浏览,有時顾客没有明确的信息需求,有時顾客但愿发現文档集合中所具有的构造、趋势、含义,在這些場所下,就需要使用挖掘技术。
22.决策對信息有哪些规定。
a.可靠性;b.完整性;c.精确。
23.试述领导的强制影响力与自然影响力。
所谓影响力,就是一种人在与他人交往中影响和变化他人心理和行為的能力。從影响力的性质来看,可分為强制影响力和自然影响力两种。强制影响力是伴随领导者所担任的职务而来的,带有强制性质,下属不能随便违抗。這种权力重要决定于個人在组织中的地位。自然影响力也叫威信,這是由领导者具有良好的体現而收到被领导者的敬佩,靠领导者以身作则来影响他人接受自已的意見,從而起到领导的作用。這种影响力是建立在群众對领导者崇拜、信服的基础之上的,是非权力性的影响力。
24.請简述“大科學”“大工程”“大企业”的共同特點。
它們的规模庞大,构造复杂,具有多分支性和综合性,其参变量之多,活動规律之复杂,输入和输出信息量之巨大是過去小生产、自然經济所無法比拟的。
25.請简述关系的规范化過程。
26.简述专利信息检索的特殊性。同2-8-1421:05答复育明教育27位粉丝9楼3.组织信息流的构造和作用
a.垂直流。是指组织内具有不一样权力、地位、职能等级的上下级之间纵向的信息交流活動。
b.水平流。是指组织内具有相似或相近权力、地位、职能等级者之间的横向信息交流,亦称平行流、横向流。
4.信息技术发展规律
a.信息技术辅人律,以满足人类需要為中心;b.信息技术拟人律,以节省物质和能量為動力;c.信息技术共生律,以人类信息运動规律為根据;d.信息技术倍增律,以摩尔定律為標志。
5.美国信息产业政策的特點
a.依托私营部门和市場自由竞争,尽量減少和消除不必要的规章等市場障碍,加强信息技术和信息产品的開发和创新,提高效率并以合理的价格向公众提供信息服务,這是美国政府发展信息产业的一种基本政策原则。
b.政府及時颁布有关信息产业政策,大力扶持信息产业,尤其是對国家竞争力有关键影响的信息技术产业的发展。
c.除從国家安全、知识产权和個人隐私等方面考虑需要進行强制规范外,规定減少政府干预,保证信息产品和服务通過建立一种自由竞争的市場在全球范围内自由流動是美国信息产业政策的一种基本特性。
6.信息政策和信息法的异同
信息政策与信息立法关系亲密,信息政策是调整国家信息活動并借以指导、推進整個信息活動发展的行動指南;而信息立法是為了调整在信息活動中产生的多种社會关系。
信息法律是成熟了的信息政策的升华,信息政策尽管可以通過必要的指导和干预来加以宏观调控与管理,并发挥重要的作用,不過它需要通過必要的法律手段才能实現,需要對应的法律作保障。
信息政策是信息立法的基础,信息法律是保障信息政策得以贯彻和实行的法律手段。
7.中美信息政策有何不一样?
8.我国信息化建设的重要内容、特點及建设成果
9.信息服务的原则
a.针對性原则;b.适時性原则;c.精练性原则;d.以便性原则;e.效益性原则;f.竞争性原则。
10.信息管理的研究對象与研究范围。同1
11.管理决策人员与市場营销人员的信息需要
管理决策人员的信息需要:a.管理决策人员所需要的信息内容综合广泛,往往是具有战略性、全局性和预测性的波及决策對象内外各方面的信息;b.對信息数量和质量有较高的规定,一般规定少而精、通過浓缩加工的信息,對信息的简要性、完整性、精确性和客观性规定都比较高;c.多依赖正规信息机构所提供的信息服务,并且规定信息服务工作有较强的针對性和适時性,可以提出尽量多的决策方案可供选择。
市場营销人员的信息需要:a.信息需要拾分广泛;b.需要及時、新奇、精确、可靠的信息,對信息服务的及時性和针對性规定很高,并且常常要借助于非正规渠道获取信息;c.市場原因拾分复杂,使得市場营销人员运用現代化的计算机与网络通信技术建立面向市場竞争需要的信息系统势在必行。
12.信息功能
13.信息技术的发展對信息管理领域的推進作用
14.信息产业在国民經济中的地位和作用
a.信息产业的形成与发展,是工业經济向信息經济转变、工业社會向信息社會转变的关键内容。b.信息产业是現代社會經济发展的動力和国家竞争实力的基础。c.信息产业對国民經济各部门的发展具有先导作用。d.信息产业對国民經济构造具有软化作用。
15.和物质产品相比,信息产品的特性有哪些
a.易传递性与非消耗性;b.效用滞後性与差异化属性;c.惟一独创性与可反复性;d.非
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025中心卫生院病理科临时技术员派遣及服务保障协议
- 教育政策与学校管理创新
- 上呼吸道试题及答案问答
- 上消化道异物试题及答案
- 2025中外合资企业总经理任职合同范本及履行细则解读
- 设备安装员考试题及答案
- 2025年绿色环保养猪场建设与安全运营监管合同
- 2025中心商业地产交易合同附房产增值前景与投资回报评估
- 2025年智能自动化生产线专用机器人采购及系统集成服务合同
- 神笔马良的测试题及答案
- 仓储业务基础知识培训课件
- 苏教版二年级数学下册第六单元《三位数的加法笔算》教案
- 7年级数学试卷(有答案)
- 干热河谷优秀课件
- 误吸预防与处理
- 台风过后复工前安全检查表
- GB/T 20840.8-2007互感器第8部分:电子式电流互感器
- GB/T 2007.1-1987散装矿产品取样、制样通则手工取样方法
- 《歌唱祖国》-课件
- 天津临港海洋重工建造基地码头工程(PPT)
- 图像西方与想象西方——《良友》西方形象的重构与呈现
评论
0/150
提交评论