




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章
非结构化数据库相关概念
数据库发展历史简略回顾
互联网催生了NoSql系统
非结构化数据库现实意义
TRIP数据库系统主要特点
第二章TRIP系统概述一、TRIP
的沿革二、TRIP
的组成三、关键技术TRIP的数据类型TRIP的记录结构TRIP的文件结构检索词的Hash运算TRIP数据库系统简介
1972年瑞典皇家工学院图书馆开发 ——面向科技书目磁带数据检索专用的软件3RIP
DEC10/20运行
欧美图书、情报、议会较为流行1985年移植到DECVAX系列机。易名为
TRIP 从此广泛用于图书馆外,石油、化工、医药等领域零开发
TextRetrievalInformationProcessing
TRIP–FullTextManagementSystem一、TRIP沿革
——最早的全文检索系统与关系数据库系统RDBS的差别关系数据库以关系代数为坚实的理论基础,适于能用二维表格来逻辑描述的结构化数据。数据对象一般不太长、比较规范。如人员、物资、财务帐表等报表管理。属于二维平面的数据结构。TRIP适用于不能用二维平面表格来记载的数据
数据对象既包括关系库能够处理的结构化数据,特别擅于对付长短不一,结构不规则且难于规范的数据。如杂志文章、图书资料、文件报告、法律法规、往来书信、备忘录等任意规格的文本数据。还可以存储二进制文件数据。(关系型数据库所不擅于处理的)
TRIP是面向非结构化数据的数据库系统
整体看未见有完整的基础理论,但关键环节,如查找采用了顶尖的索引技术;数据存储用了任意变长技术。
1986年安装在中国科技情报研究所1987年底推出中、英文版TRIPv2.6 UnionCatalogofChinesePeriodicals经济日报(90),新华社(91),经贸部(01)以及 全国科技情报所、NSTL采用1994~1998先后由德、美、加经营。
鼎盛时(95)TRIP的营业额居全球第一、美国第二。1999~现在瑞典TietoSwedenAB经营。2004代码中心
采用于海量结构化数据检索。
2005国防数据图书馆系统2005印尼Petro_China海量PDF资料的档案检索管理
二、TRIP的组成
TRIPsystemTRIPgridTRIPjxpTRIPnxpTRIPxmlVT100ASCIIGUITRIPmgrTRIPtoolkitASETRIP@clientTRIP@viewTRIPagent三、TRIP系统的关键技术TRIP的数据类型TRIP的记录结构TRIP的库结构检索词的Hash运算
TRIP数据库是由记录组成记录又由字段field组成。字段按数据类型分有7种:文本、词组、整数、实数、日期、时间、字符串
Text,Phrase,Integer,Number,Date,Time,String
词组字段可再分成子字段subfield文本字段可分成带序号的段、句和词word, 检索时可在指定的段、句、词中查找。日期字段存YYYY-MM-DD时间字段存HH:MM:SS字符串字段放文字、图象、图表及其它二进制数据。TRIP的数据类型
词组类型PHRASE
由子字段Subfiled组成;每个子字段长度256字节;超过256字节会分段处理,但意义不完整;
文本类型TEXT
由段paragraph、句sentence、词word组成PHRASE、TEXT字段存文字信息
其中的每个word都有位置信息,如段号句号,第几词
TRIP数据库中的记录数是没上限的;每个记录的长度是不限的;每个记录的字段数、子字段数、段落、句子数和词的个数 也没有上限;文本字段的段落、句子、词的长度也不受限;除字符串字段外,其余字段的内容均可做倒排,即可被快速查找;字符串字段能存放二进制数据Office文档,图片,CAD,声音,文字75年设计
数据不限长1field 1subf题目内容…2field 1subf作者甲
2subf作者乙
3subf作者丙…3field 1subf期刊名称
2subfISSN号4field 1parag文摘内容第一句。第二句….5field 1parag第一段第一句。第一段第二句。第一段第三句。…
2parag第二段第一句。第二段第二句。第二段第三句。… 第二段第四句。第二段第五句。第二段第六句。…
3parag第三段第一句。第三段第二句。第三段第三句。…
4parag
第四段第一句。第四段第二句。第四段第三句。……TRIP的记录结构(三维示意)
一个记录1PHtitle2PHauthor3PH
Keytitle4TEabstract5TEtext
TRIP的记录结构(三维示意)
两个记录示意TRIP的记录结构(四维示意)1户主姓名家庭住址曾经住址说明家庭成员P性别 P年龄 P工作单位P单位地址P1field1subf户主姓名
2field1subf家庭现住址3fieldsubf1曾经住址1subf2曾经住址2…4field家庭情况说明信息最早最成熟的非结构化数据库管理系统
真正的多媒体全文数据库系统每个TRIP数据库由三个独立的文件(files)组成:不是fileDBname.BAF
存放原始数据的主文件DBname.BIF
存主文件中词的倒排(inverted)信息,供词检索用DBname.VIF
存倒排词的截断信息的文件,供词的截断检索用这三个文件合在一起形成TRIP的一个数据库
独立于计算机的操作系统,
可以在不同的操作系统的TRIP下运行: Windows,Solaris,True64,AIX,Linux,MAC…
在Unix下建立的这三个数据库文件,可以拷贝到Windows上安装的TRIP系统中使用,当然必须知道库结构。
TRIP的库结构TRIP文件结构概念图
DBname.BAF(Basefile)TRIP倒排文件结构概念图
DBname.BIF(index,invertedfile)TRIP词汇倒排文件概念图
DBname.VIF(vacaburaryinvertedfilefile)Hash运算
词在BIF中的定位由hash哈希码–低端若干bit位为块号所决定词条
term散列码生成器32bit散列码Nbit入口块号(n=7)1234568910111213141516010011100111100110011001100001117TRIP数据库的最大容量
取决于计算机操作系统所能处理的单个文件的大小 微机Linux系统上实验过的: 1200万记录的EI数据库,英文,2000字节/记录 BAF文件:23GB BIF文件:15GB VIF文件:5GB维护方便起见,每个库不宜太大同时打开250库进行查找Hash
哈希算法的查找速度最快TRIP的检索反应速度比一般关系型数据库快一个数量级。检索一个词的速度与数据库的大小几乎无关,
百万记录数量级情况,70年代1/3秒
现在的计算机,达到百分秒级,几十至百毫秒。多个词组合查找时的时间与词的频度有关。TRIP的检索速度
面向大对象存储机制
规范的、非结构化的,文字的,二进制的,任何数据均存储在全独立的内部环境中。
最快速查询算法(散列函数)
采用倒排文件(Invertedfile)索引技术的引擎(Engine),在建立数据库时每个词都通过散列函数(hash)生成一个唯一码存在数据库BIF文件中,找这些词就像“探囊取物”,一次到位。
灵活多变的数据输出提供一系列预制函数(如编辑、排序、统计、分析、数据关、调用用户自制子程序…)
TRIP最成功之处一、TRIP的沿革二、TRIP的组成三、TRIP的关键技术TRIP的数据类型TRIP的记录结构TRIP的文件结构检索词的Hash运算谁能建库?
怎样建库?
谁能使用库?
怎样使用库?
第三章TRIP常用组件介绍
本章介绍怎样建立数据库设计数据库的构架,那些字段,类型,查找,如何将数据库构架安装进TRIP如何往TRIP写入数据
系统管理员
system数据库管理员
FileManager(FM)用户管理员
UserManager(UM)普通用户
UserTRIP
系统一经安装成功,就有一个用户存在,用户名为system,口令z系统管理员systemmanager谁能建库?
TRIP系统的四种用户
SystemMgr(system)系统管理员UserMgr
FileMgr用户管理员数据管理员User… Database…一般用户… 数据库…只有系统管理员system可以改任何用户的口令其它人只能改自己的口令account用户权限管理
谁能建库?-数据库管理员怎样建库?-用什么工具和步骤谁能使用库?怎样使用库?怎样建立TRIP数据库?入门工具两种用户界面TRIPclassic命令行方式的界面,要求用终端,或安装 仿真终端,或通过telent远程登录至TRIP服务器 必须是VT200以上的终端。VT100不支持中文。TRIPmgr 图形用户界面,本地必须安装TRIPmgr软件。TRIP的组成
TRIPsystemTRIPtoolkitTRIPjtkTRIPxmlVT100ASCIIGUITRIPmgrASETRIP@clientTRIP@viewTRIPagent设计步骤:首先,
1、拟定好字段名称,数据类型,是否要倒排(查找);2、给每个字段一个英文或拼音字符名。
数据类型ph
tenuindatist
IdphY文章IDtitphY题名
autphY作者AbsteY文摘
下一步,进入TRIP系统,用终端菜单方式或文件方式生成库结构也可通过TRIPmgr的图形界面方式建立数据库的结构。
数据库的设计与生成
登录—管理—数据库—数据库设计—建立/修改
首先登录到TRIP服务器在命令行输入TRIP<cr>终端菜单方式生成库结构登录TRIP系统输入用户名和密码
成功登入后进入顶级菜单top-menu
光标停在检索栏
往右移动光标至“管理”并按两次回车键
进入数据库设计界面
光标停在数据库设计上时按回车键,获得下拉菜单出现生成/修改数据库设计界面
输入数据库名称后按回车键数据库设计的顶层界面
自动生成三个文件文件地址在登录目录下可以改变
转入下一个屏幕,进行字段的设计VT终端的下一屏是小键盘的7键,可用如下按键顺序实现:先同时按Ctrl,k两键,然后按7,亦即Ctrl+K,7
即可获得下一屏。
字段名 最多16个字符,字符及_倒排类型 N,Y,W,S Y ph字段词,词茎,整段 te字段词,词茎
num,dat,time字段字段号而非内容 W 只用于ph字段词,词茎
S 单独索引,只用于词组文本字段输入字段名、数据类型、要不要倒排及说明后,按Ctrl+e键暂存起来,接着再输入其它字段,直至全部输入完。最后按F3键退一级,再按<Enter>键存起来(Ctrl+e)。
字段名及倒排:记录名字段 定义该字段内容为唯一名Part_Field
Y,N定义该字段为子记录所用子记录名字段 定义字记录中该字段的内容为子记录Subfield必备字段
只对phrase字段的要求 Subfieldsto 字段值可有可无 Subfields1to 不可缺少 Subfields1to2 不可缺少,不多于2个 Subfieldsto3 可有可无,不多于3个
Cont…
对字段内容的限制
模式限制Pattern
通过有效值表或字典内容限制ph的内容。版式保持layoutretained
保持原数据上的LF,Tab,空行。文本字段更需要。日期字段的数据格式:
YYYY-MM-DDYY-MM-DD 按照上述格式存入的日期,可以用15种不同格式输出。…cont
对字段内容的限制
保存设计时,需按小键盘上的Enter键,也可同时按Ctrl,E两键实现存成功与否,会在底行提示
数据库框架建立成功后,如果是中文库,涉及词切分,必需告诉TRIP采用哪种方式切词,为此,按小键盘6键,或按Ctrl+K,6,即可获得一个小屏。选择N,M,W,A之一,隐含的是N中文自动分词V6版本,四种切分方法,任选一种N:
单汉字A:allM:最大匹配法W:在M基础上,对切出的大词再切直至两字词,单字、交叉词不切。以“中华人民共和国”为例,N:7中华人民共和国M:1中华人民共和国A:14中华人民共和国人民共和国共和国中华华人人民共和中华人民共和国W:7中华人民共和国中华人民共和国人民共和国共和国TRIP用的VT100小键盘作为功能键TRIPGoldLeaveQuitPageFieldstartFieldstopFieldlistFieldbcgrEnterVT100PF1PF3PF3kp7kp8kp8kp9kp9Ctl+ETRIP功能键
及其代用表TRIP用VT100小键盘作为功能键(常用7个)同时按<CTRL><f>两个键,后跟数字键1-10,即等同于微机的功能键F1–F10。同时按<CTRL><k>两个键,后跟数字键1-9,即等同于VT100小键盘数字键<kp1>-<kp9>。
数据库设计存好后,按F3键往上推出,直至顶层菜单再按回车键,获得上面所示的菜单,光标停在CCL检索再按回车键,则获得检索操作屏幕
现在想了解一下刚才建立的数据库构架,需用CCL命令STATUS
用上下箭头可以上下移动屏幕可查找的字符TRIP只可对英文字符和0~9数字进行倒排处理,除非在 searchablecharcters中作特殊定义。不要定义为可查找词包括:双、单引号”
’在检索命令中10个有特殊意义的字符,包括:$#&.!?:()+其它字符如-/*@…经过定义后,再对数据库重新倒排,则可被查找到。数据库设计的第二种方式:文件注入式
编辑如下的文本文件,名为database.defOPTIONS=5(tit: 1PHRASE COM(论文题名
),aut: 2PHRASE COM(作者),ktit: 3PHRASE COM(期刊名),year: 4PHRASE COM(期刊年份),vol:5PHRASE COM(卷号),NO:6PHRASE COM(刊期),abs: 7PHRASEORIG COM(文摘),)文件注入法生成库结构
数据库结构设计好之后,怎样给数据库添加记录?
两种方法:
批式装入——TFORM数据格式
联机录入——通过终端方式,需要设计录入界面录入工作单既可用来往数据库录入数据,也可以用来修改记录。数据的批量入库准备
TFORM文本文件:三种格式(^前置)R^NF字段内容…^P字段内容…^P……^_______________________________________________R^NF^1p字段内容…^2p字段内容…^4p字段内容….^_______________________________________________R^nF^p^nL字段内容…^p^nL字段内容…^pnL字段内容….^TFORM文本文件格式
(^断后)R^nF^ P字段内容…^P字段内容…^P….^R^nF^ P^nL字段内容…^P^nL字段内容…^P….^TFORM
文本文件格式
(子记录)R^NF字段内容…^P第二子字段内容…^P……^G^nF子记录字段内容…^P子记录n字段第二子字段内容…^P……^TFORM文件格式R^1f经济全球化与中国服务贸易开发^2f涂中才^p权勇民^3f大连市政府经济研究中心^p
LG商业会社^4f当今世界,经济全球化正在以迅雷不及掩耳之势全面展开,...^5f世界经济^p服务贸易^p
开放^6f一、引言:“世界经济潮流,浩浩荡荡,顺之者昌,逆之者亡”。孙中山先生的这句名言对我们站在世纪之交,应对世界经济形势的种种变化和趋势具有重要的指导意义。
…..^R^1f….数据库结构1 title2 author3 address4 abstract5 Keywords6 ContentsTFORM文件怎样入库和倒排?两种方式:
菜单方式(登录进入TRIP系统)登录
管理——数据库——建立/修改——装入/倒排——装入/倒排 输入数据库名称和TFORM
文件名称
命令方式(在操作系统的命令行)
loadBaseNameYNTFORM_filename IndexBaseName
loadixBaseName
YNTFORM文件名TFORM文件的Load入库与Index倒排数据online录入—录入格式的设计录入工作单的生成登录—管理—格式—录入格式—建立/修改—录入工作单的设计(一)
勾画出字段布局录入工作单的设计(二)
设计录入数据区录入工作单的设计(三)
每个字段域的定义步骤:1、定义字段域的左(左上角)位置,即起始位
把光标放在起始位,按ctl+k,8即成。2、定义字段域的右(右下角)位置
用tab键或箭头(左右、上下)键移动光标到所需位置,即字段域的一行的最右端,或矩型的右下角处,然后依次按F1键、ctl+k、8即可。3、将所生成的字段域与TRIP字段联系起来
依次按Ctl+k,9获得字段表录入工作单的设计(四)
数据区与字段关联录入工作单的设计(五)录入工作单的设计(六)4、按<Enter>或Ctrl+E将设计好的录入工作单存入TRIP系统中。说明:1、只有数据库的拥有者才能设计工作单。工作单可以设计成只是针对某一些字段,不一定非得包括全部字段。2、进行数据录入,或修改数据时,可以按照
登录-数据录入-增加记录/数据修改-数据库名-Form名的路线获得录入工作单。注意,增、删、修改记录的用户,必须对该库具有写权限方可。两用途:数据录入和后台数据修改
1、沿下列路线进入录入格式生成菜单
管理-格式-录入格式-生成/修改菜单
2、按提示输入数据库的名称和工作单的名称,按回车键3、在空白屏幕上填写字段标题,并预留好数据录入区间4、定义数据录入区
kp8 字段数据区开始
tab键或方向键移动光标至所需位置 F1+kp8 字段数据区结束
cont…设计录入工作单的要点5、录入区与数据字段挂钩 光标停在录入区,按kp9获得字段表,光标移至字段处;
按*键选择,出现*时表明录入区已与数据库该字段有了 联系,按ctrl+e存储;6、待所有字段的录入区都定义好并与数据库挂上之后,按f3退 至前一级菜单,再按ctrl+e将录入工作单存储起来。 还可以选择录入区的属性(反显,黑体,下划线…) 或者在录入时从其它数据库中调用数据
Cont…
谁建的库,归谁所有
只有经所有者给TRIP的用户授权,该用户才能查看或修改。三种级别:库,字段,记录。又分读access
和写write权限。记录级授权要在Readscope栏填写可被查找的内容,如: 计算机 Allnot(计算机or互联网)
数据库的权限(授权)
1、最基本的命令2、高级检索3、输出显示4、display功能5、间接检索与词表检索6、动态统计与分析第四章、TRIP数据库的使用指南
介绍CCL命令CCL(CommonCommunicationLanguage)
是交互式文本查找命令,由国际标准化组织ISOInternationalStandardOrganization制定的一种通用的语言标准ISO87773RIP一开始就采用类似CCL的原形命令,如:
Find,Show,Print后来为ISO专家正式推出CCL,1985年TRIP便全面采用BASe
basename
打开名为basename的数据库 Find
网络 查找“网络”这个词Show
按预定输出格式显示命中记录PRint
file=xxx
把刚才检索的结果打印成文件xxx
STOP
(<F1><F3>)
退出(logout)TRIP系统
4.1最基本的检索命令
——支持and,or,xor,not四种运算符的检索
F计算机and网络
F计算机or网络
F计算机not网络
F计算机xor网络
4.2TRIP的高级检索
Fph=计算机andph=网络 Ftit=计算机andabs=网络 Ftit=(计算机and网络) 在指定的字段内用#或“”可以查出该字段有无数据:Ftit=# 查出tit字段有数据的记录Ftit=“” 查出tit字段没有数据的记录——指定字段范围的查找
Day为日期字段 age为数字字段Fday=fr2003-06 Fday>2003-06 Fday=to2002-10,fr2003-6Fage>30Fage=<60
——按记录号r检索(不管是否倒排过)Fr=fr1 Fr=101to300 ——查日期字段、数字字段$ 前后有空格时表示一个词,用于位置检索。
无空格时取决于$的位置: 位于一词之前或后时,表示前、后被截断的任意字符位于一词之中时,外文表示一个字符,中文表示一个字
Fg$$d
找good,gold,gild,grid,但不找god
Fpar$$$y
三个$$$表示任意长的字符串(包含0个). 前后有空格时表示至多有1个词,多用于位置检索
Fapple...pear
apple与
pear之间最多夹有三个词的记录。注意.的两侧有空格隔开。F高..校 ‘高校’,‘高等院校’,‘高等学校’——截断检索符(作用于词)
# 表示任意个字符
Fdevelop#
develop,developed,development,developments
Faut=J#smith
字段aut中以J字符开头的smith都将被找到
!
表示一个字符
F!ose
查找dose,hose,rose FFind=!!!!! Nohits!: 表示最多一个字符
Fcolo:r
查找color和colour
——截断检索符(作用于字符)
& 放在首位,表示在‘&’之后的词必需出现在子字段或句子之首位,放在末位,表示在‘&’之前的词必需出现在子字段或句子之末位Ftit=&computer
查tit字段中,computer开头的记录F&中山 查找在子字段或句子中以‘中山’起头的记录
——首位、结尾符&
上一次检索结果基础上的进一步查找
S=1 <99>BASecorrS=2 <12>Findcomputer FcomputerS=3 <5>FindS=2ANDretrieval FandretrievalS=4 <4>FindS=3ANDrname=Mat$ Fandrname=Mat$S=5 <1>FindS=4ANDlibrary FandnetworkS=6<1>FindS=2andnetwork Fs=2andnetwork
二次查找
Ffieldname=‘整个子字段的内容’
时印——记录生成或最后修改时间
TimeStamp(TS)
Fts=fr2005-01-01
phrase字段整个子字段内容的查找
S
用户定义隐含格式或系统的隐含格式显示Sf=fdn1,fdn2…
只显示所指字段内容Sf=xyzSort=fdn1,fdn2 按输出格式zyx,先后按字段fdn1,fdn2排序输出Prf=xyzsort=fdn1,fdn2file=my_file.txt
上述显示的结果生成一个文件
4.3检索结果的输出显示检索结果的文件输出如同show命令,但生成文件Prsort=fdn1,fdn2file=my_file.txt
按fdn1,fdn2两级排序,并按系统格式生成文件Prf=xyzsort=fdn1,fdn2file=my_file.txt
按fdn1,fdn2两级排序,并按xzy格式生成文件
若不指定路径,自动生成在登入TRIP的目录下数据从数据库出来后在用户界面上的显示布局输出格式语句
结构<boxnoatb(*)+lines,columsizelines*colums Fieldname <t=用户定义词> Functioncomponents>输出格式outputformatFunctioncomponents<base> 数据库名<curdate>现在日期<hits> 在本次检索中命中的记录总数<rid> 库中的记录号<ris> 本次检索中的记录号<h.field=**>字段内容前插入**(h表示head,前插)<s.field=/>字段之间用回车换行符隔开(s表示separate)<s.sub=;> 子字段之间用分号;隔开<s.p=//>正文类型字段的段落之间空两行,并缩回两字符。<t=
>无条件插入文字.例:<t=RecordNo:<rid>>插入文字“RecordNo:”
和记录号Tstamp:入库时间,不作为函数,而作为字段名使用。输出格式例1<<box1atb(*)+2,10tit><box2txt>>输出格式例2<
<box1atb(*)+2,2 <h.tit=题目:> tit> <box2atb(*)+2,10 <h.aut=作者:> <s.sub=,> aut>>
一是进入TRIP的输出格式编辑器,按照TRIP的输出格式 语句,联机编辑而成;二是在TRIP之外利用其它编辑器(如word)按TRIP的输出 格式语句,编成文本文件,然后利用TRIPIMPO命令 写到TRIP系统中;三是把其它数据库已有的格式复制过来。
输出格式三种生成方法<
<box1atb(*)+1,1
<t=库名:<base>/记录号:<rid>> !无条件插入<h.field=题目:>tit !字段内容前面插入提示> <box2atb(*)+3,1 <h.field=作者:> <s.sub=;>org >
<box3atb(*)+2,5<t=Abstract:/>abs>>
输出格式的设计输出布局示例<
<box1atb(*)+1,1<t=库名:<base>/记录号:<rid>> !无条件插入<h.field=题目:>tit !字段内容前面插入提示> <box2atb(*)+3,1 <h.field=作者:> <s.sub=;>org >
<box3atb(*)+2,5<t=Abstract:/>abs>
<t=/Createdtime:>tstamp>>
输出格式的设计(添加记录生成时间)输出布局示例(tstamp)特殊的输出函数
<case><boxatb(*)+1,1<h.field=_<tdcolspan=5_>馆藏:><s.sub=;> <case(libname, 'CN111001':'中信所', 'CN311001':'中科图', 'CN111013':'机械院', 'CN111016':'化工中心', 'CN111015':'冶金院', 'CN111024':'医科图', 'CN111023':'农科图', 'CN111031':'计量院', 'CN111025':'标准中心',) >>关联输出
根据数据库输出的内容,TRIP可用它连接到另外一个数据库的字段去取数据,然后和本数据库的其它字段数据一起输出。这类似于关系库的关联。不仅能取到词组字段的内容,也能取出文本字段的内容。关联函数
<link><link>
用于根据现在数据库输出的内容作为查找项,去另外一个TRIP数据库中取出数据,然后和本数据库的其它字段数据一起输出。格式<boxatb(*)+1,1<link(F1,link_db,load_fld,L1)>>F1:目标库输出字段,内容作检索词Link_db:关联库Load_fld:关联库取出数据的词组字段名L1:关联库中何处查找指示符LINK指示符0
在关联库中的记录名字段查1在所有的TE字段中查2 在所有的TE/PH字段中查3 在所有的PH字段中查13在所有的PH字段中进行完全匹配查Fieldname在指定字段名中进行查找‘Fieldname’
在指定字段名中进行完全匹配查<link>用法用法1:用F1的内容在关联库的记录名字段中查,从字段load_fld取出数据<link(F1,link_db,load_fld,0)>用法2:用F1的内容在关联库所有的text字段中查找,从load_fld输出<link(F1,link_db,load_fld,1)>
<link>用法用法3:用F1的内容在关联库所有的TE、PH字段中查找,从load_fld字段取出数据:<link(F1,link_db,load_fld,2)>用法4:用F1的内容在关联库的fieldname查找,从load_fld输出<link(F1,link_db,load_fld,fieldname)>
<link>用法用法5:用F1的内容在关联库所有的所有PH字段中完全匹配查找,从load_fld字段取出数据:<link(F1,link_db,load_fld,‘3’)>用法6:用F1的内容在关联库的fieldname完全匹配查找,从load_fld输出<link(F1,link_db,load_fld,‘fieldname’)>
如何从文本字段取出内容?<
<link(F1,linkdb,load_fld,’fieldname’,dummy1)><boxatb(*)+1,1<t=Helloworld!>><boxatb(*)+1,1<t=Herecomesthetextfromthelinkdatabase…/><s.p=/>dummy1>>
目标库中需预先设立一个dummy1文本字段,当道具,临时用其它一些有用的函数<if–empty(fieldname)><if–nonempty(fieldname)><call>
<boxatb(*)+1,1<if-nonempty(image)><t=_<_/td_>_<tdvalign=topalign=middlewidth=450_>><t=_<imgsrc="_/cgi-bin_/blob.cgi?dbname=<base>&RID=<rid>&FID=2&FNO=4"_>>><boxatb(*)+1,1<if-empty(image)><t=本记录无图像>>
<CALL>在数据输出之前调用用户写的子程序对数据进行处理。该子程序可以从本数据库的字段,或从外部文件,或其他数据库中取来数据.格式:
<boxatb(*)+1,1 <t=<call(reformat,fieldname,0)>>>reformart子程序fieldname取出数据的字段0 立即调用输出格式中的五个保留字符<>/ 回车换行!注释符_为输出上述这些符号需在这些符号前用_
输出示例<boxatb(*)+1,1 <if-nonempty(image)> <t=_<tdvalign=topalign=middlewidth=450_>> <t=_<imgsrc= “_/cgi/bin_/blob.cgi?dbname=<base>&RID=<rid>&FID=2&FNO=4"_>><boxatb(*)+1,1 <if-empty(image)> <t=本记录无图像>>实际输出<tdvalign=topalign=middlewidth=450><imgsrc=/cgi-bin/blob.cgi?dbname=demo&RID=15&FID=2&FNO=4>本记录无图像
Outputform<<box1atb(*)+1,1<t=库名:<base>/记录号:<rid>> !无条件插入<h.field=题目:>tit !字段内容前面插入提示> <box2atb(*)+3,1 <h.field=作者:> <s.sub=;>aut >
<box3atb(*)+2,5<t=Abstract:/>
abs><t=/Createdtime:>tstamp>>
输出格式输出布局示例(tstamp)根据内容调用程序的输出示例<boxatb(*)+1,1 <if-nonempty(image)> <t=_<tdvalign=topalign=middlewidth=450_>> <t=_<imgsrc= “_/cgi/bin_/blob.cgi?dbname=<base>&RID=<rid>&FID=2&FNO=4"_>><boxatb(*)+1,1 <if-empty(image)> <t=本记录无图像>>
Outputform
1、最基本的命令2、高级检索功能3、输出显示4、display功能5、间接检索与词表检索6、动态统计与分析第四章、TRIP数据库的使用指南
介绍CCL命令功能
浏览库中存在的词汇(word),浏览phrase字段中整个子字段的内容4.4display命令用法1:浏览整个数据库中(限在text、phrase字段)与指定的词片相关的词,它们分别出现多少次数。命令格式是:Dterm
显示整个数据库中有多少词term(=fterm)Dterm#
显示整个数据库中有多少以词片term为首的词display功能的用法用法2: 显示在指定字段中与给定的词片相关的词。命令格式是:Dfldn=term
显示字段fldn中有多少记录有词term(=fterm)Dfldn=term#
显示字段fldn中有多少记录含有词片term为首的词display功能的用法display功能的用法3
显示指定词组字段中指定出现频度的内容Dfldn=termfr>n
显示fldn字段中,词term出现的频度大于n的内容Dfldn=term#fr>n
显示fldn字段包含有词片term的词、同时频度大于n的内容Dfldn=#fr>n
sort=fr
显示fldn字段中频度大于n的内容,按频度排序display
功能的用法4
显示词及其出现频度,用word或fr在display之后。Dwordab=#
显示ab字段中所有的词Dword
ab=#病#
显示ab字段中含有“病”的词Dfr
wordab=#病#
显示ab字段中含有“病”的词 出现的频度
display功能的用法5浏览指定词组字段中以给定的词片开头或结尾的内容 Dfldn=&term
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年福建省厦门市集美区杏东中学英语七下期中统考模拟试题含答案
- 体育健康海南试题及答案
- 2025年人才资源策划优化协同协议
- 2025年姐妹公司策划合作发展协议
- 2025年交通运输领域视频监控施工安全协议
- 2025年专利代理协议书模板(非职务)
- 内部审计与风险防控的协同效应
- 监管变化带来的挑战与应对
- 2025年建筑工程门窗供应协议书
- 2025年特岗教师教育理论基础精准模拟试卷(2025版)
- 贵州国企招聘2025贵州省粮食储备集团有限公司招聘76人笔试参考题库附带答案详解析集合
- 学生集中配餐管理制度
- 婚纱店合伙合同协议书
- 温州市光伏发电研究报告-温州市光伏发电行业市场深度调研与投资前景分析
- 胃癌内科护理常规
- 工程资金共管协议书
- 2025年安全管理员安全培训考试试题带答案(培优)
- 广东省广州市越秀区2025届七下生物期末学业水平测试试题含解析
- 2025年建筑制图试题及答案
- 危险化学品企业“安全领导力”专题培训指导材料(雷泽佳编制-2025A1)
- 浙江省台金七校联盟2024-2025学年高一下学期5月期中联考地理试题(原卷版+解析版)
评论
0/150
提交评论