版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
TRS全文检索系统
应用培训TRS培训部2003年内容安排TRS全文检索系统介绍TRS数据库效劳器及管理员工具的安装及卸载TRS数据库效劳器启动及关闭方法TRS数据库系统各种对象概念及其属性TRS数据库的各种字段类型、索引类型和索引策略等TRS数据库各级权限机制,权限管理和权限检查的规那么等数据加载的方法以及数据文件的格式说明数据库检索表达式的语法规那么以及运算符、函数、键值等系统概述(1)TRS〔TextRetrievalSystem〕信息发布检索系统是由TRS公司开发的一个体系结构先进、功能强大的面向文本数据的数据库管理系统,广泛地用于各种信息数据库、以及信息门户的建设。TRS全文数据库效劳器的核心技术为全文检索,它为各种格式文档的存储、管理和检索提供动力。它的主要功能和性能如下:1.
“零〞空间膨胀率〔-10%至20%〕。
2.基于本钱优化的查询算法(索引分区技术,多线程并行运算技术,面向全文检索的Cache技术),使得G级数据库查询速度到达亚秒级,并支持大量并发用户的同时访问。
3.多线程设计,支持SMP体系结构。
4.支持跨平台计算:支持NT4.0,Linux,SunSolaris,IBMAIX,HP-UX,CompaqTrueUnix,SGIIRIX,SCOUnix。5.除了提供标准的C/C++API外,还提供COM和JavaBeans组件,可以使用符合工业标准的开发工具进行快速开发(ASP和JSP)。6.支持Unicode(WCS2)。系统概述(2)7.采用开放的数据存贮管理机制,通过TRSforRDBMSGateway,可以透明地连接oracle、db2、sqlserver、sybase和informix五个主流的数据库管理系统。8.领先的中文信息处理技术:内嵌汉语自动分词系统,支持按词索引、按字索引、按关键词索引、二元组索引,大大提高检索的准确性和响应时间。9.检索信息快、准而且全:允许使用文中的任意字、词、句和片段进行检索,提供了基于文献内容而不仅仅是文献外部特征的全文检索手段。TRS所提供的按词和按用户自定义关键词进行索引和检索,以及基于知识词典的扩展检索功能,满足了特殊应用领域的高查准率和高查全率的要求。
10.检索功能强大:全方位检索手段,提供了多达48种检索运算符。包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索、渐进检索、历史检索、词根检索、大小写敏感检索、概念检索、对检索结果按与检索表达式的相关性和重要性程度排序等。11.平安性好:具有系统级、数据库级、记录级和字段级四级平安控制机制。12.提供功能强大的TRS管理员工具:数据库维护、数据库的平安性控制、数据的完整性和一致性、数据库备份和恢复、用户管理等功能。人民日报:水利网:chinawater吉大图书馆:北京市卫生部:://更多实例请参照TRS公司网站:://trs应用实例Cel转换体
系
结
构安装目录结构及作用启动和关闭TRS数据库效劳器硬件及软件环境l运行中文版MicrosoftWindowsNTServer4.0(ServicePack3)以上版本操作系统的小型机、效劳器、工作站、Pentium及其兼容机。l内存64MB以上,建议使用128MB内存。l一个可用空间在100MB以上的独立硬盘或分区用于安装效劳器。l操作系统可使用的对换空间最好在100MB以上。局域网连接设备。效劳器在Windows下安装运行安装介质上setup.exe产生目录:\TRS4安装过程中需要:-输入产品的key-设定效劳器缺省端口号-选择将效劳器登记到WindowsNT系统效劳中-选择效劳器启动方式等操作安装步骤产品KEY在[序列号]中输入产品键值。产品键值是由厂家根据您的机器号生成的,所以这时您需要与厂家联系,将上面对话框中显示的机器号告诉厂家以获得相应的产品键值。效劳器网络端口号知识词典和例如数据库加载完成后,安装程序显示如下图的对话框,要求你输入效劳器的网络端口号。默认为8888,此时可以修改。登录NT效劳及选择启动方式TRSServer目录结构TRSHome目录binsystemdictibasetempoem目录结构相关说明bin:存放效劳器所有可执行程序、动态连接库及版本信息文件。system:存放数据词典、系统配置及KEY文件,该目录下的文件是效劳器的核心文件,不能破坏,否那么效劳器将无法正常启动和运行。除配置文件以及KEY文件外,其他文件均由效劳器自动维护。ibase:效劳器存放数据库的缺省目录,包括数据库的全部数据和索引。TRS允许用户设置并使用其他的目录来存储数据库。dict:存放效劳器缺省的知识词典及用户定义的词典。oem:主要用来存放为TRS系统配置的OEM产品。用于文本过滤。temp:系统的临时文件公用区。
T40hostid.exe:获得安装机器的ID,用于产生效劳器运行时所必须的KEY。T40server.exe/t40shutdown.exe:启动/关闭效劳器的程序。T40master.exe:效劳器管理员-list:查看当前登录用户的相关信息;-password:查看系统管理员〔system〕的口令T40service.exe:将TRS效劳器作为一个NT效劳时,用于管理该效劳的命令行程序。T40console.exe:将TRS效劳器作为一个NT效劳时,用于管理该效劳的图形界面程序,即TRS控制台。Bin目录下系统命令效劳器的启动/关闭(1)TRS效劳器启动后,占用TCP/IP的8888端口,用户在启动时可指定端口号〔必须大于1024〕。方法:1.命令行直接启动/关闭启动:执行/bin/t40server.exe[端口号]关闭:执行/bin/t40shutdown.exe[端口号]
效劳器的启动/关闭(2)方法:2.命令行启动/关闭做为NT系统效劳的TRS效劳器启动:执行trshome\bin\t40service-start前提条件:一:操作系统必须是WindowsNT/2000;二:在操作系统文件‘NT目录\system32\drivers\etc\services’中已经参加‘trs4xxxx/tcp’这个效劳端口;三:TRS效劳器已经作为NT系统效劳进行了注册。关闭:执行trshome/bin/t40service-stop
效劳器的启动/关闭(3)方法:3.用TRS控制台启动/关闭作为NT系统效劳的TRS效劳器启动:在TRS控制台的菜单中选取“启动效劳〞功能。关闭:在TRS控制台的菜单中选取“关闭效劳〞功能。4.在操作系统启动时自动引导首先登记TRS效劳到NT系统效劳中,并将启动方式设置为“自动〞。每次重新启动时,操作系统将自动启动TRS效劳器。【说明】无论是用哪一种方式关闭效劳器,所使用的端口号必须与启动效劳器时的端口号一致。效劳器关闭时并不是立即退出,它必须等待所有正在执行的效劳请求完成后才彻底结束,但是这时效劳器不再响应新的效劳请求。如果系统中已没有任何名为t40server的进程时,那么表示效劳器正式关闭。有时候需要强制“杀死〞TRS效劳器,虽然可以用任务管理器完成,但是还需手工去除TRS效劳器所创立的共享内存映射文件等。用命令‘t40shutdown–kill端口号’可自动完成所有这些操作,当系统文件‘NT目录\system32\drivers\etc\services’中存在‘trs4xxxx/tcp’时,其中的端口号可以省略。效劳器升级要求:(1)效劳器升级包中包含的文件〔参见手册〕必须放在同一目录下。
(2)在进行效劳器升级前,注意先备份原来的数据,然后关闭效劳器。再运行安装包下t40update即可完成TRS效劳器系统文件的自动更新。(3)如果所运行的t40update处在效劳器的bin目录下,那么只会进行数据词典的更新,而不会进行效劳器系统文件的复制。效劳器在Unix下安装Home目录其他目录其他目录服务器帐号驻留目录binsystemdictibasetempoem安装前准备工作(1)确定是否使用支持大文件的安装包如果你要求TRS效劳器支持大文件〔即largefile,有的系统称超过2G的文件为大文件,而有的系统那么认为超过1G的文件就是大文件〕,那么必须使用支持大文件的安装包进行安装,同时还必须保证用来存储数据库文件的文件系统允许大文件的读写,即去除文件系统本身对大文件的“人为〞限制,例如:SUNSolaris要用mount_ufs命令的largefiles选项mount文件系统,无论操作系统是64位的,还是32位的;IBMAIX要将系统的/etc/security/limits配置文件中的fsize参数设为-1,并用smit工具将文件系统的属性设置成“LargeFileEnabled〞,无论操作系统是64位的,还是32位的。安装前准备工作(2)确定效劳器的用户帐号TRS效劳器的各种文件必须驻留在操作系统的一个用户帐号之下,因此在安装之前要首先为TRS效劳器确定一个操作系统用户,以下简称为效劳器帐号。操作系统中已有的任意一个用户帐号都可作为效劳器帐号,但最好还是专门创立一个用户帐号作为效劳器帐号。效劳器帐号所在的硬盘或分区的可用空间应在100MB以上,对效劳器帐号在硬盘空间使用上的限制不能小于100MB。安装包命名说明安装包的命名有以下四种形式:TRS4.nnBxxxxGBTRS4DEMO.nnBxxxxGB其中:‘TRS4’表示该安装包是一个TRS4效劳器的正式发行包;‘TRS4DEMO’表示该安装包是一个TRS效劳器的演示包〔只有一个License,自安装日起一个月内有效〕;‘nn’是编译环境的机器字位数,如‘64’,‘L32’表示在32位环境下支持64位文件;‘Bxxxx’是该效劳器的生产批号,如‘B1000’;‘GB’表示该效劳器使用以简体中文内码〔GB2312、GBK、GB18030〕为主体〔缺省〕字符集;‘BIG’表示该效劳器使用以繁体中文内码为主体〔缺省〕字符集。‘MACHINE’表示该效劳器运行所需硬件环境,一般指机器的CPU名称;‘OS’表示该效劳器运行所需软件环境,即操作系统及其版本号;‘tar’表示该包是用‘tar’命令归档而成的。如:。安装相关说明安装请具体参照用户手册“效劳器在Unix下的安装〞进行。安装成功后可以在trs效劳器帐号下执行bin目录下的t40server/t40shutdown[端口号]启动和关闭trs效劳器。也可以在root帐号下启动。因为即使此时TRS效劳器是由root启动的,效劳器运行时的实际用户帐号和用户组仍然是效劳器帐号和它所在的用户组,而不是root。另外,对于核心版本在2.2以下的Linux操作系统,效劳器要求在root账号下启动,虽然在效劳器帐号也能成功启动效劳器,但其运行效率远不及由root启动时高。有时候需要强制“杀死〞TRS效劳器,虽然可以用‘kill’命令完成,但是比较烦琐,并且还要手工去除TRS效劳器所创立的IPC资源〔如共享内存、信号量等〕。用命令‘t40shutdown–kill端口号’可自动完成所有这些操作,当系统文件‘etc/services’中存在‘trs4xxxx/tcp’时,其中的端口号可以省略。小结
必须记住产品序列号,可以备份SYSTEM\KEY文件。在使用TRS信息检索系统之前,必须保证先启动TRS效劳器。掌握TRS效劳器的启动和关闭方法。熟悉TRS效劳器的目录结构。TRS管理员〔ADMIN〕作用安装与卸载启动与退出根本概念:TRS对象及对象属性使用
ADMIN作用TRS管理员是TRS信息发布检索系统的客户端管理工具,主要用于对各种TRS对象进行管理、设计和维护等,并具备完整的检索、浏览和维护功能。
安装与卸载软件需求:中文Windows95/98/nt/2000;TRS数据库效劳器;IE4.0以上版本安装:执行安装介质中的setup.exe卸载从菜单项选择择卸载程序进行目录结构:\TRS4\TRSAdmin\bin:存放可执行文件、动态连接库和帮助文件等。\TRS4\TRSAdmin\Navigate:存放数据库/视图的导航文件。\TRS4\TRSAdmin\Temp:存放TRS管理员执行过程中生成的临时文件。
启动与退出[前提条件]:TRS效劳器处于启动状态双击桌面上“TRS管理员4.0〞图标输入:TRS效劳器地址端口号用户帐号名口令字第一次进入用系统默认管理员帐号名(system)和口令字(manager)登录可退出登录并用其他用户的身份重新登陆
用户组用户数据库〔数据库字段〕视图〔视图字段〕词典文件格式TRS根本概念:对象用户组 TRS具有独立于操作系统的用户组管理机制,使系统方便实现数据平安的措施之一。 TRS系统的用户组是各种类型用户的集合; TRS系统可支持多达65535个用户/用户组。 系统安装时,将自动创立两个用户组/用户:administrator/system/和guest/pub。 用户组名与用户组名之间,以及用户组名与用户名之间不能重复。 创立用户时如果没有给用户指定组,那么默认放在系统的匿名组中。用户TRS具有独立于操作系统的用户管理机制。要访问TRS系统,必须首先拥有一个用户帐号,用户帐号是实现系统和数据平安的主要手段。SYSTEM:system属于Administraor组,是系统的超级用户,不能修改名称,不能被注销,可由自己修改口令。PUB:PUB属于Guest组,是公共用户,不能修改名称,不允许设置口令,能被System注销,拥有登录权限(CONNECT用户)。
用户级权限用户级权限对应于用户的类型。TRS系统有五种类型的用户级权限: 超级用户(SYSTEM)–系统中只有一个
系统数据库管理员(DBA)
用户组数据库管理员(GDA)
系统资源用户(RESOURCE)
系统登录用户(CONNECT)
超级用户只能是SYSTEM,在建新用户时不可选。超级用户SYSTEM所拥有的权限维护系统配置。创立和注销用户组,维护所有用户组的属性。创立和注销用户,维护所有用户的属性。创立文件格式,维护文件格式的属性。蕴涵系统数据库管理员的所有权限。
系统数据库管理员(DBA)所拥有的权限不经授权就可对系统中的所有数据库、视图以及词典对象进行所有操作。(但不能创立用户、用户组、文件格式〕蕴涵用户组数据库管理员的所有权限。
用户组数据库管理员(GBA)所拥有的权限
不经授权就可对系统中与该用户处在同一用户组的用户所拥有的所有数据库、视图,以及词典对象进行所有操作。蕴涵系统资源用户的所有权限。
用户级权限(1)系统资源用户(RESOURCE)所拥有的权限 有权在系统中创立数据库、视图,以及词典对象。蕴涵系统登录用户的所有权限。系统登录用户(CONNECT)所拥有的权限
有权登录到系统中。
经过授权,可对系统中其他用户所拥有的数据库、视图,以及词典对象进行相应的操作。
用户级权限(2)数据库对象
创立、修改TRS数据库对象加载数据库记录,掌握记录入库格式检索数据库,掌握检索表达式的写法维护数据库对象,掌握数据库的复制、记录的复制、数据库优化等数据库数据库是TRS系统中的主要数据对象,它物理地存储了用户加载到系统中的所有数据资料。每个TRS系统可管理多达数十亿个数据库。数据库实际上是一个数据表,表的每一行是一个数据记录,每一列那么是一个数据字段,行列的交叉点即为字段值。
数据库规模 数据库的规模主要指两个方面:能够容纳的最大记录数和数据库文件的最大容量。如果是64位文件系统和64位操作系统,那么最多可容纳40多亿条记录。如果采用64位文件系统,那么单个文件的容量实际上没有限制。另外,理论上TRS允许每个记录的最大长度为256M字节,每个字段值的最大长度为16M字节〔如以ALONE方式存储字段值的长度不受此限制〕。但在实际中,如果一个记录〔或字段值〕太长,会引起操作系统忙于虚拟内存的交换,使机器性能急剧下降,所以系统人为地限制一个记录的最大长度为机器物理内存兆字节数的64的倍数〔最小为1〕兆字节,如物理内存为128M,那么允许的最大记录长度为2M字节。数据库对象的创立【说明】必须是具有Resource及以上权限的用户才可以创立数据库。进入创立数据库对话框有三种方法:
方法一:选择“文件|新建〞命令,在“新建〞对话框里双击数据库图标;方法二:在对象管理窗口里切换到“数据库〞标签,然后按工具栏上的按钮;方法三:在对象管理窗口里切换到“数据库〞标签,然后在对象管理框按鼠标右键,出现菜单后选择新建。【注】数据库名称必须填写数据库级权限数据库权限、视图权限和词典权限统称数据库级权限。
数据库权限共有五种:记录检索权(SELECT):拥有这种权限的用户,能够对数据库进行检索操作。数据更新权(UPDATE):拥有这种权限的用户,能够对数据库进行数据加载、记录插入和修改操作。数据索引权(INDEX):拥有这种权限的用户,能够对数据库的索引进行创立、删除和验证操作。数据库结构修改权(ALTER):拥有这种权限的用户,能够对数据库的属性及结构进行修改操作,包括增加和删除字段,以及修改字段的属性。 数据库删除权(DROP):拥有这种权限的用户,能够删除数据库。
数据库属性数据库存放的路径:必须是系统配置中的数据和索引路径之一,缺省为系统配置中的第一个数据路径。存放位置:有一类应用:TRS系统只管理和维护索引,而数据存储在其它系统中就是通过此项设置的。此项如果不为空,内容是存储效劳器的有关信息的字符串,如“ORACLE〞,那么说明实际数据集中存储在一个数据宿主效劳器中,TRS系统只管理和维护索引。如果为空,那么说明由TRS系统负责管理数据库的数据存放的位置。缺省值为空。词典:数据库所用词典,缺省为系统配置中的缺省分词及停用词典名。
词典TRS的全文检索不单是一种快速的字串匹配系统,要获得良好的检索效果,必须使用一系列知识词典。词典对象是TRS系统中非常重要的根底资源,是按词索引和检索技术的根本依据。按用途划分,TRS系统有八种类型的词典:分词词典(SEGMENT)
附加分词词典(SEGMENTEX)停用词典(STOP)
附加停用词典(STOPEX)稀疏词典(SPARSE)
主题词典(THESAURUS)同义词典(SYNONYM)反义词典(ANTONYM)
其中,分词词典、附加分词词典、停用词典、附加停用词典和稀疏词典是用来建立数据库的索引并进行查询的词典,统称为索引词典;主题词典、同义词典和反义词典是用于智能扩展检索的词典,统称为辅助知识词典。
索引类型及索引策略索引类型TRS系统有两种类型的数据库索引:B+树索引和倒排(INVERT)索引。这两种类型的索引相辅相成,互为补充。〔详见手册〕索引策略 对于英文数据库,TRS系统采用按词索引的固定模式。 对于中文数据库,TRS系统那么有四种类型的索引策略:按中文词检索的索引策略、按中文字检索的索引策略、按用户自定义关键词的索引策略,以及二元组索引策略。在实际应用中,采用何种索引策略主要取决于数据的特点、检索的需求和系统的资源等。不同的索引策略,所需的索引词典也不尽相同。(见下页)索引策略与词典的关系稀疏词典分词词典附加分词词典停用词典附加停用词典按词置空必需可有可无可有可无可有可无按字置空置空可有可无可有可无可有可无按关键词必需忽略忽略忽略忽略二元组置空可有可无可有可无可有可无可有可无策略词典按词索引策略TRS内嵌的汉语自动分词系统是TRS的领先技术,使得TRS在国内外同类全文检索系统中独具特色。对大多数中文全文检索应用来说,按词索引是首选的索引策略。(其余策略介绍详见手册〕其中内嵌的分词系统是采用以词典为根底的分词算法。分词词典用于汉语自动分词,由假设干个汉语词汇组成,词典中的英文词汇不起作用。每局部词词典可容纳多达10万条词汇,每个词汇的最大长度为20个字节,即10个汉字。TRS系统提供的缺省分词词典的每个词汇具有语法属性,以提高分词的准确性。用户定义的分词词典或增加的词汇那么没有属性。该分词词典是经过加密处理的,用户可以浏览词典的词汇,但不能浏览其属性。数据库字段(1)TRS数据库有六种类型的字段:日期型(DATE)
;数值型(NUMBER);字符串型(CHAR)短语型(PHRASE);全文型(DOCUMENT);二进制型(BIT)我们可以对CHAR,DATE,NUMBER进行字段级检索,对PHRASE和DOCUMENT进行全文检索,但对BIT字段不进行检索,系统规定BIT字段始终不建索引。所有的查询操作都是在一定的字段上进行的。每个数据库可定义1到1023个字段。
◎日期型字段(DATE)日期型字段只能用来存储“年月日时分秒〞这类表示日期的数据。◎数值型字段(NUMBER)数值型字段只能用来存储整数或实数。对于实数,可以限制其小数位的长度,在数据库加载时将忽略多余的小数位数。整数或实数不能超出机器的单精度浮点数所能表示的范围,可以使用科学计数法表示这些数据。◎字符串型字段(CHAR)字符串型字段可以用来存储任何形式的字符串。最大长度不能超过255个字符。数据库字段(2)◎短语型字段〔PHRASE)可以用来存储任何形式、任意长度的文本数据,最适合作为“标题〞这样的字段。短语型字段与字符串型字段的最大差异在于短语型字段支持自动分词,而字符串型字段不支持自动分词,其字段值整体是一个索引键值。主要特点:没有长度限制;没有缺省值;没有取值范围;不允许多值;加载时不进行字段值的唯一性检查;加载时允许空值;允许建立索引;支持自动分词,倒排索引属性固定〔只有位置〕;字段值必须是文本数据;数据集中存储。
数据库字段(3)◎全文型字段(DOCMENT)既可以用来存储任何形式、任意长度的文本数据,也可以用来存储其它格式类型的多媒体数据。全文型字段区别于短语型字段的关键所在有三点:1、全文型字段的数据有多种存储方式。系统通常是集中存储短语型字段字段的数据,而分类存储全文型字段的数据,这样有助于提高大规模数据库的检索结果的概览〔不包括全文型字段和二进制型字段〕速度。2、全文型字段的字段值可以附加一个源格式数据。3、全文型字段的倒排索引属性可以任意指定。
综合起来,这类字段的主要特点是:没有长度限制;没有缺省值;没有取值范围;不允许多值,但允许附加一个源格式数据;加载时不进行字段值的唯一性检查;加载时允许空值;允许建立索引;支持自动分词,倒排索引属性可任意定义;字段值可以是多媒体数据;数据有多种存储方式。数据库字段(4)◎二进制型字段
可以用来存储任何格式类型的多媒体数据,主要特点是:没有长度限制;没有缺省值;没有取值范围;允许多值;加载时不进行字段值的唯一性检查;加载时允许空值;不建立索引;字段值可以是任何多媒体数据;数据有多种存储方式;数据库字段(5)允许多值:一条记录的某字段可存多个值。PHRASE、DOCUMENT字段不允许多值。值唯一性:使用此属性可除去重复记录,仅对CHAR,DATE,NUMBER字段有效。禁止空值:控制该字段是否允许空值。仅对DATE、NUMBER、CHAR字段有效。索引属性:BIT字段始终不建索引。公共检索:选中表示所有用户均可对本数据库字段进行检索。〔实现字段级权限控制〕
字段小结字段权限字段级权限包括数据库字段权限和视图字段权限。字段级权限只有一种,即:字段检索权(SELECT),拥有这种权限的用户,能够在该字段上进行检索操作。练习:1、创立自己的数据库,理解不同字段的属性和数据库级权限。2、创立一个带多值的数据库,并在相关字段上做唯一性检查。
数据库记录加载及数据入库格式
数据库建好以后,就可以把数据装库。数据装库有两种方式:联机录入和批量数据加载。联机录入:双击翻开数据库点击‘记录’菜单项‘添加记录’(见演示)批量数据加载步骤:
1、选定目标数据库。
2、准备加载文件。包括
数据文件:格式见下页。其中对于多媒体文件在DOCUMENT字段和BIT字段的加载有特殊的格式。数据文件实际上是由一个或多个记录数据组成的TRS标记文件,统称为TRS格式文件。包括:标准格式、字段内部标识号标记格式、字段顺序号标记格式、无字段标记格式和全文格式。单个TRS格式文件的大小不能超过2G字节。
TRS系统的数据加载,除了支持以上五种TRS格式外,还支持ISO2709和XML格式文件的直接入库。(详见手册)
控制文件:用来控制数据的加载过程的配置文件。(一般用默认)创立数据文件TRS标准装库文件格式数据记录文件实际上是由一个或多个记录数据组成的TRS置标文本文件。每个记录都以标记“<REC>〞开始,如下(其中n<=1023)<REC><字段名1>=字段值1……<字段名2>=字段值2……<字段名n>=字段值n……<REC><字段名1>=字段值1……<字段名2>=字段值2……<字段名n>=字段值n……可以在写字板中或者trs管理员工具中直接编辑。日期数据书写格式日期的书写格式有四种:通用格式:2001.07.1010:10:20AM2001/07/1010:10:20AM英文格式:07,10,200110:10:20AM07-10-200110:10:20AM无分隔符格式AM中文格式2001年7月10日10时10分20秒上午
日期函数系统支持$DATE和$TIME特殊日期的入库$DATE()取当前日期$TIME()取当前时间$DATE(+7)取当前日期往后推七天的日期$DATE(-7)取当前日期往前推七天的日期$TIME(+60)取当前时间往后推60秒的时间$TIME(-60)取当前时间往前推60秒的时间
多媒体格式文件的加载多媒体数据可加载到Document字段和Bit字段格式如:<正文>=@c:\temp\test.doc^word<正文>=@c:\temp\test.xml^word<图象>=@c:\temp\test.jpg^jpeg【注】对文本格式和HTML(XML)格式的数据入库后可以直接进行检索。其他格式象word、pdf类型的数据,需要使用后台的OEM插件。〔OEM配置见手册〕
数据库对象的修改
对某个数据库做修改或删除操作时必须具备相应的权限才可以执行。数据库建立后,一般不允许对数据库的结构或者属性进行修改。
当数据库记录不为空而确有必要修改时,可先把数据库中数据存储成装库格式文件,然后按要求建立新的数据库后再把原始数据装入,最后删除原数据库。数据库检索一般检索实现:在工具栏的输入框里输入检索表达式。最常见的逻辑运算符(+-*^)和通配符(%,?):*:与;^:异或;-:非;+:或〔具体见帮助〕“?〞表示一个英文字符或汉字,用“%〞表示0到多个英文字符或汉字。建立和使用导航树检索通过建立导航分类树进行分类检索。高级检索通过对话框生成复杂的检索表达式检索。
一般检索例输入“中国*北京〞表示在默认字段〔正文〕查询中国和北京同时出现的记录。输入“中华%〞表示在默认字段查询出现“中华……〞的记录,这里%为通配符。输入“日期>1997.01.01*作者=王%〞表示查询日期为1997年1月1日以后〔不含〕并且作者是姓王的记录。输入“作者=%国庆〞将检索出所有作者为“张国庆〞、“欧阳国庆〞、“国庆〞等的记录。输入“作者=张%〞将检索出所有作者为“张国庆〞、“张三〞、“张〞等的记录。输入“中国^北京〞将检索出默认字段或者出现北京或者出现中国的纪录,即两个值只出现其一的纪录。输入“作者=张?庆〞将检索出所有作者为“张国庆〞、“张大庆〞等的记录,而作者为“张庆〞的记录不会被检索出来。
数据库维护索引维护由于非正常操作等原因,导致索引文件被破坏,不能进行检索,需要重新对数据库建索引。数据优化对数据库的数据文件和索引文件进行优化重组。数据复制/恢复指两个库之间数据的复制。数据库备份注意:首先需要在备份设备的提示框里输入备份的文件名,如:c:\trs4\trshome\temp\data.bak数据库结构备份/恢复选择“文件〞菜单“导入/导出〞项。数据库记录的导入/导出翻开数据库记录浏览窗口,选择“文件〞菜单->“另存为〞。
视图视图是TRS系统中的一种辅助数据对象。TRS系统支持对数据库记录和字段进行直接的授权机制来实现数据的平安保密性控制,但有时显得有些烦琐。通过视图来限制某些用户对数据库字段和记录的查询,就可以用一种简便的方式间接地完成对数据库记录和字段查询权的控制。
视图实际上是一个逻辑数据表,它是逻辑地从一个或多个数据库中抽取一个或多个字段并满足指定条件的记录。视图并不物理地存储数据,只是描述了组成该视图的数据所遵循的逻辑。每个TRS系统可管理多达数十亿个视图,每个视图中可包含1到128个数据库。
视图字段及视图权限视图字段类型〔六种〕DATE,NUMBER,CHAR,PHRASE,DOCUMENT,BIT,对视图字段只有检索权限。视图权限〔三种〕◎记录检索权(SELECT):拥有这种权限的用户,能够对视图进行检索操作。◎视图结构修改权(ALTER):拥有这种权限的用户,能够对视图的属性及结构进行修改操作,包括增加和删除字段,以及修改字段的属性。◎视图删除权(DROP):拥有这种权限的用户,能够删除视图。练习:在DEMO2数据库上创立一个视图,要求该视图中只包括日期=1997.1的数据。
文件格式文件格式用来说明多媒体数据的格式类型。在数据库加载时,TRS系统将根据数据格式确定相应的数据存储方式,使用相应的分词方法;在数据输出时,TRS系统将根据数据格式对数据进行相应的处理,便于浏览。每个TRS系统可管理多达1023个文件格式对象。TRS系统在安装时,将自动创立常用的数据格式对象。〔见手册〕
TRS系统允许用户自己定义新的数据格式,或者修改已有的数据格式。数据格式一旦定义,就不允许删除,所以必须谨慎,只有超级用户〔即SYSTEM用户〕有权创立新的数据格式。系统配置(1)系统路径:在建库时,库及词典相关的存放路径。物理内存:效劳器的物理内存总量,以兆字节计算。最长空闲:允许一个用户实例(TRS系统为每一次登录都分配一个独立的许可证)最长的空闲时间。以分计,超时将自动Logout。最小有效:一个用户应该保持的最小有效时间〔除非退出登录),以秒计。在此期间内不允许自动退出登录。检索历史:系统缺省的最大检索历史步数。最长检索:一次检索操作的最长执行时间,以秒计算。最大下载:系统允许的一次最大下载记录数。这个配置项只有在前端应用程序使用时,才发生作用。系统配置(2)维护起始/维护终止起始时间和终止时间之间的小时数为TRS系统进入空闲状态的检测窗口,如果不限定终止时间,那么检测窗口为一小时。如果机器的当前系统时间在检测窗口内,并且已有一段时间〔比方至少10分钟〕没有任何用户访问TRS系统,那么TRS系统进入空闲状态。在空闲状态下,系统可以进行一系列的自动维护任务,如优化数据库,整理用户实例等。当系统完成一个自动维护任务时,如果机器的当前系统时间仍处在“空闲状态起始时间〞和“空闲状态终止时间〞之间,那么系统会启动一个新的自动维护任务。这个两个配置项改变后,需要重新启动TRS系统才有效。最大排序对检索结果进行排序的最大记录数,为零表示不限制。建议使用系统默认值。
TRS对象:TRS系统中的对象包括:用户组(GROUP);用户(USER);数据库(DATABASE);数据库字段(BASECOL);视图(VIEW);视图字段(VIEWCOL);词典(DICTIONARY)文件格式(FORMAT)所有这些对象都具有一致的命名规那么:对象名可以是中文,英文或中英文的组合,最长为31个字符。对象名内英文字母的大小写无关。只能包括A-Z,a-z,0-9,_,或汉字。除数据格式外,对象名不能用TRS保存字(关键词)。属于同一个域内的对象不能重名。小结(1)字段与索引:TRS数据库有以下6种不同类型的字段:日期型字段(DATE)数值型字段(NUMBER)字符串型字段(CHAR)短语型字段(PHRASE)全文型字段(DOCUMENT)二进制型字段(BIT)索引是为实现快速检索的根底,在TRS系统中,作为检索入口的数据库字段必须建立一定的索引,否那么该字段上的值不能被检索。
我们可以对CHAR,DATE,NUMBER进行字段级检索,对PHRASE和DOCUMENT进行全文检索,但不对BIT字段进行检索,BIT字段始终不建索引。小结(2)权限机制:TRS系统的平安控制是通过权限管理来实现的。TRS系统的权限有四个级别,即:用户级权限:超级用户(SYSTEM);数据库管理员(DBA);用户组管理员(GDA);资源用户(RESOURCE);登录用户(CONNECT);数据库级权限:记录检索权(SELECT);数据更新权(UPDATE);数据索引权(INDEX);数据库结构修改权(ALTER);数据库删除权(DROP)。字段级权限和记录级权限:都只有检索权限
对TRS系统中的用户组操作、用户操作、数据库操作、数据库字段操作、视图操作、视图字段操作、词典操作和文件格式操作都必须有相应的权限才能进行。小结(3)
数据加载和检索:
加载文件有两类:一类是数据文件;另一类是控制文件。
数据文件是用来存放待加载的数据的文件。数据文件有两种形式,即数据记录文件和批处理文件。其中,加载DOCUMENT字段和加载BIT字段有特殊的格式。
控制文件用来控制数据的加载过程的配置文件。
TRS的表达式分为统计表达式和检索表达式两种,TRS既支持在DATE、NUMBER和CHAR字段上通过键值进行数据库查询,同时也支持在PHRASE和DOCUMENT字段上用任意自由词、词串以及数值进行检索,此外还支持特殊键值的检索。
小结(4)用户手册使用说明全文检索效劳器用户手册-附录A:TRS保存字-附录B:TRS错误信息-附录C:Win32错误信息管理员工具用户手册-附录A:检索表达式构造-附录B:数据库加载格式标准结束语培训教师联系方式:翟英佳237zhai.yingjia@trs齐永欣220qi.yongxin@trs谢谢!如何进行房地产市场分析学习内容理论局部案例学习为什么要进行房地产市场分析?房地产市场分析的思路、步骤和方法什么是房地产市场分析?慈溪银泰地产工程市场研究及定位报告市场为什么要进行房地产市场分析?
开发商建筑师消费者1。评估工程所处的市场环境2。寻找工程潜在的市场时机,挖掘需求尚未被满足的市场3。制定工程的开展方向和市场定位4。推荐最具竞争力的产品建议5。评估工程目标实现的可能性。。。市场分析是对市场调研搜集到的信息进行整合与提炼的过程,市场分析的结论是进行决策的根底。开发商是追逐利润的,建筑师是唯美主义的,市场分析是连接开发商、建筑师和消费者的桥梁,房地产市场分析是基于对市场的理性判断具体起到哪些作用呢?什么是房地产市场分析?概念,即指:针对某种特定物业研究市场的供需关系。需求方:物业的购置者或租赁者供给方:市场中的各竞争物业〔包括住宅、公寓、写字楼、商业、酒店等〕市场分析不是简单的罗列市场数据,而是必须基于数据进行分析!房地产市场分析的思路、步骤和方法
1。思路三个层次区域市场、专业物业市场、工程市场两个方面供给、需求三个时段过去、现在、未来区域市场分析专业市场分析工程市场分析广州经济环境和房地产市场广州住宅市场工程所在地市场例如:区域房地产开展处于何种阶段?工程市场处于何种竞争格局?竞争供给分析客户需求分析竞争供给分析客户需求分析竞争楼盘分析客户需求分析房地产市场分析的思路、步骤和方法
2。步骤第一步:市场区域界定这里所指的区域是中观房地产市场分析的根本单位,具有完整的房地产市场特征的范围,一般以行政区划来划分。第二步:区域经济环境和市场分析考察整个区域经济环境,判断区域房地产市场处于何种开展阶段,找到影响房地产市场变化的主要因素,对区域房地产开展前景进行预测。第三步:专业市场分析按物业类型进行市场细分,对各专业市场的供给和需求进行比照预测,从而揭示各专业市场的需求潜力及分布状况。第四步:工程市场分析根据对竞争对手及消费者的分析找到工程的时机点、预估工程的市场占有率。房地产市场分析的思路、步骤和方法
3。方法第二步区域经济环境和市场分析区域经济环境分析区域房地产市场分析〔一〕根本内容+对当地经济环境中决定所有类型房地产供给和需求的根本因素进行分析,对过去变化趋势进行判断,预测未来的开展前景。房地产市场分析的思路、步骤和方法
3。方法第二步区域经济环境和市场分析〔二〕根本资料的获得区域经济环境分析1、总量指标GDP、人口、人均GDP、固定资产投资、新批三资企业人数、接待入境旅游人数……2、结构指标:产业结构及布局、就业人口结构3、水平指标:人均收入水平、消费水平、人均居住面积、住宅消费支出水平4、城市经济开展方案、产业规划、城市总体规划区域房地产市场分析1、投资:开发投资额2、土地开发:土地开发投资、开发面积、土地出让金3、商品房开发:施工面积、竣工面积、年开发量4、销售:销售额、销售面积、价格、空置量、吸纳量5、房地产景气指数、价格指数数据来源各地方统计年鉴、统计公报、经济开展月报、地方经济信息网、地方政府网站、中房指数、国房指数、地方房地产年鉴土地、规划部门的政府官员访谈规划、房地产等专业人士访谈房地产市场分析的思路、步骤和方法
3。方法第二步区域经济环境和市场分析〔三〕能够反映区域房地产市场开展状况的指标人均GDP与房地产开展关系GDP增速与房地产开展关系发展阶段启动阶段快速发展阶段平稳发展阶段减缓发展阶段人均GDP(美元)800~30003000~40004000~80008000以上需求特征生存需求生存、改善需求兼有改善需求为主改善需求为主发展特征超速发展单纯数量型快速发展以数量为主,数量与质量并重平稳发展,以质量为主,数量与质量并重缓慢发展综合发展型宏观经济增长房地产业发展状况小于4%萎缩4-5%停滞5-8%稳定发展大于8%高速发展房地产市场分析的思路、步骤和方法
3。方法异常基本正常正常运行基本正常异常房地产开发投资额增幅<-5%-5%~5%5%~15%15%~255>25%适度投资利于拉动经济增长,而增幅过高,将使供给过量,若无需求匹配,将导致供过于求房地产开发投资/GDP<0.050.05-0.10.1-0.140.14-0.2>0.2反映房地产投资规模的基础
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- flash 课件教学课件
- 自愿放弃孩子协议书(2篇)
- 购买籽种合同范本(2篇)
- 高中技术《技术与设计II》课堂强化练习
- 节妇吟课件教学课件
- 南京航空航天大学《短片创作》2021-2022学年第一学期期末试卷
- 南京工业大学浦江学院《数值分析》2023-2024学年第一学期期末试卷
- 毕业论文(设计)-香榭美临住宅楼工程施工组织设计
- 深圳人民医院幕墙工程施工组织设计
- 《致橡树》说课稿
- 数据恢复业务合同
- 智能化工程监理实施细则
- 《民法典》全文学习PPT
- zzf微血管减压术治疗舌咽神经痛
- SPECTRO MAXx 06直读光谱仪操作规程
- PCS9700 监控后台操作方法培训
- creo自顶向下设计方法
- 物流配送中心规划与设计课件
- 常用截止阀尺寸表
- 2013三无班组评定标准
- 二年级《看图写话》教学设计
评论
0/150
提交评论