下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SQL Server 2000 全文检索技能1全文检索及其生长状态随着海量信息的出现以及盘算机存储技能的生长,文献数据库正由书目数据库向全文数据库变化。这一变化使得全文检索技能得到空前的生长。常用的实现全文检索的要领重要有以下两种:第一种要领是不合错误数据库创立索引而直接对文章举行匹配的要领。这种要领由于没有创立索引库,因此所占空间较少,但同时正是由于它没有索引库,以是在举行全文匹配时要消耗大量的时间。第二种方规那么是一种为全文创立倒排索引库的要领。这种要领可以大大节流检索的时间。但同时,这种要领必要占用必然的存储空间来创立索引库。如今,国表里对全文检索的研究可以说是到达一个热潮。很多研究机构
2、和贸易构造都在举行这方面的研究。国际最具影响力的全文检索评估机构当属TRE(TextRetrievalnferene)。它是由美国技能和尺度研究所(NIST)和美国高级研究筹划局(DARPA)配合举行、自1992年以来每年一次的全文检索评估集会,集会到场者带来研究的检索体系以供专家举行评估。传统的信息单元,图书馆等也开始创立全文数据库,引进种种全文检索技能。一些软件公司,也纷纷推出全文检索软件。海内比力有代表性的如TRS等,而外洋比力知名的有下文将要先容的irsft公司开拓的SQLServer2000。2在SQLServer2000中设置全文检索办事SQLServer是irsft公司在本来和S
3、ybase公司互助的底子上推出的一款面向高端的数据库体系。而SQLServer2000版本那么是最新的、大型联机事件处置惩罚的新型数据库平台。它继续了SQLServer从前版本的一些强盛的上风,如简朴易用、具有精良的不变性和高效性等等。同时,它的成效比从前的版本越发强盛,界面越发友爱。总之,无论是在成效、宁静性、可维护性,照旧在易操纵性上都较从前版本有了长足的进步。它的全文检索成效设置简朴,利用非常便利。我在创立关于信息检索的英文论文题名、文摘数据库的历程中,利用了SQLServer2000。由于文摘文本单词量均匀在500个摆布,并且论文记载数目较多,假设不为文摘创立全文索引库,将严峻影响检索
4、服从。因此,我利用SQLServer2000的全文检索成效为这个数据库提供了全文检索办事。2.1创立全文检索办事的历程如下:第一步,在SQLServer中创立一个全文数据库EnglishData。在该数据库中创立一个表Papers。该表的字段有paper_id(代表论文的挨次,数据范例为int,长度为4,要求非空,并为标知,标知种子为1,主动增量为1)、paperAitle(代表论文的标题问题,数据范例为vhar,长度为200,要求非空)、paper_abstrat(代表论文的文摘,数据范例为vhar,长度为8000,要求非空)。第二步,为创立全文索引,必然要为该表创立唯一索引(UniqueI
5、ndex)。我为Papers表的paper_id字段创立唯一索引。第三步,将数据渐渐导入到表Papers中。第四步,翻开SQLServer的企业办理器,在左侧的树视中点击数据库。然后点开数据库EnglishData。选择“全文目次。点击右键,选择“新建全文目次,创立全文目次Paper-AbstratFullSearh,然后创立名称为AbstraetSearh的调理。其他担当默认。第五步,选择企业办理器的右侧的表Papers,单击右键,选中“全文索引表,单击“在表上创立全文索引。将会出现“全文索引指导窗口。点击“下一步会到达“选择索引窗口。由于本表只有一个唯一索引paper_id,点击“下一步,
6、会出现“选择表中的列窗口。选择“paper_abstrat字段,然后点击“下一步,出现“选择目次窗口,担当默认设置,点击“下一步,出现的窗口“选择或创立添补调理(可选)窗口,担当默认设置再点击下一步。出现“正在完成SQLServer全文索引指导,点击“完成。完成设置。第六步,选择表Papers,点击右键,选择“全文索引表,点击“启动完全添补,等候完成。第七步,设置数据源名。在DB办理器中的“体系DSN中,单击“添加,选择“SQLServer。在数据源名中输入“EnglishData,然后举行客户设置。第八步,假设以后对表Papers举行任何的修改(包罗添加、删除记载和对原记载举行编纂),都要重
7、复第六步的操纵。这一步是为了包管全文索引库可以或许与表Papers的修改同步。以上是创立全文索引的全历程。完成创立后,即可以利用尺度的TSQL语句对其举行全文检索。2.2在eb平台上举行全文检索固然利用TsQL语句可以很便利地举行全文检索,但笔者思量到不是全部的用户都把握了TsQL语句,因此为便利用户检索,笔者创立了一个基于eb界面的全文检索平台。用户只需将检索词提交给eb办事器,办事器利用ASP调用AD控件来对SQLServer2000数据库举行查询,并将检索效果以eb页面的方法返回给用户。ASP(AtiveServerPages)是微软公司创立的一套办事器端足本情况。方案职员可以结合HTL
8、、ASP指令和AtiveX控件创立动态、交互且高效的eb办事器应用步伐。由于全部的步伐都嵌入HTL中且在办事器端实行,因此不必担忧客户端的欣赏器可否运行步伐。同时,它还具有简朴、易开拓、兼容性好等长处。AD(AtiveXDatabjet,AtiveX数据工具)是一个ASP内置的AtiveX办事器组件(AtiveXServerpnent),用于数据库拜候,可把它与ASP结合起来,创立提供数据库信息的网页内容,对数据库举行查询、插入、更新、删除等操纵。AD工具可以操纵全部DB驱动步伐存取的数据源格式。同时,AD还具有简朴易用、速率快等长处。SQLServer2000的全文检索办事可以支持布尔检索和
9、加权检索等高级检索。用ASP可以实现这些检索成效。3全文检索语句NTAINS和FREETEXT的利用全文检索利用户可以高效检索存储在数据库的har、varhar、text、ntext、nhar、nvarhar等数据范例列中的文本数据。在举行全文检索之前,应创立和填凑数据库全文索引。3.1全文索引为了支持全文索引操纵,SQLServer70新增了一些新的存储历程和Transat-SQL语句。利用这些存储历程创立全文索引的详细步调如下(括号内为每步所调用的存储历程名称):(1)启动数据库的全文处置惩罚成效(sp_fulltexLdatabase);(2)创立全文目次(sp_fulhexLatalg
10、);(3)在全文目次中注册必要全文索引的表(sp_fulltexttable);(4)指出表中必要全文检索的列名(sp_fulltexLelun);(5)为表创立全文索引(sp_fulltexLtable);(6)添补全文目次(sp_fulltext_atalg)。下面举例说明:在本例中,对test数据库bk表中title列和ntes列创立全文索引。/起首先启动SQLServer的全文搜刮办事。usetest/翻开数据库g/翻开全文索引支持exeutesp_fulltext_databaseenable/创立全文目次ft_pubsexeutesp_fulltext_atalgft_test,r
11、eate/为titles表创立全文索引数据元,pk_title为bk表中由主键所创立的唯一索引,此参数必需。exeutesp_fulltext_tablebk,reate,ft_test,pk_title/设置全文索引列名exeutesp_fulltext_elunbk,title,addexeutesp_fulltext_lunbk,ntes,add/创立全文索引exeutesp_fulltexLtablebk,ativate/添补全文索引目次exeutesp_fulltext_atalgft_test,start_fullg至此,全文索引创立完毕。3.2全文检索SQLServer2000提
12、供的全文检索语句重要有NTAINS和FREETEXT。NTAINS语句的成效是在表全部列或指定列中搜刮:一个字或短语;一个字或短语的前缀;与一个字相近的另一个字;一个字的派生字;一个重复出现的字。NTAINS语句的语法格式为:NTAINS(lun*),)此中,lun说明被搜刮列,利用时说明对表中全部全文索引列莲行搜刮ntains_searh_nditin说明NTAINS语句的搜刮内容,其语法格式为:|)|ANDIANDNT|R.n下面就siple_ter和predix_ter参数做一扼要说明:sipleter指出NTAINS语句所搜刮的单字或短语,当为一个短语时,必需利用双引号作为定界符。其格
13、式为:rd|“phrasepredix_ter说明NTAINS语句所搜刮的字或短语前缀,其格式为:“rd*|“phrase比方,下面语句检索b0k表的title列和ntes列中包罗database或puter字符串的图书名称及其解释信息:selettitle,ntesfrbkherentains(tilte,database)rntains(ntes,datable)rntains(title,puter)rntains(ntes,puter)FREETEXT语句的成效是在一个表的全部列或指定列中搜刮一个自由文本格式的字符串,并返回与该字符串匹配的数据行。以是,FREETEXT语句所实行的成效
14、又称做自由式全文查询。FREETEXT语句的语法格式为:FREETEXT(lun*,freetext_string)此中,lun说明被搜刮列,利用*时说明对表中的全部全文索引列举行搜刮。Freetext_string参数指出所搜刮的自由文本格式字符串。比方,下面语句利用FREETEXT语句搜刮bk表中包罗SuessfulLife字符串的数据行:selettitle,ntesfrbkherefreetext(*,SuessfulLife)4竣事语通过学习和理论,我以为SQLServer2000的全文检索办事有以下长处:第一,简朴易用。由于SQLServer2000的全文检索办事已经集成到整个办事中,因此,全文检索可以利用“企业办理器举行同一的图形界面的办理。并且,举行检索时可以利用尺度的TSQL语句,学习、利用非常便利。第二,SQLServer2000成效强盛。好比,其自身具有“噪音词(niseter)过滤的机制。在“.SSQLTDATASQLServ
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商户入住商务合同范例
- 天津滨海汽车工程职业学院《地球物理场论I》2023-2024学年第一学期期末试卷
- 天府新区信息职业学院《装修工程概预算实训》2023-2024学年第一学期期末试卷
- 正常购买合同范例
- 广告大屏合同范例
- 汕尾锅炉陶瓷喷涂施工方案
- 欧式合同范例
- 凉皮供货协议合同范例
- 录音制作合同范例
- 《2 我向国旗敬个礼》教学实录-2024-2025学年道德与法治一年级上册统编版
- 酒店用品设备采购投标方案(技术方案)
- JCT908-2013 人造石的标准
- 员工职业生涯规划调查问卷
- 课程与教学论-全书要点(余文森版)-
- 万物之理-爱因斯坦之梦智慧树知到课后章节答案2023年下中国海洋大学
- UI设计·形考任务一
- 天津理工大学数据结构实验报告4
- 雷达原理与系统-雷达系统设计与实验
- 充电桩工程施工组织设计施工组织
- 起诉状(淘宝虚假交易)
- 论文《后疫情时代信息技术与幼儿园教育深度融合的策略研究》
评论
0/150
提交评论