从提问文档中读N个提问式_第1页
从提问文档中读N个提问式_第2页
从提问文档中读N个提问式_第3页
从提问文档中读N个提问式_第4页
从提问文档中读N个提问式_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、从提问文档中读N个提问式将读进的提问式转为展开表形式从顺序文件数据库中依次读进M个文献记录,y=1构成一个记录标引词标识表X=1第X个提问与该文献记录比较成功否?该记录放入结果文档中y=y+1yM?所有被检索的文献记录完否?提问文档结束否?YYYYN=XX=X+1将顺序文档倒回到初始状态N菊池敏典检索处理流程置参数为初始状态取出逻辑表达式中一标识进行判别填入层次值AFD或NFD栏目内容提问结束符吗?将“命中”以及“拒绝”标记分别置入最后一项的AFD或NFD栏目中根据层次值,完成表中各项AFD或NFD栏目中未完成值取出检索词的编号将检索词号对应在检索表中信息置入提问表相应位置中算项算子结束符NY

2、图5-3 表变换处理流程5.3.1 逆波兰表达式逆波兰表达式提问表达式算子进栈轨迹算子退栈轨迹提问式算子保留栈算项轨迹顺排文献文档用户提问检索处理命中文献输出图5-1 主文献数据库文档从文献记录中抽出可供检索的关键词,经排序、整理后编制成各种倒排文档。索引文档各种倒排文档检索处理结果输出转换为逆波兰以及其它处理方式用户提问图5-2 联机检索系统原理从检索表中依次取出一条指令是终止指令吗?判别操作码?根据操作码给出的操作性质,从第一,二操作地址中取出参加运算的文献集合,进行逻辑运算将运算结果放入第三操作数地址指定的工作区内将工作区中文献记录号集合放入特定工作区内根据检索词地址对照表取出地址对应的

3、检索词在倒排文档中检索,将命中文献号放入相应的第三操作数指定的工作区内存贮输入逻辑运算逆波兰检索处理流程图语法检查有错误吗?将提问表达式转换为等价的逆波兰表达式形式将逆波兰表达式形式转换为检索指令形式利用倒排文档进行处理,并输出结果打印出错信息NY图5-5 倒排文档检索算法基本流程图机读文献语句分析语词加权确定阈值选出标引词概念转换受控词停用词处理抽词关键词文档与索引生成手检或机检用户相关性判断反馈图 4-5 自动标引工作流程图索引索引(小小)/mb文献文献集合集合(中中)200mb文献文献集合集合(大大)2Gb文献集文献集合合词号地址词号地址45% 73%36% 64%35% 63%文献地址(记文献地址(记录)录)19% 26%18% 32%26% 47%64k分块地址分块地址27% 41%18% 32%5% 9%256k分块地址分块地址18% 25%1.7% 24%0.5% 0.7%输入文本Data切分字处理非用字表字典文件建立单汉字索引压缩地址码字倒排文档图4-6 单汉字检索系统文本处理流程图取文本取完否?依次取文本中字字取完否?在非用字表中找到了吗?

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论