城轨线网非结构化数据全文检索软件设计_第1页
城轨线网非结构化数据全文检索软件设计_第2页
城轨线网非结构化数据全文检索软件设计_第3页
城轨线网非结构化数据全文检索软件设计_第4页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概 Web模 web模块和检索模块的接 附录:API说 .py类MainSource中函 .py中DistSource类中的函 flaskr.py中的函 概coreseekmmseg算法对中文文档进行分词,通过主索引+增量索引的方式保证结果的实时性,前端采用flask框架,构建了一个信息检索,系统概要设计Web检索web主Web检索web主检索进增量1系统详细设计 时进行,并将查询结果进行相关性排序后返回给web。检索模块的实现工作流web转发过来的查询请索引进 pdfpdf词解析中文直接读分词解析中文直接读分配词汇、件倒倒排2配置文件设置index中设置数据源的名称,索引文件的路径和文件名,文档属性的存放方式,最小索Searchd中设置的IP地址和端口,或UNIX与socket的路径,日志文件名,日志文3.2.3*.Spa主要文件的属性(DocInfo),检索程序启动时会把此文件加载到内存。另外可……(循环Word_hitinfo,有多少个分词,就有多少个……(循环Word_hitinfo,有多少个分词,就有多少个在文档中出现了多少最后一个出现在文档中的……(循环多个词汇在文档中命中的位当前行中每一列的数文档id,4个字节或者8个字一个4SpdWeb用户登查search函结果显有多个,则通过pagination分页显示,并通过download函数为每个结果生成相应的, Webpython来写成的,用户的查询请求提交至服系统主要代码文件1 show_entries附录:API .py类MainSource中函1.1原型 说明:初始化主索引信息,配置文件,设置源数据的路径、起始ID、索引文件 参数:dirname:原型原型 被处理完,则返回False .py中DistSource类中的函2.1原型 说明:初始化增量索引信息,配置文件,设置源数据的路径、起始ID、索引文件 参数:dirname:原型原型 被处理完,则返回Falseshpinxapi.py文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论