版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 网络信息移动搜索的结构框架与技术机理探讨 摘要:网络信息移动搜索作为传统互联网搜索的进一步延伸,可为用户提供随时随地的个性化信息服务。在界定网络信息移动搜索的概念和特点后,重点对其整体框架和搜索技术机理进行探索。关键词:移动搜索,信息资源,搜索引擎,无线应用协议1 引言信息爆炸与信息饥渴一直是困扰网络时代信息用户获取所需信息而面临的难题。互联网搜索引擎的出现虽然在一定程度上缓解了这种困境,但为用户提供个性化的随时随地随身的信息搜索服务仍有一定差距。随着独立wap(无线应用协议)的兴起和3g(第三代移动通信技术)技术商用的热推,作
2、为信息产业搜索引擎和移动通信两大热门领域融合的网络信息移动搜索已逐步成为互联网搜索模式转变和创新的新起点。目前,对网络信息移动搜索的研究主要集中于计算机、通信和图书情报三个领域,重点围绕其发展概况1、业务方式与盈利模式2、技术模型3、搜索平台4和发展趋56五个主题展开。但已有研究仅仅是从各个学科的视角进行探索,具有一定的局限性;且未对各个主题之间的交互关系进行探索。在已有研究成果的基础上,本文重点对网络信息移动搜索的整体框架和具体搜索机理进行分析,以期对网络移动搜索的技术有一个整体的认知。2 网络信息移动搜索的概念与特点2.1 概念网络信息移动搜索是指以无线网络为传输层,对分布在互联网和无线网
3、的信息资源进行搜集和整理,然后提供给便携式移动用户终端的一种信息资源管理活动。在处理信息资源的程序方面,网络信息移动搜索与互联网搜索引擎具有一定的相似性,包括信息搜集、信息处理和用户信息查询三个阶段。但更重要的是不同点,网络信息移动搜索更加强调对用户需求的确切回答,具有准确性和个性化特点,而不是像互联网那样仅仅提供的一些链接。网络信息移动搜索提供的是个性化的信息服务,而网络搜索提供的是信息检索功能。2.2 特点(1)准确性网络信息移动搜索准确性高的特点可以从用户便携式移动终端设备的特点和网络信息移动搜索运行方式两个方面来考察。手机和pda终端的界面较小,搜索结果的显示不可能过多,因此用户对搜索
4、结果的查准率要求很高,而对查全率要求较低。同时由于网络接入速度较慢和运营方式(一般情况需收取流量费)等特殊状况,进一步推进了用户对网络信息移动搜索结果准确性的需求。(2)个性化网络信息移动搜索的终端一般都是唯一的用户使用,可结合移动用户的搜索记录、搜索习惯等个人偏好进行分析筛选,为用户提供最为符合个人需求的搜索功能。7随着带有gps功能的智能手机的出现,网络信息移动搜索可以识别用户所处的时间和地点,为用户提供本地个性化信息。3 网络信息移动搜索的结构框架广义上,网络信息移动搜索实质上是信息资源管理活动的一种形式,是一种满足信息用户需求的一种途径。其结构框架具体可从业务需求、业务系统结构和业务支
5、持实体三个方面来理解,如图1所示。 3.1 业务需求与支持实体业务需求,即用户信息需求,是网络信息移动搜索展开的起始点,整个结构框架都是围绕业务需求展开。由于用户的信息需求具有准确性和个性化等特点,因此,需要相应的搜索引擎具备语义分析、智能分析和行为分析等多种功能。业务支持实体是为网络信息移动搜索的运行提供技术和设备支持的运营商。便携式设备终端厂商主要是为用户提供移动搜索的设备层服务。而整个具体业务搜索过程的实现是依靠服务提供商借助通信和计算机技术实现。目前,已形成了传统互联网搜索引擎服务提供商(如百度、google)、wap门户的移动搜索平台(如悠悠网)和专业移动搜索服务提供商(如
6、移动运营商的“移动梦网”)三大阵营。3.2 业务系统结构(1)设备层与接入层设备层是便携式设备终端厂商开发的终端工具,主要是手机和pda等。接入层指使用移动搜索业务的各种方式,如wap、ivr. java/brew和短信等。其具体接入方式如图2所示。 (2)综合管理平台层综合管理平台层主要负责用户接入和搜索引擎的接入等综合业务管理。用户接入管理包括上文提到的各种方式接入的接口、把搜索结果展现给用户的接口、用户行为日志的记录与分析三个方面。搜索引擎的接入管理负责对用户不同的搜索请求进行分析,然后选择合适的搜索引擎去实现,并对用户得到搜索结果的后继操作进行记录和统计。(3)搜
7、索引擎层搜索引擎层是整个搜索业务展开的最为关键的一步。但网络信息移动搜索具有接入方式的多样性与搜索范围广泛性等特征,因此存在wap搜索引擎、java/brew搜索引擎和ivr(互动式语音应答)搜索引擎等多种类型。(4)内容整合平台层网络信息移动的搜索内容比传统互联网的搜索内容更加广泛,信息资源的格式与类型也更多样化。因此,需要一个内容整合平台层来负责对来自互联网、无线网和本地的信息资源进行整理分类,以提高搜索的效率。4 网络信息移动搜索的技术机理网络信息移动搜索与互联网搜索引擎的技术相类似,主要分为网页搜索、预处理和查询服务三个过程,但在具体机理方面又有一些特殊之处,如图3所示。就搜索方式来说
8、,可分为站外搜索和本地信息资源搜索两种形式。由于后一种搜索方式的步骤仅在搜集和过滤方面与站外搜索不同(参考文献8已有较为详细的介绍),且java/brew和ivr搜索引擎的原理都与wap搜索引擎的机理类似,下文主要探索基于站外信息的wap搜索引擎的技术机理。 4.1 网页搜索站外搜索指的是对广泛的wap站点以及web站点的搜索查询,是传统互联网搜索服务在移动平台上的延伸。9网页搜索是实现站外搜索的关键步骤之一,主要包括爬行和抓取,即图3中的搜集阶段。主要是通过网络爬虫将wap站点以及web站点的页面爬取到本地服务器,然后将爬取的页面按照url路径生成的目录层次进行存储,提供给后续的预
9、处理阶段。其具体实现可借助已有的成熟的搜索引擎(如百度、google)或研发自制的爬行和抓取程序。该阶段与传统的搜索引擎的爬行机理一致,只是爬行的范围更加广泛,站点类型多了wap站点。4.2 预处理(1)过滤过滤是对网页搜索的原始信息资源进行净化和消重,包括精简网页内容、清理无关信息,提取有效的正文和关键词。由于涉及到wap和web两种站点,需要将html网页统一转换为wap协议标记语言文档。网页的净化和消重可以采用传统互联网搜索引擎中已经比较成熟的方法。(2)自然语言处理自然语言处理中的分词技术是网络信息移动搜索中的关键步骤之一,决定着检索结果的精确性。在具体应用时,可依据查询语句的特点采用
10、常用的基于统计的分词方法、基于理解的分词方法和基于字符串匹配的分词方法。例如,网络信息移动搜索中有的信息用户查询常常使用的是中文自然语句,则应用基于字符串的正向减字最大匹配法进行分词。10(3)索引索引是指对过滤后的wap站点和web站点的网页信息进行处理,将网页到索引词的映射转化为索引到网页的映射,抽取出索引项,形成相应的索引表,最终建立可及时更新的索引库的过程。在索引库中,站点网页文字内容和关键词的属性(如出现的位置、字体和颜色等相关信息)都应有所记录,且能够定期更新。由网络信息移动搜索的终端用户信息需求特点可知,用户不可能会有过多的等待时间,而索引是决定网络信息移动搜索引擎性能的关键,可
11、以提高信息查询速度。因此,具体设计网络信息移动搜索引擎时,可结合相应的业务功能与性能需求进行综合考虑,选择适合各自的文件索引格式,如倒排索引和后缀数组等。4.3 查询服务查询服务包括检索和结果展示两个步骤,是在对用户搜索语句处理后,从索引数据库中找出所有包含搜索词的网页,并借助用户行为日志,根据排名算法计算出哪些网页应该排在前面,然后按照一定的格式返回到“搜索”页面,将符合条件的个性化信息以排序方式或分类方式展现给移动终端的过程。根据分析统计,用户平均查看搜索引擎返回搜索结果不超过两页,每页10个条目。11鉴于网络信息移动搜索对精确性和个性化的要求,为了提高系统的响应性,可以在组合排序阶段只考
12、虑前10个或者更少的存活文档。由于用户接口的设备对信息的显示格式有所差异,在查询结果的输出时,应对信息进行处理和相关格式的转换。移动终端设备的用户界面,即人性化的人机交互界面设计对查询服务的用户满意度具有重大的影响。因为系统输入(用户查询语言)和输出(搜索结果展示)都是通过该界面进行。这也从另一个方面反映了网络信息移动搜索需要多个业务实体之间的配合,才能为用户提供更加便利的信息服务。5 结语综上所述,网络信息移动搜索是一个涉及范围广、集多种技术、多类业务实体于一体的新型研究领域。本文认为,网络信息移动搜索实质上是信息资源管理活动的一种,技术是为用户的信息需求做支持。尤其是在互联网搜索技术已较为
13、成熟的背景下,关键是需要首先探索用户信息需求的特征,然后结合相应的通信技术与计算机技术为用户提供个性化的信息服务。同时,尽管网络信息移动搜索的搜索机理与传统互联网的搜索技术机理相类似,但在智能化和个性化方面存在较大的差异。本文重点对其结构框架和技术机理进行了阐述,各种智能技术和算法如何实施与运用还有待进一步探索。参考文献:1 李华.网络搜索服务的新经济模式移动搜索 j. 中国索引,2009(4):9-13.2 徐顺山.移动搜索业务模式与技术实现分析 j. 无线通信,2008(11):23-26.3 陈明,孙丽丽.基于wap的移动搜索模型 j. 计算机工程,2008(2):205-209.4 周燕,雷晓平.基于corba的移动网络搜索平台研究与实现 j. 计算机与信息技术,2009(3):29-35.5 李一.无线搜索引擎的现状与发展 j. 图书馆学研究,2007(11):32-34.6 马凌,侯正伟.移动搜索路在何方? j. 中国电信业,2009(2):58-61.7 杨慧锋.中国移动搜索概况研究 d. 北京:北京邮电大学,2008.8 曾庆祥.移动终端本地资源搜索引擎的研究与设计 d. 北京:北京邮电大学,2007.9 杜
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三只猴子活动教案
- 《APC与抗原提呈》课件
- 蚌埠三中2020-2021学年高二第二学期4月月考化学答案
- 家具销售技巧培训
- 社会工作参与扶贫社会工作专业教学案例宝典
- 《天花工程量的计算》课件
- 智慧养老的发展智慧养老技术概论
- 发票管理系统
- 《练习题宏观答案》课件
- 《组课程设计》课件
- 引水隧洞专项施工方案
- 初中英语-Unit5 What are the shirts made of教学设计学情分析教材分析课后反思
- UbuntuLinu操作系统上机实践实验题题库期末考试试卷24
- 2022-2023学年浙江省湖州市高二年级上册学期期末数学试题【含答案】
- 锂电池运输规范说明
- DBJ51∕T 081-2017 四川省城镇二次供水运行管理标准
- 《美丽中国是我家》 课件
- 110KV电缆敷设专项施工方案方案
- 《新时代劳动教育100问》读书笔记思维导图
- 仪表“三查四定”检查清单
- GB/T 7284-2016框架木箱
评论
0/150
提交评论