电子政务基础教程 第十一章 政务信息代理服务_第1页
电子政务基础教程 第十一章 政务信息代理服务_第2页
电子政务基础教程 第十一章 政务信息代理服务_第3页
电子政务基础教程 第十一章 政务信息代理服务_第4页
电子政务基础教程 第十一章 政务信息代理服务_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章政务信息代理服务11.1政务信息代理概述大型政务系统中,资源引擎能与成百上千个网站和各类数据库、数据中心互连,构起庞杂的信息管道。显然,各政府机构履行的职能互不相同,所需信息也不一样;同一机构中不同部门、不同岗位人员所需的信息也不一样。于是从信息管理角度就出现了矛盾:一是从宏观需求角度,希望相关资源聚集越多、越全面、越详细越好;而对具体人员,则希望信息越精准、越齐备与越方便越好。在信息爆炸、全球每个个人、每件物品、每个事件和每个过程全都数码化的今天,这一矛盾就日益尖锐。于是,信息代理技术就应运而生:它一端面对海量信息资源,另一端面对数以千计的不同业务领域中需要专业化、精准化资源服务的用户,中间通过一套智能识别、加工与聚类机制,将资源的抓取、识别、分析、检索和推送等功能交由计算机自动实现,体现信息代理枢纽的功能。11.2政务信息代理功能11.2.1信息代理概述信息代理又称智能代理(IntelligentAgent),简称代理(Agent)或代理机,是一种智能化、可进行复杂的自动数据处理的软件,用于自动搜索与各类特定主题相关的信息,是近年人工智能领域研究的热点。它综合多种技术,融合智能化、个性化、规模化信息检索与推送式服务的核心技术。目前它已成为大量电商系统、社交和自媒体平台等的后台,为其用户提供个性化服务与提升客户体验的不可缺少的工具。信息代理的服务质量主要取决于代理机的程序、设定信息源的数量与质量、代理程序的功能与自分析自学习性能。互联网中,简单的代理机可根据用户提供资源样本、给定的匹配度阈值等,在全网漫游抓取信息;也可根据用户提供的信源网站目录跟踪抓取信息;还可按主题或地域范围等扫描抓取。因此,这类程序又称网络爬虫,它与聚类分析等程序结合就构成代理机。11.2.2信息代理的框架与流程1)信息代理框架

代理可有多种框架,各层功能如下:(1)资源层

框架底部代表政务系统包含的各种不同形态、不同来源、不同格式与内容资源,可以包含内部与外部信息,以及业务信息等。归整层

中间代表系统对从资源层抽取的各类信息进行的归集整理处理,主要处理对象有各种非结构化信息,半结构化信息与结构化信息,以及语音和图像等信息。引擎层

引擎又可分为自动分类引擎,实现如第10章的自动分类与聚类处理等功能;智能推理引擎,针对资源特征、类型、分类与用户资源需求及使用行为等画像与建模;个性化用户引擎,实现用户专题服务,跟踪反馈其使用习惯与兴趣等,提供针对性的服务。

由于代理只负责资源处理,功能上属于中间件,并不直接呈现结果。故在此3层之上,应通过各种协议与接口等,呈现在不同的终端或传输给其他应用。2)信息代理作业流程代理机被视为知识处理实体,运行一般需要知识库、规则库、推理机、各引擎间的通信协议等;功能上要能实现知识发现代理、通信协作代理、规则库应用代理、监督代理、知识库管理代理、推送代理等。各代理机逻辑上都有自己的知识库,各用户的信息需求传给相应的知识库。系统按用户库中对其设定的需求特征、兴趣、检索行为、工作内容等为样本来筛选信息。系统通过知识发现系统检查知识库中是否有用户既往的信息需求,若有就将其记录提取出来,通过与近期搜索的增量信息比对,将其中达到要求者推送给用户界面。若库中没有其信息需求,经规则应用库代理生成一定的搜索匹配规则,传给知识发现代理进行搜索,结果经信息过滤后存于信息数据库,再经知识库的推理机制推断用户的潜在需求,作为用户需求历史记录,结果推送给用户。代理机还根据一定规则,实时动态地跟踪信息数据库中历史记录在内部或Internet网上的变化,一旦知识发现代理收集到相关的更新内容,就通知规则应用库生成新的检索规则或应用,并通知用户有新的信息内容,还可将更新内容以推送方式提交给用户。检索完成后允许用户对结果进行满意度和相关度的评价并反馈知识库,一方面了解用户的新需求,另一方面完善用户所需信息相关度的匹配规则,为其未来的信息检索提供内容。11.2.3信息代理的特点

目前有许多代理软件,具备程度不等的智能性。智能代理技术是人工智能在网络信息技术领域的运用,具有显著特性和强大功能。1)信息代理的主要特点(1)智能性

体现为对信息特征作自动识别与比对,有一定的运算推理和经验学习能力,能接受用户的资源目录、数据或文献样本、给定阈值等条件,以建立资源搜取目标;在运行中它能对用户的使用行为(如网页驻留时间、跟踪访问层级与退出行为等)分析其意图,再从信息路径、选择过程等兴趣特征上建立用户特征记录。(2)替代性

替代用户进行某些操作,反馈其结果。典型的如代替用户进行信息查询、跟踪选择、下载比对等作业,管理用户的个人资料及其专用目录下的知识库等。管理员可为用户创建代理,或允许其自己创建代理,“代理机”称呼也由此特性而来。

(3)学习性

也称自主性。代理机能根据资源环境、应用环境和用户等的变化,动态调整去完成各项任务的规则、模型与知识库。能通过观测用户使用过程,持续修改与优化其运算、聚类与代理策略等。(4)自动性

可在网络中漫游搜索目标主机,按规则进行资源筛选与抽取,将结果返回用户界面,能随用户兴趣主题的改变而改变搜索模式、采集对象与内容等。(5)主动性

能根据用户设定的具体信息源,或主题领域等,跟踪检测对象的变化。当其发现新增信息时,会主动将其适用内容下载并提交用户。(6)合作性

各智能代理有标准接口,采用统一通信格式交流信息。多代理系统由代理组成,通过代理本身的搜索活动和相互之间的交互活动,构成系统的群体活动,相互之间分工合作共同完成复杂任务,从而实现系统整体的功能或目的,同时,每个代理也在这种交互的过程中实现了自己的功能与目的。(7)媒介性

能通过知识匹配、领域匹配、使用习惯匹配等方式使本代理的用户与其他智能主体进行信息交流,建立联络,相互协调共同完成复杂的任务,等等。(8)持续性

各代理机对应不同的任务,如在互联网搜索访问,或针对特定政务信源的访问。这种活动动是多点并行的,具有可跨地域、时空持续运行的功能特点。2)信息代理的核心技术代理的特点都建立在计算机“理解”信息内容的基础上。“理解”是计算机通过对大量文章中的词语要素等的划分,对其语义、语境、语法、语用和领域等的记录分析的积累性实验、学习、反馈、验证与改进等,形成统计意义上的知识库、规则库、模型库与过程库等。技术上要求系统具有自动信息采集、自动分类整理、自动网页链接、自动全文概括、自动关联信息提要、全文自然语言查询与信息多渠道发送等。能为用户自动建立个性化资料中心,并以个性窗口呈现;能为用户自动建立信息渠道,通过关联性优化选择信息至桌面。性能上要求的处理量级为2~3小时内,能对百万量级的文章完成核心内容自动分类与运算,完成依据用户的兴趣模型或种子样本的聚类,将阈值以上的资源推送到桌面。3)信息代理的分类

目前,代理可分为4种基本类型:①一般信息代理;(二)检测和监视代理;(三)数据挖掘代理;(四)用户或个人代理。代理技术最初应用于商业领域,随着技术和应用的发展,其特性和功能也不断地扩展,应用在智能搜索代理、数字图书馆、电子商务、远程教育和版权检查与保护等领域。随着电子政务的深入化、精准化与个性服务的发展,代理技术在政务领域开始了许多新应用11.3代理机制的建立11.3.1电子政务的代理需求随着电子政务朝深度与广度的整合发展,由政务数据的4项基本特性带来的3个关联性矛盾就在资源处理上日显困难。4项基本特性是:①政务数据的多源性;(二)政务数据的海量性;(三)政务数据的相关性与;(四)政务数据的多态性;3个关联是:(一)传统的结构化技术无法处理大量非结构化政务数据的矛盾;(二)不同应用间的数据难于形成跨系统的内容关联的矛盾,(三)缺乏成熟的智能服务模型,无法为各级管理者与公众者提供个性化、专题化的信息支持等。从本质上看,谷歌、百度等搜索引擎就是信息代理机,具有从海量信息源中抽取专题信息的功能。但电子政务还有其他代理需求,主要有4点区别。代理机的性质与体量不同针对的信源不同拥有主体不同服务方式不同11.3.2代理机功能实例以HP旗下Autonomy公司为例,它为全球一万多个政府机构及跨国公司提供信息代理服务,其产品采用基于语义计算模型的代理机可在资源筛选端让机构配置互联网和内部网中的资源站点,能根据业务需要设立公众反馈、讨论室、内部业务数据流和各资源库列表等。用户端允许不同使用者自行创建个性化的资源栏目、信息频道,并与其业务平台整合,随时通知各用户与其特定角色和兴趣相关的发展状况,实时跟踪外部领域新闻和系统内部的各类动态。其具体功能如下:运用自然语言实例(关键词、样本文档或部分片段)创建兴趣聚焦代理。重新训练兴趣聚焦代理。自动建立超链接与文档摘要。可定义结果数量与质量特征。可选信息源。可设置时间段、语种、搜索方式等。个性化显示,等等。用户在这些功能支持下,通过设置兴趣领域来定制代理机。代理机将持续识别所有相关内容,然后在简洁的个性化页面中以完整的URL链接显示所有筛选内容;还会在出现新信息时及时监测到并提交用户。用户职能或岗位变化,其关注领域改变时,就可重新训练代理机,以切换到新领域。在“推”式服务中,当用户关注主题出现了一个消息,或公众反馈栏目中,甚至跟踪的某些公网网站开始出现一些能反映舆情民意的话题时,用户会通过邮件、短信、屏幕窗口或其媒介收到提示。通过代理实时反馈新闻,持续搜索与增加各用户兴趣目录的匹配资源,能使政务机构具有更高的服务效率、洞察能力与决策水平。11.4代理服务简介

1)作业界面

图11-3是一个采用AutonomyAgents构建的政务知识管理与决策支持系统的用户界面示意。图中前有小三角标志的“专题”,就是系统中的代理机界面。图11-3中的“专题”指用户要求代理的具体领域,代理机由此建立资源泵,对后台资源进行筛选、抽取、阈值计算与匹配,将结果推送到用户桌面。此界面可看出,创建代理就是建立多渠道聚类,以用户自定主题的方式来进行。但与一般聚类不同的是,聚类是针对所有信息,按特定算法经统计分析后自行分类;代理则由人工指定主题域、其他样本词甚至一个文献片断后提交系统,经代理机搜索梳理后建立定向聚焦。用户均可指定专题,选择信源、建立专题域,开展个性化信息服务。示例中建立了“金融服务、科技服务、生产服务、现代服务业发展与产业优化升级、物流、服务业、广东省建立文化大省规划纲要、商贸服务、信息服务业、上海市信息服务业发展五年规划”等主题域代理,显然,以这些种子片语作标题可为使用者提供了专题代理,将由后台进行聚类后输出。当然,用户可通过增加与删除任何样本来调整聚集结果。2)专题代理示例

现以“金融服务”为例,说明建立代理的具体过程。(1)聚集名

在“聚焦名”框中输入“金融服务”作为一个专题的聚焦名。(2)初始训练

对代理机进行初始训练。“训练”是以系列主题词、整篇文档或文章片段输入系统作为其所需专题的代表性概念框架。所选主题词可是一个或一批,如本例“金融服务”的训练词目为“银行、债券、股票、纽约证交所、伦敦证交所、纳斯达克、期货、上证指数、深圳股市、上海股市、投资、融资、基金、风险投资、投资环境、保险、银监会、保监会、证监会”等。输入这些词并提交后,系统就以此为概念模型对资源进行内容挖掘,将符合度阈值以上的文档全部发送的用户桌面上来。(3)结果数量

当查询到的资源数量较多时,设定每页面一次显示的结果文档数。(4)最低相关度

文档内容与样本概念群比对后的统计符合度阈值,其值从10、20、30…90,代表百分比。(5)结果期限

表示代理机挖掘的资源时间期限,可设定“当天、一天、二天…、一周、二周…”。(6)信息源

表示代理机挖掘的信息源目录,可按需在各信道前的小框中打勾,也可在“全选”框中打勾,表对所有信息源按上述概念群进行资源挖掘比对。(7)语言

默认为中文。(8)排序

与前述分类部分面板相同。(9)在社区中显示

表示本用户所建立的代理是否要在社区中显示,打勾则显示在社区中。该功能用于通过专题聚焦与其他用户或专家建立联系,是在电子政务领域中一项新颖而重要的功能。3)建立专题代理示例二对代理的训练,除用主题词集外,还可用整篇文章或其部分片段输入“初始训练”窗,如图11-5所示:聚焦名为“上海市信息服务业发展五年规划”,训练文章采用“上海市信息服务业发展五年规划”,提交后,初始训练窗下就显示该文章名,并在前面的小框内打上勾。这时,在专题主页“您的聚焦”目录中,本文标题后出现“(训练过的)”字样。以文章作为训练样本交系统进行挖掘比对时,其结果数量可能不多,特别在高阈值情况下,但资源相似度较高,如本例检索时就将各其他各省市的类似五年规划全部检出。代理结果的质量取决于两点:一是系统跟踪的信息源数量与专业程度,二是描述专题对象的主题是否准确、周全,或者说取决于资源架构与概念模型的质量。4)结果显示用户建好聚焦主题提交系统后,代理将其“淘取”的符合条件的资源推送到桌面,如前述“金融服务”经代理抽取出的部分结果就如图11-6所示,并显示“Matchingdocumentsforagents金融服务”。每篇文章由4部分描述:相关度百分比及小框、文档标题及右侧五个小标志、摘要、相关文档等。百分比值是代理机将从资源引擎中抽取的所有文档经比对后相关度值大于图11-5中设定“最低相关度”的文章目录列出,按从大到小排序。右侧有五个小标志按钮,从左至右功能分别为:

(1)Contents(内容)。

(2)HighlightedContents(重点内容)。

(3)Summary(提要)。

(4)CreateAgentBasedonthisStory(按此文章创建代理)。

(5)Emailthislink(邮件发送此链接)。11.5专家集聚1)专题社区的建立信息代理适于构建个性化资源服务,多由使用者自行建立。在电子政务中,同一领域会同时受到不同部门领导、专家和相关的社会专业人士关注,如通货膨胀问题,经济主管部门、金融机构、统计部门、财政系统等的专家和甚至公众都可能要求建立代理,添加并跟踪其关注的信源与分析报导等。此时,系统不仅应将信息资源聚类,同时还会将建立本领域专题代理的专家或信息使用者们也聚集起来,组成一个虚拟社区,为不同部门、不同机构、不同地区的专家提供一个相互认识与在线交流的空间,发挥知识交流与倍增作用。可见,代理机不仅能在政务资源层面建立,还能在人与人之间建立选择与聚集机制,将需要信息的人员与拥有答案的人员之间建立联系,动态组成涵盖众多领域、有众多人员参与的专题社区。特别是能随某项研究过程的进展中,在理解正在执行的内容之时,找出相应领域的专家。这一功能对于公众与社会机构参政议政、民主决策、行使监督权、跟踪了解某个领域的进展、协同研究等起到良好的作用。同时,这一功能还能使系统在不断了解各执行人员的经验基础与积累上,由代理机在人员之间建立起能提升团队整体竞争力的联系。2)专家聚集的主要服务形式采用信息代理的专家聚集,主要能产生如下一些形式的政务服务:内容交叉推送完善资源频道优化检索功能结果可扩展同样,这些漫游既可针对资源文档进行,也可针对专题组内的专家进行,使得在政务研判活动中,能针对具体问题,找到最适合的专家与见解等。11.6信息代理的发展

1)智能代理简介信息代理正朝机器学习与智能代理方面发展。美国斯坦福大学的HayersRoth认为“智能代理”应具有3项功能:1)能在感知环境中的动态条件,执行动作影响环境,进行推理以解释感知信息;2)能求解问题;3)产生推理和决定动作。Roth定义的智能代理是在物联网环境中运行的,代理应在选择执行过程中进行识别、推理和规划。这样的智能代理就包括人类与社会中具有感知或观察能力的智能设备的联网与动态分析和处理能力,使智能代理能自动收集信息并提供相关服务,不需要人工干预即可执行一些任务。在电子政务领域,开展智能代理的一些基础设施业已具备。如各城市的一些单位、机关、商店、街区与道路上,均已安装了摄像装置;公安、城管等执法人员也已配备了行政执法记录仪等。这些装置对于动态记录感知范围的对象与过程,各类事件的追溯等起到重要作用。但目前,这些装置只是一种记录设备,尚不具备对所摄取的影像资料进行分析、研判与自动报警等能力。进一步的发展,就需要后台强大的影像模式识别与分析软件,对一些可能涉及违法和影响安全的动作与场景等进行动态分析比对,对符合报警条件阈值的一些行为场景等自动报警,引起监控观察者的注意,对于辅助人工干预与自动提示相关人员注意防范等将起重要作用。2)智能代理的基本特性智能代理应至少具备自主性、机动性与个性化服务能力等,具体如下:

(1)自主性智能代理具有自主与协调工作能力,表现其运行的自动化程度,即其操作行为可无需人工干预。但代理在系统中仍须通过人工加以控制,当代理提出请求时,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论