舆情监控项目背景及产品概述_第1页
舆情监控项目背景及产品概述_第2页
舆情监控项目背景及产品概述_第3页
舆情监控项目背景及产品概述_第4页
舆情监控项目背景及产品概述_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四媒体网络媒体来袭…网络舆情的形成舆情发展的几个特点

网络信息综合监控的难点必须使用舆情监控系统通过网络传播的信息包含了网民对当前社会各种现象以及诸多热点问题的立场和观点,话题涉及政治、经济、军事、娱乐、体育、卫生、科技、个人生活等各个领域。因此,网络舆论能够最直接、快速地反映各个层面的社会舆情状况与发展态势。由于网上的信息量十分巨大,仅依靠人工的方法,难以应对网上海量信息的收集和处理。“工欲善其事,必先利其器”,政府或者企业需要舆情IT平台,实现自动化的网络舆情预警与分析,解决网络舆情管理过程中的舆情采集、分析、表达、干预等难题,从而梳理和客观呈现互联网上的热点舆情,使政府或者企业利用互联网舆情,汲取民间智慧,变网络舆情由被动防堵,化为主动梳理、引导。为推动构建和谐网络环境做出应有的贡献。舆情监控系统的使命系统概述由于网上的信息量十分巨大,仅依靠人工的方法难以应对网上海量信息的收集和处理,需要加强相关信息技术的研究,形成一套自动化的网络舆情监控系统,及时应对网络舆情,由被动防堵,化为主动梳理、引导。接下来我将从设计角度,简单概述整个系统我们能帮您实现…从互联网采集海量数据,包括国内网站、境外网站逐条分析是否与“我区”相关逐条分析是否属于“我区舆情”逐条分析是否属于“我区负面舆情”分析各条舆情“舆情热度”,评估其影响力,分析“重大舆情”“重点事件”分析各条舆情的传播路径、传播时间,做到舆情能“查得清”每日生成“网络舆情简报”,重大舆情生成“舆情专报”时时进行舆情预警24小时不间隔监测,监测时差保障在60分钟内网络舆情监控的系统工作流程网络舆情监控的系统硬件部署产品概述系统数据来源覆盖电信、网通、教育网、联通、铁通、长宽等主要ISP,基本实现全网监控系统实现功能实现对信息的分析挖掘功能,主要包括:特定对象监控实现传统手段的所有功能,通过监控特定对象、特定目标的线索,截获特定对象上网信息情报侦察运用信息检索、统计等技术和方法,搜集网上敌社情信息和违法犯罪线索,发现网上影响国家安全和社会稳定的对象、活动、事件和信息,分析特点和规律。对象调查运用信息检索、关联、核查等技术和方法,调查嫌疑组织、人员及其网上活动,追踪网上有害信息的传播轨迹,分析嫌疑组织、人员的网上关系,以及有害信息传播的特点、规律对象监控运用信息检索、关联、统计等技术和方法,监控重点人、重点组织的网上活动情况,跟踪其网上关系、活动轨迹,分析活动特点和规律。舆情监测运用信息检索、统计等技术和方法,跟踪监测境内新闻媒体、交互式论坛等网站的舆论动态,发现预警网上舆论热点和敏感问题,分析舆情态势和特点、规律。系统架构公司自主研发和运用搜索引擎、文本处理、知识管理、基于自然语言理解的自动摘要技术和自动提取关键词技术,可实现对信息的加工处理,减少人工浏览所需要的大量时间。通过对互联网海量信息自动获取、提取、分类、聚类、主题监测、专题聚焦,支持动态和静态网站信息的采集,加密网站信息采集和需要登陆验证的网站信息采集。系统架构图产品简介对不同政府、企业和行业监管等职能部门而言,舆情监测的需求既有通用性,也有个性化的特点存在,舆情监控系统具有极大的扩展性,凡是需要对舆情、口碑关注的政府、企业、高校和其他组织机构都可以通过本系统进行量身打造,建立适合自己的舆情监测体系。舆情监控系统一共包括四个子系统:舆情数据采集系统、舆情数据分析应用系统、舆情展示平台和舆情检索平台。提供相关舆情、负面舆情、预警信息、热点信息的发现、主题事件监测、分类监测、舆情监管、统计分析、辅助决策支持等多层次、多维度的舆情信息服务。根据用户的网络舆情监测和定向追踪等信息需求,形成简报、专报、图表等分析结果,从而帮助用户及时掌握舆情动向。为领导和舆情工作部门提供信息参考和决策支持。系统的工作流程采集存储采集器从互联网上采集新闻、论坛、博客等舆情信息,并存储到全文数据库中。智能分析舆情分析工具对数据库中的舆情信息进行智能分析和加工。舆情展示和加工舆情展示和加工平台把经过加工处理的舆情数据发布到Web界面上并展示给用户。用户通过舆情展示平台浏览舆情信息,通过简报生成等功能完成对舆情的深度加工。产品特点及优势支持自定义URL来源及采集频率舆情监控系统用户可以设定采集的栏目、URL、更新时间、扫描间隔等,系统的扫描间隔最小可以设置成1分钟,即每隔一分钟,系统将自动扫描目标信息源,以便及时发现目标信息源的最新变化,并以最快的速度采集到本地。支持多种网页格式

舆情监控系统可以采集常见的静态网页(HTML/HTM/SHTML)和动态网页(ASP/PHP/JSP),还可以采集网页中包含的图片信息。支持多种字符集编码

舆情监控系统采集子系统能够自动识别多种字符集编码,包括中文、英文、中文简体、中文繁体等,并可以统一转换为GBK编码格式。产品特点及优势支持整个互联网采集舆情监控系统元搜索模式是以国内知名互联网搜索引擎的结果为基础并利用采集器直接面向互联网定制内容进行直接采集,用户只需要输入搜索关键词就可以了。支持内容抽取识别

舆情监控系统可对网页进行内容分析和过滤,自动去除广告、版权、栏目等无用信息,精确获取目标内容主体。支持基于内容相似性去重

舆情监控系统通过内容相关识别技术自动判别分类中文章的关系,如果发现描述相同事件的文章自动去除重复部分。产品特点及优势内嵌Javascript脚本执行引擎随着Web2.0相关技术的发展,脚本语言越来越多地应用于论坛、新闻评论、博客等类型网站的建设,目的是提高用户的交互性和易用性。由于搜索引擎的采集工具一般不支持脚本语言,因此Google、百度等搜索引擎只能收录少量来自论坛、博客和新闻评论的内容。舆情采集工具内嵌了脚本引擎,能够实现网页中脚本语言的自动解析和执行,从而能够实现对于采用脚本语言的论坛、博客以及新闻评论网站的采集,为舆情分析提供全面的数据保障。灵活丰富的展示

灵活多样的页面展示,方便简捷的个性化定制功能,用户根据自己喜好配置首页的显示内容、样式、摆放的位置、信息条数、滚动信息、栏目高度、以及设置发布权限等,方便用户对系统的使用和管理。根据权限分配栏目,设置浏览权限,不同权限级别看到的栏目信息、简报信息有所不同。统一配置与管理功能系统提供统一的配置入口,便于用户对系统使用和管理。包括数据来源配置;智能分析结果存储配置;智能分析工具条件配置;检索条件配置;首页栏目配置;权限管理配置、环境变量配置等。产品特点及优势负面舆情分析提供舆情自动分类功能,对用户关注的敏感信息进行监控,通过褒贬倾向性分析技术发现负面信息,实现对敏感信息的有效监控。按照“快速反应、确认事实、妥善处理”的原则及时对负面舆情进行分析、判断、评估,准确查找舆情信息产生的原因,认真核实舆情反映的问题,对舆情走向作出正确的判断,对舆情可能产生的影响进行客观、全面评估。新闻聚合

自动聚合网络新闻并自动进行褒贬倾向性的分析。舆情趋势分析与预警码

在舆情分类和褒贬分析基础上,建立多个舆情指标,可以根据舆情指标和舆情分类的结果评估和分析当前的宏观舆情态势。另外,还可提供全国与各地舆情对比功能,帮助用户及时准确地把握宏观舆情走势。提供信息预警机制,可以将短时间内发生的突发热点事件以及敏感新闻通过短信或邮件的方式通知用户,同时可以帮助用户快速制作出关于此热点事件的统计简报。产品特点及优势热点自动发现舆情系统采用基于内容相似的智能聚类技术,能够自动识别网络上的热点新闻事件,及时掌控论坛中的交互信息,发现网民的关注焦点和热点。同时利用舆情分类信息,把用户不关注的热点信息过滤掉,提高热点发现的准确性。根据新闻热点、关键词、专题等信息进行热度分析,包括转载、点击、评论、回复和报道率等关键因素,并能够对这些因素进行综合排名,并支持以半小时为间隔的任意时间段进行统计分析,同时提供1天、3天、7天等时间序列的符合用户精确度要求的分类热点排序专题信息的自动发现与统计分析系统

根据用户设定的专题条件,自动搜寻定位该专题的相关信息。提供多角度的统计分析功能,统计专题的新闻报道篇数、主贴报道数、回帖报道数、博客报道数;设定时间内的专题报道趋势;各个网站对专题报道情况的统计;分析专题设计的热点人名、地名机构名等信息。便于用户全方位、多视角的了解专题情况。热点挖掘

自动识别网络上的热点新闻事件,及时掌控论坛中的交互信息,发现网民的关注焦点和热点。产品特点及优势舆情关联自动把一条新闻和该新闻相关的新闻、BBS评论、博客评论等信息,帮助用户多方位、多角度了解新闻事件的进展情况,全面地掌握各种渠道相关信息。简报功能

简报信息的选择灵活多样,可选取收藏的信息、也可选择不同栏目的信息。图形化展示功能

对热点新闻和事件发展趋势进行图形化显示,帮助用户更加直观地了解舆情发展态势。产品特点及优势元搜索功能提供元搜索入口,自动调用Google、Baidu等搜索引擎,可以根据用户输入的关键词,获取到网页分布的站点情况、发布时间等信息,帮助用户制作简报信息。网络探针

提供网络探针功能:确认后的有害信息进入待处理状态,系统自动定期探测目标网站上的有害信息是否已经删除,并及时修改状态信息。查处管理

对查处的信息进行登记、探测、搜索、统计分析和数据管理。产品特点及优势信息检索提供了强大的检索功能,可以对海量舆情数据进行高效、准确、实时的搜索。对检索结果信息实时进行智能的挖掘,给出检索结果的热点。在舆情检索方面,提供结构化和非结构化数据联合查询技术,从而满足了用户对企业搜索的广泛需求。企业级搜索需要精确(查全和查准两者需要兼顾)和快速(数据一旦变化需要及时体现),而互联网搜索引擎无法满足精确和快速的目标检索需求。舆情检索主要特点包括结构化与非结构化数据的统一管理、实时动态索引、支持GB18030和UTF8大字符集、中文(字词混合索引)、英文(精确索引)、多种检索入口、同义词典,主题词典、支持检索结果的分类统计和浏览、支持对检索结果的各种排序等。产品特点及优势结构化与非结构化数据的统一管理实现结构化和非结构化数据的统一检索,回答基于元数据(meta-data)和基于全文(full-text)的联合查询。实时动态索引

数据增删改时快速同步更新索引,无需重建整个索引,也无需局部重建索引。即数据维护(增删改)后马上能够检索出来。支持GB18030和UTF8大字符集

便于对中文偏僻字和世界各国文字的支持。中文(字词混合索引)由于中文的特殊性,存在字词索引的问题,按字索引保证百分之百的查全率;按词检索保证一定的查准率,并且可以维护分词词典,通过对词典的训练,逐步提高检索查准精度。所以中文检索系统需要提供一种索引方式,保证一定查准率的同时提供100%查全的手段。产品特点及优势英文(精确索引)因为词根处理的正确率不高,还有各国英文用词不是很规范,导致词根处理后错误更多,查全查准成问题。精确索引是解决之道,检索时通过截断符表达式加以解决,例如:eason%or(flavo?ring?Orflavoring?Orflavoring)。除了词根索引,还提供精确索引。多种检索入口属性字段检索(例如分类检索)、关键词检索、位置检索(例如同段检索)、多字段“与或非”组合检索、二次检索(渐进检索)

、大小写敏感检索、中文简繁体扩展检索、支持超长检索表达式(例如长度为2K)等。同义词典,主题词典检索时能够应用同义词典和主题词典进行扩展检索。支持检索结果的分类统计和浏览显示检索结果的分布情况,报告各类别的命中记录数。支持对检索结果的各种排序基于文章内容与检索表达式的相关度计算的相关性排序;基于一个或多个特征属性的字段排序。支持有多个文本字段和非文本字段参与的相关排序,并且可以指定各参与字段的权重系数。产品特点及优势信息自动分类与敏感信息监控采用命名实体识别、褒贬识别及其自动分类技术,舆情系统可以对以下几种信息进行监控:特定的地区:主要是关注的地区,例如北京地区。特定的人物:主要是国家领导人,以及特定地区或机构的政治人物;特定的类别或事件:主要是用户关注的领域,如政法领域,医疗卫生领域等。其

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论