开题报告-微博舆情管理平台数据分析系统的设计与实现_第1页
开题报告-微博舆情管理平台数据分析系统的设计与实现_第2页
开题报告-微博舆情管理平台数据分析系统的设计与实现_第3页
开题报告-微博舆情管理平台数据分析系统的设计与实现_第4页
开题报告-微博舆情管理平台数据分析系统的设计与实现_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

7/7题目:微博舆情管理平台的设计与实现——数据分析系统适合专业:信息安全专业 指导教师(签名):提交日期:2013学院:计算机学院专业:信息安全学生学号:毕业设计(论文)基本容和要求:微博作为迅速崛起的新兴社会媒体,在网络舆情领域日益引起研究者的关注。面对互联网量的数据信息,我们无法想象仅仅通过人工的方式来对互联网舆情进行全面监控的难度。因此,结合网络信息采集技术和文本信息自动处理等技术研发一个网络舆情自动监控系统将有利于社会管理者们与时了解网络舆情的状态和趋势,因而可以对发现的热点舆情与时进行干预,引导疏通民众情绪和心理,避免矛盾的进一步恶化而造成更大的社会损失。现有舆情监测系统在采集、检索和分析模块中都是采用基于统计和特征关键词的方法,由于忽略了文本中的语义信息往往会导致分析结果的不精确。本毕业设计主要针对当前微博中用户身份定位、热点信息挖掘以与负面信息的发现与与时处理等机制进行设计与实现,主要分为数据采集、数据挖掘分析和结果呈现三个部分。主要的工作分工如下:数据采集(微博爬虫程序)功能的实现,抓取微博文本信息。对收集到的文本信息进行数据分析,确定舆情热点关键词、分析用户身份关系将分析结果进行数据呈现。微博舆情管理平台预期实现对主流微博平台(新浪微博,腾讯微博等)消息的自动采集分析,得出最近热点词,关键词;输入关键词后可对与此关键词有关的微博消息进行评估预警,提醒使用者与时作出应对措施毕业设计重点研究的问题:对收集到的数据进行甄别归类分析,实现分词等算法。向量空间模型模型(VSM)与潜在语义索引(LSI)文本倾向性分析实现毕业设计应完成的工作:进行微博舆情监控方面现状的网络调研,熟悉微博管理系统的全过程;熟悉微波舆情监控系统的工作流程,设计合理的分工方案;熟练掌握c和php数据分析算法实现;撰写毕业论文。参考资料推荐:王艺.《重大突发公共事件的微博舆情监测与引导初探》.民族学院学报.2011.05c语言相关资料超.《文本倾向性分析在舆情监控系统中的应用研究》(硕士学位论文).邮电大学.2008.02莫溢,盛华,悦,程学旗.《一种相关话题微博信息的筛选规则学习算法》.中文信息学报.2012.09陆浩.《网络舆情监测研究与原型实现》.邮电大学.2009.02莫溢,盛华,悦,程学旗.《一种相关话题微博信息的筛选规则学习算法》.中文信息学报.2012.09涛.《智能信息处理技术在互联网舆情分析中的应用》(硕士学位论文).同济大学.2008.05LarsenB,AoneC.Fastandeffectivetextminingusinglinear-timedocumentclustering.In:ProceedingsoftheFifthACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining,SanDiego:CA,1999.16—22.其他要说明的问题:题目:微博舆情管理平台设计与实现——数据分析系统设计实现学院:计算机学院专业:信息安全学生:骁学号:09283050文献综述:研究背景:舆情分析关乎国家发展与社会和谐,目前已有越来越多的机构和行业从事舆情分析。Web2.0时代的到来,使人们进入网络信息大爆炸时代。新浪微博每天有近1亿的微博容产生。如何从海量的微博信息中提取有价值的信息,并对负面、消极与虚假信息进行与时的管控,已经成为舆情热点分析的突出问题。良好的解决方案,不仅可以监督规网络行为,净化网络环境,更重要的还能从中获取各类有用信息,进行诸如商业价值(用户兴趣挖掘),信息传播学(网络拓扑与热点追踪),以与一些社会学方面的研究。从而能够满足人们的需求,同时对于社会的和谐、网络舆论生态的健康、国家的发展都有重要的现实意义。研究现状与基本方法目前,已有越来越多的机构从事舆情分析。但是,这些舆情分析系统一般只应用于企业或政府,更关注于对负面、消极与虚假信息的监管,并且不对公众开放。在当今的社会,人们也迫切希望得到一些关乎自身利益的事件的发展情况,如物价的变化、对于一些厂家产品的使用评价等。对于微博舆情预警功能模块的实现,网络舆情安全的评估预警等功能实现的不多。研究容与意义

微博舆情管理平台预期实现对主流微博平台(新浪微博,腾讯微博等)消息的自动采集分析,得出最近热点词,关键词;输入关键词后可对与此关键词有关的微博消息进行评估预警,提醒使用者与时作出应对措施。面对互联网量的数据信息,我们无法想象仅仅通过人工的方式来对互联网舆情进行全面监控的难度。因此,结合网络信息采集技术和文本信息自动处理等技术研发一个网络舆情自动监控系统将有利于社会管理者们与时了解网络舆情的状态和趋势,因而可以对发现的热点舆情与时进行干预,引导疏通民众情绪和心理,避免矛盾的进一步恶化而造成更大的社会损失。主要参考文献:[1]洋,何楚杰,段俊文,春程.《微博舆情热点分析系统设计研究》.信息网络安全.2012.09[2]王艺.《重大突发公共事件的微博舆情监测与引导初探》.民族学院学报.2011.05[3]涛.《智能信息处理技术在互联网舆情分析中的应用》(硕士学位论文).同济大学.2008.05[4]超.《文本倾向性分析在舆情监控系统中的应用研究》(硕士学位论文).邮电大学.2008.02[5]唐晓波宋承伟.《基于复杂网络的微博舆情分析》.情报学报.2012.11[6]恒文.《基于网络语义挖掘的舆情监测预警研究》(硕士学位论文).理工大学.2010.05[7]王晶,朱珂,汪斌强.《基于信息数据分析的微博研究综述》.计算机应用.2012.07[8]莫溢,盛华,悦,程学旗.《一种相关话题微博信息的筛选规则学习算法》.中文信息学报.2012.09[9]谭俊武.《面向网络舆情分析的文本倾向性分类技术的研究与实现》(硕士学位论文).国防科技大学.2009.11[10]陆浩.《网络舆情监测研究与原型实现》.邮电大学.2009.02[11]M.Spitters,W.Kraaij.UsingLanguageModelsforTrackingEventsofInterestoverTimeProceedingsoftheWorkshoponLanguageModelsforInformation.Retrieval(LMIR),Pinsburgh,2001.[12]LarsenB,AoneC.Fastandeffectivetextminingusinglinear-timedocumentclustering.In:ProceedingsoftheFifthACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining,SanDiego:CA,1999.16—22.[13]J.Yi,T.Nasukawa,RBunescu,andw.Niblack.SentimentAnalyzer:ExtractingSentimentSaboutaGivenTopicusingNaturalLanguageProcessingTechniques[A].In:Proceedingsofthe3rdIEEEInternationalConferenceonDataMining(ICDM22003)[C].研究方案:理论基础:1)向量空间模型模型(VSM)

2)潜在语义索引(LSI)3)聚类分析方法研究步骤:1)研读文献,对已采集数据的算法分析进行调研;

2)建立模型,进行模块化设计;3)数据分析部分的代码实现;4)对系统的整体实现;5)系统的测试、评价、反馈、改进;6)实验数据收集,撰写论文。关键技术与难点1)尝试将共词网络与复杂网络方法应用于基于微博的网络舆情分析中。使用图论对现实中的舆情问题进行建模,运用数学基本理论对模型中实体之间的关系进行定量计算,应用直观的共词网络与复杂网络可视化方法,对微博舆情分析中的两个主要任务,热点探测和微博领袖热点发现展开综合研究。2)微博部分信息是零散的、高噪声的、随机的和碎片化的,从而导致构建出的文档向量空间矩阵维数较高,但数据稀疏,因此传统基于VSM(VectorSpaceMode1)的文本聚类方法在微博客热点探测中的效果不佳。需要对VSM进行改进或者提出更高效的方法。3)舆情监控系统的核心技术在于舆情分析引擎,涉与的最主要的技术包括文本分类、聚类、观点倾向性识别、主题检测与跟踪、自动摘要等计算机文本信息容识别技术。其中基于关键词统计分析方法的技术相对比较成熟,但在其有效性方面还有很大的提高空间。预期成果

通过与组员的配合,实现一个能对微博信息进行检测分析的平台;与已有的检测平台相比,实现更高的有效性,准确性;初步实现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论