09004510赵倩楠-开题报告_第1页
09004510赵倩楠-开题报告_第2页
09004510赵倩楠-开题报告_第3页
09004510赵倩楠-开题报告_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题目基于马尔可夫链的食品安全舆情热度预测研究学生姓名赵倩楠班级学号09004510专业信息管理与信息系统提纲(开题报告3000字以上):1.对指导教师下达的课题任务的学习与理解2.阅读文献资料进行调研的综述3.根据任务书的任务及文献调研结果,初步拟定的执行(实施)方案(含具体进度计划)一、本课题的研究意义和研究背景食品安全本就是民生大事,与社会公众的生活息息相关。根据著名的马斯洛需求理论,食品安全属于人类最基础的需要,和人类的联系最紧密,人们的关注度自然也最高。现今,食品安全事件的传播主要借助于互联网,网民通过大量的转载,评论,增加事件的关注度。因此,食品安全问题已经逐渐成为全世界关注的话题。而近年来,我国也屡次发生食品安全问题,公众渐渐对政府的监管监测失去了信心,对国内食品失去了信心,甚至出现了担忧。例如奶粉行业,国内大部分的公众都不愿意购买国内奶粉,他们宁愿花高价购买进口奶粉。这一举动大大的影响着我国食品业的发展。因此综合多次的食品安全事件,不难发现我国不完善的食品安全网络舆情监督监测体系成了食品安全问题产生的主要原因,由此而引发的执行力度不够,反应滞后等问题都对食品安全监管产生了很大的负面影响。为了进一步解决这类问题,则需要对食品安全网络舆情做出更深层次的研究。本文,主要通过对是食品安全网络舆情的热度计算,分析其发展趋势,及时做好食品安全问题的预防和检测工作。二、本课题的文献综述1.食品安全网络舆情综述刘文,李强(2011)[1]认为食品安全网络舆情是指有食品安全事件引发的,有网络媒体、网民等主体对食品安全事件的报道、转载和评论,并在民众认知、情感和意志基础上,对食品安全形势、食品安全监管所产生的主观态度。翟传增(2012)[2]认为食品安全网络舆情因为结合了网络因素使之区别于传统舆情的传播方式,具有5大特点。一是即时性,现今互联网普及率大幅度提高,公众可以食品安全事件可采用随传随编随发的操作,这样在几分钟的时间内甚至几秒钟之内可以达到千万次的阅读。二是匿名性,互联网是一个虚拟的平台,在网络上发表言论的主体都可以是匿名的,因此网民可以随意的对食品安全事件进行评价,这无疑减少了评论信息的有效性。三是过量性,食品安全事件一经发生,会产生巨大的回响,参与讨论的人数众多,而人们对于同一个事件的观点也会不同,因此很难准确的反映出食品安全事件的本质。四是交互性,网络平台的接收者和发布者之间可以进行信息的交互,在短时间内可以产生很大社会动员力,极易造成食品安全事件相关信息传播失真,失控,发酵,膨胀。五是突变性,食品安全网络舆情与其他传统舆情的发展趋势有很大的不同,一般来说食品安全网络舆情热度会在短时间内达到最大点,又会在很短的时间内关注度急速下降,不会如其他舆情一样持续很长时间。综上所述,首先食品安全网络舆情作为网络舆情的一种,它区别于传统的舆情传播方式,如报刊,杂志的传播。其次食品安全网络舆情由于其他形式的网络舆情无论在自身特点传播方式上也存在着很大的差异,因此不能单单把研究其他网络舆情的方法照搬到食品安全网络舆情的方法研究上。2.热度评价指标综述李勘,李晶,刘萍(2011)[3]认为一个舆论事件是否是热点,取决于热门对给事件的关注程度,通常通过点击数和回复数来进行描述的。因此在统计数据是可以搜集主要新闻网站,主要论坛,主要博客中回复数,点击数,回帖数,转载数,以它们为评价指标,进而做出热度的计算。张一文,齐佳音,方滨兴,李欲晓(2011)[4]认为热度评价指标可设定为市场化报刊媒体、党报中央媒体数(人民网报刊检测平台利用关键词进行搜索),广电媒体新闻数(人民网媒体检测平台进行搜索),新闻专题数(搜索范围限于选定的影响力大的新闻门户网站,通过舆情检测平台结合人工进行搜索和分类),实时新闻数、新闻评价数(使用百度新闻搜索功能进行搜索,再通过人工进行计算和分类),发帖量、浏览量、回复数、博文数(一方面主流论坛搜索,再一方面利用人民网搜索平台进行搜索),新闻话题数(将新闻专题中的新闻进行总结,找出最具影响力的话题,同时结合专家进行评判和筛选),意见领袖博文数(采用人民网舆情监控平台进行搜索)这7个指标。综上可以看出,指标的选择会对热度计算的结果产生很大的影响,如果单纯的根据博客的回复数,点击数,回帖数,转载数这四个指标来计算,会显得指标的单薄性,局限性,不能很好的评价事件。而用后者的7个评价指标,又可以发现其中好几个指标需要进行人工统计。一般来说,人工统计数据过程中会存在误差,不能很好的保证数据的有效性,并且人工统计数据的效率不高,会影响研究进度,因此需要建立完善的指标体系,在这过程中,既要注重指标数据的可取性,又要注重有效性。网络舆情热度预测方法综述刘勘,李晶,刘萍(2011)[3]认为可以采用马尔可夫模型进行预测分析。因为马尔可夫模型是预测分析中的一个可靠模型,成功运用于社会生活各个方面,如股票预测,价格市场,人力资源供给,人口流动等。而马尔可夫链适用于离散的,随机的状态过程。由于影响食品安全网络舆情发展的因素具有多样性和不确定性的特点,舆情发展的状态可以看做一个随机发展的过程,而它的发展受当前时间的影响非常强烈,即t+1时刻的状态与t时刻的状态有关,转移过程只与当前热度值有关。这些特点正好符合了马尔科夫链的适用条件。罗晖霞,曲晓玲(2010)[5]认为可以采用K-means算法[6]进行舆情预测。K-means算法,实质上是一种将聚类视为密度估计问题的概率方法。其主要步骤是先进行多个聚类的中心选取,即聚类中所有对象的平均值,然后计算聚类之间的相似度,利用同聚类相似度大,不同聚类相似度小的原理,把两个相似度最大的聚类合并成一个大的聚类,以此方法一直等到合并到最终条件为止。曾果(2008)[7]认为可以采用K近邻算法进行预测研究。K近邻算法的主要思想是:计算出新样本与训练样本之间的距离,找出距离相近的K个邻居;根据这些邻居所属的类别判定新样本的类别,如果都属于同一个列别,那么新样本也属于这个类,否则,对每个候选类别进行评分,按照某种规矩来确定新样本的类别。这种方法运用到食品安全网络舆情中也就是利用与新话题相似的历史话题的点击数时间序列来对新话题的热度进行预测。实验证明,内容相似的话题事件之间往往具有相似的发展态势,可以利用相似话题的整体发展态势对新话题的舆情热度进行有效的预测。[8]ZhangYiwen,QiJiayin,FangBinxing,LiYuxiao(2011)[9]认为可以采用BP神经网络算法进行网络舆情的预测。BP神经网络模型法通常是采用多个节点的输入层,隐层,多个或者一个输出层组成,当样本信号输入网络是,逐层进行计算,再将输出的结果与原始预测结果进行比较,如果误差不在可接受范围,则逐层返回,利用误差对节点再进行调整,直到误差变小,满足需求时为止。BP神经网络模型的本质是通过历史数据的学习找出数据变化趋势之间的非线性关系,并通过输出量与预期量之间的误差不断调整网络中各个单元的权重,使整个网络的误差最小。[10]综上可以看出,许多学者在网络舆情预测方面做出了较多的研究。上述的方法中也各有自己的优缺点和适用的方面,针对于本文所研究的食品安全网络舆情来说,结合它自身区别于其他网络舆情的特点,因此,本文选用马尔科夫链进行食品安全网络舆情热度的预测。指标权重计算方法综述吴殿廷,李东方(2004)[11]认为可以采用层次分析法指标权重的计算。层次分析法(AnalyticHierarchyProcess,AHP)是美国运筹学家、匹兹堡大学萨第(T.L.Saaty)教授在20世纪70年代提出的一种系统分析方法,80年代初引进我国,是一种定性与定量分析相结合的多目标属性决策方法。决策者将复杂的问题分若干层次,通过数学建模进行计算比较,最终得到各个因素的权重。[12]一般来说,AHP方法的研究体系分为三层,最高层为目标层,该层表示解决问题的目的;中间层为准则层;最底层为方案层。层次分析法的主要贡献在于:1)提供了层次思维框架,便于整理思路,做出结构严谨,思路清晰;2)通过对比进行标度,增加了判断的客观性;3)把定性判断与定量推断结合,增强科学性和实用性。ZOUZH,YUNY,SUNJN(2006)[13]认为可采用熵值赋权法进行指标权重的分析。熵是信息论中测量系统无序程度的度量。系统提供的信息量越大,熵就越小;反之,信息量越小,熵就越大。熵值赋权法就是依据个指标数据所包含的信息量大小来确定指标的权重。熵值赋权法是一种客观赋权法,是根据各指标值的变异程度所反映信息量的大小来确定指标的权重。当某个指标的熵值越大时,则说明指标信息的无序度越高,这个指标的利用价值越小,权重越小;反之,指标的熵值越小,指标信息反映的无序度越小,则这个指标的利用价值越高,权重也就越大。当某个指标的数据完全无序时,其熵值等于1,其对综合评价的效用值为0。综上所述,因为本文所选取的指标中并没有层次的区分,因此层次分析法不适用于本文指标权重的计算。而熵值赋权法,在操作性,有效性上都符合本文的指标,因此选择上值赋权法进行指标权重分析。参考文献:[1]刘文,李强.食品安全网络舆情监测与干预研究初探[J].中国科技论坛,2012,(7):44-49.[2]翟传增.新媒体时代食品安全网络舆情引导机制研究[J].安阳师范学院学报,2012,(4):145-147.[3]刘勘,李晶,刘萍.基于马尔科夫链的舆情热度趋势分析[J].计算机工程与应用,2011,47(36):170-173.[4]张一文,齐佳音,方滨兴,李欲晓.非常规突发事件网络舆情热度评价体系研究[J].情报科学,2011,(9):1418-1424.[5]罗晖霞,曲晓玲.基于网络舆情的K-means算法的改进研究.电脑开发与应用,2010,(8):4-8.[6]MacQueenJ.SomeMethodsforClassificationandAnalysisofMultivariateObservations[C].In:Proceedingsofthe5thBerkeleySymposiumonMathematicalstatisticsandProbability.Berkeley,UniversityofCaliforniaPress,1967:281-297.[7]曾果.基于K近邻的垃圾邮件过滤模型[J].铜仁学院学报,2008,(9):118-119,134.[8]聂恩伦,陈黎,王亚强,秦湘清,金宇,于中华.基于K近邻的新话题热度预测算法[J].计算机科学,2012,(6):257-260.[9]ZhangYiwen,QiJiayin,FangBinxing,LiYuxiao.TheIndicatorSystemBasedonBPNeuralNetworkModelforNet-mediatedPublicOpiniononUnexpectedEmergency[J].ChinaCommunications,2011,(03):42-51.[10]贾建波.基于BP神经网络的股市分析[J].商场现代化,2010,(11):132-134.[11]吴殿廷,李东方.层次分析法的不足及其改进的途径[J].北京师范大学学报(自然科学版),2004,(4):264-267.[12]王小云,蓝少华.档案信息质量评价之-指标权重分析及运用[J].档案学通讯,2010:41-45.[13]ZOUZH,YUNY,SUNJN.Entropymethodfordeterminationofweightofevaluatingindicatorsinfuzzysyntheticevaluationforwaterqualityassessment[J].JournalofEnvironmentalSciences,2006,18(5):1020-1023.三、本课题的论文第一章前言第二章文献综述2.1高校舆情综述2.2高校舆情研究现状综述2.2.12.2.2主观指标2.3网络舆情热度预测方法综述2.3.1K-means算法2.3.2K近邻算法2.3.3BP神经网络算法2.3.4马尔可夫模型2.4指标权重计算法方法综述2.4.1层次分析法2.4.2熵值赋权法第三章食品安全舆情指标体系的建立第四章食品安全网络舆情热度计算第五章食品安全舆情热度预测计算逻辑5.1状态划分5.2状态转移矩阵第六章食品安全舆情热度预测实证四、本课题的初步执行方案2012年第14~15周分析题目要求,查找相关资料,阅读参考文献第16周开题答辩,完成开题报告第17~18周外文翻译和批阅2013年第1~6周调研并分析整理文献资料,构建论文框架第7~10周中期检查第11~13周

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论