网络视频中的影视评论分析技术研究_第1页
网络视频中的影视评论分析技术研究_第2页
网络视频中的影视评论分析技术研究_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、网络视频中的影视评论分析技术研究浦晓亮辽宁师范大学计算机与信息技术学院摘要:随着目前我国社会经济的快速发展,人们物质牛活在得到极大满足的同时,对 于精神生活的需求也愈发凸显。基于这一现状,近年来国内的影视市场得到了极 大繁荣,尤其是受到互联网技术的发展影响,影视作品也呈现出了许多新的特 征。对此,就针对网络视频中的影视评论分析技术展开相关的研究工作意义重 大。本文简要介绍了影视评论的基本概念,从信息采集、数据预处理、评论分析 等三个方面对网络视频中的影视评论分析技术展开了具体探讨。关键词:网络视频;影视评论;信息采集;数据处理;随着当前互联网信息技术的快速发展,齐种专业化的影视网站也有了长足的

2、发 展与进步,这些网站在为网民提供相关影视节目信息查询工作的同时,也为广 大用户提供了对影视节目进行评论的平台。对此,有关影视节目的评论内容近年 来呈现出了指数级的增长趋势,对于影视节目的评论已经从专业的影评人员扩 展到了广大的网民群体。针对网络环境屮的影视节目评论内容进行搜集、分析, 能够对影视节目的制作、发行,以及宣传等工作提供重要的促进、推动作用。因 此,影视节目评论分析现已成为互联网评论分析研究的一个重要领域。评论即为评论者针对某项话题发表带有鲜明个人情感色彩的观点表达,评论的 构成主要包括了话题、创作者、观点与情感等耍素。评论的对象通常也就是所评 论的话题,亦可将其称作影视作品的某一

3、项特征。以电影评论为例,其通常评论 的特征主要就有电影作品当中所涉及到的各项元素以及相关的演职人员。电影构 成元素则包括了剧本、台词、布景、摄影、咅乐等内容,所牵涉到的工作人员则 有编剧、演员、导演、制片人等。做出评论分析内容即为主动发现评论内所牵涉 到的相关评论对象,以及评论人员做出的具有明显倾向性与代表性的观点表达。二、信息采集 应用人工维护方式针对影视节目信息开展持续性的追踪及维护工作,往往有着 较大的工作量。对于目前在互联网上己经公布出的共享性数字资源信息,针对影 视节目基础性信息内容开展自主化采集与选取,是促成影视节目库建设的重要 方式之一。对于影视节目数据信息库的建设,常规的做法是

4、利用当前的互联网视频网站采 集系统,这一系统可以促成对齐主要视频网站信息的采集和数据调取,利用技 术化手段改造处理后,完成对于相关影视节目信息的搜集工作。当前的主流视频 网站釆集系统所获取的目标对象基木都是以视频形式为主,其中重点包括视频 内容的标题、发布人员、发布吋间以及相关的描述性信息等有关内容。影视节目 信息系统所需采集的数据内容即相应的影视节目信息,其屮主要有影视节目名 称、演员、导演、播放量、每集时间等相关信息内容。三、数据预处理这项技术内容主要是对所采集的影视节目信息进行统一化的标准文本处理,其 整体系统设计处理最终所要达到的口标对象即简体屮文评论信息,而要实现这 一目标需要把搜集

5、到的相关评论信息进行文字形式与分词等文本转换处理。因为 一些评论内容存在着繁简字的映射关系,要想实现完全转换过程较为复杂,在 具体实施的过程当中,可先将繁体字处理成简单的单个汉字予以映射,便能够 满足要求。在分词处理时,则可选用ictclas软件进行处理。当前所采用的分词系统较难达 到对影视节目名称等相关专有名词的自动化检出,但是分词的精准性又会对最 终的信息应用产生较大的影响。对此,可将在信息采集过程当中所搜集到的演员 或是导演等相关专有名称词汇加入到附加词典内,由此系统便可仅选取专有名 词作为选取特征要素,将形容词作为情感词,在进行影视评论信息搜集时,仅 需提取相关的名词与形容词來展开处理

6、。四、评论分析由词汇特征出发所创建出的影视节目评论分析系统,应当要先确定评论内所包 括的特征词汇,即所评论的目标对象。因在数据预处理环节新加入了演员与导演 名称等相关专有名词,此时再进行分词z时,所得到的结果便可直接发现影视 评论内容中的有关专业词汇,相关的词汇也便能够充当评论的候选特征要素。此外,因汉语言分词系统在针对评论文本开展分词处理之时,会把没有包含在 词典内的命名实体或是词组分隔开来,这样以来,将会导致只依靠分词系统所 获得的名词无法对评论特征做出精准描述。对此,可采取基于频繁项挖掘的特征 提取手段來解决以上问题。基于给定的窗口范围当中和名词共现程度超过特定阈值的字符串作为候选抽取

7、特征,这一方法不但可以将具有频繁性特征的评论抽取出来,而且还可以有效 弥补因为分词系统把复杂特征分隔为多项专业词汇导致的特征抽取错误情形。总而言z,在本次研究屮,基于网络视频当屮的影视评论分析技术展开了相关 的探究工作,基于自动网页抓取技术以及模板之上的信息抽取技术,建立起影 视资源信息库,同时利用网络技术来主动抓取相关的评论内容。然后再通过之前 所创建的影视专业词汇与汉语言分词技术,对评论内容实施分词处理,借助于 频繁项分析方法,主动探究影视评论中的频繁特征,作为备选标准,进一步综 合具有典型性的感情词汇,获取到影视作品屮不同特征的情感倾向分析结果。参考文献1 卢娟网络影视评论的现状及生态构建j电影文学,20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论