产品评论挖掘研究综述._第1页
产品评论挖掘研究综述._第2页
产品评论挖掘研究综述._第3页
产品评论挖掘研究综述._第4页
产品评论挖掘研究综述._第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2008, 44(36 1引言随着 Web 的广泛使用,用户购买和使用产品之后会在Web 上发表对产品的评论, 这些评论中包含用户对产品的性能 或功能等方面持有肯定还是否定的态度 。 生产厂商和用户对产 品评论的分析可以获得大量的有用信息:生产厂商不仅可以了 解用户对产品目前已提供的性能的评价和产品的不足, 还可以 了解用户的需求,找出用户最感兴趣和最希望提供的功能, 从 而改进产品 1。 用户购买产品之前可以了解已经购买了该产品 的用户关于该产品的使用体验,了解产品各个方面的性能, 还 可以对同类型的产品按照性能进行对比, 从而合理地购买产品 2。目前用户一般通过在 Web 上填写问卷调查表

2、的方式或直 接使用自然语言发表一段评论的方式来表达对产品的态度 。 问 卷调查表属于结构化数据, 可以使用成熟的数据库技术进行分 析并显示统计结果, 自然语言描述的产品评论属于无结构化数 据, 生产厂商和用户要想从产品评论中获取信息, 只有通过人 工阅读方式来获取信息, 而这是一个消耗时间且容易产生错误 的过程 。 因此产生了对用户评论挖掘的研究, 目的是通过采用自然语言处理技术, 对自然语言描述的无结构的用户产品评论中进行数据的自动挖掘, 找到有用的信息, 并以直观的方式对 挖掘结果进行表示 。2产品评论挖掘框架产品评论挖掘是文本挖掘研究领域中最近几年兴起的研究 热点, 以 Web 上发表的

3、用户产品评论作为挖掘对象, 采用自然语 言处理技术,从大量文本数据中发现用于对该产品各方面性能 的评价 。 目前产品评论挖掘分为产品特征提取 、 主观句定位 、 用户 态度提取 、 态度极性判定和挖掘结果显示 5个子任务 (如图 1 。(1 产品评论语料库 。 产品评论挖掘是针对某类产品 (比如 手机 、 数码相机 进行挖掘, 因此必须首先建立产品评论的语料 库 。 目前研究主要采用从指定的网站 (比如英文的 www.Ama - 、 中文的 pinglun.IT 获取某类产品的产品评论 来构建产品评论语料库 。(2 产品特征提取 。 从产品评论中发现用户对产品的哪些 产品特征 (产品的部件 、

4、 部件的性能或功能 进行了评价 。基金项目:重庆市自然科学基金 (the Natural Science Foundation of Chongqing City of China under Grant No.2007BB2134 。作者简介:伍星 (1978- , 男, 博士研究生, 讲师, 主要研究方向为自然语言理解 、 Web 挖掘; 何中市 (1968- , 博士, 教授, 博导, 主要研究方向为机器-收稿日期:2008-09-15修回日期:2008-10-16产品评论挖掘研究综述伍 星, 何中市, 黄永文 WU Xing , HE Zhong-shi , HUANG Yong-we

5、n重庆大学 计算机学院, 重庆 400044Computer College of Chongqing University , Chongqing 400044, China E-mail :wuxingWU Xing , HE Zhong-shi , HUANG Yong-wen.Product review mining :A survey.Computer Engineering and Applications , 2008, 44(36 :37-41. Abstract :Product review mining is the process of finding informa

6、tion from product reviews on the Web through natural language process technology.It is a rising field that is the sub field of unstructured data mining from plain text.The information mined fromproduct reviews can help manufacturers to improve their product ,and help user to buy product with more ra

7、tionality.A survey of product review mining is discussed.Firstly , the framework of product review mining is analyzed.Then , the tasks of product reviewmining that include subjective sentence identify , product feature extracting , user attitude extracting , polarity classifying and mining result sh

8、ow are also described in detail , and finally the future reseach directions about product review mining are pointed out. Key words :textual pattern ; subjective feature ; word polarity摘 要:产品评论挖掘是以 Web 上用户发表的产品评论为挖掘对象, 采用自然语言处理技术, 从大量的文本数据中发现关于产品 的功能和性能的评价信息的过程 。 产品评论挖掘是一个新兴的研究领域, 是对自然语言描述的无结构数据进行数据挖

9、掘的典型代 表 。 产品评论中挖掘得到的信息不仅可以帮助生产厂商改进产品, 还可以帮助用户合理的购买产品 。 对产品评论挖掘进行了全面 深入地讨论, 介绍了产品评论挖掘系统的通用框架, 然后对产品特征提取 、 主观句定位 、 用户态度提取 、 态度极性判定 、 挖掘结果显 示这 5个子任务进行了详细地阐述, 最后介绍了产品评论挖掘的最新方向 。关键词:用户评论; 主观特征; 词语极性 DOI :10.3778/j.issn.1002-8331.2008.36.010文章编号:1002-8331(2008 36-0037-05文献标识码:A中图分类号:TP18Computer Engineeri

10、ng and Applications 计算机工程与应用 37Computer Engineering and Applications 计算机工程与应用2008, 44(36产品评论 语料库产品特征提取 主观句定位 产品特征集合主观句集合用户态度提取 态度极性判定 挖掘结果显示图 1产品评论挖掘系统框架1. 最大的缺点是电池容量小使用时间短 。 2. 外表华丽, 适合白天使用 夜景不用三角架不行, 防抖极差, 防红眼基本不起作用 。3. SONY T9可以放在裤兜里 。图 2产品特征(3 主观句定位 。 发现产品评论中的哪些句子用户表达了 对产品的主观态度 。(4 用户态度提取 。 从主观句

11、中寻找表示用户态度的单词 、 短语或结构 。(5 态度极性判定 。 确定用户态度的极性:正性 (肯定 、 支 持 /负性 (否定 、 反对 。(6 挖掘结果显示 。 对挖掘结果进行直观地显示 。 文章的后续部分将对产品评论的 5个子任务进行详细地 介绍 。2.1产品特征提取生产厂商一般会提供一个关于产品各个方面性能的说明文件, 但是产品评论挖掘一般不从这样的说明性文件中提取产 品特征, 主要原因是:首先生产厂商和用户对产品特征关注的 角度不一样, 生产厂商提供的产品特征更多的专注于一些技术 细节, 对于这样的细节用户一般不感兴趣; 其次产品评论中对 特征的描述是一个开放性的问题, 用户可能在产

12、品评论中发表 生产厂商根本没有考虑到的一些产品特征, 因此需要从产品评 论语料库中提取产品特征 。产品特征分为显示特征和隐示特征, 显示特征是直接出现在产品评论中描述产品的性能或功能的名词或名词短语 。 隐示 特征没有在语句中直接进行描述, 需要句子进行语义理解才能得到 。 图 2中的第 1、 2句中的电池容量 、 外表 、 三脚架和防红眼 是显示特征, 而第 3句中语句的字面语义是相机容易放在口袋里, 其实指出了 SONY T9的大小这个隐示特征 。 提取隐示特征 需要自然语言的完全理解技术, 而该技术不成熟, 因此目前的产品评论挖掘中产品特征提取均都只考虑显示产品特征 。显示产品特征的提取

13、分为人工定义和自动提取两类方法 。 人工定义就是针对特定领域的产品建立该领域的产品特征词汇表 。 Li Zhuang 人工定义针对电影的产品特征, 将电影的产品 特征分为两类:电影的元素 (比如:screenplay 、 vision effect 和与电影相关的人员 (比如:director 、 screenwriter 、 actor 3。 姚天 昉 利用本体建立了汽车的产品特征 4; Kobayashi 、 Inui 和 Mat -sumoto 以半自动的方式建立了针对汽车和游戏的产品特征, 首 (论文档中抽取候选的特征, 再以人工的方式进行标注 5。采用人工定义产品特征的方法, 每一个

14、领域的产品都需要 该领域的专家参与才能定义该领域的产品特征, 因此移植性较差, 并且人工定义的产品特征是静态的, 当产品的功能发生改 变后 (比如手机加入了新的功能 , 只有重新召集领域专家才能 将新特征加入该类产品的产品特征集合中 。自动提取产品特征主要使用词性标注 、 句法分析 、 文本模 式等自然语言技术对产品评论中的语句进行分析, 从中自动发 现产品特征 。 Kim 和 Hovy 首先寻找句子中包含表达主观性的 词汇, 然后定义一个大小固定的窗口, 以主观性词汇为中心, 将 窗口中的名词或名词短语作为特征 6。 Jeonhee Y 、 Nasukawa 、 Bunescu 和 Nibl

15、ack 指定了具有 BNP (Base Noun Phrase 结构 的名词短语才可能是产品特征, 并使用信息检索算法度量该特 征是否与指定产品类相关 7。 Hu Minqing 和 Liu Bing 首先对评 论中的语句进行词性标注,只保留句子中的名词或名词短语, 将产品评论语料库中的每一个句子生成一条记录插入 Trans -action File , 然后采用 Apriori 算法从 Transaction File 中寻找频 繁项 (频繁 1, 2, 3项集 , 将得到的频繁项作为候选产品特征, 再根据两条启发式规则对候选产品特征进行过滤得到产品特 征集合 。 该方法结构简单便于实现,

16、具有良好的移植性, 获得了较高的召回率 (80% , 但准确率有待提高 (71% 8。 Popescu 、Yates 和 Etzioni 采用 KnowItAll 中人工定义的抽取指定关系 (part of 关系 、 is a 关系 的文本模式抽取产品特征 。 该方法在 Hu Mingqing 的 5类产品的产品评论语料库取得了召回率 77%(降低 3% 、 准确率 89%(提高 18% 的良好效果 。 该方法需 要使用人工定义的通用文本模式,因此具有和 KnowItAll 系统 同样的缺点:部署困难和移植性较差 9。2.2主观句定位用户产品评论中包含两类信息:客观信息和主观信息 。 客观信息

17、是用户表述的一些事实信息, 主观信息是用户表述自己 对产品的主观态度, 因此需要确定产品评论中哪些语句是表示 了用户态度的主观句 。判定主观句的方法主要是查看语句中是 否出现了主观性特征,主观性特征包括可以表示主观性的动 词 、 形容词 、 名词 、 短语 、 文本模式或人工定义的词汇表, 主观性 特征的获取分为人工定义和自动获取两种方式 。人工定义主观性词汇表通过人对用户产品评论的语料库 进行总结, 得到表示主观性的词汇表 。 Kim 和 Hovy 采用了人工 定义的方法建立了主观性判定特征词表 10; Bethard 和 Hong Yu 使用 FrameNet 和 PropBank 的语义

18、角色标注,提取动词作 为主观性的线索 11。自动获取主观性特征的方法分为监督学习和弱监督学习 两类方法 。 监督学习需要对主观性进行了标注的语料库, Wiebe 开发了人工标注的主观性语料库 12, 通过人的知识来决定句子 是否为主观句, 标注了引起句子成为主观句的元素, 并按照该 元素引起的主观性的强弱进行了等级的划分 13。 该语料库的标 注过程中发现形容词是引起主观性的一个重要特征,因此 Wiebe 从标注的语料库中学习了作为主观性的形容词 14。建立主观性标注语料库的另一个方法是直接采用报纸的 文章类型作为篇章层次的主观性标注 。 Yu Hong 和 Hatzivas -siloglo

19、u 直接使用 WSJ 作为语料库, 将文章分解为一元单词 、 二 元词对 、 三元词对, 以文章的类型 (Editorial , Letter to Editer , and 习的方法获取那些单词 、 二元词对 、 三元词对可以作为主观性382008, 44(36特征 15。 Riloff 和 Wiebe 直接使用文本模式作为捕获表示主观 性特征的复杂结构 。 该方法首先利用已有的主观性和客观性词 汇表分别建立具有高准确率的一个主观性分类器和一个客观 性分类器,利用这两个高精度的分类器对语料库中句子进行 主 /客观性分类, 然后将 AutoSlog-TS 中的文本模板采用语料库 中的句子进行实

20、例化, 生成文本模式, 最后根据句子的主 /客观 性标注, 对文本模式的主 /客观性进行评分, 以得到主观性的文 本模式 16。主观性标注语料库的建立需要大量的人力和时间, 而采用 弱监督的方法抽主观性特征不需要提供主观性标注语料库, 只 需提供少量的主观性特征作为种子集合, 就可以从语料库中自 动获取更多的主观性特征 。 Riloff 采用 BootStrapping 方法自动 提取可作为主观性特征的名词, 该方法只需要提供由少量可作 为主观性特征的名词构成的种子集合和无标记的语料库 。 首先 从语料库中发现出现了种子集合中主观性特征的句子, 根据这 些句子自动抽取侯选文本模式,对侯选文本模

21、式进行评估, 选 择最优秀的文本模式加入文本模式集合, 再使用文本模式抽取 新的主观性特征, 将新的主观性特征加入种子集合, 该过程不 断的进行迭代以获得更多的可作为主观性特征的名词 17。 2.3用户态度提取Kobayashi 、 Inui 和 Matsumoto 建立了形容词的用户态度词 汇表 (比如:comfortable , tight , supportive 18。 Li Zhuang 从人工 标注的数据中寻找了 1093个词汇作为正性词汇, 780个词汇 作为负性词汇,无论评论语句中出现了正性还是负性词汇, 那么都将该词汇作为表示了用户态度的词汇 3。 Bing Liu 和 Mi

22、ngqing Hu 提取句法分析树中修饰作为产品特征的名词和 名词短语的形容词或副词作为用户态度 19。 Kim 和 Hovy 不进 行句法分析而是直接定义一个窗口, 根据句子中的产品特征定 义窗口出现的位置, 将在窗口中出现的形容词作为用户态度 20。 Popescu 和 Etzioni 使用文本模式提取用户态度, 将出现在文本 模式中的形容词作为用户态度 21。2.4态度极性判定态度的极性判断和用户态度提取既有联系又有区别, 联系 在于二者都是使用特定的词语或者结构, 不同在于用户态度提 取只判断什么样的语言单元表达了用户在特征上的态度 (观 点 、 情感 , 态度的极性判断需要进一步确定

23、用户所表达态度的 倾向:正性 (褒 、 肯定 、 赞扬 /负性 (贬 、 否定, 批评 。 文本的态度 分析分为词语 、 短语 、 句子 、 篇章等多个层次, 篇章层次的态度 极性的判断多用于基于情感的多文本摘要等领域, BoPang 直 接使用 NGram 语法,对文章进行分解,得到的 N 元组作为特 征, 训练篇章层次的态度极性分类器 22。 Turney 首先判断句子 中词汇的极性, 再判断句子的极性, 最后确定整个文章的态度 极性 23。产品评论挖掘中需要抽取的是用户在某一具体的产品特 征 (比如手机屏幕的大小 所表示态度的极性, 因此更多地倾向 于对词语 、 短语的态度进行分析 。

24、词语或短语的极性判定需要 极性词汇表, 极性词汇表的建立分为人工定义和自动获取两种 方法 。 人工定义方法通过人对语言的分析来建立极性词汇表, 直接查询极性词汇表即可获取词汇或短语的极性 。 Ku Lun-wei , Liang Yu-ting 和 Chen Hsin-his 建立的极性词汇表包含两性词汇表和人工从 Web 上收集构成的中文网络极性词典, 二 者一共包含 2764个正性词汇和 7778个负性词汇 24。 娄德成 和姚天 昉 分别对 HowNet 中的 6564个词条和从 2454篇汽车 评论中人工选择得到的极性词汇以人工标注的方式建立极性 词汇表 25。 Hatzivassil

25、oglou 和 Wiebe 分析了语义方向和程度词 汇 (副词和名词 对语义方向的影响, 手工建立了一个 73个单 词构成的词汇表 26。Wang Chao 、 Lu Jie 和 Zhang Guangquan 发现产品评论语 料库中的评论包含两个部分的内容:标题和具体内容, 而标题 通常表示了整个评论的态度, 因此可以将标题中的用户态度作 为具体内容的的极性标注, 建立朴素贝叶斯分类器, 计算具体 内容中词汇的极性 27。 Yang Changhua 、 Lin Kevin Hsin yih 和 Chen Hsin hsi 将博客上的回复信息的表情图标 (通常用户会 使用从网站提供的表情图标

26、中选择一个来表示自己的态度:肯 定 /否定 作为回复语句的极性标注, 通过计算语句中的词汇与 表情图像之间的互信息来建立极性词汇表 28。Hatzuvassiloglou 利用形容词之间的连词存在语言学上的 限制 (连词连接的两个词表示相同或相反的态度 , 将语料库中 的形容词聚类为正性词汇和负性词汇 。 实验结果表明对形容词 的极性判定具有较好的效果, 该文只对形容词进行了语义方向 的判定, 可以采用同样的方法来确定动词和副词的极性 29。 上述方法建立的极性词汇表由固定的词汇构成, 而用户产 品评论中所使用表示用户态度的极性词汇可能在极性词典中 并未包含, 需要对产品评论中未出现在极性词汇

27、表中的词汇进 行处理 。 Ku Lun-wei , Liang Yu-ting 和 Chen Hsin-his 充分利 用了中文词语由字构成的特点, 指出词语的态度极性由构成该 词语的字的态度极性组合而成, 而字的态度极性通过字出现在 人工建立的极性词汇表中的正性 /负性词汇中的频率来表示 。 该方法不仅可以判定极性词汇表中未包含词汇的极性, 还可以 计算极性的强弱 24。 娄德成和姚天 昉 25使用 Turney 30的 PMI-IR 方法来处理极性词汇表中未包含的极性词 。 Kim 和 Hovy 使用 了一个假设:同义词的极性相同, 因此使用 WordNet 寻找同义 词, 对人工定义的极

28、性词汇表进行扩展 。Turney 30采用互信息和信息检索结合 (PMI-IR 的方法判 定词汇极性, 该方法假设同一篇文章中出现的词语具有相同的 情感极性方向 。 首先建立 7个单词构成的正性词汇集 PWords 和 7个单词构成的负性词汇集 NWords (如图 3 , 对需要进行 极性判断的词汇 UWord , 分别计算 UWord 与 PWord 和 NWords 中的每个极性词汇的互信息 (PMI :Point Mutual Information , 下面的公式采用 IR 方法计算两个词的互信息:PMI (Word1, Word2=log2p (Word1&Word212&

29、quot;其中 p (word1&word2表示将 word1和 word2构成的二元词对使用搜索引擎从 Web 检索出现二元对的网页的数目, p (word 1 表示使用搜索引擎从 Web 检索出现 word1的网页的数目,p (word2表示使用搜索引擎从 Web 检索出现 word2的网页的 数目 。 最后分别将计算得到的 UWord 与 PWord 每个极性词汇 的互信息相加和 UWord 与 NWords 每个极性词汇的互信息相 加, 用前者减去后者, 结果为正表示 UWord 更靠近正性词汇, 为负表示 UWord 更靠近正性词汇 。 Turney 的方法只需少量的 了广泛

30、地应用 。伍 星, 何中市, 黄永文:产品评论挖掘研究综述 39Computer Engineering and Applications 计算机工程与应用2008, 44(36 PWords=good, nice , excellent , positive , fortunate , correct , superiorNWords=bad, nasty , poor , negative , unfortunate , wrong , inferior图 3Turney 的正 /负性词汇表Ana-Maria Popescu , Bao Nguyen , Oren EtzioniOPINE

31、Review SummaryQuality Room Staff friendliness Staff :beautiful Fullness :full图 4Popescu 的挖掘结果BatteryZoomSizeWeightpositive Digital Camera 2图 5Hu Mingqing 的挖掘结果2.5挖掘结果显示产品评论挖掘的目的是为生产厂商和用户的决策提供信 息的支持,因此必须将挖掘结果进行直观的展示 。 Popescu 和 Etzioni 采用列表方式对产品评论的挖掘结果按照产品的特征 进行显示 (如图 4 , 针对每一个产品特征列出肯定或否定的评 论, 用户可以进一

32、步查看肯定否定的源语句 21。 Liu Bing 采用 了图形化方式来显示挖掘结果, 不仅提供了按照产品特征的方 式查看用户评论 (如图 5 , 还提供了比较两个产品相同的产品 特征上得到的用户肯定 /否定评价的图形化比较 31。3产品评论挖掘的研究方向(1 自动获取产品特征的层次关系 。 自动获取产品特征的方法获得特征地位是等同的, 忽略了产品评论中特征之间的层 次关系 。 比如:手机的包含屏幕, 而屏幕又包含大小 、 颜色象素 、 材质等更细小的产品特征, 因此应提取产品特征的层次关系以 方便挖掘结果的显示 。(2 获取高质量的产品评论 。 Web 上的用户产品评论存在 大量的噪音, 有的

33、评论根本和产品无关, 还有很多的广告信息, 这会严重影响产品评论挖掘的质量 32, 因此应过滤产品评论, 以提高挖掘结果的准确率 。(3 拓展产品评论的来源 。 产品评论目前的挖掘数据还主 要针对是一些商业网站上的用户评论, 而用户的产品评论不仅 仅发表在一些专门的评论网站, 博客同样是产品评论的重要 来源 33。4总结本文首先从概念上对产品评论挖掘进行了界定, 并对其与。 挖掘的系统框架,指出了产品评论挖掘包括产品特征提取 、 主观句定位 、 用户态度提取 、 态度极性判定 、 挖掘结果 5个子任 务, 对每个子任务的现有解决方法进行了详细介绍, 并对该研 究领域的原型系统进行了对比, 经过

34、深入地思考发现了该研究 领域新的研究方向 。 产品评论挖掘的深入研究将在战略决策 、 情报分析 、 企业规划等领域发挥积极的作用 。产品评论挖掘技术是一个新兴的 、 富有挑战性的前沿性研 究领域, 受数据挖掘 、 信息检索 、 信息抽取 、 搜索引擎 、 文本分类 等多个学科领域的影响, 作为文本挖掘的典型代表必将对其产 生巨大的推动作用 。 有关这方面的研究在国外还刚刚起步, 而 国内这方面的研究还非常少, 有许多新的理论 、 方法和应用还 需要去探索和发现 。参考文献:1Morinaga S , Yamanishi K , Tateishi K , et al.Mining product

35、 reputationson the WebC/Proceedingsof the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , Edmonton , Alberta , Canada , 2002.2Hu Nan , Liu Ling , Zhang J.Analyst forecast revision and market salesdiscovery of online word of mouth C/Proceedingsof the 40th Hawaii Inter

36、national Conference on System Sciences , Waikoloa , Big Island ,HI , USA , 2007. 3Li Zhuang , Feng Jing , Zhu Xiao-yan.Movie review mining and summa -rizationC/Proceedingsof the 2006ACM CIKM International Con -ference on Information and Knowledge Management , Arlington , Vir -ginia , USA , 2006.4Kob

37、ayashi N , Inui K , Matsumoto Y.Collecting evaluative expressionsfor opinion extractionC/IJCNLP, Hainan , China , 2004.5姚天 昉 , 聂青阳, 李建超 . 一个用于汉语汽车评论的意见挖掘系统 C/中国中文信息学会成立二十五周年学术年会, 北京, 中国, 2006. 6Kim S M , Hovy E.Determining the sentiment of opinionsC/The20th International Conference on Computational

38、Linguistics , Geneva , Switzerland , 2004.7Yi J , Nasukawa T , Bunescu R C , et al.Sentiment analyzer :Extractingsentiments about a given topic using natural language processing techniques C/The3rd IEEE International Conference on Data Mining ,2003. 8Hu Mingqing , Liu Bing.Mining and summarizing cus

39、tomer reviewsC/Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining ,Seattle , WA , 2004. 9Popescu A M , Etzioni O.Extracting product features and opinionsfrom reviewsC/HumanLanguage Technology Conference and Con-ference on Empirical Methods in Natural La

40、nguage Processing , Vancouver , Canada , 2005.10Kim S M , Hovy E.Identifying and analyzing judgment opinionsC/Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics , Proceed -ings , New York , USA , 2006.11Bethard S , Yu Hong , Thornton A

41、, et al.Extracting opinion proposi -tions and opinion holders using syntactic and lexical cues J.Computing Attitude and Affect in Text :Theory and Applications , 2006, 20:125-141.12Wiebe J , Bruce R F , O Hara T P.Development and use of a golddata for Annual Meeting of the Association for Computatio

42、nal Linguistics , Mary -402008, 44(36 12Ephraim Y , Malah D.Speech enhancement using a minimum meansquare error short time spectral amplitude estimatorJ.IEEETrans on Acoustics ,Speech , Signal Processing , 1984, 32(6 :1109-1121. 13Chang J H , Kim N S.Voice activity detection based on complexLaplacia

43、n modelJ.ElectronicsLetters ,2003, 39(7 :632-63414Almpanidis G , Kotropoulos C.Voice activity detection based ongeneralized gamma distributionC/Proceedingsof ICME , 2006:961-964.15Chang J H , Kim N S , Mitra S K.Voice activity detection based onmultiple statistical modelsJ.IEEETrans on Signal Proces

44、sing , 2006, 54(6 :1965-1976.16Sohn J , Kim N S , Sung W.A statistical model-based voice activitydetectionJ.IEEESignal Processing Letters , 1999, 16(1 :1-3. 17Cho Y D , Al-Naimi K , Kondoz A.Improved voice activity detectionbased on a smoothed statistical likelihood ratioC/ProceedingsofICASSP , 2001

45、:737-740.18Ramirez J , Segura J C , Benitez C.Statistical voice activity detectionusing a multiple observation likelihood ratio testJ.IEEESignal Processing Letters , 2005, 12(10 :689-692.19Ramirez J ,Segura J C , Gorriz J M , et al.Improved voice activity detection using contextual multiple hypothes

46、is testing for robust speech recognitionJ.IEEETrans on Audio , Speech and Language Processing , 2007, 15(8 :2177-2189.20Jong Won Shin , Hyuk Jin Kwon , Suk Ho Jin , et al.Voice activitydetection based on conditional MAP criterionJ.IEEESignal Pro -cessing Letters , 2008, 15:257-260.21Varga A , Steene

47、ken H J M.Assessment for automatic speech recog -nition :II.NOISEX-92:A database and an experiment to study the effect of additive noise on speech recognition systems J.SpeechCommunication , 1993, 12(3 :247-251.(上接 36页 land , USA , 1999.13Wilson T , Wiebe J.Annotating opinions in the world pressC/4t

48、hSIGdial Workshop on Discourse and Dialogue , Sapporo , Japan , 2003.14Wiebe J.Learning subjective adjectives from corporaC/Proceedingsof the Seventeenth National Conference on Artificial Intelligence and Twelfth Conference on Innovative Applications of Artificial Intelligence ,Texas , USA , 2000. 1

49、5Yu Hong , Hatzivassiloglou V.Towards answering opinion questions :Separating facts from opinions and identifying the polarity of opi-nion sentencesC/Proceedingsof the 2003Conference on Emprical Methods in Natural Language Processing ,Sapporo , Japan , 2003. 16Riloff E , Wiebe J.Learning extraction

50、patterns for subjective ex -pressionsC/Proceedingsof the 2003Conference on Empirical Methods in Natural Language Processing , Sapporo , Japan , 2003. 17Riloff E , Wiebe J , Wilson T.Learning subjective nouns using ex -traction pattern bootstrappingC/Proceedingsof the Seventh Con -ference on Natural

51、Language Learning , Edmonton , Canada , 2003. 18Kobayashi N , Iida R , Inui K , et al.Opinion mining as extraction ofattribute -value relations C /THe 19th Annual Conference of JSAI , Japan , 2005.19Hu Mingqing , Liu Bing.Mining opinion features in customer re -viewsC/Proceedingsof Nineteeth Nationa

52、l Conference on Arti -ficial Intellgience , San Jose , USA , 2004.20Kim S M ,Hovy E.Automatic detection of opinion bearing words and sentencesC/CompanionVolume to the Proceedings of the Second International Joint Conference on Natural Language Pro -cessing (IJCNLP-05 , Jeju Island , Republic of Kore

53、a , 2005. 21Popescu A M , Nguyen B , Etzioni O.OPINE :Extracting productfeatures and opinions from reviewsC/HumanLanguage Technol -ogy Conference and Conference on Empirical Methods in Natu -ral Language Processing , British Columbia , Canada , 2005. 22Pang Bo , Lee Lillian , Vaithyanathan S.Thumbs

54、up?sentiment classi-fication using machine learning techniques CoRR cs.CL/0205070, 2002.23Turney P D.Thumbs up or thumbs down?Semantic orientationapplied to unsupervised classification of reviews C/Proceedingsof the 40th Annual Meeting of the Association for Computational Linguistics , Philadelphia , PA , USA , 2002.24Ku Lun-wei ,Liang Yu-ting ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论