基于表情符号的文本情感分析研究_第1页
基于表情符号的文本情感分析研究_第2页
基于表情符号的文本情感分析研究_第3页
基于表情符号的文本情感分析研究_第4页
基于表情符号的文本情感分析研究_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

我们毕业啦其实是答辩的标题地方基于表情符号的文本情感分析研究1研究背景与目的研究方法研究结果问题讨论CONTANTS2研究背景与目的3

发表观点、评论大量情感信息互联网互联网交友app微博论坛网络信息情感分析互联网研究方法研究结果问题讨论

研究背景与目的5文本情感分析用自然语言处理、文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观信息。可用于公共卫生监测、健康相关干预效果评价等。如Du等学者在研究公众对HPV疫苗接种的接受度时,通过分析含有HPV疫苗关键词的相关文本,发现公众主要担忧疫苗安全性。情感极性分类正向情感:人对正向价值的增加或负向价值的减少所产生的情感,如愉快、信任、感激、庆幸等;负向情感:人对正向价值的减少或负向价值的增加所产生的情感,如痛苦、鄙视、仇恨、嫉妒等。研究方法研究结果问题讨论

研究背景与目的6情感极性分类:2.不小心把腿拉伤了痛死了。1.来到这边心情瞬间好了,还是这里空气适合我。3.今天开学了,很伤感…我很怀念我的爷爷奶奶!时光倒流到我儿时,别人上学都是父母接送,而接送我的只有爷爷奶奶…父母惟一能给我的就是钱…可是我更喜欢得到他们的“时光”…我很伤心,爷爷奶奶都那么老了,有一次爷爷开着“嘉陵”摩托载我上学,回来摔伤了…我很心痛…如今想好好孝敬他们,可是己不在了。正向负向负向研究方法研究结果问题讨论

研究背景与目的7机器学习-情感分析常用的方法测试集预测结果应用过程训练集机器学习模型预测训练过程人工阅读文本并标注情感方向(人工标注)研究方法研究结果问题讨论

研究背景与目的8机器学习大量的人工劳动机器学习-存在的问题耗时、昂贵大规模人工标注的训练样本研究方法研究结果问题讨论

研究背景与目的9整条文本表情符号9研究方法研究结果问题讨论

研究背景与目的研究目的提出一种将表情符号作为情感方向标签,不需人工阅读文本而仅根据表情符号的情感方向标注文本的方法;并将根据表情符号标注的文本作为训练集训练分类器,在人工标注的测试集上进行验证,评价此方法的实际应用价值。研究方法研究结果问题讨论

研究背景与目的11研究方法11研究背景与目的研究方法研究结果问题讨论时间:2013年6月-2016年6月地点:广东省软件:Blued范围:注册用户发表的帖子资料来源12来到这边心情瞬间好了,还是这里空气适合我来到这边心情瞬间好了,还是这里空气适合我[憨笑][憨笑]13不小心把腿拉伤了痛死了不小心把腿拉伤了痛死了[流泪][流泪][流泪][流泪]研究背景与目的研究方法研究结果问题讨论14构建表情符号库:eg:来到这边心情瞬间好了,还是这里空气适合我[憨笑]纯文本表情符号研究背景与目的研究方法研究结果问题讨论提取出帖子中含有的表情符号2名工作人员同时对这些表情符号归类为正向表情符号或负向表情符号,参考国外网站的表情符号归类,并结合中国网民实际使用情况对于同一表情符号两人分类不一致的情况A只含一个表情符号训练集情感方向确定规则:来到这边心情瞬间好了,还是这里空气适合我[憨笑]辞了工作,昨晚在球场又被偷了平板,耳机,1000多现金,notcool!!难过!!![怒][怒][泪][泪][嘻嘻][嘻嘻][嘻嘻]刚理完发[晕][晕][晕]正向负向不纳入研究背景与目的研究方法研究结果问题讨论含多个表情符号,情感方向一致B含多个表情符号,情感方向不一致C16特征加权05特征选择06训练分类器07逻辑回归支持向量机朴素贝叶斯模型融合去除表情符号01文本清洗02中文分词03去除停用词04训练模型:研究背景与目的研究方法研究结果问题讨论17爬取的文本随机抽样测试集人工标注表1分类情况混淆矩阵真实情况(人工标注)机器学习预测结果正向负向正向TPFN负向FPTN17研究背景与目的研究方法研究结果问题讨论研究结果18研究背景与目的研究方法研究结果问题讨论19表2选取的部分表情符号示例正向表情负向表情[大笑][哈哈][Joyful][泪][難過][泪奔][太開心][憨笑][Laugh][怒][不开心][愤怒][噢耶][坏笑][嘻嘻][衰][难过][傷心][微笑][可愛][给力][哭][悲伤][快哭了][愉快][Smile][親親][委屈][伤心][心碎][呲牙][胜利][偷乐][悲催][发怒][抓狂]表情符号情感标签:正向93个(53.45%)负向81个(46.55%)训练集:13万条,正向情感7.5万条(57.6%),负向情感5.5万条(42.4%)测试集:1.38万条,正向情感0.63万条(45.7%),负向情感0.75万条(54.3%)爬虫84.4万,带表情符号文本17.1万20表3各模型的准确率和F1值算法评价指标特征词数量10050010001500200030003745朴素贝叶斯准确率0.6000.6900.7170.7310.7350.7390.739F1值0.6700.7160.7330.7410.7450.7460.747

逻辑回归准确率0.5900.6740.7040.7190.7280.7320.731F1值0.6750.7160.7320.7390.7440.7470.746

支持向量机准确率0.5980.6800.7100.7170.7270.7290.730F1值0.6720.7070.7290.7350.7440.7440.746融合模型准确率0.5970.6880.7160.7290.7370.7410.742F1值0.6750.7210.7380.7450.7510.7530.755研究背景与目的研究方法研究结果问题讨论图1不同特征词数量下的各模型准确率和F1值折线图21研究背景与目的研究方法研究结果问题讨论问题讨论22问题讨论研究结果研究背景与目的研究方法23情感分析疾病监测、了解公众对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论