一种基于实体的邮件任务提取策略课件_第1页
一种基于实体的邮件任务提取策略课件_第2页
一种基于实体的邮件任务提取策略课件_第3页
一种基于实体的邮件任务提取策略课件_第4页
一种基于实体的邮件任务提取策略课件_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

TEXEM:一种基于实体的邮件任务提取策略张相於,陈继东,李玉坤,孟小峰中国人民大学WAMDM实验室2019EMC中国实验室1谢谢你的阅读2019-10-20TEXEM:一种基于实体的邮件任务提取策略张相於,陈继东,李演示纲要研究动机相关工作处理流程事件提取基于事件聚类的任务构造任务空间向量实验评估总结&未来工作2谢谢你的阅读2019-10-20演示纲要研究动机2谢谢你的阅读2019-10-20演示纲要研究动机相关工作处理流程事件提取基于事件聚类的任务构造任务空间向量实验评估总结&未来工作3谢谢你的阅读2019-10-20演示纲要研究动机3谢谢你的阅读2019-10-20研究动机(1)电子邮件数据量剧增IDC:5Exabyte商业邮件(1Exabyte=1billionGigabyte),2007四月。电子邮件作用越来越丰富任务管理,协作管理,存档管理,联系人管理……人们处理邮件的时间十分有限现有工具不能满足需求Outlook,Gmail……人们仍需要手工管理邮件中的任务。4谢谢你的阅读2019-10-20研究动机(1)电子邮件数据量剧增4谢谢你的阅读2019-10研究动机(2)dearbhaiyaiwasmakingalistofallmycontactaddressesinUSA.coulduplssendurcompleteaddress&ph/mobile.iamscheduledtocometoUSon25th.regardsgautam5三个事件:Makingalist.Sendyouraddress&numberScheduledtocometoUSon25th谢谢你的阅读2019-10-20研究动机(2)dearbhaiya5三个事件:谢谢你的阅读研究动机(3)我们提出一种基于实体的邮件任务提取框架——TEXEM。充分考虑电子邮件中的结构信息。从邮件中提取属于不同实体的任务。对任务进行重要性评估。提高用户邮件管理的效率。6谢谢你的阅读2019-10-20研究动机(3)我们提出一种基于实体的邮件任务提取框架——TE演示纲要研究动机相关工作处理流程事件提取基于事件聚类的任务构造任务空间向量实验评估总结&未来工作7谢谢你的阅读2019-10-20演示纲要研究动机7谢谢你的阅读2019-10-20相关工作(1)Gmail,Hotmail可以提取形式较为规范的事件信息。8谢谢你的阅读2019-10-20相关工作(1)Gmail,Hotmail8谢谢你的阅读201相关工作(2)<IdentifyingandUnderstandingDatesandTimesinEmail><InformationExtractionofSeminarInformation><AutomatedEmailIntegrationwithPersonalInformationManagementApplications><Takingemailtotask:thedesignandevaluationofataskmanagementcenteredemailtool>9谢谢你的阅读2019-10-20相关工作(2)<IdentifyingandUnders演示纲要研究动机相关工作处理流程事件提取基于事件聚类的任务构造任务空间向量实验评估总结&未来工作10谢谢你的阅读2019-10-20演示纲要研究动机10谢谢你的阅读2019-10-20处理流程事件提取任务构造重要性评估11谢谢你的阅读2019-10-20处理流程事件提取任务构造重要性评估11谢谢你的阅读2019-演示纲要研究动机相关工作处理流程事件提取基于事件聚类的任务构造任务空间向量实验评估总结&未来工作12谢谢你的阅读2019-10-20演示纲要研究动机12谢谢你的阅读2019-10-20事件提取(1)每句话都可能包含一个事件。一个事件具有如下结构: Event={O,V,T,L,P,D} O:事件所有者 V:事件中的动词集合 T:事件发生的时间 L:事件发生的地点 P:事件涉及的人的集合 D:事件中的其他关键字13谢谢你的阅读2019-10-20事件提取(1)每句话都可能包含一个事件。13谢谢你的阅读20事件提取(2)电子邮件词性标注标识实意动词标识人名标识地名标识时间事件集合14谢谢你的阅读2019-10-20事件提取(2)电子邮件词性标注标识实意动词标识人名标识地名标事件提取(3)事件合并将不含有实意动词的句子与离它最近的事件合并:Heisbusytomorrowforthemeeting.事件分解如果句子含有and或but等连词,并且连接的是分句而不是短语或词。15谢谢你的阅读2019-10-20事件提取(3)事件合并15谢谢你的阅读2019-10-20演示纲要研究动机相关工作处理流程事件提取基于事件聚类的任务构造任务空间向量实验评估总结&未来工作16谢谢你的阅读2019-10-20演示纲要研究动机16谢谢你的阅读2019-10-20基于事件聚类的任务构造(1)实体识别I,We,You。第三人称实体。基于实体的事件聚类将属于某个实体的事件进行聚类。17谢谢你的阅读2019-10-20基于事件聚类的任务构造(1)实体识别17谢谢你的阅读2019基于事件聚类的任务构造(2)实体识别识别出I,we和you。识别出第三人称的名字:人名,组织名。识别出第三人称代词指代的实体:在该代词前面,并且离它最近的对应实体。Mikeiscomingtomorrow,andhewillbringsomebeers.18谢谢你的阅读2019-10-20基于事件聚类的任务构造(2)实体识别18谢谢你的阅读2019基于事件聚类的任务构造(3)基于实体的事件聚类基于事件构造阶段提取出来的事件所有者,进行事件聚类。属于同一实体的事件被聚类到一起。所有者为代词的按照上述方法识别所有者。无法识别的事件聚到一起。19谢谢你的阅读2019-10-20基于事件聚类的任务构造(3)基于实体的事件聚类19谢谢你的阅基于事件聚类的任务构造(2)20谢谢你的阅读2019-10-20基于事件聚类的任务构造(2)20谢谢你的阅读2019-10-演示纲要研究动机相关工作处理流程事件提取基于事件聚类的任务构造任务空间向量实验评估总结&未来工作21谢谢你的阅读2019-10-20演示纲要研究动机21谢谢你的阅读2019-10-20任务空间向量(1)每个人任务中的事件具有不同的重要性。基于TF-IDF对任务中的事件进行排序:Score(e)=Mean(weight(termine))Weight(term)=factor*(TF(term)*log(N/DF(term)))22谢谢你的阅读2019-10-20任务空间向量(1)每个人任务中的事件具有不同的重要性。22谢任务空间向量(2)23谢谢你的阅读2019-10-20任务空间向量(2)23谢谢你的阅读2019-10-20演示纲要研究动机相关工作处理流程事件提取基于事件聚类的任务构造任务空间向量实验评估总结&未来工作24谢谢你的阅读2019-10-20演示纲要研究动机24谢谢你的阅读2019-10-20实验评估(1)实验环境实验平台:Java数据集:Enron邮件数据集,1.2GB,150个用户的500000封邮件。词性标注:PoSTagger。实体标注:ANNIE。25谢谢你的阅读2019-10-20实验评估(1)实验环境25谢谢你的阅读2019-10-20实验评估(2)Enron邮件数据集在安然公司出事后为调查案件被向公共开放。被MIT的研究者加工整理形成。已知的最大的真实邮件数据集。26谢谢你的阅读2019-10-20实验评估(2)Enron邮件数据集26谢谢你的阅读2019-实验评估(3)27谢谢你的阅读2019-10-20实验评估(3)27谢谢你的阅读2019-10-20实验评估(4)28谢谢你的阅读2019-10-20实验评估(4)28谢谢你的阅读2019-10-20实验评估(5)以人工对邮件进行处理的结果为基准值,对我们的方法从三个方面进行评估:任务提取召回率:能够提取出多少任务。任务评估准确率:事件排序的准确率。实体识别准确率:能正确识别多少实体。29任务提取召回率73.27%任务评估准确率54.49%实体识别准确率66.48%谢谢你的阅读2019-10-20实验评估(5)以人工对邮件进行处理的结果为基准值,对我们的方演示纲要研究动机相关工作处理流程事件提取基于事件聚类的任务构造任务空间向量实验评估总结&未来工作30谢谢你的阅读2019-10-20演示纲要研究动机30谢谢你的阅读2019-10-20总结&未来工作总结提出了一种基于实体的邮件任务提取框架。对任务进行了重要性评估。提高用户邮件处理的效率。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论