2012美赛论文翻译_第1页
2012美赛论文翻译_第2页
2012美赛论文翻译_第3页
2012美赛论文翻译_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、逮捕罪犯模型你的组织,ICM正在对一项密谋的犯罪行动进行调查。调查人员非常清楚一 些参与密谋的人,希望能够确定其他成员和他们的领导之后进行逮捕。罪犯和犯 罪嫌疑人都在一家大的公司的一个综合办公室里工作。这家公司成长很快并以自 己的名字命名在研发一种软件并面向银行和信用卡公司销售。ICM最近发现了这个公司82名员工一小部分的信息,相信可以帮助他们找到最有可能的未知合伙人 和领导。因为信息业务是面向所有的员工,因此很有可能一些(可能一大部分) 指定的沟通员并不涉及此次的密谋。实际上,调查人员很清楚有一部分的人并不涉及此案。建模的目标就是确定这个综合办公室里谁最有可能是罪犯。列一个有先后次序的列表有

2、助于ICM实施监督,并进一步审问。明确的划分共犯和非共犯 也能帮助区分每组的人员。当然如果指出密谋的领导者对D/公司也会有帮助。在给出这次案件数据之前,你的主管给了你一份她几年前在别的城市工作的 这种情况的方案(调查EZ)。尽管她对自己调查EZ勺案子很满意,但她说那只是 个小的简单的例子,并会对你理解你的任务有所帮助。她给的数据如下:她认为有十个人是共犯:Anne#, Bob, Carol, Dave*, Elie n, Fred,George*, Harry, I nez, and Jaye#.(*表示这其中共犯可能性大的,#表示非共犯可能性大的)。28个信息的年表她基于自己的分析都做了相应

3、的标号:文档收集自网络,仅用于个人学习Anne to Bob:你今天为什么迟到? ( 1) Bob to Carol:那个死Anne总是监督我。我没迟到(1) Carol to Dave:Anne 和Bob又在争论着Bob的磨叽。(1) Dave to Elle n:我今天早上要见你。你什么时候来?把预算文档带来。(2)Dave to Fred:我今天什么时候都能去见你。告诉我什么时候合适。我需要带预 算文档么? ( 2)Dave to George:我待会儿去见你要谈好多事情。我希望其他人的也准备好了。把这些弄好了很重要。(3) Harry to George:你压力太大了。到底怎么了 ?我

4、们的预算会没问题的。(2) (4) Inez to George:我今天特累。你过得怎么样? ( 5) I也很累Jaye to Inez:没什 么进展。想去吃午餐么? ( 5)Inez to Jaye:幸好很安静。我很累。今天不去吃午饭了,对不起! (5)George to Dave:该谈谈了现在! ( 3) Jaye to Anne:你今天去吃午饭么?(5)Dave to George:不行。我在正要去见Fred的路上呢。(3) George to Dave:去完那儿到这儿来。(3)Anne to Carol:谁该监督Bob?他总是游手好闲。(1)Carol to Anne: 别管他。他和G

5、eorge and Dave 一起工作的很好。(1)George to Dave:这很重要。该死的Fred。Ellen那边怎么样了?( 3)没准可以 推出 E是Ellen to George: 你跟 Dave谈了么? ( 3)George to Ellen: 还没呢。你呢?( 3)Bob to Anne:我没迟到。就像你知道的我午饭时间都在干活。(1)Bob to Dave:告诉他们我没迟到。你了解我的。(1)只有D了解BElie n to Carol:找Anne并确定好下周预算会议的程序,还要帮我把George冷静下来。(2)Harry to Dave:你没发现今天George又压力特大么?

6、 ( 4)Daveto George:死Harry认为你压力太大了。别让他担心否则他又该絮叨了。( 4) George to Harry:就是总是加班再加上家里出了些问题。我会没事的。( 4) H 不是Elie n to Harry: 如果我错过了今天的会,有事么? Fred会在的而且他比我 更了解预算。(2)Harry to Fred:我认为明年的预算对许多人都施加了压力。也许我们今天需要花点时间给他们减减压了。( 2)( 4)Fred to Harry:我认为我们的预算很健康。我看不到任何有压力的东西。(2)信息量结束。文档收集自网络,仅用于个人学习你的主管指出她只破解信息中五个不同的主题

7、:1)Bob很磨叽,2)预算,3)重要的位置问题但是假设是密谋的一部分,4)George的压力,5)午饭和其他的社会问题。在信息的编码中可以看到,有些信息根据内容有两个主题。你主管分析她的情况时用的是一个显示沟通联系和信息种类的网络的方法。 下面的图表是一个信息网络的模型以及结果中的信息种类的编码都标注在网络 图里。文档收集自网络,仅用于个人学习(1)(1/ (1)(1F George你的主管指出已知的共犯 George and Dave,和Elien and Carol是通过分析 得出的,以及后来Bob自己为了减刑承认犯罪了,但是对于Carol的指控后来撤消 了。你的主管也十分确定Inez也

8、涉及此案,但是始终无法对她立案。你的主观的 建议是你们组一定要明确犯罪双方这样像Inez人就不会逃跑了,也不会有人像 Carol 一样被误判,同时ICM需要有信誉这样就不会有人像Bob-样有机会减刑。文档收集自网络,仅用于个人学习你的主管为当前的案例整理了一个网络式的数据库,以同样的格式,但是范围更大些。调查人员提示说这个密谋是有关挪用公司基金以及用互联网诈骗盗取 那些与公司有业务往来的那些人的信用卡的钱。主管给你看的EZ小例子只有10个人(节点),27条线(信息),5个话题,1个密谋话题,2个已知共犯和2个已 知的非共犯。到目前为止,新的情况(case)有83个节点,400连接(其中一些涉及

9、超过 1个主题),消息流量已超过21000字, 15个主题(其中3个已被视为是可疑的), 7个已知的同谋者,和8个已知的非同谋。这些数据在所附的电子表格文件中: names.xls , Topics.xls , Messages.xls 。names.xls 包含关键节点序号的 办公室人员名字。topics.xls包含15个主题号码的代码,也就是一个主题的简短 说明。由于安全和隐私问题,你的小组不会有直接传达的所有信息流量。messages.xls提供传播消息的链接节点(links of the nodes )和消息中包 含的主题代码。文档收集自网络,仅用于个人学习几个消息包含了三个话题。为了

10、帮忙显现(visualize可视化)消息流量, 图2提供了人和消息链接(the people and message links )的网络模型。在这 种情况下,这些消息的话题没有被表示出来因为在图1中表示了。这些话题的编号在文件Messages.xls中给出了,而且在文件Topics.xls 中描述了。文档收集自网络, 仅用于个人学习Beth$ElsieDwightStephanie*PriscillaAs尹;. Crystal Jerome存Francis 严niChr|t GerryDayi Loujs工arlerJ1an-已湎塚尿,Ellrn加Marian.f X,2 UDonaldSh

11、elley 心J /Neal戸加Faut Christina “ fti JjretcTnDougiiiKristineJuhaSandy p垃豎工 .冲肿Zm atrick SeeniarenFantiCole AndrqparkDarol5一广尸MaiC017 o o*Lars. cLaoBariol p GannaCh. J 伽uanSheng要求1:到目前为止,已经知道 Jean, Alex, Elsie, Paul, Ulf, Yao,和Harvey是同谋。也知道,Darle ne, Tran, Jia, Elli n, Gard, Chris, Paige,和 Este 不是同谋。

12、三个有嫌疑的消息主题(suspicious messagetopics )是7、11和13.更 多关于消息主题的细节在文件Topics.xls中。按照属于同谋的可能性大小建立模 型和算法,把83个节点(人)区分优先次序,并解释你的模型和指标。Jerome,Delores,和Gretchen是公司的高级管理人员。如果了解到他们其中任何一个人 涉及到阴谋,将是非常有益的。文档收集自网络,仅用于个人学习要求2:如果有新信息确定了 topic 1与犯罪相关,而且 Chris是其中一个同谋者,那 么这个优先清单会怎样变化? 文档收集自网络,仅用于个人学习要求3:获得和理解与这个消息流量(message

13、traffic )类似的文本信息的一个强 大的技术叫做语义网络分析;作为一个在人工智能和计算语言学的方法,它提供了有关的知识(消息)或语言推理的结构和步骤。另一种在自然语言处理过程中 的计算语言学能力是 文本分析。就我们的罪犯逮捕方案来讲,解释清楚对消息流 量的内容和背景的语义分析和文本分析(如果你能获得原始信息)怎样才能使你 的团队来开发更好的模型并进行办公室人员的分类。你对文件Topics.xls中的对话主题描述,是否用了这些capabilities(语义网络分析、文本分析)来提高你的模型了么?文档收集自网络,仅用于个人学习要求4:您的完整报告将最终送到DA,所以它必须详细而清楚地说明你的

14、假设和方 法,但不能超过20页。你可以以单独的文件形式在附件中提交你的程序,而这是不计算在你的页面限制内的,但提交这些程序并不是必需的。你的supervisor希望ICM成为世界上最好的解决白领阶层高科技犯罪的组织,希望你们的方法有 助于解决世界各地的重要案件,尤其是那些消息流量(message traffic )数据非常庞大的案件(成千上万的人与数以万计的消息,并可能包括以百万计的单词量)。她特别要求你的报告要包括“更深入的进行消息内容的网络、语义和文本 分析怎样对你的模型和建议有帮助”这一讨论。作为给她报告的一部分,解释 你已经使用的网络模型技术以及他们为什么以及怎样能够在任何类型的网络数 据库中被用来识别(确定)、区分优先次序和分类类似的节点,而不只是限于有 关犯罪阴谋和消息数据。例如,当你有表明感染机率的节点并已确定了一些感 染节点的各种图像或化学数据时,你的方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论