云计算与大数据工程技术研发中心汇报课件_第1页
云计算与大数据工程技术研发中心汇报课件_第2页
云计算与大数据工程技术研发中心汇报课件_第3页
云计算与大数据工程技术研发中心汇报课件_第4页
云计算与大数据工程技术研发中心汇报课件_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

HeilongjiangInstituteofTechnologyKongLeilei1抄袭检测HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei2“[Iam]translatingtheblackandwhiteimpressionsintoanotherlanguage–thatofcolour”HeilongjiangInstituteofTech黑龙江工程学院在抄袭检测中的研究进展

报告人:孔蕾蕾黑龙江工程学院在抄袭检测中的研究进展

报告人简介黑龙江工程学院计算机科学与技术学院信息管理与信息系统系副主任黑龙江工程学院云计算与大数据工程技术中心成员哈尔滨工程大学信息与通信工程专业在读博士报告人简介黑龙江工程学院计算机科学与技术学院信息管理与信息系5黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来的工作报告内容5黑龙江工程学院云计算与大数据工程技术中心简介报告内容6黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来的工作报告内容6黑龙江工程学院云计算与大数据工程技术中心简介报告内容工程技术中心简介2012年成立,学校投入150万元进行了环境改造、设备更新其前身是2007年成立的校自然语言处理实验室主要研究人员齐浩亮,教授,博士,中心主任韩中元,副教授,在读博士,软件工程系副主任安波,副教授,计算机科学与技术系主任王亚东,副教授,物联网系(筹)主任李军,副教授,软件工程系主任孔蕾蕾,讲师,在读博士,信息管理与信息系统系副主任工程技术中心简介2012年成立,学校投入150万元进行了环境研究方向信息检索信息过滤抄袭检测云计算大数据处理研究方向信息检索信息过滤抄袭检测中心主任简介齐浩亮,1972年2月生,博士,教授校自然语言处理实验室主任、计算机应用技术研究所所长中国中文信息学会,理事中国中文信息学会国际专委会,委员中国中文信息学会社会媒体处理专委会,委员YOCSEF(中国计算机学会青年论坛)哈尔滨2009、2010、2011,副主席黑龙江省首届教学新秀2008年获“黑龙江省杰出(优秀)青年科技创新奖”近期通过了龙江学者初评中心主任简介齐浩亮,1972年2月生,博士,教授承担的国家自然科学基金项目项目类型项目名称主持国家自然科学基金面上项目基于双语文档反馈的跨语言信息检索研究国家自然科学基金国际合作项目亚洲语言处理国际会议2010参与国家自然科学基金青年项目面向垃圾邮件过滤的优化目标、建模及顺序回归研究国家自然科学基金面上项目基于用户反馈的多策略翻译在线融合研究国家自然科学基金重点项目下一代信息检索研究承担的国家自然科学基金项目项目类型项目名称主持国家自然科学基主要评测成绩评测名称任务名称评测成绩说明TREC2012微博检索微博过滤第一哈工大是参赛队,中心主任齐浩亮教授作为指导教师参与了该项目,中心的韩中元老师作为哈工大的在读博士生参与了该项目CLEF2012/2013抄袭检测第一2012详细比对任务/2013高模糊抄袭、翻译抄袭SEWM2012/2011/2009/2008垃圾邮件过滤第一CEAS08垃圾邮件过滤主动学习第一微软主办主要评测成绩评测名称任务名称评测成绩说明TREC2012微12黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来的工作报告内容12黑龙江工程学院云计算与大数据工程技术中心简介报告内容13黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来工作报告内容13黑龙江工程学院云计算与大数据工程技术中心简介报告内容HeilongjiangInstituteofTechnologyKongLeilei14国内外研究现状抄袭的一般模式HeilongjiangInstituteofTech2012-10-9HeilongjiangInstituteofTechnologyKongLeilei15国内外研究现状抄袭检测:术语抄袭,一般理解为将他人作品的全部或部分,以或多或少改变形式或内容的方式,当作自己的作品发表[1]。剽窃,主要指将他人的语言文字或研究观点当作自己的成果而不加引用的公开发表[2]。抄袭检测,定义s=(splg,dplg,ssrc,dsrc),其中,splg为文档dplg中的一段,splg抄袭了文档dsrc中的某个段ssrc。定义r=(rplg,dplg,rsrc,d′src),如果splg∩rplg≠Φ,ssrc∩rsrc≠Φ,dsrc∩d′src≠Φ,则称r检测出了s,这个过程称为抄袭检测[2]。[1]世界知识产权组织,《版权和邻接权法律术语词汇》,1980.[2]MartinPotthast,AndreasEiselt,AlbertoBarrónCedeño,BennoStein1,andPaoloRosso2.Overviewofthe3rdInternationalCompetitiononPlagiarismDetection.OverviewforPANatCLEF2011.2012-10-9HeilongjiangInstitutHeilongjiangInstituteofTechnologyKongLeilei16国内外研究现状目前,文本抄袭检测的研究主要分为两类:内部抄袭检测外部抄袭检测HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei17内部抄袭检测给定一篇文章,在不借助任何外界参考资料的情况下(假设参考资料集合不能预先获得或不能自由获取),判定该文章是否抄袭、剽窃或复制于一篇或多篇文章的内容。写作风格模型、异常值检测算法等为主流方法。国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei18外部抄袭检测外部抄袭检测假定存在一个封闭的参考资料集合,在此前提下,给定一篇待检测文本,从参考文档集合中检索与待检测文本相似度超过一定阈值的文本。国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei19抄袭的分类:简单抄袭和高模糊度的抄袭[3]简单抄袭:原文复制、近似复制、修改复制。高模糊度的抄袭:意译抄袭、总结抄袭、翻译抄袭、观点抄袭。国内外研究现状[3]SalhaM.Alzahrani,NaomieSalim,AjithAbraham.UnderstandingPlagiarismLinguisticPatterns,TextualFeatures,andDetectionMethods.IEEETRANSACTIONSONSYSTEMS,MAN,ANDCYBERNETICS—PARTC:APPLICATIONSANDREVIEWS,VOL.42,NO.2,MARCH2012.HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei20简单抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei21意译(paraphrasing)抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei22总结抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei23翻译抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei24学术论文的观点(idea)抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei25抄袭检测常用的文本特征词汇特征句法特征语义特征结构特征国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei26PAN@CLEF抄袭检测评测CLEF(Cross-LanguageEvaluationForum):是在欧盟数字图书馆计划支持下举办的跨语言信息检索开放评测平台。CLEF于2000年开始举办,现已成为最著名的国际信息检索评测会议之一。PAN(Plagiarismdetection,Authoridentification,AuthorProfiling)致力于抄袭检测算法的评估2010年加入CLEF国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei27PAN近4年在抄袭检测方面的评测任务备选文档检索详细比对内部抄袭检测外部抄袭检测201020112012源检索文本对齐2013内部抄袭检测外部抄袭检测国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei28源检索

提交的查询数目需要下载的网页数目

精确率和召回率找到第一个抄袭源时提交的查询的数目找到第一个抄袭源时下载的网页的数目抄袭源在检索结果中的排序文本对齐召回率精确率granplagdetPAN@CLEF抄袭检测评估方法HeilongjiangInstituteofTech29黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来工作报告内容29黑龙江工程学院云计算与大数据工程技术中心简介报告内容HeilongjiangInstituteofTechnologyKongLeilei30PAN@CLEF2012详细比对子任务第一名PAN@CLEF2013文本对齐高模糊抄袭检测第一名文本对齐翻译抄袭检测第一名源检索任务:召回率及找到第一个抄袭源时提交的查询的数目两个指标上第一名中心在PAN@CLEF[4]http://pan.webis.deHeilongjiangInstituteofTech31黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来工作报告内容31黑龙江工程学院云计算与大数据工程技术中心简介报告内容HeilongjiangInstituteofTechnologyKongLeilei32源检索备选文档集可详疑细片信段息文档集合待检测文档海量网络资源系统处理过程框架文本对齐HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei33源检索备选文档集可详疑细片信段息文档集合待检测文档海量网络资源系统处理过程框架文本对齐HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei34在源检索中多种可疑文档查询关键词提取方法查询关键词的排序备选文档的筛选系统处理过程框架HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei35源检索备选文档集可详疑细片信段息文档集合待检测文档海量网络资源系统处理过程框架文本对齐HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei36在文本对齐中:匹配与合并匹配预处理合并系统处理过程框架HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei37匹配预处理合并双向交替合并算法(BilateralAlternatingMergingArithmetic)基于图的最大联通路径系统处理过程框架在文本对齐中:匹配与合并HeilongjiangInstituteofTech38黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来的工作报告内容38黑龙江工程学院云计算与大数据工程技术中心简介报告内容HeilongjiangInstituteofTechnologyKongLeilei39“鹰眼抄袭检测系统”在PAN@CLEF2012子任务:备选文档检索[4][4]http://pan.webis.deHeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei40子任务:详细比对[4][4]http://pan.webis.de“鹰眼抄袭检测系统”在PAN@CLEF2012HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei41子任务:文本对齐高模糊抄袭的检测[4][4]http://pan.webis.de“鹰眼抄袭检测系统”在PAN@CLEF2013HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei42子任务:文本对齐翻译抄袭的检测[4][4]http://pan.webis.de“鹰眼抄袭检测系统”在PAN@CLEF2013HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei43子任务:源检索[4][4]http://pan.webis.de“鹰眼抄袭检测系统”在PAN@CLEF2013评测指标结果提交的查询数目48.5召回率0.65找到第一个抄袭源时提交的查询的数目2.46抄袭源在检索结果中的排序3HeilongjiangInstituteofTech44黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来的工作报告内容44黑龙江工程学院云计算与大数据工程技术中心简介报告内容HeilongjiangInstituteofTechnologyKongLeilei45基于多特征融合的抄袭检测文本对齐跨语言抄袭检测中文抄袭检测系统的研究与开发……未来的工作HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei46处于跨越式发展阶段的工程技术中心迫切渴望优秀人才加盟!提供不低于学校公开招聘的待遇(包括科项目配套费1:1、周转房、配偶工作、安家费、科研启动费、工作条件等)。期待您的加入HeilongjiangInstituteofTech凝练特色,一流成果协同创新,服务社会凝练特色,一流成果HeilongjiangInstituteofTechnologyKongLeilei48抄袭检测HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei49“[Iam]translatingtheblackandwhiteimpressionsintoanotherlanguage–thatofcolour”HeilongjiangInstituteofTech黑龙江工程学院在抄袭检测中的研究进展

报告人:孔蕾蕾黑龙江工程学院在抄袭检测中的研究进展

报告人简介黑龙江工程学院计算机科学与技术学院信息管理与信息系统系副主任黑龙江工程学院云计算与大数据工程技术中心成员哈尔滨工程大学信息与通信工程专业在读博士报告人简介黑龙江工程学院计算机科学与技术学院信息管理与信息系52黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来的工作报告内容5黑龙江工程学院云计算与大数据工程技术中心简介报告内容53黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来的工作报告内容6黑龙江工程学院云计算与大数据工程技术中心简介报告内容工程技术中心简介2012年成立,学校投入150万元进行了环境改造、设备更新其前身是2007年成立的校自然语言处理实验室主要研究人员齐浩亮,教授,博士,中心主任韩中元,副教授,在读博士,软件工程系副主任安波,副教授,计算机科学与技术系主任王亚东,副教授,物联网系(筹)主任李军,副教授,软件工程系主任孔蕾蕾,讲师,在读博士,信息管理与信息系统系副主任工程技术中心简介2012年成立,学校投入150万元进行了环境研究方向信息检索信息过滤抄袭检测云计算大数据处理研究方向信息检索信息过滤抄袭检测中心主任简介齐浩亮,1972年2月生,博士,教授校自然语言处理实验室主任、计算机应用技术研究所所长中国中文信息学会,理事中国中文信息学会国际专委会,委员中国中文信息学会社会媒体处理专委会,委员YOCSEF(中国计算机学会青年论坛)哈尔滨2009、2010、2011,副主席黑龙江省首届教学新秀2008年获“黑龙江省杰出(优秀)青年科技创新奖”近期通过了龙江学者初评中心主任简介齐浩亮,1972年2月生,博士,教授承担的国家自然科学基金项目项目类型项目名称主持国家自然科学基金面上项目基于双语文档反馈的跨语言信息检索研究国家自然科学基金国际合作项目亚洲语言处理国际会议2010参与国家自然科学基金青年项目面向垃圾邮件过滤的优化目标、建模及顺序回归研究国家自然科学基金面上项目基于用户反馈的多策略翻译在线融合研究国家自然科学基金重点项目下一代信息检索研究承担的国家自然科学基金项目项目类型项目名称主持国家自然科学基主要评测成绩评测名称任务名称评测成绩说明TREC2012微博检索微博过滤第一哈工大是参赛队,中心主任齐浩亮教授作为指导教师参与了该项目,中心的韩中元老师作为哈工大的在读博士生参与了该项目CLEF2012/2013抄袭检测第一2012详细比对任务/2013高模糊抄袭、翻译抄袭SEWM2012/2011/2009/2008垃圾邮件过滤第一CEAS08垃圾邮件过滤主动学习第一微软主办主要评测成绩评测名称任务名称评测成绩说明TREC2012微59黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来的工作报告内容12黑龙江工程学院云计算与大数据工程技术中心简介报告内容60黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来工作报告内容13黑龙江工程学院云计算与大数据工程技术中心简介报告内容HeilongjiangInstituteofTechnologyKongLeilei61国内外研究现状抄袭的一般模式HeilongjiangInstituteofTech2012-10-9HeilongjiangInstituteofTechnologyKongLeilei62国内外研究现状抄袭检测:术语抄袭,一般理解为将他人作品的全部或部分,以或多或少改变形式或内容的方式,当作自己的作品发表[1]。剽窃,主要指将他人的语言文字或研究观点当作自己的成果而不加引用的公开发表[2]。抄袭检测,定义s=(splg,dplg,ssrc,dsrc),其中,splg为文档dplg中的一段,splg抄袭了文档dsrc中的某个段ssrc。定义r=(rplg,dplg,rsrc,d′src),如果splg∩rplg≠Φ,ssrc∩rsrc≠Φ,dsrc∩d′src≠Φ,则称r检测出了s,这个过程称为抄袭检测[2]。[1]世界知识产权组织,《版权和邻接权法律术语词汇》,1980.[2]MartinPotthast,AndreasEiselt,AlbertoBarrónCedeño,BennoStein1,andPaoloRosso2.Overviewofthe3rdInternationalCompetitiononPlagiarismDetection.OverviewforPANatCLEF2011.2012-10-9HeilongjiangInstitutHeilongjiangInstituteofTechnologyKongLeilei63国内外研究现状目前,文本抄袭检测的研究主要分为两类:内部抄袭检测外部抄袭检测HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei64内部抄袭检测给定一篇文章,在不借助任何外界参考资料的情况下(假设参考资料集合不能预先获得或不能自由获取),判定该文章是否抄袭、剽窃或复制于一篇或多篇文章的内容。写作风格模型、异常值检测算法等为主流方法。国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei65外部抄袭检测外部抄袭检测假定存在一个封闭的参考资料集合,在此前提下,给定一篇待检测文本,从参考文档集合中检索与待检测文本相似度超过一定阈值的文本。国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei66抄袭的分类:简单抄袭和高模糊度的抄袭[3]简单抄袭:原文复制、近似复制、修改复制。高模糊度的抄袭:意译抄袭、总结抄袭、翻译抄袭、观点抄袭。国内外研究现状[3]SalhaM.Alzahrani,NaomieSalim,AjithAbraham.UnderstandingPlagiarismLinguisticPatterns,TextualFeatures,andDetectionMethods.IEEETRANSACTIONSONSYSTEMS,MAN,ANDCYBERNETICS—PARTC:APPLICATIONSANDREVIEWS,VOL.42,NO.2,MARCH2012.HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei67简单抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei68意译(paraphrasing)抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei69总结抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei70翻译抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei71学术论文的观点(idea)抄袭国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei72抄袭检测常用的文本特征词汇特征句法特征语义特征结构特征国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei73PAN@CLEF抄袭检测评测CLEF(Cross-LanguageEvaluationForum):是在欧盟数字图书馆计划支持下举办的跨语言信息检索开放评测平台。CLEF于2000年开始举办,现已成为最著名的国际信息检索评测会议之一。PAN(Plagiarismdetection,Authoridentification,AuthorProfiling)致力于抄袭检测算法的评估2010年加入CLEF国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei74PAN近4年在抄袭检测方面的评测任务备选文档检索详细比对内部抄袭检测外部抄袭检测201020112012源检索文本对齐2013内部抄袭检测外部抄袭检测国内外研究现状HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei75源检索

提交的查询数目需要下载的网页数目

精确率和召回率找到第一个抄袭源时提交的查询的数目找到第一个抄袭源时下载的网页的数目抄袭源在检索结果中的排序文本对齐召回率精确率granplagdetPAN@CLEF抄袭检测评估方法HeilongjiangInstituteofTech76黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来工作报告内容29黑龙江工程学院云计算与大数据工程技术中心简介报告内容HeilongjiangInstituteofTechnologyKongLeilei77PAN@CLEF2012详细比对子任务第一名PAN@CLEF2013文本对齐高模糊抄袭检测第一名文本对齐翻译抄袭检测第一名源检索任务:召回率及找到第一个抄袭源时提交的查询的数目两个指标上第一名中心在PAN@CLEF[4]http://pan.webis.deHeilongjiangInstituteofTech78黑龙江工程学院云计算与大数据工程技术中心简介中心在抄袭检测上的最新进展国内外研究现状中心在PAN@CLEF2012、2013上的成绩黑龙江工程学院“鹰眼抄袭检测系统”介绍“鹰眼抄袭检测系统”在PAN@CLEF2012、2013上的性能未来工作报告内容31黑龙江工程学院云计算与大数据工程技术中心简介报告内容HeilongjiangInstituteofTechnologyKongLeilei79源检索备选文档集可详疑细片信段息文档集合待检测文档海量网络资源系统处理过程框架文本对齐HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei80源检索备选文档集可详疑细片信段息文档集合待检测文档海量网络资源系统处理过程框架文本对齐HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei81在源检索中多种可疑文档查询关键词提取方法查询关键词的排序备选文档的筛选系统处理过程框架HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei82源检索备选文档集可详疑细片信段息文档集合待检测文档海量网络资源系统处理过程框架文本对齐HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei83在文本对齐中:匹配与合并匹配预处理合并系统处理过程框架HeilongjiangInstituteofTechHeilongjiangInstituteofTechnologyKongLeilei84匹配预处理合并双向交替合并算法(Bilat

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论