学术不端检测系统说明_第1页
学术不端检测系统说明_第2页
学术不端检测系统说明_第3页
学术不端检测系统说明_第4页
学术不端检测系统说明_第5页
免费预览已结束,剩余26页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学术不端文献检测系统研制介绍与使用方法第一章系统简介1.1系统概述学术不端文献检测系统 (简称“AMLC )以中国学术文献网络出版总库 为全文比对数据库, 实现了对抄袭与剽窃、伪造、篡改等学术不端行为的快速检测,可供用户检测学位论文,并支持用 户自建比对库。其系统示意图如图1所示。务0比对资源库图1检测系统示意图1.2系统技术路线介绍AMLC采用CNKI自主研发的自适应多阶指纹 (AML FP)特征检测技术,具有检测速度快, 准确率,召回率较高,抗干扰性强等特征。支持篇章、段落、句子各层级检测; 支持文献改写,多篇文献组合等各种文献变形检测; 支持论文、图书专著等超长文献的学术不端检测。CNK

2、I自适应多阶指纹技术原理如图 2所示:侧文裆XXXYYY-CCC-DDDD-KKK-FFFF图2 CNKI自适应多阶指纹技术原理图对任意一篇需要检测的文献,系统首先对其进行分层处理,按照篇章、段落、句子等层级分别 创建指纹,而比对资源库中的比对文献, 也采取同样技术创建指纹索引。 这样的分层多阶指纹结构, 不仅可以满足我们对超长文献的快速检测,而且,因为我们的最小指纹粒度为句子,因此,也满足 了系统对检准率和检全率的高要求。原则上,只要检测文献与比对文献存在一个相同的句子,就能 被检测系统发现。1.3系统功能概述系统主要功能包括:已发表文献检测、论文检测、问题库查询、自建比对库管理等。已发表文

3、献检测:指检测系统能够自动将属于用户的已正式发表的学位论文检索出来,并对 每一篇已发表文献进行实时检测,快速给出检测结果。论文检测:主要实现论文实时在线检测功能。便于用户集中管理。问题库查询:指用户可以将检测结果中确认有问题的文献放入到问题库,自建比对库:指管理人员可以选择将检测文献放入个人比对库或者批量上传文献作为个人比 对库,该个人比对库即可作为以后学术不端文献检测的比对数据库,该自建个人比对库完全属于用 户,其他用户无权使用。1.4系统目的AMLC的目的是辅助各研究生培养单位对学位论文质量进行评估,为审查论文提供技术服务。 检测系统在对论文进行检测之后,生成检测报告,为判断论文性质提供相

4、关依据。第二章检测原理及方法2.1支撑技术CNKI拥有强大的技术研发队伍,目前已经拥有了具有国际或国内领先水准的全面的数字出版 的相关技术,包括资源采集技术,文本数据库加工技术,文本数据库技术,数字资源版权保护技术,知识挖掘技术,自然语言处理技术、快速比对技术等。在海量的全文数据的基础上实现快速准确的检 测,上述技术是基本的保证。2.2支撑资源AMLC需要一个尽可能完备的全文数据比对资源库,而CNKI的中国学术文献网络出版总库则正好满足这一要求。到目前为止,CNKI拥有学术期刊7000余种,期刊全文文献 2480万篇,期刊期数和文献收录完整率都大于99.9%,文献量居国际国内同类产品之首;出版

5、503家硕士学位点的72万篇优秀硕士学位论文,368家博士学位点的9.6万篇博士学位论文;1286家重要会议论文787万篇;600多种工具书220多万条;20000条记录;国家标准、专利、出版平台还集成整合出版了各类第三方106万篇;515家重要报纸500多万篇;1376种重要年鉴 学术引文索引数据600多万条;这些出版物做到平均日更新 SPRINGER数据库也集成到CNKI网络出版平台中;另外, 数据库资源1020种。在收录资源种类上,CNKI在国内具有明显优势,收录了期刊、学位论文、会议论文、报纸、 年鉴、工具书、专利、外文文献、学术文献引文等与科学研究、学习相关的主要资源。在资源收录 数

6、量上,CNKI明显优于同类产品,各个资源库收录年限长,期刊等主要资源库回溯到创刊。在资 源更新速度上,CNKI产品除了第三方合作的外文文献以外,其他资源都做到了日更新,单日更新 数量大,这是推行产业化、标准化运作的结果。2.3系统架构模式2.3.1系统架构图ESS lSS; C-WI-7-_N| 1 ll-T-jf=ICBASE理至统,:En图3系统架构图2.3.2系统示意图检测系统提供整套的文献学术不端行为检测,系统服务器位于CNKI中心网站,用户将待检测的学位论文通过网络在线提交到中心网站服务器,服务器在检测完成后,自动将检测结果返回给用 户。整套系统架构为 B/S结构,客户端不需要安装任

7、何软件。其系统示意如图4所示:用户1用户3用户3用户4用户51图4系统示意图2.3.3系统流程图-图5系统核心流程图2.4用户提供的资源实现学术不端检测,用户需要提供的资源包括:1.论文全文内容论文全文内容是检测论文是否存在学术不端行为的基础数据。本检测系统是对提交的论文全文内容进行分析,在内容分析的基础上,生成各项检测指标。因此,全文数据是系统所需要的必要资 源。2.元数据信息元数据指论文相应的作者、作者单位、发表时间、支持基金项目等信息。元数据是检测系统对学术不端类型进行判断所需的基础数据,为了更准确的便于系统做出预判,用户可以在提交检测文 献的同时,一并提交文献的元数据信息。特别提到的是

8、:在进行论文检测的时候,作者信息是非常必要的。输入作者信息,在后续的检 测过程中,系统能够自动根据作者信息区分比对资源中的文献是属于该作者已发表的文献,还是他 人的文献,为用户快速甄别论文是否存在学术不端行为提供更直观的印象。因为在学位论文中,引 用自己以前发表过的文献是合理的。注意:元数据不是系统必需的数据,用户在使用检测系统的时候,可以选择不填写元数据。但 我们建议最好输入作者信息。2.5检测结果内容在对用户提交的检测文献检测之后,系统生成的检测结果包括:1.重合文字来源文献信息。系统详细列出重合文字来源文献信息,这些文献都是真实存在,而且应是公开发表或得到发表 确认的。2.比对信息。检测

9、文献和来源文献的详细比对信息,用户可以快速选择重合文字部分查阅。3.总检测指标。该指标体系从多个角度对检测文献中的文字复制情况进行了概括性描述。4子检测指标。因为论文一般较长,因此,系统一般按章检索,并且每一章给出子检测指标,该检测指标从多 个角度对该章内容的检测情况进行了详细描述。5诊断类型。系统根据指标参数以及其他元数据相关信息,自动给出一个预判的诊断类型,供审查人员参考。6.检测报告。检测系统自动生成一个检测报告单,详细列出检测文献的学术不端行为检测情况,用户可以对 该报告单进行修改,生成终审报告。注意:系统只对疑似存在学术不端行为的论文生成检测报告。第三章检测指标体系学术不端行为检测系

10、统采用的指标体系分为两个部分:3.1总检测指标论文一般文献篇幅较大,字数多,硕士论文一般为35万字,博士论文则多达十多万字。因此,为了让用户对整个论文有一个快速的概况了解,特制定了以下指标体系:总重合字数(CCA )总文字复制比(TTR)总文字数(TCA)疑似章节数(QCA)总章节数(TCA)首部重合文字数(HCCA )尾部重合文字数(ECCA )上述指标从整体情况描述了论文的检测情况,便于用户快速了解该论文总的检测概况。下面对 上述指标分别进行说明。3.1.1总重合字数(CCA)论文一般篇幅大,少则 35万字,多则十多万字,若以文字复制比来衡量一篇论文的文字重合情况,则不太合适。因为对于一篇

11、十几万字的博士论文来说,10%就已达到1万字,文字复制情况已经非常严重。因此,对于博硕士论文检测,检测系统使用绝对字数即总重合字数作为检测结果的 核心指标。如图6所示:1忌蹄IS 文*fiWd,1rB= |】Ti= Bl*1#血期IUN 看It (C 11 1弓删打严Mtt iBBian刍嚴6Srj BflBii3f ifIHEgBOOSEjm W n翻隍已nitmjjjj _:arrJwiiBB11陶CZ3MWBM躺ejatf图6总重合字数示例3.1.2总文字复制比(TTR )总文字复制比则是指论文中总的重合字数在总的论文字数中所占的比例。通过该指标,我们可 以直观了解到重合字数在该检测论文

12、中所占的比例情况。3.1.3总文字数(TCA )总文字数是指该检测论文所有包含的字数,文字复制比与总文字数的乘积即为重合字数。3.1.4疑似章节数(QCA )、总章节数(TCA)疑似章节数是则检测论文疑似存在学术不端行为的章节的数量。总章节数则是指论文总的章节数(对于不按章节显示,而是按照固定长度切分的论文,每一段落为一章节)。3.1.5首部重合文字数(HCCA )、尾部重合文字数(ECCA)1万字,首部重合文字数指学位论文前 1万字中重合的文字数量。尾部重合文字数是指除去前剩下的部分中重合的文字数量。对于论文,一般开头部分均是综述性的报告介绍,其重要性远低于 论文尾部。3.2子检测指标对于论

13、文的每一章节,又制定了如下检测指标来反映该章节的检测情况,对于一篇论文来说, 每一章的内容各异,重点也不一样,其核心工作内容一般主要存在某几章中,子检测指标可以让用 户迅速了解每一章节的检测情况。子检测指标包括:文字复制比(TR)重合字数(最大段长(平均段长(CNW)LPL)APL)段落数(PN)段文字比(PR)首部复制比(HR)尾部复制比(ER)引用复制比(RR) *上述指标从多个角度反映了检测文献的检测情况,便于用户进行针对性审核。下面对各项指标分别进行说明。3.2.1文字复制比(TR )因为论文一般文字量较多,为了便于用户快速浏览检测结果。系统会自动对论文进行切分处理。有如下两种处理方式

14、:1.若用户提交的论文是 MS Word格式,且按照 MS Word格式生成了文档目录,检测系统会 自动识别论文章节,按论文实际章节信息显示论文内容。2.若论文不存在明显的章节信息,或者不是MS Word格式论文,则系统会自动按照每段1万余字符切分论文,按照切分后的结果显示。文字复制比即指论文切分后每一章节段落的文字复制情况。文字复制比即指论文的某一章节与比对文献比较后,重合文字部分在该章节中所占的比例。比例越高,反映该章节越多的文字来自于其他已发表文献。文字复制比反映了文章抄袭”的文字数量比例,一般来说,文字复制比越高,存在学术不端行为的可能性越大。文字复制比情况如图7所示。苗瑚 in;wu

15、MVn a商TH*0-薇应 stWili 屿 a F嘩八 -: W - - * T-气*.*七1 14*竹 * r *- 论l*匸f fit*.I 匚- V * W * i j * 二 * 二匚 -L匸- i- I-.云.-云. wI, I*era*2書* t* *1 5:*,0-*- M (* MS申理阪亍1 * 补p脅.kBw 审(- * 膏亍 4* r 4 Ft* - HW 4 卜1; I *-. ” I4- flvHn*M iM 41-t 4W-S- Jr* F =flrfyFTr. iwwMn*图7文字复制比示例3.2.2重合字数(CNW )重合字数指论文该章节与比对文献比较后,重合

16、部分的字数。一般来说,不管文字复制比如何,重合字数越多,存在学术不端行为的可能性越大。如图8所示,在图中,虽然文字复制比只有16%, 比例不高,但图中左文标红部分实际上是抄袭了右文的标红部分。命翊!riT-sWi.o: sITTi.* *:* w tr* * * I* 亠* “I t b*If S-产图9段落复制示例 J 图10句子复制示例324段文字比(PR)在论文的某一章节中,所有该章节文字重合段的字数之和占该章节文字数的比例为段文字比。段文字比反映了抄袭连续特征。一般来说,连续文字出现的越多,比文字分散出现的情况更可能存在学术不端行为。3.2.5首部复制比(HR)论文某一章节的前20%称

17、之为章节首部,首部的文字复制比为首部复制比。就中文文献来说,11所示,左文和右文开一般每一章节正文开头部分出现的是综述性语言,重要性相对偏低。如图头大段相同,但文字内容基本都是综述性的介绍。VTffc.Hl C,; ;-.-.iVZ-TP*-*r 4-呻补 切I - r. - k T f引5 幅:tM - .7i I if 卜-A*. Jt .-,- :. ITA _-0 c嗥4.氏 量亡予广亠弋巒T - 匕尸F 匚亍氓 Mwp -尸-丁乐匸F匚弟 r 冈/ 飞 m:噌屯 声门 * ! i iL ; .*r*o 匚 45E :, . : :*:心/,! r-亡尸i方 亡m*血石: rT亍弧 十

18、齐.养 Rhju厂r厂宀* 1?:典,pij I f fl K co TTi - vr i- -CJ i -e r,Tj艺 L- -=广H ! - f 7 ,L. iri-f- ;A ,L-: %: g :-:C-匕 E n.X-, &比、芒第色密电产匸r磴.鼻* A-%-;丄_ LtL ,f. n g iei - t? g 衍 IftHy -f*测“彳图11首部复制比示例326尾部复制比(ER)每一章节的后80%称之为章节尾部,尾部的文字复制比为尾部复制比。12所示,我们仔细查12中尾部文献则是阐述通常情况下,尾部文字内容就重要性来说,比前部文字内容要高。如图阅比较图11和图12的内容发现,

19、图11中首部文献是综述他人工作,而图自己的研究工作的目的和意义,应该是作者个人工作的体现,在这部分直接抄袭他文,性质要严重得多。giKVJWJhJ SMirK 事n申幅阳MS* I . l5- I ip-r -t 4, L 图12尾部复制比示例327引用复制比(RR)引用复制比指与存在引证关系的文献的文字重合部分的比例。对于论文来说,存在引证关系与 不存在引证关系的复制部分应区别对待。复制了他文内容,而不注明引用,性质要更加严重。同时我们也认为,不是所有的注明了引用的,就不存在抄袭,引用也应有一个度和范围的限制。第四章类型及实例介绍按照上面的检测方法和指标体系,TMLC能够处理多种的学术不端类

20、型。在论文检测中,一般不存在不当署名、一稿多投等学术不端行为。对于论文检测中的各类学术不端行为,按照性质的严 重性由低到高排序,主要包括:抄袭、篡改、伪造等。下面分别进行介绍。4.1抄袭按照重合字符数量与文字复制比例可以将抄袭划分为:类型重合文字条件总文字复制比例轻度句子抄袭各连续重合文字均10%句子抄袭各连续重合文字均=10%轻度段落抄袭存在连续重合文字=30% 且 =(总字符数/2)=50%针对各种类型,下面分别举例说明:1.轻度句子抄袭图13轻度句子抄袭示例2.句子抄袭Jima的监用巧电商.itv 口”竝iS恥Si I* 干换議圭師耳4 i U询if粗;引V*a註f曲L tl 自=套P

21、* V a,二二4 P 二; i vuvRiM t - H- * * I W* * rkN匚4#-F |- “事 * I lA I W *V* V-B-BBT览圖畅:訓I、图14句子抄袭示例3.轻度段落抄袭l-Ba住十MHH冥却就I节呵打 WPJC;SI哼皿诵:-T-CbVIr I丰jit*if图15轻度段落抄袭示例4.段落抄袭WH .1 ,计1e硏aa; 1;码灯摂必耳哥4*: S!- b_ r 殆 Aa * -flru-* -WTpLYi rt*f4 errant”&*,*磁 k I A*4*韦n&n 1 4aw4C3ae*hr- - txf S 密冬備 t MMr4n伽国|1曹如nar.

22、jhiiNiHnnr t 需汗时需,魯_* # 區斤丹 n, irm 可图16段落抄袭示例5.整体抄袭程)(钿ii计瓯嗣L; 31護*1悯r X#斗 t - - I 阿- -*! rf w- rw 尊蓼- * r * f sft* 即 *bp - T 皆二- 1* *t : 帀 iii J + w- L M aM V II-T-iW W *v - 1 PW 苦轿、 .L AFf图17整体抄袭示例另外,按照抄袭来源还可以将抄袭划分为:I)单源抄袭:重合文字全部来自于一篇文献;2)多源抄袭:重合文字来源于两篇及以上文献。如图18所示,重合文字来源有 13篇文献,属多源抄袭。&菴Jl Xe戸 |1:

23、2S1C fisriHl HRji 声 严114右m: :匕 ptHft in :壬巧PF忖_w;即刊门楼雷MFV;,卩)4+A生t氏#華ft*MH51:?皿2:轴严囂鳥心再囂郴一化叫!?九-讥几讥 九山吐九Ji 3 I 、- 、 F I n 1 V- 3 1- 吕吕=口吕吕口_出* r 爭.MP片紗,vTA.il trr讦當柚対|国姬鼻*诩1倆4也|剔丽却1丈HIH图18多源抄袭示例4.2篡改篡改是指按照期望值随意篡改或取舍数据,以符合自己的研究结论,一般有主观取舍数据和篡 改原始数据等形式。对于篡改,系统也具有一定的手段进行检测,首先来看一个例子,在一篇文献中提到:分词的准确率为99.66

24、%,词性标注的准确率为 99.07%,利用CNKI已有的相关技术,系统可以快速检测 与分词准确率和词性标注准确率有关的数值信息,供审查人员参考,对文献中数据值远高于当前公布的数据值的情况,提醒审查人员仔细核查,如图19所示。1月IliKuU呦从林注的祁*|1仙嘔机抽取出期Q琨科.勺询和诃性 标j i-同悄况“测试.讲科咋負诃的准确率申 聲和护、叩卄U ji的准确审为99. QW ,1:川2911話卄戒卑協注飞莎亦顾G蕊丽丽丽硕丽Q听 毗饕窕筋松$;:测试小乳的测试报書和曲愉川门报;U5谏的备种丈了件处卜4FL )1融n r壮件系维的丄临场演不.紿过认1%的讨论弦左委员it认为:灯国CBUt硼n

25、t环鸽协词9VLn & 崗”腳啟 wt咲耐ffVi冗中:;E 斬溟 g 葩站”曲t叶3. f E*4; JWLI 擱-_ A1-.I -辰*于Bz*再理飓建吾視 :汁,- - k 环;W - . - (豪启测舸电0征一需曲蒯瓯展财.“卑吐01写:* - A;W戟认卷 检和研起哲M葩wns剧磴H于WJL-W峯亍IfirK個恳桂帝乌口建7 B册彷杯惰术,Bia 盟*殳松卞冷册E幕却怙asu. R油瑰r古环fl跡叔.上.邮酩计If掲供鼻弄四Ml hfl墨睾砂国y壬栅.I WBtlUKVimfl : I -ft山芒砒盟正iWilMiCIff - H珂阖悄K眄 1!讦” .,理*爭炖屯I审空工垃空丿中丈

26、药gj?妆1图19篡改检测示例在图中,上面黄色标示的是检测文献中描述的分词准确率和词性标注准确率,下面部分则是在CNKI特色搜索功能一一数值搜索中检索到的当前关于分词准确率和词性标注准确率的描述。我们 可以观察到,当前检测到的所有关于分词准确率和词性标注准确率的描述文字中,其数值均低于检 测文献中所描述的数值,因此,我们有理由对检测文献中的分词准确率产生怀疑,提示审查人员进 一步核查。4.3伪造伪造的特点:新研究成果中提供的材料、方法、数据、推理等方面不符合实际,无法通过重复 试验再次取得,有些甚至连原始数据都被删除或丢弃,无法查证。伪造包括的方面很多,可以伪造数据、伪造基金、伪造项目、伪造数

27、值、表格、图形等。伪造基金/伪造项目:有些论文中虚设基金、 项目支持,这种情况可通过查询政府相关基金项目 库可以快速验证;伪造数值、图表等知识元,则可以通过CNKI已有的成熟的数值搜索技术、图表搜索技术进行查证,起到警示作用。注意:伪造是检测难度最高的不端行为,还需要做进一步、更深的研究。4.4其他类型学术不端类型肯定不止上面列出的几种,其他目前能够有所处理的类型还包括:1.引用杜撰别人根本没有说过的话,自己编造,却作为他人的话引用。尤其是杜撰引用国外学者。2.引文杜撰根本就不存在的文献,杜撰一篇引文。第五章系统功能及实例分析TMLC主要功能包括:已发表文献检测、论文检测、问题库查询、自建比对

28、库管理等,下面分 别结合例子进行介绍。5.1已发表文献检测各注册用户可在权限范围内查看本单位已被CNKI正式收录论文的检测结果。对于确定有问题20所示:的文献,还可以将其直接放入问题记录库。其流程图如图枚入问题库查看原版文献VWmWJ-VWWlVWWT/WV .WWW VWW.TWV-VWWWW.VWW iTWVW jvwvwwwAWVWWjVWVW JWWW - WWWV - WVWWWV- WW.JWVW wvwwv - ww /www-wi图20已发表文献检测流程图用户可以选择具体某一年的论文进行查阅检测,也可以通过页面提供的检索功能,检索某一个 作者的论文或者按照论文篇名检索具体的某一

29、篇文献,如图21所示。1LK1 言K立aw店怎亀r-!叵11 ,:泄辽a 注 *-*团*1塑rt r a n n显肝莊略电时竝巧“巴独I #啣住; :刍;图21已发表文献检测列表注意:因为相关原因,所有示例中涉及具体单位和个人的信息基本都隐去。选择某一篇论文,点击论文标题,进入下一个页面,对于论文来讲,一般会被切分成几个到十几个段落,用户可以依次点击查阅,如图22所示。图22已发表文献切分段落点击每一段落查看详细的检测结果,包括:检测指标,重合文字来源文献的信息以及与其文字复制比,在页面下部还标红了所有重合的文字。让用户快速了解到选择文献大约有多少文字与其他文献重合以及重合文字所处的位置等,如

30、图23所示。重合3宇*S?9Mtt二1刖怜一1匚111怜潮闖QiB.合祕阿 1: B、先梆 KUlIS 血;JI55T J严呢泪I? ja?: 13 彌L阪*ttJ則;【忖M直事ftjicu 舸*4*WtW J合文字*: r Y * 乂4 . C* * * t严ML*w*;*押帀 1 平ihsesg* (TpiBwa *tiV Cfgcoirw * * *:(阪托*如W* !#1 M *y 豎-诧 g 悌暮 +* r * Jr 十|U 谄 d 4 M f-. -:-丁叭iSi(? ? *聲法連”-射- ta倉 * a.八*9*C I4B ft*E* t I I 图24已发表文献检测页面(2)2

31、5所示。点击图24页面中的 查看原版比对”按钮,还可以查看论文的原版比对,原版是指文献发表时的排版样式,这使得用户可以快速的确定网页所指文献是否与原版文献文字一致,如图悒Ttt*福询;xe钊七I 曲口叮嘔i删窗j (i刎?雷5.2论文检测该项功能提供对论文的实时在线检测。将待检测文献通过互联网提交到检测系统服务器,系统 根据论文长度大小将在数秒内返回检测结果给用户。包括以下特点:(1)多手段论文提交方式。在线提交论文的方式包括三种:一是单篇论文在线提交,可以选择需要检测的某一论文直接上传提交;二是批量论文在线提交,可以将需要检测的多篇论文压缩为一个zip格式或rar格式的压缩文件,然后提交压缩

32、文件至检测服务器,系统将自动处理压缩文件,完成压缩文件内所有论文的检测;三是手工录入方式,可以在线录入一段文字进行检测,如图26所示。(2)多格式论文处理能力。系统能够自动处理 文档,如图26所示。MS Word、PDF、CAJ、HTML、TXT 等多种格式f 弦ii r;T上 van ftI,上I iiftA5 Wrii Jjjc CB ZJrftlEbH?. :k窝1-isfr:- an图26提交文献页面(3)文件夹式管理方式。为便于用户管理,系统采取了用户完全自主的文件夹式管理方法。用 户可以创建文件夹,设定文件夹的各项系数,包括:比对专业范围选择、检测时间选择、比对数据 库类型选择等。

33、在创建文件夹之后,当用户将文献提交到选择的文件夹之后,系统将自动根据该文 件夹设定的各项系数进行检测,而用户无需每次都进行系数设置操作。而且用户可以随时对文件夹 系数进行修改,重新设定文件夹系数,如图 27所示。.Ar4*訂于抑M*肿尸齡j *对刊;ms坊擀HI即3炉訓缈1鉴:闵BBg:属性|期*11巌:二:;待希特1也;IIrti修西文件膜HMt超歯图27文件夹式管理页面(4)便捷的文件夹系数设置。用户可以设置比对专业,例如只选择医学领域文献作为比对数据库;可以设置检测时间,例如只选择2000年到2007年的文献作为比对数据库;可以设置比对库类型,CNKI收录了期刊、学位论文、会议论文、报纸

34、、年鉴、工具书、专利、外文文献、学术文献引文等与科学研究、学习相关的主要资源,这些资源构成了检测系统丰富的比对库类型,用户可以选择一种或多种比对库进行检测,在检测系统中,用户在提交论文页面下, 选择创建文件夹链接,将出现如图28所示页面,供用户设置文件夹各项系数。龙 flAMS; IT ram: 京昭*i4E夷翼fLMS:2 冋百円址? JtllK3图28文件夹系数设置(5)用户完全自主的控制模式。对于用户提交的所有文献,用户拥有完全的处置能力,可以 随时进行删除。不仅可以删除某一篇文献,还可以删除整个文件夹,如图27所示。注意:对于论文,因篇幅较大,系统只允许用户重新检测每一章节,不能对整个

35、论文进行重新 检测。(6)快速的检测结果浏览方式。当系统检测完成后,用户可以快速的比对检测文献与抄袭来源文献,系统自动将两篇文献文字重合的部分标示出来,便于用户进行快速查阅检查。同样,系统 实现了在文献原始格式(即发表时格式)上的标示比对,更便于用户准确把握检测结果,如图29,30, 31所示。I口加(糊I9Tih:扭诚J|liiPt睛甜【“駅須你舞罚1卸【沁|时乍【価Tsw】J 一 丄 :咔 辭函9 BM 5W SS EBnus 己m HB nil w啓繭r翩IB鲤I 时 BB B:胯GT.图29论文章节列表啧柵ft附 妇:-轴如*他 严” S縈込,:I*錚3 .gjHt瞪:,巒沪阿輪 Ww 轿矗El: |脚砂松删b: I阳|用1啪:t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论