毕业设计论文简历管理系统_第1页
毕业设计论文简历管理系统_第2页
毕业设计论文简历管理系统_第3页
毕业设计论文简历管理系统_第4页
毕业设计论文简历管理系统_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学年论文(20162017学年第二学期)题目:简历管理系统专业:电子商务班级:电商11402姓名:指导教师:序号:112017年9月25日学年论文开题报告课题名称简历管理系统研究院系名称管理学院专业电子商务班级电商11402学生姓名一、课题研究的意义简历管理系统是面向企业和求职者的简历管理系统。他的主要功能是:面向企业,能够对一份简历进行有效数据进行筛选提取,便可筛掉一部分不符合岗位需求的求职者,提高一定的工作效率节省一定的资源;面对求职者,能够根据系统所提供各个企业的要求条件,修改自己简历,增大录用的机率;系统还有海量级简历模板,为求职者制作个性简历提供一定的素材。二、所属领域的研究成果目前

2、市场上已有“招聘之星”软件。具软件以人才简历库为中心,是一款帮助企业管理求职者简历、筛选简历等功能的软件。本系统主要应用的理论知识是,基于Python的jieba分词2-3和利用余弦定理计算文本的相似度4-5的内容推荐系统。在此理论方面的实际应用较多,例如淘宝根据用户浏览定制个人的推荐系统6-7,基于浏览内容的推荐订餐系统饿了么、美团等。三、研究内容面对企业,能够迅速根据企业需求筛选出合适的求职人员。面对求职者,根据系统提供的各个企业不同岗位的要求寻找到合适自己的职位,并帮助制作个性简历增加求职成功的机率。主要是通过:(1)基于对简历内容进行数据清洗、数据储存、数据分类、文件管理(2)基于ji

3、eba分词将众多简历进行分词处理(3)利用余弦定理进行文本相似度算法,将分词后的文本内容赋予权重,再用余弦定理文本相似度算法计算和关键词库的相关度,从而对一份简历是否通过筛选进行判断四、研究方法文献法。文献法是通过调查文献来获得资料,从而全面地、正确地了解掌握所要研究问题的一种方法。主要作用有:1.根据有关的历史和现状,帮助确立开题。2.能形成关于研究对象的一般印象,有助于观察和访问.3.能得到现实资料的比较资料.4.有助于了解事物的全貌系统分析法系统分析方法是指把要解决的问题作为一个系统,对系统要素进行综合分析,找出解决问题的可行方案的咨询方法。五、研究步骤(1)确定简历管理系统的研究课题(

4、2)通过查阅文献、利用网络搜索等多种方式搜集与课题内容相关的信息。(3)确立研究该课题的思路以及方法(4)系统分析与设计(5)在老师指导下修改、完善课题(6)课题研究结束六、参考文献1江志祥.智能简历解析系统的研究与实现D.北京邮电大学,2009.2张艳梅,胡文淑,曾H.基于神经网络的中文分词技术研究J.软件导干1,2007,(23):16-18.3余战秋.中文分词技术及其应用初探J.电脑知识与技术,2004,(32):81-83.4沈斌.基于分词的中文文本相似度计算研究D.天津财经大学,2006.5马军红.面向中文的文本相似度计算方法研究J.网络财富,2010,(10):165.6朱扬勇,孙

5、靖.推荐系统研究进展J.计算机科学与探索,2015,9(5):516-517.7任磊.推荐系统关键技术研究D.华东师范大学,2012.指导教师签名:2017年5月20日摘要进入信息时代,信息可以在多种渠道中进行传播。一则招聘信息可以在多个渠道发布,企业的招聘部门收到的简历数据日益增多,如何提高筛选简历效率是对招聘部门提出的新要求。求职者需要让自身简历在大量的简历中脱颖而出,除了自身的具备的专业素养还需要有一份内容突出、精美的简历。简历管理系统帮助企业在众多的简历中缩减查看简历范围,根据科学的计算方法保证结果的科学性。简历管理系统是基于Python的jieba分词和利用余弦定理对文本进行文本相似

6、度计算。采用.net开发语言和MySQL数据库,B/S技术架构。系统对简历进行分词处理,赋予权重后,采用余弦定理文本相似度计算,筛选出符合用户需求范围内的简历。系统采用MySQL数据库,支持大量的大型的数据库;MySQL优化了SQL查询,提高查询速率。简历管理系统极大的提高了简历的筛选效率,利用分词技术、对部分词赋予权重进行相似度计算最大限度降低误差,以符合实际需求。简历管理系统的特点是:系统结构简单,迅速提取目标信息。关键词:大数据、分词、数据分析、简历ABSTRACTIntheinformationage,informationcanbespreadthroughmultiplechann

7、els.Arecruitmentinformationcanbepublishedinmultiplechannels,andtherecruitmentdepartmentoftheenterprisereceivesmoreandmoreresumedata.Howtoimprovetheefficiencyofscreeningresumesisanewrequirementfortherecruitmentdepartment.Jobseekersneedtomaketheirresumesstandoutinalargenumberofresumes,withtheexception

8、ofaprofessionalqualitythatrequiresanoutstandingresume.Theresumemanagementsystemhelpsbusinessesshrinkthescopeoftheirresumesandmakesuretheresultsarescientificbasedonscientificcalculations.TheresumemanagementsystemisbasedonaPython'sbinarywordandusingthelawofcosinestocalculatethetextualsimilarityoft

9、hetext.AdevelopmentlanguageandMySQLdatabase,B/Stechnicalarchitecture.So,thesystemhastosplitthewordstotheresume,giveittotheweight,andthenitUSESthelawofcosinestodeterminetheprofile,andthenselecttheresumethatmatchestheuser'sneeds.ThesystemusesMySQLdatabasetosupportalargenumberoflargedatabases;MySQL

10、optimizesSQLqueriestoimprovequeryspeed.Theresumemanagementsystemgreatlyimprovesthescreeningefficiencyoftheresume,usingthewordsegmentationtechniqueandtheweightofsomewordstotheweighttominimizetheerrortomeettheactualdemand.Resumemanagementsystemischaracterizedbysimplesystemstructureandquickextractionof

11、targetinformation.Keywords:Bigdata;Dividetext;Analysisdata;Resume目录1 概述31.1 选题背景31.2 现状分析52相关研究33系统分析43.1 系统功能分析43.1.1 用户需求分析43.1.2 系统的功能模块图43.2 系统业务流程分析53.2.1 业务流程图53.3 系统数据流程分析63.3.1 数据流程图74数据字典95系统设计105.1 E-R图105.2 数据表设计135.3 代码设计145.4 安全设计156系统实施156.1 系统开发平台与技术简介156.2 系统实施界面166.2.1 登陆界面设计167总结17

12、参考文献171概述1.1 选题背景临近毕业季,毕业生们身边开展着各种校园招聘会、人才市场招聘以及各种网络平台的招聘。面对各个渠道提供的各种企业岗位,很多毕业生选择海投简历,这种方式无疑是工作量大、效率最低的。对于企业而言,面对众多格式不一、各具特色的简历,必须需要筛选简历找到最合适的人选。若人工一份份工阅读,必然造成一定的资源浪费,且效率较低。因此,对于企业,若能够对一份简历进行有效数据进行筛选提取,便可筛掉一部分不符合岗位需求的求职者,提高一定的工作效率节省一定的资源;对于求职者,若清楚各企业的岗位的要求,便不必海投简历,省去时间精力,应聘也有一定的方向。1.2 现状分析一份应聘简历含有应聘

13、者的基本信息、经历以及个人能力的简述。每一份简历都具备一定的信息量。现今,信息传播速度较快、传播平台较多,一则应聘消息可以通过报刊、官方公众媒体、招聘中介、招聘平台、校招、人才市场招聘等多种方式加以传播。多渠道招聘信息的传播有利于企业寻找到最适合的人选,然而招聘部门收到的简历量也有了较大幅度的增加。因此,在大量简历中如何快速、有效找到最符合某职位的人员是对应聘部门工作人员的新要求。显然,若是人工一份份阅读,是最传统较为浪费资源的方式。如果结合一定的算法设计一个可以筛选指定内容有关的简历便可缩减招聘部门一定的工作量。2相关研究Jieba分词:有三种分词模式1精确模式,将句子最精确地切开;全模式,

14、把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率。用户可以自定义词典,以增加更高的正确率,通过计算分t的关键词TF/IDF权重,来抽取关键词。基于简历内容的分词算法5-7,将简历内的文字进行分词处理,得到分词后的样本。对分词后的样本赋予权重。再根据文本相似度余弦定理计算与目标信息的相关程度,根据相关程度判别简历是否通过筛选7-12,实则是基于内容的推荐系统。3系统分析系统分析也称为“系统方法”110以系统的整体最优为目标,对系统的各个方面进行定性和定量分析,为决策者提供直接判断和决定最优系统方案所需的信息和资料。

15、3.1 系统功能分析简历管理系统是面向企业和求职者的简历管理系统。总体任务是:面向企业,能够缩减企业人事部查看求职者简历花费的时间;面对求职者,能够根据系统所提供各个企业的要求条件,修改自己简历,增大录用的概率。3.1.1 用户需求分析对于求职者,他们目的是能够找到一份满意的工作。如今招聘形式的多样化,提供了大量的招聘信息,在有限的时间内找到最合适用户的工作才是最重要的。因此他们的需求有:(1)众多招聘信息中能够筛选出合适自己的岗位(2)制作有特色的简历对于企业招聘部门,参与招聘的人员增多,随之而来投送的简历也逐渐增多,需要在有限的时间内找到合适的人选。招聘部门的要求有:(1)有效地筛选符合该

16、岗位要求的应聘者(2)尽可能花费较少的时间,并保证筛选的质量(3)能够发布招聘信息,增添新的应聘信息发布渠道3.1.2 系统的功能模块图3.2 系统业务流程分析业务流程是以达到或者完成某个目标由不同的人分别共同进行一系列有逻辑活动的相关活动的集合川。流程管理以流程为中心,通过优化企业的组织机构,灵活易变的流程设计,来提高企业的运行效率,优化资源利用率。3.2.1 业务流程图1 .顶级业务流程图,如图3-2-1所示图3-2-1顶级业务流程图2 .简历管理系统面向企业子系统业务流程图,如图3-2-2所示发布招聘招聘信息.f关键词库图3-2-2简历管理系统面向企业子系统业务流程图3.简历管理系统面向

17、企业子系统业务流程图,如图3-2-3所示图3-2-3简历管理系统面向求职者子系统业务流程图4.简历管理系统面向管理员子系统业务流程图,如图3-2-4所示图3-2-4简历管理系统面向管理员子系统业务流程图3.3系统数据流程分析数据流程分析是把数据在组织(或原系统)内部的流动情况抽象地独立出来,舍去了具体组织机构、信息载体、处理工作、物资、材料等,单从数据流动过程来考查实际业务的数据处理模式。现有的数据流程分析多是通过分层的数据流程图(DFD来实现的13。3.3.1 数据流程图1.顶级数据流程图,如图3-3-1所示图3-3-1简历管理系统顶层数据流程图2.简历管理系统第一层数据流程图,如图3-3-

18、2、3-3-3、3-3-4所示图3-3-3简历管理系统面向企业第二层数据流程图图3-3-4简历管理系统面向管理员第二层数据流程图4数据字典数据字典主要包括数据元素、数据结构、数据流、数据储存、处理逻辑的定义和描述。数据存储在数据字典中,只描述数据的逻辑结构,不涉及它的物理组织主要描述它所表示的数据结构和输入、输出数据流。数据结构标号和名称具有H件也13唯一性。(1)数据项:数据项是数据的最小单位。描述数据的静态,具有不可再分的逻辑性。数据项包括:数据项编号;数据项名称;别名;简述;类型及宽度;取值范围。数据项编号:DM-001数据项名称:企业用户名另用:username简述:企业用户登录的用户

19、名类型及宽度:Varchar;60位(2)数据结构:数据结构描述数据项之间的关系可由若干数据项、数据结构与数据结构组成。数据结构包括:数据结构编号;数据结构名称;组成;简述;相关数据流;相关逻辑处理。数据结构编号:S01-01数据结构名称:企业用户基本信息简述:企业用户基本信息组成:企业注册编号+企业法人姓名+企业公司地址+企业联系方式相关数据流:修改招聘信息相关逻辑处理:修改招聘信息管理(3)数据流:数据流是由一个或一组固定的数据项组成。可以由一个已定的数据结构,可以由若干数据元素、简单数据结构和复杂的数据结构组成。数据流包括:数据流编号;数据流名称;数据流来源;数据流去向;数据流量;高峰流

20、通量。数据流编号:C01-01数据流名称:筛选后简历清单数据流来源:企业用户导入简历数据流去向:复试者名单数据流量:100份/分钟高峰流通量:100份/分钟(4)数据储存:数据存储在数据字典中,只描述数据的逻辑储存结构,不涉及它的物理组织,主要描述它所表示的数据结构和输入、输出数据流。数据储存包括:数据存储编号;数据储存名称;简述;数据存储组成;关键字。数据存储编号:D01-1数据存储名称:招聘信息简述:招聘企业、岗位、要求、薪资、其他数据储存组成:招聘企业、招聘岗位、岗位要求、薪资、联系方式、其他关键字:招聘企业、招聘岗位、岗位要求、薪资、联系方式(5)处理逻辑:处理逻辑在数据流程图中只进行

21、简单的描述,与数据流程途中的编号和名称一致。处理逻辑包括:数据逻辑编号;数据逻辑名称;简述;处理;输入;输出;处理频率。数据逻辑编号:XS01-02数据逻辑名称:简历关键字匹配简述:将分词后的简历与关键词匹配得到筛选后的简历编号处理:将分词后的简历与关键词匹配得到筛选后的简历编号输入:分词后的简历集输出:与关键词匹配后的简历集处理频率:100份/分钟5系统设计5.1E-R图实体是现实世界中可区别于其他对象的“事件”或“物体”,每个实体有一组性质,其中一部分可以唯一标识,实体可以是实实在在的,也可以是抽象的;联系是指实体的联系分为实体的内部联系和实体与实体之间的联系。实体之间存在多种类型的联系,

22、常见实体的三种类型:(1)一对一联系(1:1)(2)一对多联系(1:n)多对多联系(m:n)14。1.企业用户、求职用户、管理员信息如图5-1-1、5-1-2、5-1-3图5-1-1企业用户表信息图5-1-3管理员用户表信息2.招聘表信息、简历储存表如图5-1-4、5-1-5如图5-1-5简历储存表信息3,简历管理系统实体之间的具体关系如图5-1-6图5-1-6简历管理系统实体之间的具体关系5.2数据表设计1,管理员信息表,设置如下:字段名字段类型字段宽度是否为空字段描述PK/FKIDInt30Notnull管理员IDPKGnameVarchar30Notnull管理员用户名GPSD30Not

23、null管理员密码2,企业用户信息表,设置如下:字段名字段类型字段宽度是否为空字段描述PK/FKidInt30Notnull企业用户IDPKEnameVarchar70Notnull企业用户名Epswint30Notnull密码Etelchar60Notnullr联系方式EdrsVarchar100Notnull企业地址Enumchar60Notnull企业注册编号ElnameVarchar20Notnullr企业法人姓名Elnumchar60Notnull企业法人身份证号3.求职者用户信息表,设置如下:字段名字段类型字段宽度是否为空字段描述PK/FKSidInt30Notnull求职者用户I

24、DPKSnameVarchar20Notnull用户名SpwdInt30Notnull密码Slnumchar60Notnull身份证号:Stelchar60Notnull联系方式4.招聘信息表,设置如下:字段名字段类型字段宽度是否为空字段描述PK/FKCIDInt30Notnull招聘信息IDPKCesVarchar100Notnull招聘企业CjobVarchar100Notnull招聘岗位CdemandVarchar200Notnull要求Ctelchar60Notnull联系方式CelsVarchar300null其他Csalint20Notnull薪资5.筛选后简历表,设置如下:字段名

25、字段类型字段宽度是否为空字段描述PK/FKJIDInt30Notnull简历"表IDPKJcountInt30Notnull计算后结果5.3代码设计代码是用来代表某实体或实体某属性值的一种符号,通常由数字、字母组成。易于被计算机和人识别和处理140代码设计的作用主要有以下几个方面:唯一地标识一个实体或属性值;系统集成基础;便于分类和统计;在某些场合节省储存空间;便于排序和索引;能提供专门的含义。代码设计主要遵循以下几个原则:唯一性,代码设计要保证每一个代码都有确定的代码实体,能够一一对应,不能出现两个相同的代码;合理性;可扩充性;致性;标准性;简单性;稳定性。1 .企业用户ID编号:

26、xxxxxxxxxxxxxxxxxxxxxxx顺序数企业类别注册年份注册时间:月份日历数小时数例如:072013表示7月20日13时2 .简历ID编号:xxxxxxxxx顺序数部门编号5.4安全设计系统的安全设计是一个非常重要的问题,特别是基于网络应用的信息系统。系统的安全主要包括物理安全和逻辑安全两个方面"150保证系统的物理安全需要保证相关的设置不收到外界的破坏,加强物理保护。保证系统的逻辑安全是保证系统的信息完整性、保密性、可用性;系统内所有的信息、数据正常的使用,正确的数据流向。系统的安全威胁因素较多14。在保证系统的物理安全过程中可能有人为或者非人为,直接或者间接伤害系统的

27、物理设施。例如软硬件的缺损。系统是基于网络的应用信息系统,系统安全体系可能会受到来自网络的病毒攻击、非授权访问、盗取数据库信息、病毒感染等威胁。需要采取以下措施预防系统受到安全威胁:(1)专人管理系统的硬件设施;定期检查跟换硬件设备是否完好;对系统进行加密(2)安装防火墙,保证安全上网。(3)及时对系统信息进行备份,将可能的损失降到最低(4)定期检查系统查看是否存在漏洞及时修补系统漏洞。6系统实施6.1系统开发平台与技术简介简历管理系统采用MySQL数据库。MySQL数据库支持多种操作系统,开发时受到开发系统因素影响较小,为多种编程语言提供了API16o编程语言多样化。可以用Java也可以用P

28、ython。支持多线程,充分地利用了CPU的资源,加快了运行速度。同时MySQL数据库优化的SQL查询算法,有效地提高查询速度,提供ODBC和JDBC等多种数据库连接途径170在数据存储方面,支持大量的大型的数据库,可以处理大量的信息。B/S结构即浏览器/服务器模式18-19,是WEB兴起后的一种网络结构模式,WEB浏览器是客户端最主要的应用软件。这种模式统一了客户端,将系统功能实现的核心部分集中到服务器上,简化了系统的开发、维护和使用。客户机上只要安装一个浏览器。浏览器通过WebServer同数据库进行数据交互。(1)维护和升级方式简单。对用户人力、物力、时间、费用的节省。(2)成本降低,选

29、择更多。(3)应用服务器运行数据负荷较重。由于B/S架构管理软件只安装在服务器端上,网络管理人员只需要管理服务器就行了,网络管理人员只需要做硬件维护。但是,应用服务器运行数据负荷较重,发生服务器崩溃等问题,因此需要备有数据库存储服务器20o6.2系统实施界面6.2.1 登陆界面设计管理员登录7总结简历管理系统,主要目的是帮助招聘者更高效地筛选应聘者投送的简历,利用基于Python的jieba分词和基于内容的推荐算法,将简历重点信息筛选出来并赋予不同的权重,缩减人工查看简历范围,大大提高单位时间内的工作效率。对于应聘者,可以查看各个企业的岗位要求,以及获取简历模板素材便于找到符合自身的工作岗位以

30、及制作精美的简历。本论文主要的工作总结有以下几点:1、理清楚简历管理系统的功能模块和系统的逻辑结构,结合目前招聘市场的现状分析了该系统的必要性。2、对简历管理系统做了深入的分析,包括功能模块设计、业务流程分析、数据流程分析、数据库设计等。为下一步实施系统在理论上做一定的分析。该系统还有很多完善,比如在系统代码设计上需要完善,系统功能较少,可以增添几个新的功能。在设计系统阶段是一个需要不断完善的过程,需要多次修改逐步完善。参考文献1江志祥.智能简历解析系统的研究与实现D.北京邮电大学,2009.2王思力.面向大规模信息检索的中文分词技术研究D.中国科学院研究生院(计算技术研究所),2006.3朱扬勇,孙靖.推荐系统研究进展J.计算机科学与探索,2015,9(5):516-517.4余战秋.中文分词技术及其应用初探J.电脑知识与技术,2004,(32):81-83.5TaoZhou.Solvingtheapparentdiversity-accuracydilemmaofrecommendersystemsA.中国高等科学技术中心.第六届全国网络科学论坛暨第二届全国混沌应用研讨会论文集C.中国高等科学技术中心:,2010:13.116奉国

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论